Peakers Hitachi Cup – 道路交通量予測コンペハッカソン 最優秀賞 工藤 航さん 東京大学大学院 工学系研究科
2019年9月25日、株式会社日立製作所とPeakersの共同開催でPeakers Hitachi Cup – 道路交通量予測ハッカソン- が行われた。本イベントは、コンペティション形式の個人戦ハッカソンだ。課題はアメリカの道路交通量のオープンデータを用いて、モデルを作成し、交通量予測を行うというもの。日立製作所からは3名のメンターが参加し、学生からの疑問や質問に対してアドバイスする形でサポートした。
本課題はデータのボリュームがかなり大きく、前処理や取り扱いの段階で苦戦した方も多かった。しかし、最終的には半数以上の参加者がMAE(mean absolute error)20~30までの間に集中(交通量の全体平均は187程度)。第一位はPeakersでの事前検証でも超えられなかったMAE20.0の壁を突破し、19.16を記録するハイレベルな争いとなった。今回は参加者の中でも特にスコアが高かった、上位3名の優秀者にインタビューを行った。
もともとサッカー少年だった工藤さんが機械学習に触れたきっかけは、試合に勝つため、相手チームの分析を始めたことだという。分析を行っていくにつれ、より高度な手法を学びたいと機械学習の勉強を始めた。将来的にはデータとビジネスを結びつけ、価値を提供できる人材として活躍したいという工藤さん。今回最優秀成績を収めた秘訣はどこにあったのか。
ハッカソンに参加したきっかけは?
来年は卒業して社会人になるので、見識を広めるために参加しました。交通量予測はやったことがなかったので、勉強するのにいい機会だなと思って。コンペはコミュニケーションも発生しますし、社員の方ともお話できます。自分がいままで知らなかった分野の勉強にもなると思います。こういうコンペだと評価がわかりやすいですし、評価してもらえる場所がいろいろあるので、成長をかみしめながらやっていけるのがいいのではないかと思います。
実際に参加してみていかがでしたか?
データが多いなというのが率直な感想です。もっと整理されているデータなのかと思っていました。時間の制約もあり、実務のスピード感、スケール感に近い内容のことをやらせていただいたなと思います。一番工夫して意識した点は、モデルの汎化性能を高めたいというところで、データの分け方とか、最終的にはいくつもモデルを作った上でそれを平均するというアプローチを取ったのですが、特徴量エンジニアリングはそこそこに、汎化性能を高めることにより注力しました。
もっとこうしておけばよかったと思う点は?
データを投入して終わってしまったところがあったので、現場なら解釈性がもっと必要だと思いました。使っていないデータもあって、分析しながらデータを入れようと思ってはいたのですが、時間が足りず、できませんでした。そこが少し心残りです。他の参加者の方で自分よりも特徴量エンジニアリングをうまく作られている方が多くいました。自分はハイパーパラメータの探索がうまくいったのですが、もっと特徴量エンジニアリングをもっとがんばらなくちゃいけないなと思いましたね。
日立製作所へのイメージは変わりましたか?
正直、これまであまり知らなかったのですが、講義をして頂き業務について学んだことで、幅広い領域で開発されていらっしゃることを知りました。メンターさんから、AIについて詳しくはないけれど今後活用していきたいというクライアント企業に対して、プロジェクトを進めることの難しさや面白さといったリアルなお話を聞かせていただいてよかったです。
今後どんなハッカソンに参加してみたいですか?
スポーツ分析か、スポーツビジネス関連ですね。スポーツファンの心理とか競技データ、守備戦術を定量的に評価するとどうなのかとか。スポーツは純粋に趣味なのですが、機械学習のモチベーションにもなっています。勉強が煮詰まったときなどに、「スポーツビジネスなら、どう活かせるだろう?」と考えると、またワクワクした気持ちで勉強できます。
今後のビジョンは?
あるスポーツビジネスのイベントでパネリストの方とお話ししたとき、どんなことを分析テーマにしたらいいか聞いたら、「データ分析で何ができるのかは、言ってもらわないとわからない」と言われたんです。そのとき、「データの分析者自身が、データ分析で何ができて、それでいくらの利益が生まれるのかを伝える責任があるな」と感じました。それまではモデリングをきちんとして、データに特化した技術力だけ持っていればいいと思っていたのですが、データの活かし方まできちんとわかっていないとチャンスが狭まってしまうのだなと思いました。最終的には独り立ちして、自分一人でもビジネス的な価値を出せる人になりたいです。