Hitachi 1Day Online Competition 2020–日立製作所のトップAI研究者と学ぶ-地下道歩行者量予測- 優秀賞 伊藤大輝さん 慶應義塾大学 メディアデザイン工学
毎年好評を博している日立製作所コンペティション。本年は2020年9月26日および10月24日の二度にわたって開催され、合計50名以上の学生が参加ししのぎを削った。
本年のテーマは北海道の駅前地下歩道における利用者数予測だ。札幌駅前の地下歩道は、休日約4万人、平日約5万人と多数の観光客や通勤・通学者が利用する交通の要地である。今回のコンペティションでは、「新型コロナウイルスの感染拡大下でも地下道を安心して利用してもらうための、アプリ等による予想混雑度提供」を仮想の事業目的として設定。参加者はそのプロトタイピングと仮定して、札幌市が公開する地下道の人流データや交通機関のデータ・気象データなどから30分後の地下道利用者数を予想するモデルの構築に挑んだ。当日は、日立製作所・研究開発グループの社員の方がメンターとして参加。経験豊富で高いスキルを持つ社員たちが、参加者を手厚くサポートした。
10月24日の回で第二位に入賞したのが、慶應義塾大学の伊藤大輝さんだ。大学では、メディアデザイン工学を専攻している。データ分析を始めたのはここ1年くらいで、趣味として独学で取り組んでいる。参加するにあたって、過去に開催された日立製作所コンペティションのインタビュー記事に目を通して気合い十分で臨んだ。今回の一番の勝因は、これまでの経験が生きたことだったと語る伊藤さん。勝因の詳細や採用した手法、メンターの印象などについてインタビューした。
大学院ではどんな研究をされていますか?
メディアデザイン専攻で、データ分析はここ1年くらい趣味でやっています。よーいドンでスタートして、結果は自分次第というところが好きでハッカソンに参加しています。将来についてはまだ絞り切れていませんが、いろいろなスキルを経験のなかで磨いていけるような仕事をしたいと考えています。
今回のコンペティションの感想を聞かせてください。
やったことがないデータにとても興味があるので、今回も面白そうなデータがいじれるなと思い、参加しました。結果には正直驚いています。結構がんばれたなと思いますね。
事前準備としては、これまでに開催された日立ハッカソンのインタビューを読みました。経験値を高めることが大事だと思うので、優勝者がどんなふうに取り組んだのか、勝因を分析しました。時間制限があるハッカソンでは、ゼロからスタートして良い結果を出すのは難しいと思います。後から考えてこうすればよかったという気づきが毎回あるものなで、過去のハッカソンの記事は必ず読むようにしています。
途中でコロナ期間のデータが含まれていることに気づき、ワクワクしました。トレーニングデータとテストデータでデータが違うケースがあることは知っていたのですが、扱うのは初めてだったので、良い思考訓練になりました。
特に力を入れたのはどんなところでしたか?
今回、学習データのクロスバリデーションをするところには、結構時間をかけてしまいました。今回のデータには新型コロナウイルス感染拡大の影響があるため、今年の6月1日の値を予測をするとき、昨年の6月1日のデータを参照するとうまくいかないと考えました。そこで、どこで区切ってバリデーションすべきかいろいろ試してはみたのですが、結局あまりこだわらずおおざっぱに区切ればいいんだという結論になりました。ターゲットエンコーディングも結構やって、成果が出そうだったのですが結果的にうまくいかなかったので、反省しています。
1位の方は僕よりも前処理をもっと丁寧にやっていたので、結果はその差でしょうか。今回のような6時間のハッカソンで良い結果を出すには、前処理を高速で終わらせることと、コードのテンプレートを持っていることがポイントだと思います。その意味で、自分のこれまでの経験がかなり活かせたと思います。
メンターを担当された社員の方や、日立製作所にはどのような印象を持ちましたか。
聞けば何でもすぐ答えてくれて、とても頼もしかったです。日立製作所に対してはディスプレイやテレビの印象が強かったのですが、AI系の製品も結構扱っているんだなと印象が変わりました。
伊藤さんの今後の展望を聞かせてください。
将来は、エンターテイメント系のAIを作ってみたいです。趣味のゴルフを活かして、スイングデータを入れたら、あなたは石川遼タイプです」と分析してくれるようなAIが作れたら面白いなと。人を楽しませ、人をサポートするあり方が、幸せなAIの未来だと思います。