インフラデータを用いた分析にチャレンジ、「Peakers Hitachi Cup 電力消費量予測ハッカソン」開催レポート

2019年9月13日、東京駅近くのダイアゴナルラン東京にて「Peaker Hitachi Cup – 電力消費量予測ハッカソン」が開催されました。日立製作所とPeakersの共同開催で、日立製作所より3名のメンター(データサイエンティスト)を迎えて行われた今回のハッカソン。26名の学生さんが課題に挑戦し、上位層の実力が拮抗する中、優勝者からは意外な解法が飛び出しました。初心者も上級者も最大限スキルを発揮して取り組んだ1日の様子をお届けします。

課題発表

今回の課題は「ヨーロッパの電力オープンデータ用いて、電力消費量を予測する」という内容でした。ヨーロッパ各国の電力消費量の合計や風力・水力など発電システム別の生産量、各国政府が作成した前日時点での予想消費量などを用いて、指定された国の電力消費量を予測します。今回は、オーストリアの電力消費量を目的変数としました。

スコアのランキングはPeakersが作成したシステム上でリアルタイムに確認することができます。また、開発環境はローカルのPCもしくはGoogle Colaboratoryでした。

ハッカソン開始

課題発表とデータ配布後は、皆さんすぐに作業に取り掛かります。今回はメンターさんと学生さんの距離が近くなるよう、双方の席を近くに配置しました。その効果もあってか、序盤から学生さんとメンターさんの交流が頻繁に行われており、ワーク中も和やかな雰囲気で作業している様子でした。普段なかなか接することができない現役のデータサイエンティストと、直接課題について議論できるのもハッカソンの大きな魅力です。

機械学習の経験が浅い学生さんは、運営側のエンジニアによるサポートのもと作業を進めていきます。今回、初心者の方も何名か参加されていましたが、みなさんメンターや他の参加者に積極的に質問してじっくり課題に取り組んでいました。ハッカソンへの参加をきっかけに機械学習に興味を持って頂けることを、運営側としては非常に嬉しく思っています。

時折会話や笑いが起きつつも、限られた時間で高スコアを出すため、集中するときは切り替えて黙々と作業していきます。参加者が一堂に会して同じ課題に取り組むオフラインのコンペティションでは、個人戦でありながら、参加者同士協力してお互いを高め合う様子も見ることができます。

ランチ

11:30ごろ、各自作業が一段落した方からランチの時間です。

日立製作所のメンター陣も、学生さんと同じテーブルに座り食事をとります。ランチの時間は課題以外の会話が多く、学生さんとメンターがお互いに気になることをフラットに質問しあっていました。メンターからは普段専攻している研究内容やそもそもなぜ機械学習に興味を持ったのか、学生さんからは担当する業務内容やデータサイエンティストの仕事の実情について、といった内容がよく話題に上がっているようでした。

中には昼食を取らずに作業を続けている学生さんもいらっしゃいました。今回は1日という短期間であることもあり、それぞれの作業ペースを考慮するため、昼食は各自で判断して好きな時間にとってもらっています。効率よく作業を進めるためには、集中する時間と、休憩する時間のメリハリをつけることも重要です。運営側も、参加者が集中して課題に取り組める環境を整えるよう、意識しています。

午後のワーク開始

ランチ終了後、ワーク再開です。午前中からメンターさんへの質問は多かったのですが、午後になると更に増えていきました。一通り自身の引き出しからアイデアを出し終え、さらなるブラッシュアップのためにメンターさんに質問しはじめるのがこの時間帯です。今回はカラム数の多いデータだったため、どのカラムを使うか、可視化はどうするかといった前処理の方法を尋ねている方がたくさんいらっしゃったようです。メンターさん自身も課題に取り組むことで、学生さんの疑問点や不明点を一緒に解決していきます。

メンターさんは各テーブルを巡回し、困っている学生がいないか常に気にかけながらサポートを行います。どんな質問にも丁寧に向き合って解説してもらえるので、わからないことがあっても、モチベーションを保ちながら課題に取り組むことができます。先述の通り初心者の方もいらっしゃったのですが「こんなことを聞いても大丈夫かな、と思うような細かいところを質問してもきちんと答えてくださり、嬉しかったです」という声もありました。初心者の方、経験者の方関係なく、今日1日いろんなアドバイスを受けながら課題を進めた事で、みなさん大きく成長されたのではないでしょうか。

序盤からワークをしていた皆さんですが、終了が近づくにつれ、会場の空気は緊迫していきました。自身の最高スコア更新に向け最後の詰めの時間です。ギリギリまで手を動かしている学生さんも多く、ほんのわずかでもスコアを上げたい、というみなさんの熱意が強く感じられました。

ワーク終了、口頭発表

ワーク終了後は、ランキング上位7名の方からどのような方法で課題にアプローチしたか、口頭での発表を行ってもらいました。大抵の場合「大したことはやってない」と皆さん言われるのですが、実際に解説を聞くと色んな工夫をしながらデータを処理し、特徴量を算出していることがわかります。

特に1位の方は、「政府が出している予測消費量の精度がある時期から上がっていることを発見し、その時期よりあとのデータだけを特徴量として用いる」というユニークな方法で大きくスコアを伸ばしていました。1位の加藤さんが優秀者インタビューでも答えていらっしゃいましたが、このひらめきはデータをしっかり観察したからこそ。発表中も会場から驚きの声が上がっていました。

解説を聞いた感想を周りの参加者の方に聞いてみると、「あの方法は知らなかったので出来なかった。次は挑戦したい」「時間がない中でよくあの手法をやろうと思ったなあと感心した。自分にはその考えが思いつかなかった」といった声がありました。同じ課題に挑戦しながらも、持っているスキルや感覚によって解決策が異なるという点も機械学習の興味深い一面です。

結果発表、表彰

ワーク終了後は上位優秀者の方の表彰を行いました!

1位 加藤 征広さん

2位 三栖 涼雅 さん 

3位 佐藤 暸 さん

4位 森澤 竣 さん

5位   竹内 尚樹 さん

左から森澤さん、三栖さん、加藤さん、佐藤さん、竹内さん

閉会式

最後にメンターの皆さんから本日の総評をいただきました。

「上位者の方はだいたいこれくらいのスコアかな、と想定していた数字よりも、はるかに高いスコアをみなさんが更新されていて驚きました。作業している姿を見ていると、どのデータを特徴量として採用するか、データの前処理に苦戦している方が多かったように思います。実際の業務でも、分析する前段階のデータを作ることに時間がかかるケースが非常に多いので、実際に近い作業してもらう事ができてよかったと思います。限られた時間の中でスコアを更新するのは難しく、作業する時間が短いと感じた方もいらっしゃったのではないでしょうか」

「機械学習の経験がない方も、少しずつ学習に慣れていけば必ずできるようになります。ある程度のスキルを身につけた後、重要になるのが想像力です。みなさんには是非想像力豊かなデータサイエンティストになってほしいと思います」

懇親会

表彰終了後は、懇親会です。今回のハッカソンではメンターさんや、学生さん同士の交流が活発に行われ、終始和やかな雰囲気が流れていました。

日立製作所の人事担当者(左)と今回1位の成績を収めた加藤さん

懇親会はメンター陣だけでなく、日立製作所の人事の方も参加されたので、今後の採用フローや、力を入れているAI事業について真剣にお話しされている様子でした。企業の方と事業内容や採用について直接お話しできる機会は限られていると思いますが、ハッカソンでは通常は聞きにくいことも気軽に質問する事が出来ます。参加された学生さんからも「会社説明会と違って、カジュアルな雰囲気で企業の方とお話できたのがよかったです」と言っていただきました。

朝から作業に没頭して大変な1日だったと思いますが、懇親会ではみなさんの楽しそうな様子をたくさん見る事が出来ました。いい成績を残すことはもちろん大事なことですが、新しい交流や、コミュニケーションの場を広げていく事も非常に重要だと考えています。みなさんにとって有意義となる交流の場を運営側も工夫しながら提供していきたいと思います。

皆さん朝から1日、ワークお疲れ様でした!

まとめ

Peakers Hitachi Cup全4回の2回目となる「Peakers Hitachi Cup – 電力消費量予測ハッカソン」は以上で無事終了となりました。序盤からメンターさんや参加学生同士が頻繁に交流し、和気藹々とした雰囲気の中で、各自協力しながら課題を進める姿が印象的でした。また初心者の方が何名かいらっしゃいましたが、皆さん不明点を自分で調べたり、メンターさんに粘り強く質問しながら何とか課題提出まで達成できていました。機械学習の経験がなく、初めてハッカソンに参加する方は不安に思うこともあると思いますが、当日はメンターさんや周りにいる学生さんにサポートしてもらいながら課題に挑戦する事で、スキルを身につける事ができると思います。今後もハッカソンや、講義形式のハンズオンを定期的に開催予定ですので、積極的に参加して頂き、スキルを身につけていって頂ければと思います!

今回の高いスコアを記録した上位3名の方にインタビューを行いました。

こちらからご覧いただけます。

1位 加藤 征広 さん

2位 三栖 涼雅 さん

3位 佐藤 瞭 さん

それぞれの取り組みについての詳細や開発にあたって気をつけたことなど、この記事では取り上げていない内容について様々な感想をいただいています。

Peakersでは、今後も様々なハッカソン・MeetUp・インターンシップを開催予定です。ここでしか体験できない学びを手に入れたい学生の皆さん、ご参加をお待ちしております!

[contact-form-7 404 "Not Found"]