Peakers Hitachi Cup – 電力消費量予測ハッカソン- 優秀賞 佐藤 瞭さん– 東京大学 工学部 計数工学科 数理情報工学コース

2019年9月13日、株式会社日立製作所とPeakersの共同開催でPeakers Hitachi Cup – 電気消費量予測ハッカソン- が行われた。今回の課題は、ヨーロッパの電力データを用いて、消費量の予測を行うというもの。個人戦のコンペティションという形式で、各自データにどのような処理を施すか吟味しながら、様々な手法で高スコアを目指して分析を進めていく。日立製作所からは3名のメンターが参加し、学生からの疑問や質問に対してアドバイスする形でサポート。約5時間のワークの末、審査を行い、成績を発表。今回は特にスコアが高かった、上位3名の優秀者にインタビューを行った。

東京大学の工学部、計数工学科に所属している佐藤さん。機械学習の理論をきちんと習得したいという思いが強く、今後は機械学習の応用研究を行う研究室に行く予定だという。今回のハッカソンではどのようなアプローチで課題に挑戦したのか。

これまでのご経歴を教えてください

工学部の計数工学科で学んでいます。機械学習の理論をきちんと納得したいという思いが強く、今後は機械学習の応用研究をやっている研究室で学ぶ予定です。ハッカソンへの参加は3回目。これまで時系列のデータを扱った経験がなかったので、今回の問題は面白かったですね。

ハッカソンに参加してみて、いかがでしたか?

想像以上の楽しさでした。メンターの方と話すのがとても楽しかったです。知識も経験もある方に手法の話だけでなく深い理論の話をたくさん聞けて、大きな刺激を受けました。今後のモチベーションにもつながった気がします。

今回のハッカソンで、特にうまくいったなと思うところを教えてください

時間がないわりには試行錯誤もある程度できて、結果を出せたと思います。1日の電気の使用量の周期性に注目して前処理をしました。モデルを変えながら試すところまではできなかったのですが、1種類のモデルで精度を上げることに注力したのは、他の方も同じだったと思います。7位くらいまではほぼみなさん同じモデルだったので、差がついたのは前処理とか、パラメーターチューニングといった個人のスキルによるところが大きかったのではないかと思います。

逆に、残念だったところはありますか?

時間があればディープラーニングとのアンサンブルを試してみたかったですね。何度もやろうとしたのですが、結局できませんでした。ディープラーニングだけでスコアを出していた方もいたので、できていれば良い結果になったかなと思います。1位、2位の方で差がついたのは特徴量の出し方だと思います。どういう処理をしたらモデルの精度を高められるのか、データをちゃんと見て、思いつくかどうかが勝負だと思います。やはり、データを最初にしっかり見ることは大事だと思います。

今後は機械学習に対してどのように取り組んでいきたいですか?

今回、みなさん同じLight GBMを使っていたのにスコアが違ったので、問題は手法ではなく、その前段階でどこまで考えられるかが勝負なのだと思います。そこで差をつけるためには、実装だけでなく、理論もきちんとわかっていないといけないなと実感しました。これからは技術を身につけるとともに、根っこにある理論もきちんと勉強して実力を高めていきたいです。

[contact-form-7 404 "Not Found"]