Peakers Hitachi Cup – 不良品検知コンペハッカソン 最優秀賞 原 和希さん- 筑波大学 システム情報工学研究科 リスク工学専攻
2019年9月初頭、Peakers Hitachi Cup が行われた。今回は、製品を検品するセンサーからのデータを用いて、不良品を推定するという課題が与えられた。個人戦のコンペティションという形式で、各自様々な方法でデータにアプローチし、高スコアを目指して分析を進めていく。日立製作所からは4名がメンターとして参加し、学生の疑問を解決し、アドバイスする形でサポート。参加者は社員の方と交流を持ちながら、課題を進めることができた。約5時間のワークの末、審査を行い、成績を発表。スコアが高かった参加者には、どのような手法で分析を進めたか、口頭発表をしてもらった。今回はその中でも特にスコアが高かった、上位3名の優秀者にインタビューを行った。
今回のハッカソンで3位入賞を果たした原さん。普段は筑波大学の大学院で、機械学習を用いて攻撃検知などを行うサイバーセキュリティの研究をしている。ワーク中も自分のペースで黙々と作業を行う様子が印象的だった原さんだが、今回のハッカソンではどのような印象を持ったのか。
ハッカソンに参加してみていかがでしたか?
オンラインのコンペにはよく参加していますが、データサイエンス系ハッカソンへの参加は、今回が初めてでした。今回は、自分が興味持っているデータサイエンス系であることと、日立製作所さんのハッカソンであるという点に惹かれて参加を決めました。
内容は、結構難しかったですね。最初はちょっと面食らいましたが、これまでの経験を生かしていつも通りにやればいいかなと思い直し、時間をかけて少しずつ、計画を立ててこなしていったことで、最終的にうまくいったのかなと思います。普段から研究で失敗して改善して…を繰り返すことに慣れているせいか、諦めずにチャレンジすることができました。
どのような手法で課題にアプローチしましたか?
今回は、データの偏りが大きいというのが特徴的でした。ただ、日頃から使えるデータが少ない分野を研究しているので、どんなアプローチをすればいいか知っていたのは大きかったですね。
センサーから取ったデータなので欠損している値があり、それをどう扱うか考えるのに時間がかかりました。そのままでは扱えないので、別の数字に置き換えたりし、平均に置き換えたり、いっそ使わないという選択肢も視野に入れながら分析を進めました。
一番気を使った点は、今回のデータにはどういうパラメーターが適しているのかという探索です。どんなデータを扱う場合でも、データの加工とパラメータの調整を重視するのが私のやり方です。じっくり時間をかけて計算資源をたっぷり使って、数学的なアプローチや最適化の手法を使って探索していくことが重要だと思っています。
日立製作所にはどのような印象を持ちましたか?
参加してみて、日立製作所さんに対するイメージがガラリと変わりました。社会インフラを担っている会社というイメージが強かったのですが、データサイエンスにも力を入れているのだと実感しました。社会インフラから得られる膨大なデータを活用できる基盤を持っているという点で、大きな魅力を感じる企業だと思います。
今後のビジョンを教えてください
データを分析して結果を出すことがとても好きなので、将来はサイバーセキュリティの課題を機械学習で解決できるエンジニアになりたいです。自分のやっていることが社会に貢献につながる仕事は、とてもやりがいがあると思います。データを保有する基盤を持っていて大規模なサービスができる会社で、ぜひ活躍してみたいです。