Peakers Hitachi Cup – 不良品検知コンペハッカソン 最優秀賞 古田 陸太 さん- 東京大学 工学部電子情報工学科

2019年9月初頭、Peakers Hitachi Cup が行われた。今回は、製品を検品するセンサーからのデータを用いて、不良品を推定するという課題が与えられた。個人戦のコンペティションという形式で、各自様々な方法でデータにアプローチし、高スコアを目指して分析を進めていく。日立製作所からは4名がメンターとして参加し、学生の疑問を解決し、アドバイスする形でサポート。参加者は社員の方と交流を持ちながら、課題を進めることができた。約5時間のワークの末、審査を行い、成績を発表。スコアが高かった参加者には、どのような手法で分析を進めたか、口頭発表をしてもらった。今回はその中でも特にスコアが高かった、上位3名の優秀者にインタビューを行った。

今回のハッカソンで最も高いスコアを叩き出した古田さん。普段は東京大学工学部の電子情報工学科でサイバーセキュリティーの研究をしているという。実はデータ分析についてはほぼ独学だというから驚きだ。自由に楽しく分析したいという古田さんだが、今回のハッカソンではどのように戦ったのか。

ハッカソンに参加してみていかがでしたか?

ハッカソンへの参加は3回目くらいです。今回のハッカソンは面白そうなテーマだなと感じて参加しましたが、いやー、難しかったですね。みなさん、苦戦されていました。

工場のセンサー値をもとに不良品を検知するというものだったのですが、そもそもセンサーがそんなものを取っているのか?というところからスタートして。不良品センサーがあるわけではないので、「長さが1mm違ったらどうなのか?」など、あれこれ考えだすとキリがありませんでした。 今回は正解データをある程度知ることができ、それで調整しながらできたので、なんとか最後にはハイスコアを出すことができました。総合的には、さほど時間はかからなかったと思います。ただ、あれ以上もう自分のスコアは伸びなかったと思うので、これが1日ではなく3日間ハッカソンだったら、最終日で抜かされていたかもしれません。

好成績を収めましたがどのような工夫をしましたか?

今回の勝因は、まちがいなく主成分分析(PCA)です。これで不要な成分を全部削ったのが一番効きました。この方法を見つけたのは、本当に偶然ですね。たまたまハマったという感じです。

データ量が少ないというのは、基本的には大変で面倒な要因になるのですが、逆にやりやすかったともいえます。処理に時間がかからなかったので、考えた方法は全部試せましたから。1手法10分かかっていたら、たぶん終わってなかったと思います。1手法1分かかるかかからないかくらいで回せたので、思う手法は全部試せました。

今後のビジョンを教えてください

今後は大学院への進学を考えています。何を専門にするかはまだ未定ですが、勉強する中で自分がフォーカスしたいものが見つかればいいなと思います。機械学習を主題にする予定はないですが、世の中的になくてはならないものにまで広まってきているので、何らかの形で関わり続けていくとは思います。いずれは、自分のTwitterのデータとか、自分で収集したデータの分析をしてみたいですね。

終了後の懇親会では、AutoMLというGoogleのサービスですごく盛り上がりました。かつては敷居が高かった機械学習も、ここ数年で自学自習の私でもパソコン1台で使えるような時代になっています。今後もっと広まって、直感、経験、勘ではなく、データで判断できる世の中になればと期待しています。

[contact-form-7 404 "Not Found"]