ソニーのソフトウェア開発、その最前線を体感せよ。センシング機械学習コンペティション開催レポート
2020年2月22日~23日、東京都品川区にあるソニー株式会社ソニーシティ大崎にて「ソニーのソフトウェア開発、その最前線を体感せよ。センシング機械学習コンペティション」が開催されました。本イベントは、同社の持つセンサーデータから行動認識のモデル構築を行う個人戦のコンペティションです。20名の学生さんたちが参加し、それぞれのスキルを発揮しました。
課題内容
ソニー株式会社の福本さんから、本日の課題の詳細について説明がありました。今回の課題は、多数ある同社のAIを用いたプロダクトの中でもLifelog™に搭載されているものと同様の行動認識モデルの構築となっています。本アプリの開発に用いられた実測データを本イベントだけのために、特別にご提供いただき、ディープラーニングをはじめとする機械学習の手法によって、その人物が「立っている」「歩いている」「電車に乗っている」といった行動認識を行います。
モデル精度の評価基準にはF値が用いられました。評価に使用するテストデータはPublicとPrivateの二つに分けられています。開催中のリーダーボードではPublicデータを用いて算出したスコアが掲示され、最終評価はPrivateデータでのスコアで行われます。また、今回は学生さんひとりひとりにAWSでの開発環境を準備しました。
メンター陣のご紹介
2日間で計3名のメンターさんに学生さんのサポートをしていただきました。2017年入社でモーションキャプチャなどの行動認識データを複合的に扱っている佐藤 哲朗さんや、2018年入社でディープラーニングのフレームワークの開発をされている八島 拓也さんといった若手で活躍されているメンターさんの参加により、学生さんも入社後のイメージが湧いたのではないでしょうか。
メンターさん以外にも、ソニー株式会社R&Dセンターからデータ分析をされている社員の方々が入れ替わりでご参加いただきました。ランチタイムにはメンターさんをはじめとする社員の皆さんが同席し、課題内容だけでなく、普段の働き方や社内の雰囲気などのお話で学生さんとのコミュニケーションをとっていました。
ワークの様子と結果
冒頭に行われた学生さんによる自己紹介では「センサーデータに挑戦するのが初めて」「コンペティションへの参加が初めて」という声もあり、配布された膨大なデータの前処理に苦戦している様子でした。ワーク終了の1時間ほど前に、データの前処理がうまくいかない学生さんに、申告制でメンターさんに作成いただいた前処理のためのスクリプトを配布し、2日目に備えてもらう形に。
2日目、ワーク開始から30分ほどで、上智大学の渡邉 拓実さんが75.59という高スコアを出し1位へ。それまでの最高スコアに30以上も差をつけることとなりました。午後からはメンターさんへ質問をしている学生さんが多くみられ、Submitも少しずつ増加傾向に。依然として1位は渡邉さんですが、2位の東京理科大学 米川 和仁さんが自身のスコアを40台から50台に更新し、じわじわと差を詰める様子もみられました。ワーク終了間際には「時間が足りない」という声も聞こえ、急遽少しだけ時間を延長。難しい課題に対してほとんどの方が短期間で最終Submitを完了させていました。
最終的な結果は以下の通りです。※括弧内はPrivateデータでのスコアになります。
1位 渡邉 拓実さん(76.8)
2位 米川 和仁さん(54.25)
3位 宗像 佑弥さん(50.46)
4位 侭田 直也さん(45.73)
5位 今川 敦博さん(39.37)
1位の渡邉さんが2位以下に20以上の差をつけて優勝となりました。渡邉さんは「計653個の特徴量生成をして、LightGBMで5-fold CVで分類しました」とおっしゃっていました。センサーデータの扱いに慣れていた点やノイズ消去などの前処理が適切だった点が他の参加者と大きな違いとなり、口頭発表後には他の学生さんから「非常に参考になった」という声が。入賞者には、ソニー株式会社から、ポータブルスピーカーやワイヤレスヘッドセットといった豪華賞品が贈呈されました。
また、特別賞として東京大学 鎌田 啓路さんが表彰されました。多くの方が短期間で精度をあげるため学習に時間がかからないモデルを作成していたのに対し、鎌田さんはディープラーニングを使ったアプローチにチャレンジ。ソニーの小林さんからは、「今回のコンペに勝つことを考えると、短時間で成果が出る従来型のモデルを作るのは非常に正しく、入賞者のみなさんはもちろん素晴らしい。ただ、このデータで製品レベルに精度を上げるにはディープラーニングを使う必要があり、かつ実際のモデルでもディープラーニングを用いていることから、環境や時間の制約がある中でそこに挑戦し一定の精度を達成した鎌田さんを特別賞に選んだ」との説明がありました。
上位入賞者3名へ行ったインタビューも後日掲載予定です。
総評・懇親会
ソニーの福本さん、小林さんより、今回の総評をお話いただきました。1日目に課題解説もしていただいた福本さんからは「電車やバスなどの乗り物での移動には加速度センサーにさほど違いが出ないため、周波数などに着目するとさらに精度が上がったのではないかと思います。また、乗り物移動の前後には停止や徒歩があるため、それらをフレーム化して考えていた学生さんの着眼点が非常に良かったです。」とのことでした。小林さんからは「皆さん2日間でこれほどの成果を出していて本当にすごいと思います。実際に企業でデータサイエンティストのような仕事に就くと、いきなり見ず知らずのデータを渡されて加工するところから始まるので、今回はかなり実務に近い内容だったと思います。データサイエンティストは、プログラミング能力だけでなく、データを理解する力やモデルを組み立てる力など総合的な力が必要なので、様々なことに挑戦して経験を積んでいって欲しいです。」とのことでした。
懇親会には、メンターさんを初めソニーの技術部門の方や人事の方など、多くの社員さんにご参加いただきました。学生さんにとってはいろいろな方からお話を聞くことのできる良い機会になったのではないでしょうか。また、1位の渡邉さんのところにお話を聞きに行く学生さんも見られました。今回初めてコンペティションに参加する学生さんもいらっしゃったので、新たなコミュニティが広がるきっかけになれば嬉しい限りです。ケータリングも豊富に用意していただき、2日間のワークで力を出し切った学生さんたちの楽しそうな姿が多々見られました。
まとめ
実務に非常に近い課題で開催した今回のコンペティション。前処理に時間がかかり、思うように学習が進まなかった学生さんもいらっしゃいましたが、多くの学生さんから「非常に勉強になった」との声をいただきました。2日間という短期間で非常に高いスコアを出した渡邉さんの口頭発表には、とても参考になったという意見が多数寄せられており、コンペティションという場ならではの学びがあった学生さんも多かったのではないかと思います。
Peakersでは、今後も様々なハッカソン・MeetUp・インターンシップを開催予定です。ここでしか体験できない学びを手に入れたい学生の皆さん、ご参加をお待ちしております。