精度数%を競う白熱の2日間! 学生限定2Dayデータ分析ハッカソン「Peakers Academy Gunosy Cup」レポート

2019年5月25日〜26日の二日間、六本木・株式会社Gunosyのオフィスにて「Peakers Academy Gunosy Cup〜学生限定2Dayデータ分析ハッカソン」が開催されました!

株式会社Gunosyから5名のメンターを迎え、17名の学生さんたちが個人対抗のスコアアタックに挑んだ今回のイベント。白熱した2日間の様子をレポートします。

1日目:課題発表

今回の課題は「グノシー」のアプリ(https://gunosy.co.jp/service/)で配信されているメディア記事のデータから、記事とメディアIDの組み合わせを推定するというものでした。

記事のタイトルや冒頭部分などを用いて、記事がどのメディアから配信されたものなのかを推定する自然言語処理系の課題です。導き出した組み合わせの正解率がスコア化され、そのスコアで順位を競います。

今回の評価はデータ分析コンペティションプラットフォーム「Kaggle」で用いられる方式と同様のものでした。データを「Public」「Private」の二つに分け、作業中に提示されるのはPublicでの正解率ですが、最終的な評価はPrivateの正解率で行われます。
つまり、Publicのデータだけで高スコアを出しても最終的な評価は大きく下がる可能性があるため、どんなデータに対しても高い精度を保てるモデルを作成する必要があります。
また、作業環境はGoogle Colaboratoryでした。

1日目:ハッカソン開始

課題発表の後、課題データとチュートリアルが配布され、11時ごろからハッカソン本編がスタート。会場であるGunosyオフィスに、すぐに緊張感のある空気が漂い始めます。

「まずはみんなデータを精査して、どんな方針でモデルを作っていくか考えます」(メンターの桾澤さん)とのことで、確かに皆さんデータから要素を抽出したり、チュートリアルの手順を試して方策を練ったりしていらっしゃるようでした。

開始40分後には、早速チュートリアル以外でのスコア更新が!
その後も、ランチまでのたった1時間の間に続々とスコアが更新され、これからの2日間の熾烈さを予感させました。

1日目:ランチ

ランチタイムにはお弁当が配られました。ワーク中の張り詰めた空気も少し緩み、しばしの休憩時間です。

各テーブルにメンター陣が加わり、普段の専攻・開発内容や将来のキャリアなどについて和気藹々とした会話が起きていました。

1日目:講義〜午後のワーク

午後のワークがスタートするとまず、メンターの桾澤さんからこの課題を解くためのヒントとなる短い講義が行われました。

今回「普段は別の分野のデータ分析をやっていて、自然言語処理は初めて」という参加者の方も多くいらっしゃいました。ですが、先ほどのチュートリアルやこうした講義・また何よりメンターによるサポートのおかげで初めての方もスコアを出すことができ、一人ではなかなか体験できない新たな学びの機会になったとのことでした。

午後はさらに皆さんの集中度が増加していきます。途中おやつ休憩を挟みながら、会場は常にほとんど無音の状態でした。最高スコアも順調に上がっていき、1日目の終了30分前には正解率90%台に突入。最終的には1日目のうちに参加者全員がチュートリアル以上のスコアを出す独自モデルを作成・提出していました。メンター陣からも「この時点で全員モデル提出できているのはとても優秀、スコア上昇も早い!」と驚きのコメントがありました。

2日目:解説〜午前のワーク

2日目もまずはメンターの桾澤さんによる解説からスタートしました。今回は1日目の提出内容を踏まえたつまづきやすいポイントの解説、また最終スコアの算出方法についての講義でした。

ワーク開始後、数分で79%→91.6%という大幅なスコアアップが。あとでお話を伺ったところ、多くの方が1日目の終了後から2日目開始までの間に対策を練っていたようです。その後ランチの時間までは活発なスコア更新が続きました。

2日目:ランチ

ワークの終了が近づき、2日目のランチは1日目とはまた違った雰囲気でした。皆さんお弁当を食べながらでも開発を進め、会話の内容は主に分析のための情報交換に。メンターへの質問も活発に行われていました。

2日目:ラストスパート

午後のワークに差し掛かるとスコア更新は停滞気味になりました。メンターによると、一通りの手はずを尽くしたため今一度データを精査して新たな突破口を探している方が多いとのことでした。

参加者の皆さんの顔にも疲れが見え始めます。今回はハッカソンへの参加経験があまりない方が多く、1日目から合計して12時間以上ワークしているため「限界が近づいてきた」という声も。

長い膠着状態が続く中、ついに95%台へ突入するスコア更新が! 長い間静かだった会場が少しざわつき、あちこちで打開策を求める会話が起き始めます。中でも入賞圏内の上位陣が意見交換をする様子は印象的でした。
ライバルに対してもオープンマインドで技術を共有しお互いにより良い結果を残そうとする姿には、ハッカソンという競技の場だけにとらわれない強い向上心を感じました。

終了1時間前、暫定1位だった小日方さんがスコアを更新。終了10分前にもさらにスコアを伸ばし、1位のまま正解率96%を達成したところでワーク時間は終了しました。

小日方さんが96%を出した際には、周囲の参加者たちからも大きな声が上がっていました。

2日目:結果発表&表彰式

ワーク終了後、メンター陣は先述したPrivateでの最終スコア算出およびソースコードのチェックのため別室へ。その間Gunosy VPoEの加藤さんから、事業説明等が行われました。

そして、お待ちかねの結果発表! 最終的な順位は以下の通りです。

1位 大日方 孝輝 さん
2位 樋口 心 さん
3位 長澤 駿太 さん
4位 岡本 大河 さん
5位 宮澤 一矢 さん

Privateスコアでの大きな変動はなく、概ね終了時の順位どおりとなりました。入賞者の皆様にはそれぞれ賞金や賞品が進呈され、上位3名には後ほどインタビューも行われました。

メンターによる総評では「上位の方々は、取り組み方がそれぞれ大きく違っていました。今回の課題では『入稿時間』を特徴量として利用するのがスタンダードな方法ですが、その点に気づいてスコアを伸ばしている方もいれば深層学習でのアプローチをしている方もいて、我々メンターとしてもソースを見ていて学びがありました」と、今回のハッカソンの全体的なレベルの高さが感じられるコメントがありました。

その後課題に対する模範的なモデル作りの解説が行われ、長丁場の疲れもある中参加者の皆さんは真剣に聞き入っていました。この後の懇親会でも「最後の解説がとても勉強になった」という声が多く、皆さん大きな学びがあったようです。

2日目:懇親会

閉会式後はピザとお寿司が到着し懇親会が行われました。先程までの真剣な表情と静けさから一転、どのテーブルも笑い声が絶えずとても盛り上がっていました!

特に上位3名の周りには常に人だかりができており、今回どのようにして高いスコアを出したかについて盛んに情報交換が行われていました。また、メンターと参加者との間でも会話が途切れず、今後のキャリアについてアドバイスを受けている方も。

終了予定時間を過ぎても盛り上がりが収まらなかったため、結局30分後ろ倒しての閉会となりました。

まとめ

個人対抗戦ということもあり、終始静かで緊張感のある空気の中行われた今回のハッカソン。それぞれが課題と真正面から向き合い、少しでもスコアを上昇させるために試行錯誤を繰り返していました。また、優勝者の決まる大会ではありますが、参加者の皆さんがオープンマインドに積極的な意見交換をし、今回のハッカソンの枠にとらわれず切磋琢磨されている様子が大変印象的でした。

懇親会では打って変わって、メンターも含めた深く熱い交流がなされ、同じ分野で開発を行う仲間や先輩たちとの新たな出会いを皆さんとても楽しんでいらっしゃいました。

今回上位入賞を果たした皆さんのインタビューはこちらからご覧いただけます。

1位 大日方 孝輝 さん
2位 樋口 心 さん
3位 長澤 駿太 さん

それぞれの取り組みについての詳細や開発にあたって気をつけたことなど、この記事では取り上げていない内容について様々な感想をいただいています。
(メンターインタビューも後日追加予定です!)

Peakersでは、今後も様々なハッカソン・MeetUp・インターンシップを開催予定です。ここでしか体験できない学びを手に入れたい学生の皆さん、ご参加をお待ちしております!

[contact-form-7 404 "Not Found"]