データ分析×消費! 家計簿アプリのマネーフォワードが初主催・オフラインコンペハッカソン開催レポート

 2019年9月21日〜22日、東京都港区の株式会社マネーフォワード本社にて、「データ分析×消費!マネーフォワード主催・オフラインコンペハッカソン」が開催されました。本イベントは、与えられた機械学習の課題に対してモデル精度を競い合う個人戦のコンペティション。16名の学生さんたちがそれぞれのスキルを最大限に発揮ししのぎを削りました。

課題内容〜自然言語処理の知識も求められる高難度のタスク

今回の課題は、数値およびテキストを含むデータの多クラス分類(詳細は非公開)。マネーフォワード社で実際に取り組まれているタスクに近い課題で、数値の分析はもちろん自然言語処理のスキルも求められる難易度の高いものでした。データと課題の詳細は当日発表だったため、特に自然言語処理の経験がない方はかなり苦戦されたようです。

多様なバックボーンをもつメンター陣が参加

参加者のみなさんを手厚くサポートしたのが、マネーフォワード社のメンター陣です。今回は同社の研究機関「Money Forward Lab」の所長である北岸 郁雄さんや、同ラボの技術顧問を務める自然言語処理の第一人者・関根聡さんなどマネーフォワード社の技術部門を代表する方々が参加しました。

当日のサポートでは同社の子会社であるMF KESSAI株式会社・山内健太さんによる解説が特に好評でした。山内さんはデータサイエンティスト協会でセミナーの講師も務める実力派。2日目の開始時には1日目の振り返りとして困っている学生さんへのヒントおよびさらなるスコアアップを目指す方法などを提示し、自身で作成したモデルの概要を説明しました。「簡単に作った」と語りながらその時点での最上位となり、参加者の皆さんを驚かせました。

ひらめきが雌雄を決した、実力者同士の争い

コンペティション本編は、予想外の自然言語処理を求められたこともあり、1日目は長い間先述のメンターさんが正解率(Accuracy)0.603で1位という状態に。停滞が続きましたが、1日目の終了1時間前に鈴木広人さんがそれを大きく上回る0.747でランキングを動かしました。2日目の午後には1位の方に追随して複数の学生さんがスコアを大きく更新し、「このスコアを大きく上回ってほしい」というメンターさんの期待通りのハイレベルな戦いとなりました。

最終的な順位は下記の通りです!

1位 鈴木広人さん(正解率0.7475)

2位 森澤竣さん​(正解率0.7429)

3位 佐藤瞭さん(正解率0.7126)

なんと1位の鈴木さんと2位の森澤さんの差はほんのわずか。2日目に森澤さんの猛追がありながらも鈴木さんが逃げ切り、そのまま1位を獲得した結果となりました。上位3名とも分析手法はLinear SVCを利用していましたが、メンター山内さんによると「アルゴリズムに対するインプットの仕方で差がついた」とのことでした。その後、最優秀賞の鈴木さんには全体に向けて手法の解説も行なっていただきました。参加者の誰も思いつかなかった方法に会場では「その手があったか」というような、悔しげな表情をする方も。自分では思いつかなかった新たな学びを得られるのも、コンペティションに参加する醍醐味だと思います。

また、今回は1〜3位入賞のほかに、Money Forward Lab技術顧問の関根聡さんが選出する「関根賞」が用意されていました。ワーク終了後、参加者の皆さんに専用のSlackチャンネルにて自身のモデル作成手順を投稿していただき、関根さんが特に興味深く創意工夫を凝らしていると感じた方に贈られる賞です。

審査の結果、なんと2位の森澤さんがダブル受賞。基本的な手順を押さえるのはもちろんのこと、テキストを含むカラムにおいて値の特徴を細かく観察した上で前処理を行なった点が大きく評価されました。

上位入賞者2名とメンター山内さんへのインタビューはこちらからご覧いただけます。

最優秀賞学生インタビュー 鈴木広人さん
優秀賞学生インタビュー 森澤竣さん
メンターインタビュー 山内健太さん

入賞者の方には工夫した点やもっと改善できた点、メンターさんには上位入賞のポイントなどをお伺いしています。

総評・懇親会

 総評ではメンターの方それぞれから労いの言葉やアドバイスをいただきました。2日目開始時に解説を行っていただいた山内さんは、総評として誰もチャレンジしていなかったディープラーニングにあえて挑戦したモデルを披露。「未来において大きく変化しうる特徴量を使うと将来対応できないので、それ以外(今回の場合はテキストを含むカラム)だけで学習させる」という一つ進んだ視点が大変興味深い解説でした。

ワーク後の懇親会ではみなさん大盛り上がりでした! 参加者の方同士ではもちろんメンターさんと参加者の方との交流も深く、今回の課題についてどうすればもっと精度が上がったのかというお話はじめを将来的にデータサイエンティストや機械学習エンジニアとしてどのようなキャリアを描けば良いのかといったお話まで、様々な会話に花が咲いていました。予定の時間となっても盛り上がりが収まらず、懇親会は少し延長。皆さんの楽しそうな表情をたくさん見ることができました。

まとめ

1日目まではなかなか成果が出ない方も多かった今回のハッカソン。ですが最終的には多くの方が順調にスコアを伸ばし、メンターさんも驚く結果となりました。

マネーフォワード社の方々の丁寧なメンタリングで、大きく成長できた方も多かったのではないかと思います。また、今後はテキストを含むタスクの場合はその旨を応募要綱に明記するなど、参加者の方のスキルと課題が大きく離れることがないように努めてまいります。

マネーフォワード社では、2020年2月にもコンペティションを開催予定です!

課題も新たにチーム戦となり、さらにパワーアップした内容となっておりますので、ご興味のある方は是非ご応募をお願いいたします。

機械学習の力で「お金をもっと前へ」。900万ユーザー超え家計簿アプリのマネーフォワード主催・オフラインコンペティション!

[contact-form-7 404 "Not Found"]