機械学習×消費! マネーフォワードチーム戦コンペティション優勝チームインタビュー 阿部さん 金子さん 韓さん

2020年2月8日〜9日、株式会社マネーフォワードとPeakersの共催で「機械学習の力で『お金をもっと前へ』。950万ユーザー超え家計簿アプリのマネーフォワード主催・オフラインコンペティション!」が開催された。今回の課題は、数値およびテキストデータを含むテーブルデータの二値分類タスクだ。参加者は22名、1チーム3人の計7チームに分かれ、データの解読、分析、口頭発表を行った。同社主催のコンペティションは2019年9月にも1度開催しているが、今回はさらに課題の難易度が上がっている。

 2019年9月 マネーフォワード社のコンペティション開催レポート

提供データは、数値やテキストデータが含まれたテーブルデータであり、同社が実際に使用しているデータをもとに、同じ特徴を持つダミーデータとしてコンペティション用に生成したものである。そのため、参加者にとってはより現場での実務に近いデータで自分自身のスキルを試すことができるワークとなっている。当日はデータに知見のある4名のメンターが参加し、万全のサポート体制で行われた。

前述の通り難易度の高い課題であったが、機械学習の経験が豊富な学生が多数参加。それぞれ役割分担し、チーム内で補完し合う様子が見られ、ハイレベルなコンペティションとなった。

2日間のワークで何度もスコアボードが更新され、7チームで切磋琢磨する中、最終Submitで51.68という高スコアを提出し優勝となったのはチーム3。序盤からメンター陣に何度も質問し、データへの理解を深めようとしていた点が特徴的であった。メンバー3名がそれぞれ作成したモデルをアンサンブル学習させたことがスコア向上に繋がった。中でもBERTを用いた阿部さんは、アカウント情報とアクセス情報をそれぞれ有料会員登録前後でわけた4つのテーブルを作成し、特徴量を1000個作成。そこから削減していくというアプローチを行い、参加者からは驚きの声と有用だった特徴量やモデルへのインプット方法について多くの質問が挙がった。全員の高いスキルを集結させて優勝を勝ち取ったチーム3、その3名にインタビューを行った。メンバーは次の通り。

阿部 佑樹さん:慶應義塾大学大学院理工学研究科 修士1年

金子 明広さん:東京理科大学大学院理学研究科 修士1年

韓 健煕さん:上智大学国際教養学部 2年

左から:韓さん、阿部さん、金子さん

現在の専攻と将来の夢を教えてください。

阿部さん:大学院では、GANの画像生成以外への転用を研究しています。将来はデータサイエンティストとして、人々の生活にプラスの価値を提供するようなビジネスにコミットしたいと考えています。

金子さん:複雑ネットワークを研究しています。人間関係を行列で表し、それを分析することでネットワークの中にコミュニティがいくつあるか推定するという研究です。将来は、企業で数学の知見を活かす仕事をしたいです。アクチュアリーにも興味を持っています。

韓さん:国際教養学部2年在学中で、今後は計量経済学の研究室に入る予定です。予測モデリングの考え方に惹かれて、機械学習と統計学に関心を持ちました。将来はデータサイエンティストなどで、課題解決という目的のもと、知見やスキルを活かす仕事をしてみたいです。

今回のハッカソンに参加した理由は?

韓さん:オンラインコンペでは得られない、短期間で効率的なアプローチができる力を身に付けたいと思い、参加しました。

阿部さん:僕もそうですね。長期間にわたるオンラインコンペでは身につかない直感力を磨きたいと思いました。

金子さん:普段の研究ではやっていない分野なので大丈夫だかなと少し心配でしたが、良い仲間に恵まれて、自分がやりたかったことは全部できたかなと思います。自分で数字を出して結果を出していく過程が面白くて、2日間ずっと楽しかったです。

今回の勝因はなんだと思いますか?

阿部さん:この1年Kaggleなどで培ってきた知見をうまく活かせたのが良かったと思います。ログデータを扱ったコンペにも出ていたので、経験が役に立ちました。他のチームと違ったのは役割分担でしょうか。他のチームは役割分担を明確にして1つのモデルを全員で実行するというやり方でしたが、僕たちは三者三様のやり方で臨みました。この方が短期間で精度を上げられると思ったからです。

金子さん:僕はXGBoost、阿部さんはLightGBMとCatBoostとBERT、韓さんはLightGBMを使いました。

韓さん:2人は同じデータで違うモデル、2人は同じモデルで違うデータを使い、多様性のある取り組みをしたのが結果につながったと思います。

他のチームを見て、すごいなと思ったのは?

金子さん:別チームの友人が自分の専門である自然言語処理の手法を応用して取り組んでいて、すごいなと感心しました。

韓さん:いろいろなやり方を見て勉強になりました。最後にメンターさんが発表していたConvolutional Neural Networkも、今回のようなデータではほぼ使わないので独創的だなと思いました。

今回のハッカソンはどのような経験になりましたか?

阿部さん:オフラインコンペならではの大きな学びが得られました。限られた時間の中でデータを素早く理解し、事前に準備しておいたコードをスピーディに検証するなど実戦力が磨かれたと思います。

金子さん:ビジネスの現場ではどんなサイクル、どんなスピード感で課題に取り組むかを肌で感じることができました。

韓さん:やるべきことの優先順位のつけ方を確認できました。チームの仲間から知見を共有してもらえたことも大きな成果だったと思います。

マネーフォワード社のメンターさんに対しては、どのような感想を持ちましたか?

阿部さん:僕はおそらく質問数トップ1だったと思います(笑)。とてもフレンドリーに明確に教えていただき、学生に対する温かい気持ちを感じました。きちんと根拠を持って評価するなど、実際に社会で仕事をされている方ならではの深い洞察力はぜひ学びたいと思いました。

韓さん:提供していただいたデータのきれいさ、扱いやすさを見ても時間をかけて準備してくださったことがわかり、今回のハッカソンと学生に対する思いを感じました。

金子さん:作業に集中していてあまり質問しなかったのですが、僕のことをちゃんと覚えてくれて声をかけてくれたのが嬉しかったです。

[contact-form-7 404 "Not Found"]