データ分析×消費! マネーフォワード主催オフラインコンペハッカソン- メンターインタビュー エンジニア 山内 健太さん
2019年9月21日〜22日、東京都港区の株式会社マネーフォワード本社にて、「データ分析×消費! マネーフォワード主催・オフラインコンペハッカソン」が行われた。
本イベントは個人戦の機械学習コンペティション。個人向け家計簿アプリや法人向けバックオフィスのクラウドサービスで著名なマネーフォワード社が、Peakersとの共同で初主催した学生向けハッカソンである。参加者は同社提供のデータを用いて多クラス分類の課題に取り組んだ。
マネーフォワード社からは、同社の研究機関「Money Forward Lab」の所長である北岸 郁雄氏、同Labの技術顧問を務める自然言語処理の第一人者・関根 聡氏やアカウントアグリケーション本部の本部長で今回のデータ背景を詳しく知る内波 生一氏など、様々なバックグラウンドを持つ方が参加者のサポートにあたった。
本ハッカソンにメンターの一員として参加した、マネーフォワードのグループ会社MF KESSAI株式会社の社員である山内 健太さん。山内さんはMF KESSAIにて与信モデルの構築をはじめとしたデータ分析全般を担う傍ら、データサイエンティスト協会で養成講座の講師や学生向け冊子の作成などを行なっている。本ハッカソンでも2日目の開始時と総評時の解説で参加者の学びを支援し、「簡単に作った」というモデルでリーダーボード上位に食い込んで参加者たちを驚かせた。オープンマインドな姿勢で開催中も参加者から非常に頼られ、熱意溢れる山内さんに今回の感想などを伺った。
2日間学生さんの取り組みを見ていていかがでしたか?
基礎的なことを理解している方が多く、ほぼノーヒントでサンプルコードも渡さず、リードだけポンと話せば自分でどんどん形にしていったので、優秀な方が集まっているなぁと感じました。質問に来てくれる方もたくさんいたんですけど、「わからないから道しるべを教えてください」というのではなく、「こうしたいんだけれど、どこをどうすればいいのか」とやりたいことを明確にして質問してくる方が多いのが印象的でした。
どんな学生さんが多かったですか?
自分が学生だった頃と比べると、データ分析に意識的に取り組んでいる学生さんが多いんだなという実感です。ちょっとヒントを与えただけでインプットからアウトプットまで自力できて、全員が一度は自力でサブミットできていました。想像以上に自己研鑽できる方たちが集まっている印象でした。
印象深い学生さんはいましたか?
最後に種明かし的に「性別や金額で仕訳先を決めちゃいけないよね」という話をしたんですが、実は上位に入っていた方は前日のうちに、「あれを入れても精度上がらないですよね」と自分でやって気づいて報告してくれてたんです。こちらでも意図していなかったことに気づいてくれたのが嬉しかったですね。
今回入賞された方は、どこが良かったのでしょうか?
結果的にテキスト情報を含むカラムが予測に大きく寄与していたので、一般的な前処理がどうというよりは、テキスト情報の処理とアルゴリズムの選択によって順位が決まったように思います。LinearSVCという他の人が使ってこなかったアルゴリズムを使った方が大きく精度が出た感じですね。1位、2位、3位の方は、アルゴリズムは変わりませんでした。ただ、テキスト情報の前処理の仕方がみなさん違っていたので、そこで差がついたかなと思います。
今回のハッカソンで、どんなものが得られましたか?
今回の分類タスクは、会社として「いつかやらなきゃ」と思いつつ取り組んでこなかったものなんですね。誰もやったことがないので、どれだけ精度が出るか事前にわかりませんでした。それを学生さんに今回やっていただいて、精度の目安が得られたというのは大きな収穫でした。
一緒に働きたいと思う学生さんはいましたか?
ぜひ、みなさんに入社していただきたいです!今回の学生さんのように、ヒントをあげれば自分で調べて結果に結びつけていけるような方は大歓迎です。
2日間がんばってきた学生さんにひと言お願いします。
本当によくやってくれました。ビジネスでしか学べないことは、働くようになってから学べばいいと思っているので、今はビジネスでは学べない部分をしっかり勉強しておいてほしいですね。モデルづくりなどは、学生時代しか腰を据えて学べるときがありません。ハッカソンなどでそのあたりの力を磨いてほしいです。