Peakers Hitachi Cup – クレジットカード不正取引予測ハッカソン- 最優秀賞 大嶽匤俊さん 東京大学 理科一類


2019年9月20日、株式会社日立製作所とPeakersの共同開催でPeakers Hitachi Cup – クレジットカード不正取引予測ハッカソン- が行われた。課題は、海外のクレジットカード取引のオープンデータを用いてモデルを作成し、不正取引の予測を行うというもの。個人戦のコンペティション形式で、参加者は自身のスキルや経験を最大限発揮しながら精度を競い合った。

日立製作所からは3名のメンターが参加し、学生からの疑問や質問に対してアドバイスする形でサポート。偏りが大きく、セキュリティ上詳細がわからないため取り扱いの難しいデータであったが、参加者それぞれが工夫を凝らし精度を磨き上げていった。その結果、F値での評価で2位と3位は0.8461ptの同率、1位と2位3位との差は0.01pt程度でかなりの接戦となった。今回は、最後までわずかな精度の差を争った上位3名の優秀者にインタビューを行った。

学部1年生ながら今回トップの成績を収めた大嶽さん。高校時代は勉強で忙しく、パソコンに触ることすらできなかったが、大学進学後に機械学習にのめり込み、先日KaggleのAPTOSでは銀メダルを獲得している。現在は、研究者よりも機械学習やデータ分析といった技術を、どの様に社会で使っていくかに関心があるという。今回のハッカソンの手応えはどのようなものだったのか。

オフラインのコンペは初参加ですか?

はい。不正利用に対して機械学習でアプローチをかけるというこの分野では重要なテーマだったので、「これは勉強になるぞ」と思って参加しました。実際に参加してみて、期待通りでした。クレジットカードというのは、ベストなテーマだったかなと思います。ただ、変数がマスクされていたので、少し手こずった部分もありました。

今回工夫された点は?

特徴量エンジニアリングにすごく時間をかけました。自分の経験上、モデルのチューニングなどで大きな変化は得られないし、限られた時間のなかで何に時間をかけるべきか考えたときに、アンサンブルとかチューニングには時間を割くべきではないと判断しました。

うまくいかなかった点は、LightGBMの知識が不足していて、知らないパラメーターがあることに今日気づきました。それと、自分の知らない手法を使っていた方にもっと話を聞きたかったのですが、うまく言いだせませんでした(笑)。

どうすれば、短期間で実力をアップできますか?

独学も大事ですが、ハッカソンなどのイベントに参加するのが一番だと思います。エンジニアリングは「やって学べ」という世界ですので、出られるなら、可能な限り出たほうがいいと思います。

技術的なこと以外にも学びがありましたか?

ありました。一緒にやる仲間がいると、やっぱりモチベーションが上がりますね。短い時間に集中して勉強できます。今日は、Pandasの扱いを覚えました。全員の途中経過が見えるので、「やばい、負けてる!」と焦るのも刺激になります。

メンターさんに対しては、どんな印象を持ちましたか?

すごくいろんなことをわかりやすく教えていただいて助かりました。今回、企業説明を受けられたのもよかったなと思います。日立さんに対しては家電のイメージが強かったのですが、IT系のことをいろいろやられていて、むしろそっちのほうがメインなんだということに気づけました。企業イメージもすごく上がりましたね。IRも先日見たのですが、どのセグメントもすごく優良企業で、バランスのよい会社だと思いました。

将来の夢を教えてください。

機械学習は楽しいですし、今回結果を出せたことからも、自分には向いているのかなと感じています。いまRoboTechというサークルに所属しているのですが、ロボットにも使われていて使える範囲がとても広いのが機械学習の魅力です。将来何になるかはまだ決めていませんが、機械学習のスキルを磨いて、さまざまな分野に応用してみたいです。

[contact-form-7 404 "Not Found"]