Peakers Hitachi Cup – クレジットカード不正取引予測ハッカソン- 優秀賞 二瓶真友さん 津田塾大学 総合政策学部

2019年9月20日、株式会社日立製作所とPeakersの共同開催でPeakers Hitachi Cup – クレジットカード不正取引予測ハッカソン- が行われた。課題は、海外のクレジットカード取引のオープンデータを用いてモデルを作成し、不正取引の予測を行うというもの。個人戦のコンペティション形式で、参加者は自身のスキルや経験を最大限発揮しながら精度を競い合った。

日立製作所からは3名のメンターが参加し、学生からの疑問や質問に対してアドバイスする形でサポート。偏りが大きく、セキュリティ上詳細がわからないため取り扱いの難しいデータであったが、参加者それぞれが工夫を凝らし精度を磨き上げていった。その結果、F値での評価で2位と3位は0.8461ptの同率、1位と2位3位との差は0.01pt程度でかなりの接戦となった。今回は、最後までわずかな精度の差を争った上位3名の優秀者にインタビューを行った。

ハッカソンの参加は今回がはじめての二瓶さん。普段は大学で英語や政策立案などを学んでいる。機械学習に興味を持ったのは、昨年末に統計学の授業でPythonに触れ、面白いと思ったのがきっかけだ。今では英語より機械学習に没頭している二瓶さんは、どんな方法で課題に挑んだのか。

今回ハッカソンに初参加して、いかがでしたか?

堅苦しいんところなんじゃないかなと思って、何となく敷居の高さを感じていたのですが、来てみたら穏やかで、朗らかとした雰囲気でした。大学では同じ趣味の人にほぼ会えないのですが、ここにはたくさんいて、ワイワイ盛り上がって楽しかったです。緊張してたのですが、そんな必要は全然なかったなと思いました。

高スコア獲得に向けて工夫した点を教えてください。

まずモデルを決めるためにランキングを作りました。そこで一番良かったモデルがXGBoostだったのでこれに固定して、パラメーターをチューニングしながら進めていきました。このチューニングが大変でした。パラメータを最適化する計算式もあるのですが、すごく時間がかかるので、今回は手動でやりました。これが結果的にうまくいったので、ラッキーでしたね。時間があれば、パラメーターを最適化する計算はやってみたかったです。でも、あと3日くらいかかったかもしれません。

反省点はありますか?

アンダーサンプリングをやってみたのですが、うまく行かなくてひどいスコアが出てしまったので、持ち帰って勉強し直したいです。それから、私はモデルに数字をそのまんま突っ込んだのですが、受賞した方はきちんと加工してから入れていたので、その辺もこれからちゃんと勉強したいと思います。1位、2位の方はコードの見やすさもすごいなと思いました。私の場合はどこに何があるのかわからないくらい、ぐちゃぐちゃだったので、きれいなコードが書けるようになりたいです。

日立製作所さんへのイメージは変わりましたか?

一気に行きたくなりました!「この木なんの木 気になる木」の家電メーカーというイメージしかなかったのですが、いろんな事業に取り組んでいることや、BtoBの業務にも多く関わっていることがわかりました。説明会と違ってスーツじゃないのも話しやすくてよかったです。

今後取り組みたいテーマを教えてください。

理論的なところをもっと突き詰めて勉強したいです。仕事で使うとなると、今後理論も学ばないと使えないのではないかと思うので、しっかり学んでいこうと思います。今回選んだモデルも、とりあえず書けば回せるのですが、仕組みは全然理解できていないので、勉強していきたいです。

今後のビジョンを教えてください

社会課題を解決するような方向で、かつプログラミングとかAIに携わる仕事ができればと思っています。それがエンジニアなのかコンサルなのかは、まだはっきりはわかりません。政策の分野では、機械学習による予測が大きく役立つ分野です。ただ、技術に頼り過ぎると使えないAI、不要なAIもできてしまうと思うので、届けるべきところに役に立つAIになってほしいと思います。

[contact-form-7 404 "Not Found"]