金融データに多様な手法でアプローチ「Peakers Hitachi Cup クレジットカード不正取引予測」レポート

2019年9月20日、東京駅近くのダイアゴナルラン東京にて「Peakers Hitachi Cup – クレジットカード不正取引予測ハッカソン」が開催されました。日立製作所より3名のメンター(データサイエンティスト)を迎え、21名の学生さんがオープンデータを用いたクレジットカード分析の課題に取り組みました。第三回目ということもあり前回・前々回からのリピート参加が多く、また女性の参加者も多くいらっしゃった今回。参加者層だけではなく、上位入賞した方が全く違う手法を採用するなど色々な意味で前二回とは異なる雰囲気のハッカソンとなりました。とはいえ、参加者の皆さんの熱量はいつも通りの高さです。それぞれが高スコアを目指して粘り強くメンターと意見交換し、また参加者同士切磋琢磨しながら課題に取り組んだ1日の様子をお届けします。

課題発表

今回の課題は「海外のクレジットカード取引のオープンデータを用いて、不正取引検出を行う」という内容でした。スコアのランキングはPeakersが作成したシステム上でリアルタイムに確認することができます。また、開発環境はローカルのPCもしくはGoogle Colaboratoryでした。

ハッカソン開始

課題発表とデータ配布後、学生の皆さんは作業に取り掛かります。不明点があった場合に質問がしやすいよう、前回同様メンターと学生さんの席を近くに配置しました。学生さんは序盤から積極的にメンターにアドバイスを求め、効率的に作業を進めていきます。

個人戦ではありますが、周りとの意見交換を通して独学では得にくい発想や知識を手に入れられるのもオフラインハッカソンの大きな魅力の一つです。そのため、運営側もコミュケーションが取りやすい環境を整えるよう意識しています。

今回参加した女性の学生さんから「行く前は硬い雰囲気のイベントだと思っていたので、少し緊張した」という言葉がありましたが、運営側も男女問わず参加しやすい雰囲気づくりに努めておりますので、興味のある方はぜひご参加いただければと思います。ワーク中は静かですが懇親会やランチではわいわいとした楽しい雰囲気にもなりますし、メンターさんも優しい方ばかりなので、気軽にご参加いただけると思います。

今回は比較的静かな雰囲気で、一人ひとりが黙々と作業を進める様子が多く見られました。同じ会場、同じタイムスケジュールでも、課題テーマや、当日の雰囲気によって全く違うイベントのように感じられます。全4回開催されたPeakers Hitachi Cupでは、リピート参加してくださった方も何名かいらっしゃいましたが、参加する回ごとに印象が大きく異なったのではないかと思いました。

自分のスキルだけでは解決できないと思った時は、積極的にメンターにアドバイスを求めることが大事です。もらったヒントが突破口となり、大きくスコアが更新できることもあります。何よりも現役のデータサイエンティストの方から意見をもらうことは、自分自身のスキルアップにも繋がります。何度も質問するのは気が引ける方もいらっしゃると思いますが、メンターさんは、その都度丁寧に解答してくれるので、できる限り技術を盗もう! というような気持ちで、粘り強く質問してもらえると嬉しいです。

ランチ

11:30ごろ、各自作業が一段落した方からランチの時間です。

日立製作所のメンター陣も、学生さんと同じテーブルに座り、食事をとりました。ワーク中は課題についてのやりとりが主ですが、ランチ中は色々な話題が飛び交います。多いのは、学生さんの専攻内容や、メンターの担当業務・これまでの経歴についてなどで、スキルだけではないお互いの内面を知ろうとしている様子がわかりました。PCに向かっているときは険しいみなさんの表情も、この時ばかりは少しホッとして和らいでいました。

昼食中、手を休めずに作業を続ける方もいます。ほんの少しの時間も無駄にすることがないよう、課題に取り組む姿勢にスコアに対する執念を感じます。本ハッカソンは1日間のみで全6時間程度のワークのため、ずっと集中して作業を続けている方もいれば、適度に休憩や雑談を挟みうまく頭を切り替えながら取り組んでいる方もいらっしゃいました。どちらの場合でも自分に一番合った方法を選び、高いパフォーマンスを維持できるようコントロールされているようでした。普段の研究や独学で行なっている経験が活かされているのだろうなと思います。

午後のワーク開始

参加学生にアドバイスするメンターの和田さん(左)

ランチ終了後、ワーク再開です。日立製作所のデータサイエンティスト・和田さんにはPeakers Hitachi Cupの第2回と第3回に、メンターとして参加していただきました。学生さんが質問しやすいよう常に周囲に気を配り、参加者の目線に立ってわかりやすく指導してくださると、和田さんの周りには常に参加者が集まっていました。また、和田さんご自身も学生さんとの交流をとても楽しんでいらっしゃる様子でした。学生さんはもちろんメンターの方にも楽しんでもらえると、運営としてはとても嬉しいです。

学生の質問に対応する顧さん(右)

今回がPeakers Hitachi Cupのメンター初参加だった顧さん。参加者からは細かい部分も丁寧に教えてくれるので、作業が捗ったとの声がありました。参加の感想として、様々なバックグラウンドを持つ学生さんが最先端技術である機械学習に一生懸命取り組む姿が見られて嬉しかったことや、経験の有無関係なく参加者が1日で課題をやり遂げていたことから、この世界は誰でも参加できる大きな世界だと思ったことなどを挙げられていました。

序盤から静かな雰囲気の中、黙々とワークをしていた皆さんですが、作業時間の終了が近づくにつれ、更に集中して作業する方が増えてきました。今まで行ってきた手段を比較しつつ、最後の時間でよりスコアを伸ばすにはどのようなチューニングをすべきか、最後の最後までいろんなパターンを試します。スコアが停滞した場合は、周囲の参加者やメンターにアドバイスをもらいながら試行錯誤を繰り返している様子でした。16:30、6時間に及ぶワークが終了しました。

ワーク終了、口頭発表

ワーク終了後は、ランキング上位7名の方からどのような方法で課題にアプローチしたか、口頭発表を行ってもらいました。この発表は、上位入賞した参加者の手法を他の方にも知ってもらうことで、より知識を深めていただくことを目的としています。学生さんからも自分では思いつかなかったアイディアや知らなかった手法について聞けたと毎回好評で、参加者の皆さんの糧になっているようです。

1位の方はLightGBMを使って特徴量エンジニアリングに時間をかけたモデル、2位の方は同じくLightGBMですがパラメーターチューニングを重視、3位の方はXGBoostを採用してパラメーターチューニングに注力、など今回はアプローチの方法に多様性がありました。学生さんから感想としてよく挙がるのですが、「1位の人が使っていたAという方法を自分のモデルに組み込むともっと良くなるかも?」といったことを考えるのも、こうした発表を聞く面白さだそうです。今回はオープンデータでの実施でしたので、ご自宅でも持ち帰ったデータを使ってぜひ色々と試していただければ嬉しいです。

結果発表・表彰

ワーク終了後は上位優秀者の方の表彰を行いました!

1位 大嶽 匤俊 さん

2位 鈴木 広人 さん 

3位 二瓶 真友 さん

4位 木内 陽大 さん

5位   深川 晴登 さん

左から木内さん、鈴木さん、大嶽さん、二瓶さん、深川さん

1位の大嶽さんは、なんと学部一年生! 「大学の先輩に、どんなイベントか視察してくるように言われた」という大嶽さんですが、上回生が多数参加する中初参加での見事な優勝でした。2位の鈴木さんはPeakersハッカソンの常連参加者で多数の入賞経験がある方です。また、3位の二瓶さんはPeakers創設以来初めての女性入賞者。参加者の多様性にあふれた今回のハッカソンを象徴するような結果となりました。

閉会式

最後に日立製作所のメンター陣の皆さんから本日の総評を頂きました。

「参加者の皆さんがとにかく楽しみながらやっていたのが印象的でした。データへのアプローチ方法も人によって異なり、特徴量の算出に力を入れる人、いろんな観点からアンサンブル学習をする人、それぞれの方法で分析していたのがよかったと思います。入賞者の方のコードは非常に綺麗に書かれていて、とても見やすかったです。上位の方の手法がそれぞれ異なっていた点も面白いと思いました。」

「実際の業務の中では、スモールデータからモデルを作成するケースがあります。こういった場合、多くはオーバーサンプリングが手法として採用されます。今回も異常データが少ない中、この手法を採用している方が何名かいらっしゃったので、とても良いアプローチだなと思いました。今日は経験者の方、未経験の方、両方いらっしゃったと思いますが、機械学習は誰でも挑戦することができます。やる気があれば自分で勉強することができますし、学習すればするほどスキルを身につけることもできます。AIは非常に楽しい世界ですし、その中でも日立のAI事業はもっと楽しい世界だと思います。皆さんの成長を楽しみにしています。」

懇親会

表彰終了後は、懇親会です。ワーク中は真剣な表情で作業している皆さんですが、懇親会では笑顔でお話しされる様子をたくさん見ることができます。それぞれが持ちうる限りの力でやりきったからこそ、会場にはいつも連帯感のようなものが生まれていように感じます。ひとつの課題に取り組んだ同志として、会話がはずむようです。

懇親会には日立製作所の人事の方も参加します。イベントの懇親会であれば学生さんからも気軽に質問ができるので、普段はなかなか聞くことができないような「ここだけ」の話が飛び出すことも。企業も学生さんもより素に近い状態でコミュニケーションをとることで、お互いへの理解が深まっていたようです。

朝から作業を続けていた皆さん。すっかり疲れているはずですが、最後まで課題について議論されている方もいらっしゃいました。参加した学生さんから「機械学習が好き、という人は少ないと思っていたけど、今日参加して、同じ趣味を持っている人がたくさんいることがわかりました。想像以上に楽しかったです」という感想をいただきました。個人でじっくり勉強することも、もちろん重要ですが、仲間と協力しながらワークすることで、より充実した時間を過ごせたのではないかと思います。

皆さん朝から1日、ワークお疲れ様でした!

まとめ

Peakers Hitachi Cup全4回の3回目となる「Peakers Hitachi Cup – クレジットカード不正取引予測ハッカソン」は無事に開催終了となりました。今回は比較的静かな雰囲気の中で、個々が集中して黙々と作業する姿が多く見られました。その中で、前回初心者として参加された方が、今回は自主学習の甲斐あってスムーズに作業を進めている姿を見ることができ、これまでとは違う新たな発見もありました。

また、今回は上位入賞者のアプローチがそれぞれ異なっていたのが特に印象的でした。開催テーマによって、多くの参加者がほとんど同じやり方を採用する場合もあれば、今回のように全く違う手段を取る場合もあります。それぞれがもつスキルや発想力によって、様々な観点からデータにアプローチできるのが機械学習の面白いところだなと改めて感じました。機械学習に興味がある方は、経験の厚さや学部学科・年次・性別関係なく、ぜひハッカソンに参加してみてください。今ご自身が持っているスキルを最大限活かせば、きっとたくさんの知識を身につけられるはずです。Peakersでは今後も、皆さんのスキルアップの場となる様々なイベントを開催していきます!

今回の高いスコアを記録された上位3名の方には、別途優秀者インタビューを行いました。こちらからご覧いただけます。

1位 大嶽 匤俊 さん

2位 鈴木 広人 さん

3位 二瓶 真友 さん

それぞれの取り組みについての詳細や開発にあたって気をつけたことなど、この記事では取り上げていない内容について様々な感想をいただいています。

Peakersでは、今後も様々なハッカソン・MeetUp・インターンシップを開催予定です。ここでしか体験できない学びを手に入れたい学生の皆さん、ご参加をお待ちしております!

[contact-form-7 404 "Not Found"]