NLP Competition 〜 非公開データを用いた自然言語処理コンペティション- 優秀賞 鈴木広大さん 法政大学 経済学部

2019年9月初旬、朝日新聞社メディアラボにて、「NLP Competition 〜 非公開データを用いた自然言語処理コンペティション」が行われた。

本イベントは個人戦の機械学習コンペティション。朝日新聞者のメディア変革を目指す「実験室」である朝日新聞社メディアラボと、Peakersの共同開催で行われた。課題は新聞社主催のイベントらしく記事データを用いたもので、「その記事が多くの人に読まれたかどうか」を規定の基準で2値分類した(課題・データの詳細は非公開)。メディアラボからは、メディアイノベーションチームより3名のメンターが参加。いずれも同ラボで見出し生成APIなどの開発を行う、自然言語処理のエキスパートだ。

参加者は普段から研究で自然言語処理に携わる学生から、機械学習の初心者まで様々。2日間で計10時間にわたるワークを行い、各自モデルの精度を磨き上げていった。今回はその中で最終スコアが特に高かった、上位3名の優秀者にインタビューを行った。

普段大学では経済学について学んでいる、いわゆる「文系」の鈴木さん。就職活動をする中でエンジニアという職業に興味を持ち、機械学習の勉強を始めた。来年からはエンジニアとしてデータセンターで就業予定だという。自らを「Pythonを独学でやった程度の初心者」という鈴木さんだが、今回は見事2位という結果を収めている。一体どんな手法で高得点を叩き出したのか。

参加してみて、いかがでしたか?

予想通り技術的なことはちんぷんかんぷんで、みなさんの言っていることがまるで外国語のようでした(笑)。でも、メンターの方に手取り足取り一から教えてもらったので、最後までやり抜くことができました。とても楽しかったです。朝日新聞社さんは、学生を大切に思ってくださいますし、あたたかい気持ちで学生に接してくださるなと感じました。

「初心者」でも、ハイスコアが取れた理由を教えてください。

文系的な視点が良かったのかもしれません。マーケティングの授業で、響くキャッチコピーとか、人が気になる言葉の勉強をしたことがありました。今回のタスクは記事が多くの人に読まれたかどうかを分類するというものだったので、見出しの中に人に響く言葉が入っていたらポイントが高いだろうと予測して、そういう言葉を15くらいピックアップしました。こういうアプローチをしたのは僕だけだったと思います。機械学習に詳しくないからこその発想がかえって功を奏したのかもしれません。かなりのビギナーズラックでしたね。

今後のビジョンを教えてください。

今回の参加で、「自分でコードを書けるようになりたい!」と勉強へのモチベーションがグッとアップしました。新しいことに挑戦することに対しての抵抗がなくなったので、いろんなことにどんどん挑戦していきたいと思っています。僕の夢は、すべての人が自分の熱中できるものを見つけて,生き生きした人生を送れるようになることです。データ分析の技術がもっと進歩すれば、自分に向いているものや好きなものをより見つけやすくなって、幸せな人が増えていくのではないかと期待しています。

[contact-form-7 404 "Not Found"]