NLP Competition 〜 非公開データを用いた自然言語処理コンペティション- メンターインタビュー 朝日新聞社メディアラボ 田森秀明さん

2019年9月初旬、朝日新聞社メディアラボにて、「NLP Competition 〜 非公開データを用いた自然言語処理コンペティション」が行われた。

本イベントは個人戦の機械学習コンペティション。朝日新聞者のメディア変革を目指す「実験室」である朝日新聞社メディアラボと、Peakersの共同開催で行われた。課題は新聞社主催のイベントらしく記事データを用いたもので、「その記事が多くの人に読まれたかどうか」を規定の基準で2値分類した(課題・データの詳細は非公開)。メディアラボからは、メディアイノベーションチームより3名のメンターが参加。いずれも同ラボで見出し生成APIなどの開発を行う、自然言語処理のエキスパートだ。

本ハッカソンのメンター・田森秀明さんは、メディアイノベーションチームのリーダー。情報科学の博士であり、スタンフォード大学アジア太平洋研究所客員研究員として留学した経験を持つ。今回、ベースラインのコード作成やデータ準備・課題設定などにおいて中核を担った、ハッカソンの主導者だ。当日は初心者にも丁寧に寄り添い基本的な知識のインプットからサポート。懇親会ではその穏やかな雰囲気で多くの参加者と打ち解けていた。

「参加者のレベルが高かったため、こちらの意図を押し付けるのではなく、学生の視線に合わせたサポートを意識した」と田森さんは語る。また、参加学生が課題に取り組む姿勢を見て、全員に入社して欲しいと感じたという。メディアラボにとって久々の開催となった今回のハッカソンで、どのような手応えを感じたのか伺ってみた。

今回のハッカソンの率直な感想を教えてください。

過去にもハッカソンはいろいろ開催してきましたが、今回は「みなさん、できるな!」という印象を受けました。ハッカソンには得意な人も不得意な人もいて当然なのですが、今回参加されていた学生さんは、みなさんできる方ばかりでした。全員が同じレベル感で進めているのが、とても新鮮でした。メンターの出番はあまりなかったような気がします。基本的にはこちらの思いを押し付けるのではなく、学生さんの目線に合わせて見守るスタンスでメンタリングをしました。

参加学生に対してどのような印象を持たれましたか。

コンペ形式の個人戦でやらせていただいたので、みなさんとても真剣でした。ソースコードは人それぞれでしたが、1位の方はかなり細かいところまで分析していて驚きました。我々が想定していなかったところまでしっかりやっていて、「こんな分析も有効なのか」と我々としても勉強になりましたね。ランチタイムでは、学生さんと楽しく交流させてもらいました。他の会社さんのハッカソンの様子も聞くことができました。Peakersさんはいろいろな会社のハッカソンを主催しているので、他社がどんなことをやっているのかわかるのがいいですね。今後の開催に生かしたいと思います。

今回のハッカソンでどのようなものが得られましたか?

今の学生さんは、意識が高くてすごいなと思います。私が学生のときとは全然違うなあと感心しました。こんなふうに一生懸命取り組んでいる学生さんがいることがわかったのも、ハッカソンの大きな収穫です。こんな学生さんが入社して、仲間になってくれたら嬉しいですね。もう全員に「うちに来て!」と声をかけたいくらいです。

学生さんからは、「新聞社もこういう取り組みをしているのですね!」という声を多くいただきました。弊社の取り組みを知ってもらうこともハッカソン開催の目的の一つなので、知ってもらえただけでも嬉しいです。ぜひ、忘れないでいて欲しいです。

2日間頑張った学生さんに一言お願いいたします。

自然言語処理は、大きな可能性を秘めた技術だと思います。我々はこの分野の研究を本格的に始めてまだ数年で、まだまだ発展途上のところがあります。時代の先端を行く学生さんたちに教えてもらいながら、ともに学び続けていきたいです。もっとリッチな計算資源を用意して、我々がやっている見出し生成や自動要約生成などのハッカソンを主催できたらと考えています。

[contact-form-7 404 "Not Found"]