- コラム
- 2020.10.13
企業にとってどんな技術が有用なのか学びたい
2020年 DSインターンシップ インタビュー②
前回の記事はこちら:
第二弾としてご紹介するのは、「筋肉は裏切らない」東京都立大学修士1年の金さんです。
「不満」データを使って何ができるのかが気になっていた
ーーまずは簡単に自己紹介をお願いします!
ーー時間を見つけて筋トレ!筋肉は裏切らないですもんね。
大学ではどういった研究をされているのですか?
大学では主に朝鮮語の機械翻訳に関する研究を行っています。私は日本生まれの日本育ちですが、幼い頃から朝鮮語での会話もしてきたので、日本語と朝鮮語の両方話すことができます。直近で取り組んだ研究ではそこを生かし、朝鮮語から日本語への機械翻訳に取り組みました。
ーー機械翻訳だとInsight Techが取り組んでいることと結構毛色が異なる印象ですが、Insight Techのインターンへ応募をしたきっかけ、目的は何でしょうか?
大学の講義で夏期インターンを行っている企業をまとめたスプレッドシートを提供していただいて、そこにInsight Techさんの応募があったのがきっかけです。企業では自然言語処理の技術をどのように活用し、どんな技術が有用なのかを学びたくて応募しました。あとは、単純に「不満」データというのが他にはないものなので、実際にそのデータを使って何ができるのかが気になっていました。
ビジネス的に利用価値が高い切り口での不満の分類に挑戦
ーーここからは実際にインターンに参加してからのお話を聞かせてください。
まずインターンで取り組んでいるテーマを教えて下さい!
今回取り組ませていただいたテーマは「特定の切り口に応じた不満の分類・抽出」です。不満データには色々な投稿がありますが、その中からビジネス的に利用価値の高い切り口で分類を行える分類器の構築を目指しました。具体的には、不満データには「炭酸が弱いので強くしてほしい」などの改善ニーズを示しているものと、「炭酸の強さをを自由に変えられるグッズがあったらいいのに」などの新規開発ニーズを示しているものがあり、その中でも未充足ニーズを示しているものはビジネス的に利用価値が高いと考えられます。インターン期間中は新規開発ニーズを示しているか示していないかで分類を行う分類器の構築を目指しました。
ーー今年はリモートでのインターンとなりましたが、インターンに参加してみての雰囲気はどうですか?やりにくさはないでしょうか?
今年は実際にオフィスに行って雰囲気を体験することはできませんでしたが、オンライン上でInsight Techさんの社員の皆さんの前で自己紹介をした際には、いろいろな質問もしてくださりフレンドリーに接してくださり、大変良い雰囲気の会社だと思いました。
様々な分類器の構築を通してモデルの実装力を養えた
ーー実際にInsight Techのインターンに参加してみて、よかったことや学んでいることはありますか?
インターン期間中はいろいろなモデルの実装を行い分類器の構築をしたのでモデルの実装力を養えました。また、最終成果報告の際には自然言語処理が専門分野ではない人たちも参加
するため、そのような人たちにはどのように結果を見せたらわかりやすいかなども教えていただき、学べることが多かったです。
ーー様々な分類機の構築をスピード感を持って取り組んでもらった印象です。そんな中、インターン期間中を振り返ってみてこうすれば良かったなぁと思うことがあれば教えて下さい!
十分楽しく学べましたが、API化やパッケージ化などにも取り組めたらよかったなぁと思いました。
ーー買い取りますので、Insight Techに対する不満を教えて下さい!
不満データで事前学習したFumanBERTを作ってみたい!(不満ではない…)
ーーでは不満はないということですかね笑
最後に一言お願いします!
約一ヶ月間お世話になりました!
また機会があればご一緒に何かプロジェクトに取り組めたらと思います!
ありがとうございました!