• 活動レポート
  • 2020.06.29

【締切済】2020年 データサイエンティスト 夏期インターンシップ募集


ITAS

自然言語処理

データ解析

産学連携

エンジニアリング

2020夏のインターンのお申込みは締め切りました。
たくさんのご応募ありがとうございました。

Insight Techインターン募集

不満買取センターを運営しているInsight Techでは、機械学習 / 自然言語処理に特化したインターンを募集しています。

Insight Techのインターンシップの特徴

スタートアップ企業の生の雰囲気を体験できる!

  • Insight Techは社員数が30人規模の小さい企業です。
  • 今年はオンラインでの実施を想定していますので、雰囲気自体は感じにくいかもしれませんが、報告会等社員とやりとりする場も設ける予定です
実務レベルの自然言語処理技術を体験できる。

  • Insight Techは実務の至るところで自然言語処理を導入しています。
  • 「ビジネス価値がある自然言語処理」を知ることができます。
インターン期間の結果次第では、論文執筆をしたり、OSSとして公開が可能。
昨年のインターンへのインタビュー記事もありますのでご参照ください

 不満データ

Insight Techでは、不満買取センターを通じて、2020年6月現在、1500万件以上の不満データを収集しています。
ユーザの不満だけを収集したデータは、他にはないものであり、非常に面白いデータです。
また、各ユーザの性年代や居住都道府県などの属性情報も付与されています。

 期間

2020年8月はじめ頃 ~ 2020年9月末頃
※ 参加者の予定、希望により調整が可能です。
※ これ以外の期間におけるインターンシップも可能ですので、希望があればご相談ください。

 勤務場所

特別な希望がない限りはオンラインでの実施を想定しています。

 待遇

時給: 1,300円
勤務時間: 原則として1日8時間・週5日(土日祝日を除く)

※ 参加者の予定を考慮してスケジュールの調整が可能です。

 応募方法

data-service@insight-tech.co.jp 宛に下記フォームの情報を記入して送ってください。
応募フォームのテキスト文面をメール文面に直接記述いただいて構いません。
送信いただいた情報はインターンの選考にのみ利用し、その他の目的には一切利用しません。
インターンシップに関する質問もこのメールアドレスで受け付けています。
※7月中旬頃まで応募を受け付ける予定ですが、充足次第応募を締め切る場合もありますのでご了承ください。

Insight Techインターンシップ応募フォーム

  1. 氏名:
  2. 連絡先:
  3. 大学名 [研究室名]:
  4. 研究テーマ:(研究テーマ等、決まっている場合のみ)
  5. インターンでどういったテーマに取り組みたいか:
  6. (もしあれば)自身のスキル等をアピールする情報等:
応募フォーム記入例

  1. 氏名: 印西 都
  2. 連絡先: hoge_hoge@insight-tech.co.jp
  3. 大学名 [研究室名]: 不満買取大学[不満情報学部]
  4. 研究テーマ: 不満投稿文面に含まれる情報の分類
  5. インターンでどういったテーマに取り組みたいか:
    研究テーマとの親和性も高いため、投稿カテゴリの分類システムの構築に取り組みたい。
  6. (もしあれば)自身のスキル等をアピールする情報等:
    “不満投稿に言及される内容の自動分類”, 第10回不満情報研究会
    https://insight-tech.co.jp/

 応募資格 / 実施テーマ

Insight Techでは複数のインターンシップテーマを用意しています。
この他のテーマも相談に応じますので、お気軽にお問い合わせください。
不満データを使うことで、こういうことができるんじゃないか、こういうことをやりたい、といった提案も歓迎します。

テーマによって、求めるスキル・応募資格は若干異なりますが、共通する応募資格は次の通りです。

  • 作業に使うPCを自分で用意できること。

    • Windows, Mac, Unix問いません。
  • UNIX系システムの利用経験があること。

    • ログイン、ファイル操作等で十分です。
  • Python利用に親しみがあること。

    • 「言語処理100本ノック 2020」4章あたりまでの課題をPythonで記述できる程度。
テーマ例
不満投稿の内容に応じたクラスタリングシステムの開発・高度化

  • 大量の不満投稿を俯瞰的に捉えるために、Insight Techでは不満投稿の内容に応じたクラスタリングを実装しています。現行のシステムと比較してより納得感が高いクラスタリングが行われるように、モデルの高度化を試行します。
  • このテーマでは、どういったモデルが利用できそうかの議論、検討からはじめ、最終的には不満投稿の内容に応じたクラスタリングシステムの実装、構築を目指します。
不満データの切り方による単語ベクトルの差分検証

  • Insight Techでは、大量の不満データをもとに単語ベクトルを構築し、類義語検索のような枠組みに活用しています。不満データをコーパスとする単語ベクトルの構築に関して、カテゴリ別/カテゴリ横断、時期別/時期横断、辞書の違いなどによる類義語の出方を評価することで、ビジネス的に活用度が高い運用の枠組みにつなげるための検証を行います。
  • このテーマでは、ビジネス活用に向けた検証までを予定していますが、時間に余裕があれば、条件を与えれば自動で不満データから単語ベクトルを学習するようなAPIの開発実装までを見込んでいます。
文体に着目したユーザー分類試行

  • 文体に着目してユーザーの分類を試行し、その分類の中で不満の投稿傾向にどういった差があるかを分析します。具体的には1人称の表現(「私」、「おれ」)や語末の表現(「〜である」、「〜です」)に着目した分類を想定しています。
  • このテーマではユーザーの分類実験を実施します。時間に余裕があれば、不満投稿の差異の検証やユーザ分類のシステム化までを見込んでいます。
特定の切り口に応じた不満の分類・抽出試行

  • 特定の切り口に応じて、不満を分類するシステムの構築を目指します。特定の切り口としては例えば「足りていないもの/ことについて言及している不満」「より具体的なニーズを言及している不満」等、ビジネス活用に直結するようなものを想定しています。また「こういう切り口はどうか」といった提案も期待しています。
  • このテーマでは切り口に応じた不満の分類実験を実施します。時間に余裕があれば、ある程度汎用的に利用可能な分類・抽出システムの構築までを見込んでいます。

ITAS

自然言語処理

データ解析

産学連携

エンジニアリング