【大学探訪記 Vol.9】1年に13万件ある日経新聞の記事を、人工知能の一分野「機械学習」によって分類・分析する。

大学探訪記日経新聞の1年分の記事を全部読みこみ、それを分類するには、人間には約41日かかります。

その作業、コンピュータに任せてみませんか？

そんな研究をしている人がここにいます。兵庫県立大学大学院　シミュレーション学研究科D1の川田真也さんです。

川田さんは今何かと話題の人工知能の一分野である「機械学習」について研究しています。

機械学習

機械学習とは、人工知能のプログラム自身が学習する仕組みである。そもそも学習とは何か、どうなれば学習したといえるのか。学習の根幹をなすのは「分ける」という処理である。

（中略）機械学習は、コンピュータが大量のデータを処理しながらこの「分け方」を自動的に修得する。いったん「分け方」を習得すれば、それを使って未知のデータを「分ける」ことができる。

（出典：人工知能は人間を超えるか　角川EPUB選書）

そして、現在川田さんが取り組んでいるのは「新聞記事」を「分ける」ことなのです。

日経新聞には1年間で13万件の記事があります。その膨大な量の記事をコンピュータに読ませ、読ませた記事をコンピュータに分類させます。コンピュータが自発的に「分類」したその記事、人間には気づかなかった法則性があるかもしれません。例えば、

景気が悪くなる時にどんな単語が頻出するか？

どの政党が次の選挙で勝ちそうか？

どんな広告の文言が消費者にウケたのか？

そんなことが、膨大なデータを分析しているコンピュータなら、わかるかもしれません。

川田さんはもともと、修士課程を修了してすぐに研究者の道に進んだわけではありませんでした。

マーケティングや経営に興味があったので、一度webマーケティングの会社に就職し、SEOやウェブ広告のコンサルティングや、日々蓄積される膨大なアクセス数を用いた簡易的なデータ解析を行っていました。

ある時、クライアントとの会話の流れからそのクライアントの持つ年間の購買データを解析することになりましたが、ふとその時、

「スーパーコンピュータを用いて、学術的なアプローチで実データを解析すれば、どのような真理がわかるのだろうか」

という興味が湧いてきました。そしてその興味を抑えきれず、大学に戻り研究者としての道を進む決心したのです。

川田さんはこう言います。