日経新聞の1年分の記事を全部読みこみ、それを分類するには、人間には約41日かかります。
その作業、コンピュータに任せてみませんか?
そんな研究をしている人がここにいます。兵庫県立大学大学院 シミュレーション学研究科D1の川田真也さんです。
川田さんは今何かと話題の人工知能の一分野である「機械学習」について研究しています。
機械学習
機械学習とは、人工知能のプログラム自身が学習する仕組みである。そもそも学習とは何か、どうなれば学習したといえるのか。学習の根幹をなすのは「分ける」という処理である。
(中略)機械学習は、コンピュータが大量のデータを処理しながらこの「分け方」を自動的に修得する。いったん「分け方」を習得すれば、それを使って未知のデータを「分ける」ことができる。
(出典:人工知能は人間を超えるか 角川EPUB選書)
そして、現在川田さんが取り組んでいるのは「新聞記事」を「分ける」ことなのです。
日経新聞には1年間で13万件の記事があります。その膨大な量の記事をコンピュータに読ませ、読ませた記事をコンピュータに分類させます。コンピュータが自発的に「分類」したその記事、人間には気づかなかった法則性があるかもしれません。例えば、
景気が悪くなる時にどんな単語が頻出するか?
どの政党が次の選挙で勝ちそうか?
どんな広告の文言が消費者にウケたのか?
そんなことが、膨大なデータを分析しているコンピュータなら、わかるかもしれません。
川田さんはもともと、修士課程を修了してすぐに研究者の道に進んだわけではありませんでした。
マーケティングや経営に興味があったので、一度webマーケティングの会社に就職し、SEOやウェブ広告のコンサルティングや、日々蓄積される膨大なアクセス数を用いた簡易的なデータ解析を行っていました。
ある時、クライアントとの会話の流れからそのクライアントの持つ年間の購買データを解析することになりましたが、ふとその時、
「スーパーコンピュータを用いて、学術的なアプローチで実データを解析すれば、どのような真理がわかるのだろうか」
という興味が湧いてきました。そしてその興味を抑えきれず、大学に戻り研究者としての道を進む決心したのです。
川田さんはこう言います。
「関係ないキーワード同士の関係性が見えると、ほんとうに嬉しい。流行が出来上がるメカニズムも解明できる。また、リーマン・ショックのデータを調べるとその扱いが国際面、経済面、政治面とどんどん面が移り変わっていった現象もとても興味深いです。」
現在、川田さんは日経新聞の記事について分類されたものをクラスター解析し、再分類、統合を行うための吟味を行っています。
こういった研究が可能になったのも、スーパーコンピュータ「京」の活躍があればこそ。コンピュータが人間の知能を超える日は近いのかもしれません。
【バックナンバー】
【大学探訪記 Vol.8】雲とチリの相互作用を、スーパーコンピュータで再現する。
【大学探訪記 Vol.6】スーパーコンピュータ「京」で社会のしくみを解き明かす
【大学探訪記 Vol.5】銀幕スターを通じて「戦後の日本人」を解き明かす
【大学探訪記 Vol.4】ベトナムの人材育成を支援したい!と、ベトナムに単身渡る女子大生
【大学探訪記 Vol.3】プロ野球に統計学を適用するとどうなるか?
【大学探訪記 Vol.2】1本の木を植えるとどんだけ気温が下がるのか?
【大学探訪記 Vol.1】東大のNicogoryというスタートアップを訪ねました