MENUCLOSE

実践メディアビジネス講座III データセクション株式会社 池上俊介氏 講演

2012年7月6日の実践メディアビジネス講座III には、大規模なデータから高度な情報処理技術を用いて価値のある情報を見つけ出すビッグデータを扱っておられるデータセクション株式会社の池上俊介氏にお話をいただきました。
以下は受講した学生が提出したレポート(印象に残ったキーワードを挙げ、どんなことが考えたか、という設問)より抜粋したものです。

・自然言語処理
人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野である。要するに、ある文章からから言葉を抽出し咀嚼することである。この技術により、さまざまなブログや動画などのコンテンツがカテゴライズされる。この技術を個人の発信している文章に使用し、趣味趣向など傾向を導き出し、そのデータをビジネス面で活かすことが可能である。近年、SNSが活発に行われている。個人の情報をより発信しやすい社会になっている。情報爆発の時代と言える。その情報過多の莫大なデータに対して、自然言語処理を行って活路を見出す。プロファイル分析を行えば、個人の性格・趣味趣向などのデータを獲得することが可能だ。そのデータに基づいてターゲッテイングな広告を配信することで、購買に繋がるやもしれない。コンテンツにマッチした広告を表示したり、様々なコンテンツをカテゴライズしたり、フィルタリング機能のために利用できる。インターネットが歴史とともにデータを蓄積し発展していくのに、不可欠な技術である。

自然言語処理とは人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野のことだそうです。この技術はビッグデータを処理する際に必要な技術なようです。自然言語処理は8割正解であれば大丈夫というゆるい世界のようですがそれゆえに適合率と再現率のバランスを見極めるのが非常に重要なポイントになります。適合率と再現率はどれくらいの時間でどれくらいの精度のものをつくるか、というものです。適合率が下がれば再現率は上がるようなバランス関係なのでそのさじ加減は難しいように感じました。しかしこの技術が今後発展していくことにより人工知能がユーザーに質問を繰り返していくことによって意思決定の支援をするような画期的な技術が当たり前になる世界がそう遠くない未来来るのではないかと感じました。

・ビッグデータ
「ビッグデータ」とは、情報通信、とくにインターネットの発達にともなって爆発的に増大した構造化されていない莫大な量のデータ。それら様々な局面に発生した巨大データの集まりを分析することでビジネス傾向の特定、病気の予防、犯罪の対策などにメリットがあると言われている。上でも述べたが、現代は情報にあふれている。その「ビッグデータ」を「自然言語処理」で解析することによって、さらに、インターネットは発展を遂げる。しかし、「Garbage in,garbage out」という格言がある。これは、「ゴミのようなデータを使っていくら解析しても出てくる結果はゴミばかりだ」という意で使われており、情報を解析するまえに十分に精査する必要性をうたっている。

ビッグデータとはICタグなどのセンサー、ソーシャル・メディアに掲載された投稿、インターネット上に保存されたデジタル写真、ビデオ、オンライン購入の処理レコード、携帯電話のGPS信号など、さまざまなソースで生成されている物の総称のことです。このビッグデータを処理する市場は今後も成長傾向が続き、ビッグデータを巡る様々な事業が登場してくるのは自明の理だと思います。アメリカのオバマ大統領がビッグデータの処理ができる人材を育てようと政策を始めたことからもその重要性がわかるように思います。日々更新されるブログやツイートのような膨大の情報を有効活用し、リスクモニタリング、競合他社比較、反響調査などに役立てているお話を聞いて感心しました。直接相手に自分の意思や考えを主張しない日本にはなくてはならない技術であるように感じます。ただこうした情報の多くは他者に簡単に閲覧されてしまうものであるためためにネット上でのマナーや自分の発言への責任感などは常に持つべきだと再確認させられ気が引き締まりました。

GMS授業支援システム(在学生向け)