いまや、インターネット上にはありとあらゆる『声』があふれている。たとえば、なにか物を買おうとするとき、すぐにスマートフォンで商品のクチコミを調べてしまう人もいるだろう。もっともその数が多すぎて、結局どうしていいかわからないことも珍しくはないのだが……。

そんな状況を打破する画期的なソフトウェアが登場した。ウェブ上に散らばった膨大な『声』を分析して人々の『意思』を読み取る、『DecisionEngine』だ。

MIT spinout dMetrics believes this online chatter is an information treasure-trove for the health care industry.

『声』を『情報』に

『DecisionEngine』を開発したのは、dmetrics社の設立者であるポール・ネミロフスキー氏だ。開発にあたり、彼がテキスト分析の対象に選んだのは『医療』だった。この薬はいい、この処方は良くなかった、この症状には何が効くか……。そんなウェブ上の『声』は医療業界にとって宝の山であり、また患者たちにとっても日常的に大きな問題だと考えたのである。

人々が何をして、何をせず、何を考えているのか。これから何をするつもりで、過去には何をしたのか。また、何を求めていて、何が怖くて、何を望んでいるのか……。ポール氏いわく、ウェブ上の書き込みにはそうした内容が詰まっているという。しかし、それらはそのまま使えるものではなく、きちんと『情報』に翻訳する必要があるというのだ。

書く側だという人も多いだろう。

image by

amazon.co.jp

『DecisionEngine』には、機械学習機能と自然言語処理機能が搭載されている。FacebookやTwitterなどのSNS、ウェブフォーラム、さらにニュースや動画のコメント欄まで、ウェブ上のあらゆる書き込みから『声』を拾い集めて分析するのである。

現在dmetrics社は、100万以上のソースをもとに、患者自身が訴えた症状・解決策・成果のデータベースを持ち、そこには14,000以上の医薬品・ヘルスケア商品の情報が含まれている。こうした情報を使うことができれば、企業側の疑問――たとえば、ある症状のために薬を使っている人はどれだけいるのか、他社製品に乗り換えようとしている人はどれだけいるのか――にはシンプルな解答が与えられるだろう。

しかしポール氏はソフト開発に苦戦したようで、「スラング、誤字脱字、句読点のない文章、句読点の多すぎる文章……ウェブ上のテキストを適切に分析するのはとても難しい」とも話している。

image by

リサーチのrTYPE[アイシェア]

『声』の読み取り方

もちろん、これまでにもネット上の書き込みを分析するソフトはあった。しかしポール氏いわく、その多くは使われる言葉とその意味に重きを置いていたという。たとえば薬の名前が出てくる回数を数えて、書き込みが重要かどうかを判定したり、ポジティブかネガティブかを判別するという方法を採っていたのだ。しかしポール氏は、「言葉や表現とはそんなものではない。私たちはもう少し複雑な生き物だ。言葉のウラにある『意思』を理解する必要がある」と話す。

解釈のメカニズム

『DecisionEngine』の特徴は、あらゆる単語および類義語を認識したうえで文法や意味を解釈することだ。さらにソフトは、オンライン上のテキストを3つの段階で分析するようになっている。テキストの性質を分類していくことで、人々の『声』をきちんと聞き分けるのである。

たとえば、とある製品についての『声』を分析する場合だ。『DecisionEngine』は、まず製品に関するウェブ上のテキストを片っ端から収集し、フェイク・サイトやスパムなどを取り除く。ここまでが第1段階である。つづく第2段階では、そこからさらにマーケティング資料やニュース記事などが取り除かれる。そして、いわゆる『個人の声』だけが残されるのである。

聖徳太子

何人もの声を聞き分けられたというが……。

image by

NEXUS NEWS

第3段落では、その『声』のテキストを書いた者が、いったいどんな『意思』を持っていたのかが分析される。薬をこれから使うのか、まだ検討中なのか、使ってみて思うところがあるのか、それとも別のものに乗り換えようとしているのか……。たとえば、こんな書き込みならばどうだろう。

「いま薬Aといっしょに薬Bを10mg飲んでいますが、よく効いている気がします。なので、薬Cを一緒に飲んでも大丈夫なものか、主治医に聞いてみるつもりです。ただ、個人的には薬Aはむずかしい薬だと思います。しっかり寝て、食べて、運動しているときはよく効きますが、それでも週2~3回くらいにしておくとちょうどいい感じです。」

こうしたテキストの場合、従来のソフトは単語や意味に注目するため、「よく」「むずかしい」「しっかり」「ちょうどいい」といった言葉を主に検出する傾向がある。しかし『DecisionEngine』は、薬Aと薬Bを併用しての効果や薬Bの摂取量、薬Cを併用したいという考え、医師を尋ねること、そして薬Aへの不満と、テキストの意味を正確に理解するのだ。

こうした情報の集積は、たとえば問題解決の方法の検討など、企業側のアクションにつながりうるという。

image by

fotolia

この『DecisionEngine』は、企業やNPOなどの法人向けに開発されたソフトであり、消費者のクチコミ検索は目的とされていない。したがって、何か欲しいものがあったときに役立つようなことは将来的にも考えづらいだろう。現在dmetrics社は、金融業界と政治団体に向けてソフトの試用を実施しているという。

REFERENCE:

Detecting consumer decisions within messy data