ブログの「気分」を分析
先日、ブログ上の文字情報(テキストデータ)の分析
(テキストマイニング)が、書き手の「性別」や「年齢」の推定
を行えるところまで来ていることをご紹介しましたよね。
この話を知人にしたら、
“それは「ネカマ」(ネットオカマ)との闘いだね・・・”
と切り返されたんですが!
まあ、文章では人格が変わるというか、
男性的な言葉遣いをあえてする女性がいます。
また、男性の中にも、
文章から受ける印象が女性的だと感じられる方がいますよね。
ですから、性別を見分けるのはそう簡単ではないはず。
とはいえ、ブログウォッチャーが行っている性別判定の予測精度は
90%以上ということですから、性別を的確に区別できる手がかりを
うまく組み込んだ分析に成功しているところもあるわけです。
さて、ブログ分析を専門とする「きざしカンパニー」では、
さらに踏み込んだことをやってますね。
最近、ブログの書き手の
「気分」(感情)
を推定する分析を試験サービスとして提供開始してます。
(日経産業新聞、207/12/20)
新サービスの名称は、
「My boo(マイブー)」http://myboo.kizasi.jp/
です。
メインとなる機能は、
上記サイトに解析したいブログのURLを入力すると、
対象としたブログ全体から感じられる
「トーン」(ブログににじみ出る気分・感情)
と、そのブログで取り上げられることの多い、
「テーマ」(話題)
を判定の参考となった文中のキーワードと共に
表示するというものです。
例えば、トーンとしては、
「清く、かしこまっている感じ」
「おいしい!と感じている」
など。
テーマとしては、
「釣り」
「グルメ」
などと表示されます。
早速私自身のブログや、
他の方のブログで試してみました。
私のブログは、
「解析できませんでした。」
というエラーが表示されてしまいました。残念。
他の方のブログでも、
うまく解析できないブログが結構たくさんありました。
うまく解析できた某ブログの場合、
トーンとしては
「感謝の気持ち」
がブログからにじみ出ており、
テーマとしては、
「本」
について多く書かれているという結果が出ました。
ブログ本文とつき合わせてみると、
確かにそんな印象を受けます。
なお、この解析結果にはさらに、
対象としたブログと類似したテーマで書いている
「著名人ブログ」
のリストが同時に表示されます。
きざしカンパニーでは、マイブーの分析を通じて、
「自分はこんな気分でブログを書いていたのか」
「こんなテーマを多く書いていたんだな」
といったことがわかるとしています。
なるほど。
自分の文章を分析することで、
あまり意識していない自分自身の特徴を発見し、
理解することができますね。
ただ、ひとつ気になったのは、
感情の起伏が激しい人のブログは果たして分析できるのか?
という点です。
現在のマイブーの分析対象はあくまでブログ全体です。
日によってコロコロと気分が変わるブロガーの文章からは
一定の気分傾向は取り出しにくいはずですよね・・・
まあ、マイブーはブログを楽しくするための無料の娯楽サービス
ですから、あまり厳密なことを言うのはやめときましょう。
それにしても、マーケティングリサーチャーとして、
また、人間心理に深い関心を持つものとして、私は、
「人が語る、書く生の言葉」
の裏側にある人の意識を深く探る技術にはとても惹かれます。
ですから、無料で収集できる豊富なブログデータを活用した、
テキストマイニングの今後の進展には大いに期待しています。
投稿者 松尾 順 : 2007年12月21日 15:17
トラックバック
このエントリーのトラックバックURL:
http://www.mindreading.jp/mt/mt-tb.cgi/720
コメント
面白いサービス教えていただいてありがとうございます。自分のブログで試してみました。
「怒り」がにじみ出ていて「本」についての話題が多いそうです。趣味でやってる「書評」ならぬ「マンガ・ゲーム評」ブログなので、方向性はあってるけれどちょっと違うかな~と。
でも自分では公正に書いてるつもりだったのに・・・今後は「怒り」と判断されないようにちょっと気はつけよう(涙)
この先もっとカテゴリ分けが細かくなってくると面白そうです。大期待!
投稿者 はぐれヲタ : 2007年12月25日 19:54
気分(感情)の判定の詳しい仕組みがわかりませんが、おそらく文脈を読み取っての判定ではなく、キーワード、つまり単語レベルで判定しているのではないかと思います。したがって、怒りに関連したキーワードが多くなると、文脈に関係なく「怒り」という判断になるのでしょうね。
投稿者 松尾順 : 2007年12月25日 20:45
コメントしてください