デスクトップマスコット「Apricot」と「キャラ化とビジュアライゼーション」

ちょっとここらでそろそろ「Apricot」の思い出を語ろうか?ということで、最初に考えたコンセプトと一貫してやってきたことを書いてみようと思います。

コンセプト

最初に考えた「Apricot」のコンセプトは、情報検索やテキストマイニングの結果をキャラクターにより視覚化(ビジュアライゼーション)することでした。これは、今まで一貫してやってきてたことでもあり、Apricotの本質です。

このコンセプトは、下記のエントリに書かれていることに非常に近いです。というかほぼ同じだと思います。


キャラ化とビジュアライゼーション
http://blog.slndesignstudio.com/archives/2008/05/post_660.html

処理の概要

Apricotで実際に行っているメインの処理を大雑把に書くと、喋らせる前処理として下記のことを行います。

  1. RSS/AtomフィードのエントリをWebから取得(注1
  2. エントリをtf・idfによる特徴量抽出
  3. 特徴量抽出を行ったあとクラスタリング

この結果を基にキャラクターを喋らせます。喋らす内容は、最近よく使われた言葉を基に、最も近いエントリと(クラスタリングされた結果を基に導き出される)類似のエントリへ誘導するための言葉(注2を使います。この言葉がバルーン上に出される(Activation時の)リンクと一致します。なので、最近ブログなどで言及された言葉以外喋りません。

(注1 現在は、1の箇所がブログだけでなくTwitterの発言や天気予報なども取り込むようになっています。
(注2 クラスタリングされた結果は上のスクリーンショットでは、オレンジ色のプラスマークで表されるキーワードとなって表示されます。

ちなみに基本的に以上の処理に関連のないものは、Apricot.exeでは実装していません。ランチャーやタイマーなどはIronPython上のスクリプトで実現しています。

というわけで、デスクトップマスコットという名前でちょっと誤解されるような結果になってしまったような感じがするので定義し直すと「RSS/Atomフィードのための情報検索システムとビジュアライザー」になるかと思います。
まぁでも絶対この名称は一般的ではない、かつ受けがよくなさそうなので、「デスクトップマスコット」となっているのでした。