twitter における「クラスタ」について考えてみる

twitter座談会(5/21のMTGをそう呼ぶ事にする)で、「クラスタ」という言葉を知った。
サーバセットアップの気晴らしにちょっとまとめてみる。

twitter座談会までの自分の認識

システム屋の自分としては、「クラスタ」といえば「複数のコンピュータで1つのサービスを提供する際のコンピュータ達のこと」という認識。
人々に対して使うイメージはなかった。

twitter座談会で学んだ「クラスタ

  • 共通の属性をもつ人々の集まり。
  • twitter上では、SNSでよくある「コミュニティ」や「サークル」「グループ」など明確に定義されているわけではない。
  • 関連するつぶやきを行っている人々。
  • 会話している訳ではないが、流れがあり、やっぱり会話しているのかも。
  • twitterのつぶやきをwatchしていると存在にわかりだす。そこからがtwitterは面白い。
  • 可視化の可能性としては、「Tagtter」が有力。

クラスタの定義(自分の独断と偏見)

  • 同一属性をもつユーザの集合
  • 一時的に発生することもある
  • 長期的に存在するものもある
  • クラスタは生き物で、発生・メンバー増加・メンバー減少・消滅と常に変化していく
  • 参加しているメンバーが、クラスタに属している意識は低い。
    • (興味があるから会話に参加している→外部メンバーからみるとそのユーザはクラスタの一員)

クラスタを見つける方法を考えてみる。

  • お互いにフォローしあっているユーザは同一クラスタに所属していると考える
  • ダイレクトつぶやき(@付きつぶやき)をしているなら、元も先も同一クラスタに所属していると考える
  • お気に入りについてもダイレクトつぶやきと同じことがいえる
  • つぶやきの時間帯が似ているなら同一クラスタに所属している
  • 上記をそれぞれカウントし合計を求めることで、クラスタ分けが可能ではないか?

クラスタ化を判断する

クラスタかを判断するのをシステム化する方法は思いつかない。

サービス化可能か?

  • 自分が所属しているクラスタ内のメンバーで、まだ自分が属していないクラスタメンバー発見による友達の広がりはあるかもしれない
  • クラスタ内の主要メンバーのログを表示することで、システム的にまとめサイトができるかもしれない

この記事の注意

きばらしなので、ググって調べたり、まとめサイトに目を通したりといった調査はせずに自分の脳内だけで書いております。
ので、まったく違っている可能性もあります。