今話題の音声SNS「Clubhouse」はどう盛り上がっているのかデータ分析してみた
Clubhouse(クラブハウス)という音声SNSが突然日本で流行りだしました.Clubhouseの詳細はこの辺の記事をご覧ください.
流行りだしたんだからデータを分析したくなるのが,計算社会科学者のサガなわけですが,残念ながらClubhouseの内部データを直接取ることは当然できません.一部では「クラブハウスのAPIが公開されている」という噂もありましたが,違うClubhouseでした.割と一般的に使われる名称をSNSとかに使われるとこういう時になかなか困ります.
というわけで,代替手段としてTwitter上に投稿されたイベントの告知データを取得して,そこからClubhouseの現状について分析してみたいと思います.
イベント告知のURLはある程度決まっているため,当該URLが含まれるツイートを収集し,イベントページから情報を確認します.
データは1月21日から1月25日まで収集しました.そのうち,イベント告知のリンクがついていたものは17,130ツイートありました.
Clubhouseの利用の増加
まず,1月21日からイベントURLが一日にどのくらいツイートされていたのかを見てみましょう.
およそ1月26日くらいからイベント告知ツイート数がどんどん増加していっていることが分かります.それまでは400件弱だったのに対し,2月5日は2000件を超えており,5倍程度のイベント告知がツイートされています.
ここからも,それなりのブームになっていることが分かります.
イベントすべてがツイッター上で告知されるわけではないでしょうが,少なくとも外にオープンになるイベントが5倍に増加したということは,同程度には活性化していると考えてよいのではないでしょうか.
日本語の利用率
さて,1月26日くらいから日本でClubhouseが流行り始めたようですが,ツイッター上で日本語のイベントが最初に確認されたのは,1月24日1:00から開始された「日本人ユーザーさん、ミートアップしましょう〜」というものでした.
その後,日本人が大量参入してClubhouse内に一気に日本語のイベントが増加していったようです.
以下のグラフは,イベントの開始(予定)日ごとの日本語が使われているイベントとそれ以外のイベントの数,そして日本語率を示したものです.
1月26日くらいから日本語イベントが増加し,1月28日には半分以上が日本語のイベントになりました.日本人の中で大ヒットしている様子が見て取れます.
とはいえ,実際に半分以上が日本語のイベントだったかどうかについては慎重に考える必要があります.そもそもツイッターからデータを取っていますが,日本人のツイッター利用率は高いため,その分多めに出てしまっている可能性は否定できません.
とはいえ,かなりの日本人がClubhouseを利用し始めたのは間違いないでしょう.
ちなみに,6日以降激減しているのは5日までに予告イベントとして登録されたものだけを取っているためです.
また,イベントの主催者数の累計を見てみると,以下のようなペースで増加しています.
2月5日の深夜までの間に日本語イベントの主催者がトータルで1万人を突破しています.なかなかな増加っぷりです.
イベント開催時間
先ほどのイベントの主催者の増え方がガタガタしていることから,どうやらイベントは特定の時間に集中して行われているような気がします.
というわけで,日本語のイベントがいつ行われているのか調べてみました.日本時間の何時台にイベントがスタートしたのかをプロットしたものがこちらです.
イベントの多くが20~22時に集中していることが分かります.このくらいの時間がClubhouseのゴールデンタイムといえそうです.思ったより0時以降の開始のイベントは少ないんですね.意外とみんな健康的.
主催者ネットワーク
最後に主催者同士の関係をネットワークにしてみてみましょう.一度でも同じイベントに登壇予定だった主催者をリンクで結びネットワークを作成してみました.
日本語のイベントに参加しているアカウントだけをピックアップしています.トータルで1万人もいたので,全部をプロットするのは難しいのですが,最大コンポーネントを中心にプロットした図がこちらです.
かなり巨大な塊が一つと,周りにもチラホラとコミュニティができているのが分かります.この辺,本当は時間発展とか見ると面白そうなのですが,今回は時間の都合上割愛.
折角ネットワークを作ったので,Louvain法を使ってクラスタリングをしてみました.
さすがに大量のクラスタができてしまって収拾がつかなかったので,人数の多いクラスタから特徴的なものをピックアップしてみました.
クラスタ0
クラスタ0のイベントタイトルによく使われていた単語のワードクラウドが以下の通りです.
全体的に統一感のないようなトークが繰り広げられているようですが,主催者を見てみると,
・小島慶子
・イケハヤ
・Yoichi Ochiai
などが並んでいて,主にビジネス分野などの有名人がトークをするイベントが多いクラスタだということが分かりました.
開催されたイベント数も2月5日までに295と他のクラスタよりも圧倒的に多く,日本のClubhouseの中心的存在であることが分かります.やはり有名人強い.
ちなみに,このクラスタにはネルー値で有名な同僚のAI研究者松尾豊先生が入っていました.なんで研究者がここに?と思ったけど,この原稿を書きながらClubhouseを立ち上げたらちょうど松尾先生がこじるりさんとトークイベントをしてました.なるほど.
クラスタ1
クラスタ1のワードクラウドはこんな感じでした.
こちらは,主にベンチャービジネス系の人たちの集まったクラスタという感じでした.何人か中心的な人物をググってみたのですが,ベンチャーキャピタルやら起業やらの言葉が飛び交っていたので,多分そんな感じ.
あと,D2というのがありますが,これは形態素解析のミスで,D2Cが正解のようです.Direct to Consumerの略だそうです.
クラスタ2
クラスタ2のワードクラウドはこんな感じ.
こちらは,完全に初心者向けの使い方講座といった感じのイベントが多いクラスタでした.
クラスタ3~5あたりも,ビジネス系の話題が多い感じで,とりあえずベンチャーやIT系の人たちが中心になってコミュニティを作っている様子がうかがえました.
クラスタ6
ちょっと毛色が変わったところですと,クラスタ6がありました.
こちらは,Jリーグ関係者が多く存在するコミュニティでした.ビジネス系が多い中でこういったコミュニティも存在するというのはなかなか面白いですね.とはいえ,Jリーガーが入っているわけではなく,Jリーグの広報とか営業とかそんな感じの人たちが入っているようで,やはりビジネスよりのようです.
クラスタ7
クラスタ7も特徴的なワードクラウドが出来上がりました.
こちらは完全に医療系ですね.といっても,コロナ関係の話などではなく,医療ビジネスや医療テックの話がメインのようです.この辺,やはりClubhouseはビジネス系の人たちメインのSNSなんだなと感じさせられました.
各クラスタでのイベントの時系列変化
最後に各クラスタに所属する人たちがイベントを行った回数を時間を追ってみていきたいと思います.
これを見ると,やはりクラスタ0の人たちが行うイベントが圧倒的に伸びていることが分かります.2月5日の時点で,クラスタ0が295件,クラスタ1が177件,クラスタ2が132件のイベントを行っています.当分の間はここがClubhouseの日本の中心となって盛り上げていくのではないかなと思われます.
おわりに
というわけで,最近流行っているらしい音声SNS,ClubhouseのデータをTwitterから拾える分だけ調べてみました.
個人的には1週間くらいで皆飽きるんじゃないかなと思っていたので,意外と続いているなという印象です.
とはいえ,なんか「新しもの好き=アーリーアダプター」の間で流行っている雰囲気ですので,これが一般に浸透していくかどうかは今後を見極めないといけない気がしますね.クラスタ6,7のようなちょっと捻ったコミュニティがもっと増えるといいのかなとも思いますが,この辺も結局ビジネス系なんですよね.
ビジネス系だけのイベントで今後も展開していくのか,新たなブレイクスルーがあるのか,今後の展開に注目です.
最後にデータ分析あるあるなとても良い話なんですが,実は今回調べていたら最初2月1日くらいから急激に取れるイベント数が減ったんですよね.「なんだ,やっぱりもう飽きられてたのか?」と思ったのですが,あまりにも急激な減り方だったのでおかしいなと思ってよくよく調べてみたら,2月1日くらいに微妙に仕様が変更されていて,データが取れなくなっていたことが分かりました.
新しいサービスだから仕様変更はつきものだけど,分析する側としては本当にやめてほしい.もうちょっとで「Clubhouseはすでにオワコン」という記事を書いてしまう所でした.危ない危ない.