Twitterの投稿数は1日5000万だという話
Google, Twitter, Web, コミュニケーション 2月 23rd, 2010
As a member of the Twitter analytics team, part of my job is to measure and understand growth. The graph above tells a story of how we’ve grown over the past three years in terms of number of tweets created per day. Please note that tweets from accounts identified as spam have been removed so the counts in this chart do not include spam.
(Twitter分析チームではTweetの推移を分析しているのですが、上野グラフでは毎日のTweet量を、過去三年間でどのように推移したかを表しているものです。なお、スパムはこの数値には含まれていません。)
1日に5000万のツイートですってよ。レコード長が140バイト。ただし日本語は140文字なので、280バイト(かそれ以上)。同じDB設計なら280バイトで、さらにプロファイル情報なども考えるとレコードあたり400バイトぐらいのデータ長で考える必要がありますが、だとすると一日に増加するデータ容量は、
400Byte × 5000万 = 200億バイト≒約18.6GB/日
もうすこし読むと、下のほうに、
Today, we are seeing 50 million tweets per day—that’s an average of 600 tweets per second. (Yes, we have TPS reports.)
(現在、一日に5000万のTweetsがあり、それは平均600Tweets/秒になります)
となっています。勢いがすごいな。
データ量にして、一ヶ月に558GB、一年で6.5TB。まあこれはテキストだけなので、写真などのマルチメディアデータは含みません。たいした容量です。
たいした量ですが・・・思ったほどではなかったな。なぜかというと、だいぶ前にGoogleEarthの記事を読んだからかも。
http://www.itmedia.co.jp/news/articles/0609/27/news104.html
Google Earthのデータは「70Tバイト以上」
Google Earth開発責任者が来日し、「Google Earthのデータ量は70Tバイト以上」と明かした。データ量は毎月増えているといい、ユーザーによるコンテンツの追加にも期待をかける。
あと、このへんとかも。
http://gigazine.net/index.php?/news/comments/20080110_google_20petabytes/
Googleフェローの発表資料によると、2007年9月時点でGoogleは1日に20ペタバイト(20,000テラバイト=20,000,000ギガ バイト)以上のデータを大規模なコンピュータ群で処理しているようです。それにしても想像するのが難しいほどのデータ量ですね。
ペタとか、意味がわからんですよ。そのうちカンタンに扱えるサイズになるんだろうか。「この映画、2時間ほどですがデータは1ペタぐらいですね」「こちらの機器の転送量は2Pbpsですね」的な。
頑張れムーアの法則。
・・・と、ひさしぶりにせっかくちゃんと書いたと思ったら、GIGAZINEにすでにまとめられていた・・・かなしいとき。とりあえずトラックバックしておこう。
http://gigazine.net/index.php?/news/comments/20100223_twitter_50million_tweets_per_day/
関連記事
- iPad購入一週間後レポート
- Google chromeの動画アレコレ
- 失敗を 笑い飛ばした バンクーバー
- iPadを買いたい人が客観的にデータを見てみようとする記事
- ドメインを変更するべきかどうかについてまとめ
- クリスマスプレゼントにはiPod touchが人気
- 最近の読書|Twitter Power


