ツヨライブ

Web業界で働く大村剛士(オオムラツヨシ)のWebマーケティングブログ。新しいユーザー体験を考えたり、紹介したり。

Twitterの投稿数は1日5000万だという話

Google, Twitter, Web, コミュニケーション 2月 23rd, 2010

As a member of the Twitter analytics team, part of my job is to measure and understand growth. The graph above tells a story of how we’ve grown over the past three years in terms of number of tweets created per day. Please note that tweets from accounts identified as spam have been removed so the counts in this chart do not include spam.

(Twitter分析チームではTweetの推移を分析しているのですが、上野グラフでは毎日のTweet量を、過去三年間でどのように推移したかを表しているものです。なお、スパムはこの数値には含まれていません。)

引用元: Twitter Blog: Measuring Tweets.

1日に5000万のツイートですってよ。レコード長が140バイト。ただし日本語は140文字なので、280バイト(かそれ以上)。同じDB設計なら280バイトで、さらにプロファイル情報なども考えるとレコードあたり400バイトぐらいのデータ長で考える必要がありますが、だとすると一日に増加するデータ容量は、

400Byte × 5000万 = 200億バイト≒約18.6GB/日

もうすこし読むと、下のほうに、

Today, we are seeing 50 million tweets per day—that’s an average of 600 tweets per second. (Yes, we have TPS reports.)

(現在、一日に5000万のTweetsがあり、それは平均600Tweets/秒になります)

となっています。勢いがすごいな。

データ量にして、一ヶ月に558GB、一年で6.5TB。まあこれはテキストだけなので、写真などのマルチメディアデータは含みません。たいした容量です。

たいした量ですが・・・思ったほどではなかったな。なぜかというと、だいぶ前にGoogleEarthの記事を読んだからかも。

http://www.itmedia.co.jp/news/articles/0609/27/news104.html

Google Earthのデータは「70Tバイト以上」
Google Earth開発責任者が来日し、「Google Earthのデータ量は70Tバイト以上」と明かした。データ量は毎月増えているといい、ユーザーによるコンテンツの追加にも期待をかける。

あと、このへんとかも。

http://gigazine.net/index.php?/news/comments/20080110_google_20petabytes/

Googleフェローの発表資料によると、2007年9月時点でGoogleは1日に20ペタバイト(20,000テラバイト=20,000,000ギガ バイト)以上のデータを大規模なコンピュータ群で処理しているようです。それにしても想像するのが難しいほどのデータ量ですね。

ペタとか、意味がわからんですよ。そのうちカンタンに扱えるサイズになるんだろうか。「この映画、2時間ほどですがデータは1ペタぐらいですね」「こちらの機器の転送量は2Pbpsですね」的な。

頑張れムーアの法則。

・・・と、ひさしぶりにせっかくちゃんと書いたと思ったら、GIGAZINEにすでにまとめられていた・・・かなしいとき。とりあえずトラックバックしておこう。

http://gigazine.net/index.php?/news/comments/20100223_twitter_50million_tweets_per_day/

関連記事


このエントリをはてなブックマークに登録 この記事をPOOKMARKに登録する Deliciousにブックマーク Yahoo!ブックマークに登録このエントリをlivedoorクリップに登録 このエントリをBuzzurlにブックマーク

コメントをお願いします