HootSuiteはAWSの障害から如何に回復したか

21日の夜、いつも使っているTwitterのクライアントソフトHootSuiteを起動して、ツィートを見ようとしたところ、なんだか調子悪い。投稿するとエラーになる、ツィートリストの更新も時々エラーになる。ま、こんな夜もあるさ、と諦めてベッドへ。次の朝、再チャレンジしたものの、むしろエラーの発生確率が高まったような気がして、直接Twitter.jpにアクセスしたところ、アマゾンAWSに障害が発生していることを知ったわけです。
AWSの障害は数日続き、大きな話題となりました。
このAWSの障害については、別途書きたいと思いますが、HootSuiteが如何に障害から回復したかについて、InformationWeekに記載されていますので、それを紹介しましょう。クラウドを考える上での参考になると思います。

HootSuiteはアマゾンのクラウドコンピューティングサービスを使うことにより、急速に成長することができた。ただし、今回の障害によりHootSuiteは、サービスが実際どの程度の信頼性を有しており、今後の障害リスクを如何にヘッジするかを再検討している。
HootSuiteのCTOであるSimon Stanlake氏が「全くの最悪ケースのシナリオ」と呼ぶ、アマゾンAWSの東海岸のデータセンタが障害になった木曜日、一日分の営業日をロスしたことになる。
ウェブ上の(Salesforce.comの)Chatterをモニターするソーシャルメディア・ダッシュボード機能を提供するHootSuiteは、木曜日の1:00amから7:00pmまでオフラインになった。その後、同じアマゾンデータセンターの異なるAvailability Zone上にバックアップサーバからサービスをリストアすることが出来た。アマゾンは、これらのZoneを高可用性のアーキテクチャの一部として市場展開している。すなわち、データセンター内の1つのZoneに障害が発生しても、その他のZoneに存在する顧客には影響がない設計になっていた。しかしながら、バージニアデータセンターの4つのZone全てが木曜日の事象が発生中影響を受け、データセンター・サービスは週末まで完全復活しなかった。
HootSuiteは、その時点でオフラインのAvailability Zoneに囲われていた、いくつかのカスタマデータを犠牲にし、火曜日の夜の時点のバックアップを元に進め、木曜日の夜にサービスを回復できた。これは、その期間中の新規ユーザや更新を行ったユーザ操作の一部を消失したことを意味する。
ブログへの投稿で、HootSuiteは、全ての$50ドル(および企業ユーザには追加の措置)を提供するとしている。HootSuiteのサービス規約では、24時間以上サービス停止の場合にのみ、払い戻しをするとしている。「ユーザに不便をかけたことを認識しており、正しいことをしたいのだ」(CEOのRyan Holmes氏)
Stanlak氏はアマゾンのインフラがもろかったことは不快な驚きであったとしている。「全てのAvailability Zoneが駄目になるのは、地域全体を駄目にする地震のようなシナリオであるという印象を持っていた。」とStanlak氏はインタビューに答えている。
Satanlake氏は、一部はリスクは極めて少ないという観点から、バックアップとリカバリ計画をどの程度保守的にするべきかを決定していた。例えば、HootSuiteの本番データベースとWebサービスのインスタンスを頻繁に同期化したもので、いざというときには本番運用できる「ホットバックアップ」を維持するために必要な費用を評価する際に意味が出てくる。リスクは比較的に低いと考えていたため、一日分のデータを消失するリスクを受け入れていたのだ。
Stanlake氏によれば、HootSuiteのサービスでは、ユーザアカウントデータの管理はアマゾンのEBS(Elastic Block Storage)サービスに異存していた。木曜日の午後遅くまでに、アマゾンは4つのAvailability Zoneのうち、3つのZoneでサービスのリストアを完了した。しかし、HootSuiteの本番データベースを含むZoneはアクセスできなかった。時間が経つにつれ、またアマゾンが問題解決に近づいていないように思えたため、エンジニアチームはデータベースのバックアップコピーを元にサービスのリストアする以外に選択肢はないと決断した。「我々はこんな決定をしたくなかった。ただ、結果的にベストオプションであった。」(Stanlake氏)
というのも、HootSuiteは日曜日になるまでデータベースへのアクセスが回復しなかったからだ。
このような大変な状況であったが、Stanlake氏はクラウドコンピューティングのアイデアはまだ生きているとしている。技術をベースとしたスタートアップ企業にとって急速に成長するためには、標準的なWeb戦略になっているからだ。
「これらのサービスがなければ、今日の我々はなかったことに間違いないと思う。再発防止に関してサービスプロバイダと真剣な議論をする予定であることは確かだが。」(Stanlake氏)
「あらゆる可能性を否定しないが、おそらくすぐにアマゾンから移ることはないのではないかと思う。」(Stanlake氏)
「HootSuiteは冗長化に加えて、地域的に世界中の顧客をカバーするために、他のデータセンターとのリプリケーションするインフラ構築をすでに進めている。おそらくこの計画を加速するだろう。しかし、最も効率的な分散アーキテクチャの構築には時間がかかる。難しいのは、それを適切に行うことなのだ。」(Stanlake氏)

2010年当初の予測を振り返る:第六話

2011年の1ヶ月目も半ばを過ぎたところで、去年はどうだった、今年はどうなる、といった話はそろそろ終わりにしようかと思います。その最後を飾るのは、やはりお気に入りのAppirio
2010 Cloud Predictions – Year in Review“と題した記事で2010年当初の予測を振り返っていますので、それをレビューしてみましょう。

予測No.6 エンタープライズ・コラボレーションは機能であってビジネスではない

SalesforceのChatterやGoogle Waveはビジネスアプリケーションと透過的に統合されたリアルタイム・コラボレーションという価値があるが、単独のエンタープライズ・コラボレーションは競合上困難になるであろうと予測。

評決

当たり。Google Waveを例にとれば、元々の形としては消えてしまったが、コラボレーション技術の先進的な部分のいくつかはGoogle Appsに取り込まれている。SalesforceのChatterプラットフォームの進化と、Chatter Freeの発表により、エンタープライズ・コラボレーションにおいて、単独ビジネスの構築がいかに困難であるかが明らかになっている。

コラボレーション・ツールというのは、便利ではあるのですが、じゃあどれくらいビジネスに貢献できるのか、その投資効果はどの程度か、と聞かれるとなかなか明確に答えられないものであるため、単独のビジネスは難しいのでしょう。

2011年中小企業向け技術予想トップ10:第2話

IT Analysisというサイトで、SMB Groupが行った2011年中小企業向け技術予想トップ10が紹介されています。この予想を検証してみたいと思います。

No 2. 中小企業がソーシャルメディアの今ラインを整理するよう求める

中小企業は、ソーシャルメディアの流れにのり、新規顧客の開拓や顧客サービスの改善に役立てようとしている。しかし、(ツィッター、Facebook、ブログなどの)ソーシャルメディア間をまたがるマーケティング、ブランディング、評判、さらには、これまでのCRMソリューションを管理していくのは悪夢のようだ。2010年市場への道と題した調査にも記したように最も大きなチャレンジでもある。

2011年、中小企業は、異なるチャネルにまたがるインバウンドおよびアウトバウンドの活動を効率化し、その効果を計測できるようなひとまとめにしたソリューションを求めるようになる。

ベンダーはこれらのチャレンジに対応できるよう努力している。例えば、BatchBlueの”Social CRM”は、小規模ビジネス向けに営業のコンタクトと、ソーシャルメディアへのフィードを統合している。HubSpotのインバウンドマーケティングは、統一したダッシュボード上で、「見つけてもらえる」ようなコンテンツを作成し、最適化し、広め、より多くの取引をまとめ、web上で関連するやりとり同士をリンクすることに役立つ。Sage CRMソリューションは、ソーシャルメディアと、ビジネスチャンスやコンタクトを統合し、営業、セールス、サポートに携わる人々の営業活動やマーケティングキャンペーンの優先付けや絞りこみをより効果的に行うことができる。Salesforce.comのChatterはSalesforceユーザには無料で提供され、プロフィール、グループ、オンラインドキュメント共有、タスク管理、コンタクト、ウェブフォーム、ステータス更新、ニュースフィードをCRMと統合することが可能となる。