何気ない記録

なんとなく自分の意見を書き記すときにつかいます。つまり不定期更新です。

バイマの鯖落ちから察するエニグモの社内

 

BUYMA運営のエニグモ、塩試合のハーフタイムにCM打ち過ぎてあえなくサーバーダウン : 市況かぶ全力2階建

バイマってかエニグモはエンジニアの地位が低いんかな…。インフラの投資が少ないわ、鯖落ちの謝罪は掲載しないわで明らかにエンジニア再度のフォロー対応が社内で潰されてる感じ。鯖落ち以上のその後の対応も微妙

2015/06/17 11:09

 

うーむ。

正直あれだけ大量に流すとインパクトと同じだけ嫌悪感しか湧かないし、うちの奥さんなんて「うぜー」っていった後DSの電源いれてリズム天国始める始末。

 

鯖落ちも相まって、相当無駄金だったんじゃねーかと思うんだけど、それはきっと代表の試合結果に対する不満の矛先となってしまっている為でしょう。

 

それはさておき。

 

あれだけうざい広告を投下しておきながら、サイトはダウンするという粗相をやらかしたわけですが、現状バイマのサイト上には謝罪は掲載されておりません。

もしかすると鯖落ち復帰の直後にはどこかに掲載されていたのかもしれませんが、私が見た時点ではいずれも掲載されている事実はありませんでした。

 

このサイトよく見ると、そもそも運営からの連絡がありません。

アカウント登録してログインすると、やっと案内が見えるのですが、当然そこにも昨日の鯖落ちについての連絡はありません。

 

念のためエニグモ側の方も見てみますが、ありません。

 

もっとも、ソーシャルサービス上にはコメントがでているので、うちの告知は全てソーシャルサービス上のアカウントでやっているんだ!と豪語されるならそれはそれでいいのですが、だとしても鯖落ちについては「メンテナンス・障害情報」には載せるべき内容ですよねー。

ちなみに、これまでは普通に表示遅延や計算の誤差などは障害扱いで掲載されていますので、今回の件だけ掲載しないというのは明らかに違和感があります。

 

不都合な事実は隠したいのでしょう。

 

ただ、今回の鯖落ちとか外から眺めると結構微妙な話にも思えます。

 

おおよそこれだけの広告を、それもあえて代表戦をほぼジャックする形でやるわけですから、リアクションの規模は想定しづらいものの、少なくとも何かしら対策は打ったものと思われます。

 

類似のケースとしてテレビ東京WBSで紹介された直後に鯖落ちするケースや、Yahoo!JAPANで記事が配信されたため鯖落ちするケースなどがありますので、規模は想定しにくいものの、CDN方面に相談していればもう少しなんとかなったんじゃないのかと思わなくもないです。

 

特に、メールサーバなどを見るとAWSで組み上げているようですので、そもそもそっち系であればあれだけ大規模な広告を打つ予算があるなら、なんとでもなったんじゃないかと思わなくもないのです。

(IP的にはIDCフロンティアが出てきますが、それもクラウドだと思われますので…)

 

大反響の結果、綺麗に撃沈するというのは、計画の甘さよりも最近の事情としてはエンジニアサイドの保守的な見積もりに対する信頼というか、関心の低さが招いているのではないかな、と思っています。

 

昔はサーバなんてものは年間契約や購入が必要であったりスポット対応が非常に難しく、その結果の鯖落ちという話でした。

昨今では、クラウドVPSの普及により、1日どころか1時間単位での増強も可能で、オートスケーリングという便利な機能やCDNの活用という選択肢もあり、予算をそれほど気遣う事なく、様々な対策を講じる事が可能となりました。

 

その結果、鯖落ち案件というのは、読みの甘さ以外の何物でもない結果でしかなく、それも、誰が読み間違ったのか、という事が問題の原因である事はいうまでもありません。

 

おおよそ今回のようなケースは事前に予測しやすいケースであるため、突然Yahoo!JAPANに関連記事が掲載されたようなケースと比較すると、どのタイミングでどの程度のアクセスが最低限行われるかは予想する事は可能です。

 

サッカーの試合では少なくともキックオフが大幅に遅れる事はまれで、ロスタイムも概ね3分〜4分程度ですから、逆算すればもっともアクセスが集中する時間は算出されます。

もっとも、試合自体が2時間程度で、前後含めても6時間も想定しておけば十分である事を考えると、ピークタイムの対策を6時間行っておけばよく、コスト的にも広告費と比べれば全くもって負担はありません。

 

また、代表戦の視聴率はほぼよい数字を叩き出しますし、今回は事前にチケットの売れ行きも好調だった事も加味すれば、トップラインで反響がある前提でアクセス数の想定を行えばまず外さないと思われます。

 

ここからはロジックとの兼ね合いではありますが、日々のアクセス数に対する各ファンクション毎の負荷率の相関を調べ、想定トラフィック数を見積もり、そこから増強規模の設定を行えばよいわけですね。

 

で、ここまでの話は、おそらく日常的に実サービスの運用や開発を担うエンジニアであればそれほど難しくない話で、問題は、この数字や対応プランについてなぜあれだけの広告費を投じたにも下変わらず実施に至らなかったのか?という点です。

 

どう考えてもあれだけの規模の広告への対応ですと、エンジニアサイドは相当保守的な数値を出す(少なくとも私であれば)と思いますので、それですら読みが甘かったという話であればそれまでですが、広告費の規模を考えると「甘い」で済ますレベルではないと思います。

そう考えても、保守的な数値が出ていたが、なんらかの理由でそれが楽観視され、結果あの鯖落ちに至ったのではないか?と感じます。

 

外から見た感想にすぎませんが、エニグモ社内でそう言ったエンジニアの意見に対してちょっと過小に評価する傾向があるのかなぁと穿った目で見たくなってしまいます。

 

また、通常は運用担当者としても不具合告知は速やかに出すべきと考える(告知がでない事による、さらなる問い合わせなどを避ける為)ものですから、それすら出さないというのは、運営サイドの意見や対応よりも、営業サイドの事情で押し切っているという感じがします。

 

スタートアップベンチャーの時点でこのような匂いを醸し出すというのは、なかなか香ばしい気がします。

 

仮に、エンジニアサイドや運営サイドにそう言った情報の開示を怠る傾向が「仮に」あったとしても経営サイドが適切なフォローをすればよい話です。

ですが、エニグモ側のリリースにも出ていませんし、結局は「なかった事」というアピールを恐らくは当面するものと思われます。

(もっとも、もともとサービス側で告知することで運営会社で告知するような内容ではありませんが)

 

当然、中の事を私は知りませんので、ぜひ社内に詳しい方がいたら、実際の話を投稿いただければと思いますが、外から見ていると「イケイケでやってるわりに、しょっぱい環境をエンジニアサイドに押し付けるってのは関心しないなぁ」という感想しか湧いてこないというのが本音で、最近のスタートアップベンチャー界隈の闇を見たような気すら感じました。

 

代表戦のなんとも微妙な結果と合わせて、なんとも微妙なスタートアップ界隈の1面を垣間見た昨晩でした。