1998年、ピクサーで災害が発生しました。たった一つの誤入力されたコマンド — rm -rf / — によって、トイ・ストーリー2が存在から消え始めました。キャラクターごと、シーンごとに、1年かけて作り上げた映画が数秒で消えていきました。チームは、ウッディの帽子、バズの翼、そして全てのセットが目の前から消えていくのを信じられない思いで見ていました。エンジニアたちがバックアップから復元しようと急いだとき、さらに悪いことに気づきました — バックアップシステムは数週間前に静かに故障していたのです。ITプロフェッショナルとして、私たちは皆このような経験をしたことがありますが、これから何を学び、バズを時間通りに彼の宇宙船に乗せることができるでしょうか?
この「コアメモリー」は1998年に起こりました。ピクサーの共同創設者エド・キャットマルが彼の著書「Creativity, Inc.」でこれを回想しています。物語は、内部サーバーで日常的なファイルクリアランスを行っていた不運な名前のないピクサー従業員が、誤ってトイ・ストーリー2のルートフォルダに削除コマンドを入力したところから始まります…これは良いニュースです。この「履歴書更新イベント」により、キャラクターモデルやアセットが消え、ファイルサーバーはすぐにシャットダウンされました。
\ 残念ながら、その時点でトイ・ストーリー2の作業の約90%が失われ、続編のバックアップシステムも約1ヶ月間正常に機能していませんでした。この時点で、トイ・ストーリー2は一からやり直すか、制作を完全に中止するかのどちらかでした。
バズとウッディが協力して家に帰るように、母親が救世主となりました。映画のテクニカルディレクション監督であり、2023年のディズニーの人員削減の影響を受けることになるゲイリン・サスマンは、自宅にトイ・ストーリープロジェクトのコピーを持っていました。ゲイリンは産休中で、自宅から仕事を続けることを決めました — 今日では普通のことですが、当時はタブーでした。母親として、子育てと同じように常に先を見据えて計画を立て、週に一度は仕事を持ち帰ることを心がけていました。これは大きな利点でした。なぜなら、最新情報を得ながらトイ・ストーリー2の信頼性の高いバックアップを維持することができたからです。
\ 新生児のように、ピクサーは慎重にラップトップをオフィスに運び、車での移動中はブランケットで包み込みました — ラップトップのために子守唄を流したかもしれないと想像します…あるいは、それは私がするようなことかもしれません。サスマンのラップトップからのバックアップがあったおかげで、チームはファイルをコピーし、失われたほぼすべてのものを回復することができました。
\ それは多くのハイタッチがある喜ばしい機会であり、削除の責任者の顔にも笑顔をもたらしたかもしれません。サスマンのバックアップコピーには映画全体がコンピュータに入っていませんでしたが、彼らはトイ・ストーリー2を時間通りに完成させ、納品するのに十分なものを取り戻すことができました。インスピレーションを与える音楽を流し、誰も見ていないかのように踊りましょう。なんて素晴らしい話でしょう?
\ ファイルを削除した従業員はどうなったのでしょうか?注目していただいて嬉しいです。今のところ、彼らが解雇されたり、結果に直面したりしたという報告はありません。当時の緊張感は想像しやすく、おそらく彼らとバックアッププロセスに関する将来のプロジェクトがあったのかもしれません。
この経験は、ピクサーの人々だけでなく、世界中のITプロフェッショナルにとって貴重な教訓となります。複数のバックアップを作成し、このような事件が再び起こらないように追加のセキュリティ対策を実施するという強い決意があります。
\ この話では、バックアップシステムは数ヶ月前に故障していたにもかかわらず、誰も気づきませんでした。それは復元するためのバックアップがなく、ビジネスが停滞していたことを意味します。これは今日の出来事に似ていると思いませんか?そうであるべきです。なぜなら、最近ではよく起こることだからです。企業はこの災害から安全を確保するために何ができるでしょうか?
3-2-1ルール - データバックアップルールは、データの3つのコピーを2つの異なるタイプのストレージメディアに保存し、1つのコピーをオフサイトに保存することを推奨する戦略です。この方法は冗長性を確保し、ハードウェア障害、盗難、またはローカルな災害などの単一障害点からデータを保護します。
\
オフサイトバックアップ - オフサイト、エアギャップデータバックアップは、データのコピーを別の物理的またはクラウドロケーション(オフサイト)に保存し、プライマリネットワークから切断された状態(エアギャップ)を維持します。この組み合わせにより、ローカライズされた災害やランサムウェアなどのサイバー脅威からデータを保護します。ランサムウェアはエアギャップされたバックアップコピーにリモートでアクセスしたり破壊したりすることができません。
\
RPO&RTO - リカバリーポイント目標とリカバリータイム目標。これは重要なだけでなく、災害時のビジネス継続性と生存にとって不可欠です。ほとんどの企業は、テスト済みで監査に合格したバックアップを持っていると述べていますが、災害が発生してシステムを復元する必要がある場合、計画よりもはるかに長い時間がかかり、そのためにビジネスは損失を被ります。
\
コマンドレベルの制限。従業員はrm -r Linuxコマンドを使用しました。これはディレクトリとそのすべての内容を再帰的に削除します。より高度なシステムでは、特別なスクリプトを使用するか、2段階認証を要求することで、最高プロジェクトディレクトリレベルでこのコマンドが実行されるのを防ぐことができたでしょう。
\
\


