Trouble/Incident

2万社分のレンタルサーバー移行、知っておきたい意外な教訓

tech.nikkeibp.co.jp 老朽化していた物理サーバーを1881台廃棄した。 同社はヤフーの仮想化基盤上に新しい環境を構築した2015年から、ユーザー企業に新しい環境への移行を要請した。だが、移行支援ツールを用意した上でメールや書面で作業を依頼しても、ほと…

金融庁がコインチェックに異例の立ち入り検査、運用管理やセキュリティを目視で確認

itpro.nikkeibp.co.jp 詳しく調べる重点的な検査項目は次の4点。詳しく調べる重点的な検査項目は次の4点。 (1)情報システムをマルウエア(悪意のあるソフトウエア)の感染から防ぐ対策やリスク管理体制、(2)取引口座にひもづく暗号鍵の保管ルールや運用…

GMOペパボで不正アクセス、最大7万7385件の個人情報流出

itpro.nikkeibp.co.jp

障害が発生する前提で備える、クラウドのトラブル対処の考え方

itpro.nikkeibp.co.jp パブリッククラウドを利用する際に、手厚い準備をしておきたいのが「障害への対応」だ。インスタンス(仮想マシン)の冗長化構成などを採ったうえで、障害発生時の対処手順を明確にしておく。障害発生時の影響が大きい基幹系システムで…

ニンテンドーeショップ、クリスマスに約6時間ダウン(復旧済み)

www.itmedia.co.jp

米国防総省が市民のネット投稿を監視か? AWSの設定ミスで露呈

www.itmedia.co.jp

大規模な接続障害、Googleが謝罪 「ネットワークの誤設定」原因

www.itmedia.co.jp itpro.nikkeibp.co.jp

[続報]メルカリが個人情報流出で新情報、実際は「有効期限0秒のキャッシュ」

itpro.nikkeibp.co.jp

「メルカリ」Web版で個人情報流出 最大5万4180人分 キャッシュサーバ切り替えで障害

www.itmedia.co.jp tech.mercari.com

ZOZOTOWN、システム障害で26時間利用不可に 現在は復旧 データベース上のトラブルが原因

nlab.itmedia.co.jp

謝ったんだから、アナタが悪いんですよね。

www.atmarkit.co.jp プロジェクトの「客観的な仕事の完了基準」が設定されていなかった 「仕事の完了は、正常系の動作が仕様通りであり、また残存した欠陥についても、その解決が見込めること。今後、新たに発覚するかもしれない欠陥は、ベンダーが無償で対…

Azureの東日本リージョンが7時間にわたってダウン。原因はデータセンターの冷房が失われ自動シャットダウン。日本のリージョンはこの1カ月で三回目の障害

publickey1.jp

AWS でいままで起きた大規模障害を振り返る

qiita.com

AWS、S3の大惨事の原因を公開―ヒューマンエラーが発端だった

jp.techcrunch.com gigazine.net www.itmedia.co.jp www.publickey1.jp

Amazon S3が停止した日―アナリストは冗長性の重要性を指摘

jp.techcrunch.com

AWSのS3(US-EAST-1)がダウンでMediumやImgurなど多数のサービスに影響

www.itmedia.co.jp

GitLab.comが操作ミスで本番データベース喪失。5つあったはずのバックアップ手段は役立たず、頼みの綱は6時間前に偶然取ったスナップショット

www.publickey1.jp YP氏は、おそらくpg_basebackupに空のデータディレクトリが存在することによって動作がおかしくなっているのだろうと考え、このディレクトリを削除することにした。しかしその1~2秒後、彼はその操作が(セカンダリの)db2.cluster.gitlba…