本/雑誌
SREサイトリライアビリティエンジニアリング Googleの信頼性を支えるエンジニアリングチーム / 原タイトル:Site Reliability Engineering
BetsyBeyer/編 ChrisJones/編 JenniferPetoff/編 NiallRichardMurphy/編 澤田武男/監訳 関根達夫/監訳 細川一茂/監訳 矢吹大輔/監訳 玉川竜司/訳
5280円
ポイント | 1% (52p) |
---|---|
発売日 | 2017年08月発売 |
出荷目安 | メーカー在庫見込あり:1-3週間
※出荷目安について |
追跡可能メール便利用不可商品です
- ゆうパック 送料無料
著者・出版社・関連アーティスト
商品説明
サイトリライアビリティエンジニアリング(SRE)とは、Googleで培われたシステム管理とサービス運用の方法論です。GoogleのSREチームの主要メンバーによって書かれた本書は、ソフトウェアのライフサイクル全体にコミットすることで世界最大規模のソフトウェアシステムがどのように構築、導入、監視、維持されているのかを解説します。はじめにリスク管理やサービスレベル目標、リリースエンジニアリングなどSREの行動の基礎となる原則について解説し、次にインシデント管理や障害の根本原因分析、SRE内でのソフトウェア開発など大規模分散コンピューティングシステムを構築し運用するSREの実践について詳述します。さらにSREのトレーニングやコミュニケーションなどの管理について紹介します。急速にスケールするサービスを高い信頼性で運用する方法を解説する本書はエンジニア必携の一冊です。
関連記事
収録内容
1 | 第1部 イントロダクション(イントロダクション |
2 | SREの観点から見たGoogleのプロダクション環境) |
3 | 第2部 原則(リスクの受容 |
4 | サービスレベル目標 ほか) |
5 | 第3部 実践(時系列データからの実践的なアラート |
6 | オンコール対応 ほか) |
7 | 第4部 管理(SREの成長を加速する方法:新人からオンコール担当、そしてその先へ |
8 | 割り込みへの対処 ほか) |
9 | 第5部 まとめ(他の業界からの教訓 |
10 | まとめ) |
11 | 付録 |
close