経営情報システム SRE (サイト・リライアビリティ・エンジニアリング)

SREについて

SREとは

SREは、グーグル社が提唱・実践しているインフラ運用方針であり、ソフトウェアエンジニアの役割である。この役割を果たすエンジニアをサイト・リライアビリティ・エンジニア(こちらもSRE)と呼ぶ。当時グーグルはインフラ運用の可用性を低下させているという直接的な課題と間接的な課題を抱えており、その2つ問題を解決するためにSREが発案された。

従来からの2つの課題

これまでインフラを管理するエンジニアは、自動でできるような作業も厳密なマニュアルを作って手作業で行なってきた。その中で、手作業によるコストと担当者間のコミュニケーションコストなどが問題になっていた。

①直接的な課題 … 手作業によるシステム運用コストなど

②間接的な課題 … DevOps担当者間のコミュニケーションコストなど

課題解決のための自動化

高い可用性で運営を行うには人手による運用を減らし、ソフトウェア開発によって作業を自動化し、処理の負荷や障害の発生を監視を推奨することで成り立つ。

SRE担当者が安定したシステムを構築することで、Dev担当者とOps担当者が協力して開発するコストを軽減し、効率的な開発を可能とする。