【募集背景】
Azure上に構築されるAIプラットフォームを中核として、AWS・GCP上の顧客/周辺システムと連携する構成を前提とした非機能要件を満たすための設計・実装・運用設計をリードしていただきます。
【作業内容】
SREエンジニアとして、AIプラットフォームの運用設計を軸に、クラウド基盤全体の設計・構築・運用をリードしていただきます。
Azure上の開発・本番環境の設計・構築(ネットワーク/セキュリティ/リソース設計・管理を含む)を行っていただきます。
AWS・GCP上の連携先システムとの接続を前提とした、クラウド間のネットワーク/セキュリティ/運用設計(接続性、権限、ログ、監査、障害時の切り分け等)を行っていただきます。
コンテナオーケストレーション環境(AKS)を中心としたKubernetes運用設計を行っていただきます。
マイクロサービス群を統合するAKSクラスタの設計・構築・最適化を行っていただきます。
Infrastructure as Code(例:Terraform)によるAzure環境の構築自動化を行っていただきます。
Observability/監視設計(Azure Monitor等)およびクラウド間連携を含む運用可視化・アラート設計を行っていただきます。
顧客から提示される非機能要件(可用性、性能、耐障害性、セキュリティ、運用性等)を踏まえ、クラウド構成・冗長化・監視設計・運用プロセスまで含めて要件充足するための設計・実装を行っていただきます。
データ領域(DB/ストレージ等)における、要件に応じたデータ冗長化・バックアップ・復旧・整合性確保および他クラウドの連携先システムとのデータ連携を考慮した構成設計を行っていただきます。
パフォーマンスチューニング、障害対応プロセスの整備、運用改善の継続推進を行っていただきます。
運用設計ドキュメント/手順書の作成・更新をリードし、他チーム・関係者と協調しながら信頼性向上を推進していただきます。
【求める人物像】
プロジェクト全体を俯瞰し推進できるリーダーシップを持ち、PM的な視点でタスク管理・課題解決に取り組める方を求めています。
主体性を発揮し、受動的・指示待ちではなく、プロジェクト成功に向けて能動的に貢献できる方を求めています。
関係者と円滑なコミュニケーションがとれ、技術的な内容を分かりやすく共有・調整できる方を求めています。
【開発環境】
Azureを中心としたクラウド基盤およびAKS、Terraform、Azure Monitor等を用いた環境です。