NEW
リモート可
【Azure/Kubernetes/一部リモート】AIプラットフォームSRE基盤設計・運用案件
雇用形態
業務委託(フリーランス)
業務内容
【募集背景】
Azure上に構築されるAIプラットフォームを中核として、AWS・GCP上の顧客/周辺システムと連携する構成を前提とした非機能要件を満たすための設計・実装・運用設計をリードしていただきます。
【作業内容】
SREエンジニアとして、AIプラットフォームの運用設計を軸に、クラウド基盤全体の設計・構築・運用をリードしていただきます。
Azure上の開発・本番環境の設計・構築(ネットワーク/セキュリティ/リソース設計・管理を含む)を行っていただきます。
AWS・GCP上の連携先システムとの接続を前提とした、クラウド間のネットワーク/セキュリティ/運用設計(接続性、権限、ログ、監査、障害時の切り分け等)を行っていただきます。
コンテナオーケストレーション環境(AKS)を中心としたKubernetes運用設計を行っていただきます。
マイクロサービス群を統合するAKSクラスタの設計・構築・最適化を行っていただきます。
Infrastructure as Code(例:Terraform)によるAzure環境の構築自動化を行っていただきます。
Observability/監視設計(Azure Monitor等)およびクラウド間連携を含む運用可視化・アラート設計を行っていただきます。
顧客から提示される非機能要件(可用性、性能、耐障害性、セキュリティ、運用性等)を踏まえ、クラウド構成・冗長化・監視設計・運用プロセスまで含めて要件充足するための設計・実装を行っていただきます。
データ領域(DB/ストレージ等)における、要件に応じたデータ冗長化・バックアップ・復旧・整合性確保および他クラウドの連携先システムとのデータ連携を考慮した構成設計を行っていただきます。
パフォーマンスチューニング、障害対応プロセスの整備、運用改善の継続推進を行っていただきます。
運用設計ドキュメント/手順書の作成・更新をリードし、他チーム・関係者と協調しながら信頼性向上を推進していただきます。
【求める人物像】
プロジェクト全体を俯瞰し推進できるリーダーシップを持ち、PM的な視点でタスク管理・課題解決に取り組める方を求めています。
主体性を発揮し、受動的・指示待ちではなく、プロジェクト成功に向けて能動的に貢献できる方を求めています。
関係者と円滑なコミュニケーションがとれ、技術的な内容を分かりやすく共有・調整できる方を求めています。
【開発環境】
Azureを中心としたクラウド基盤およびAKS、Terraform、Azure Monitor等を用いた環境です。
スキルタグ
求めるスキル
- ■必須スキル:
- ・Kubernetesを用いた運用設計の経験 ・Terraform等によるInfrastructure as Codeの経験(Azure環境) ・Azureクラウドの知識・実務経験(複数サービスを組み合わせた設計・運用経験) ・Observability設計の経験(Azure Monitor、Datadog等の監視ツールを活用した監視・可視化設計) ・非機能要件(可用性・性能・耐障害性・セキュリティ・運用性等)を踏まえた設計・実装経験
- ■歓迎スキル:
- ・AKS(Azure Kubernetes Service)の運用経験 ・AWS/GCP上のシステムと連携する構成の設計・運用経験(連携先としての理解で可) ・FinOpsの知見・コスト最適化の実務経験 ・Cosmos DBやSQL系データベースのパフォーマンスチューニング経験 ・AIワークロード/高負荷API基盤/大規模検索基盤の運用経験 ・OpenAIやLLM(大規模言語モデル)基盤の運用経験
更新日: 1日前