【募集背景】
ユーザー数のさらなる増加を実現するためのサービス拡大を目指しているが、そのためにはサイトの信頼性を高めるSREの強化が重要なポイントと捉えています。SREとして、プロアクティブに施策を実施していけるようにチームに新たな方を迎えることで、組織強化を図りたいと考え増員募集をします。
【作業内容】
急拡大中の事業を牽引するSRE(Site Reliability Engineer)ポジションを任せします。
具体的には「どのようにしたらサービスをより多くの方に、より便利に使ってもらえるか」というユーザー視点に立ち、
仮説・実行・検証のサイクルを回しながら、サービスの信頼性を高めて頂きます。
・SLA/SLO/SLIの設定・監視、モニタリング環境の改善
・OS、ミドルウェアなどの継続的アップデート
・障害対応およびボトルネック調査・対応
・AWSなど複数クラウドを使用したシステム環境の運用安定化
・アーキテクチャ改善(マイクロサービス、API Gatewayの導入など)
【ポジションの魅力】
・自身の技術をベースに、加速度高く信頼性向上を中心としたSRE施策に携わっていける。
・新技術の調査 / 導入に積極的に関われる。
→マイクロサービス化を進めていたり、分散トレーシングの仕組み作り、カオスエンジニアリング、カナリアリリースなどの技術にも取り組んでいる。
・まだまだSREとしての活動は完全ではない中で、組織の作り込みから携わることができる。
【開発環境】
・言語:Go, Python, JavaScript, Ruby, PHP
・サーバ:AWS VPC, EC2, ECS, RDS, ElastiCache, S3, CloudFront, GCP Compute Engine, Amazon EKS, Kubernetes Engine
・サーバOS:Ubuntu, Amazon Linux
・データベース:Amazon Aurora MySQL
・検索エンジン:Elasticsearch, Cloudsearch
・サーバレス:Lambda, Cloud Functions
・プロビジョニング:Ansible, Docker
・オーケストレーション:Terraform, CloudFormation, Capistrano
・アプリケーションモニタリング:NewRelic, AWS X-Ray
・インフラモニンタリング:CloudWatch, Datadog, PagerDuty, Prometheus、Grafana
・ログ管理:Fluentd
・データ分析:Bigquery, Athena
・CI/CD:CircleCI, GitHub Actions, AWS CDK, Argo CD
・バージョン管理:GitHub