SRE (Site Reliability Engineer) Observability H/F

Ref
SREObs0319
CDI
Bordeaux
Brest
Lyon
Nantes
Paryż
Rennes
Roubaix
Tuluza
Francja

L'équipe Platform d'OVH a pour mission principale d'offrir à nos clients un ensemble de solutions (produits et services) leur permettant de construire facilement leurs plateformes d'applications de demain, scalables, et évolutives.

Le but ? Réduire considérablement l'effort et le temps consacrés à l'onboarding, l'exploitation et au monitoring des plateformes applicatives de nos clients.

Compte tenu des forts enjeux pour le groupe, nous renforçons l'équipe de plusieurs SRE afin de construire notre offre Observability et assurer une qualité de service irréprochable.

Votre rôle ?

Dans le langage courant, le rôle de cette équipe n'est rien d'autre que de dépenser beaucoup d'énergie pour en économiser plus tard (malin, non ?), tout en s'amusant avec des nouvelles technos du marché.

Si on précise un peu les choses, voici les missions associées : 

  • Évaluer l'importance des problèmes impactant l'infrastructure internes et externes.
  • Dépister les problèmes complexes et coordonner les efforts de l'équipe pour les corriger.
  • Suggérer et aider à mettre en oeuvre les meilleures pratiques pour que les incidents ne se reproduisent qu'une seule fois, et jamais plus.
  • Assurer la continuité du service avec des responsabilités d'astreinte
  • Travailler avec les équipes pour identifier, éliminer les goulots d'étranglement afin d'améliorer la performance et réduire les coûts.
  • Mettre à jour et tenir à jour un rapport mensuel contenant les indicateurs systèmes clés de santé (KPI/SLA) et analyser nos performances
  • Organisation post-mortem et suivi post-actions
  • Fournir une assistance aux propriétaires de l'application et une intégration continue  

Vos atouts ?

  • Très bonnes connaissances en systèmes Unix
  • Vous maitrisez Python et/ou GO
  • Des compétences sur Java et Rust seraient un plus
  • Vous avez l'habitude de participer à des revues de code
  • Bonnes compétences en réseau
  • Vous êtes à l'aise avec l'exploitation de systèmes distribués
  • Vous maitrisez les outils CI/CD/CA, plateformes et outils associés
  • Messaging / Pub-Sub system (Redis, Kafka) sont des mots que vous utilisez quotidiennement
  • Vous maîtrisez un ou plusieurs outils de monitoring, de plateformes, et des processus organisationnels liés.
  • Vous êtes à l'aise avec les Stacks Observability standard du marché (ELK, Prometheus…)
  • Vous avez l'habitude d'être impliqué directement dans le design des solutions et des choix techniques tactiques.
  • Vous avez une bonne capacité à écouter et à communiquer, à évaluer et résoudre des problèmes, à accomplir plusieurs tâches en même temps et à établir des priorités dans un environnement parfois stressant et critique
  • Vous êtes ouvert aux changements réguliers, force de proposition. Vous avez une âme de facilitateur. Passionné de technologies, vous êtes en veille permanente
  • Ce que vous faites, vous le faites d'abord pour le client, puis pour vous faire plaisir. Pas dans l'autre sens :-)
  • Vous maitrisez l'anglais dans un contexte professionnel


Votre parcours ?

  • 3 ans minimum d'expérience en tant qu'ingénieur système / software engineer dans un environnement critique et exigeant.
  • 2 ans en tant que SRE / DevOps au sein d'infrastructures Cloud critiques 

En tant que membre de notre équipe, votre expertise ne ravira pas seulement nos clients en leur fournissant des services fiables et performants, mais vous contribuerez également à façonner le rôle majeur du SRE dans l'entreprise.

 
Twój zespół

Platform as a Service

Nasz zespół Platform as a Service ma za zadanie ułatwiać pracę programistom. Dostarcza im rozwiązania, dzięki którym mogą tworzyć coraz… Dowiedz się więcej