SRE – Site Reliability Engineer

  • Freelance
  • -
  • 400-550 €⁄j

ESENCA

Raison d’être :

Le Site Reliability Engineer joue un rôle stratégique dans la fiabilité, la disponibilité et la performance des systèmes de l’entreprise. Ce poste implique des responsabilités sur les infrastructures cloud et on-premise, la gestion de l’obsolescence des systèmes critiques (OS, bases de données), ainsi que la sécurité et la traçabilité des accès. Il est également chargé de construire et de maintenir les fondations techniques essentielles.

Gestion des Infrastructures Cloud et On-Premise :

Garantir la fiabilité, la performance et la sécurité des infrastructures cloud (AWS, Azure, GCP) et on-premise.

Construire et maintenir les fondations techniques essentielles nécessaires aux équipes de l’IT France et IT des BUs

Automatiser le déploiement et la gestion des socles avec des outils de configuration management et InfraAsCode.

Superviser les environnements hybrides et optimiser leur utilisation.

Gestion et maintenance des serveurs physiques : installation, configuration, supervision et optimisation des performances matérielles.

Gestion de l’Obsolescence :

Identifier les systèmes critiques en risque d’obsolescence (OS, bases de données).

Planifier et exécuter les mises à jour ou migrations pour assurer la continuité des services.

Travailler avec les équipes de l’IT France et IT des BUs pour garantir la compatibilité des solutions déployées.

Observabilité et Analyse des Performances

Définir, surveiller et améliorer les indicateurs de fiabilité (SLO, SLA, SLI).

Mettre en place des outils d’observabilité pour garantir une supervision en temps réel.

Identifier les goulets d’étranglement et proposer des solutions pour les résoudre.

Sécurité, Gestion des Accès et Traçabilité

Être garant des accès aux plateformes (cloud et on-premise).

Gérer les droits d’accès, superviser et garantir la conformité des politiques de sécurité.

Mettre en place des outils et processus pour assurer la traçabilité complète des accès et des modifications.

Gestion des Incidents et Résilience

Assurer un rôle clé dans la gestion des incidents critiques via des processus d’astreinte (on-call).

Réaliser des analyses post-mortem et implémenter des solutions pour renforcer la résilience des systèmes.

Garantir une continuité de service grâce à des mécanismes de redondance et de basculement.

Intégration et Déploiement de Solutions Externes (Outils et SaaS)

Évaluer, intégrer et déployer des outils ou solutions SaaS externes répondant aux besoins opérationnels.

Automatiser le déploiement de ces solutions tout en assurant leur conformité aux standards de sécurité.

Collaborer avec les équipes de l’IT France et IT des BUs pour garantir une intégration fluide.

Automatisation et Optimisation des Ressources

Réduire les interventions manuelles grâce à des processus automatisés pour la maintenance et le déploiement.

Collaborer avec les équipes de l’IT France pour optimiser les coûts et l’utilisation des infrastructures.

Infrastructure hybride : Posséder une expertise en gestion des environnements cloud (AWS, Azure, GCP) et on-premise.

Observabilité : Maîtriser les outils de monitoring et d’analyse

Sécurité : Avoir une solide compréhension des mécanismes de gestion des accès et de la traçabilité.

Obsolescence : Posséder une expérience dans la gestion et la mise à jour des systèmes critiques.

SaaS & Outils externes : Savoir évaluer et intégrer des solutions externes.

Automatisation : Posséder une expertise dans l’automatisation InfraAsCode et la configuration management

Optimisation des ressources : Posséder une expertise dans l’impact des coûts sur les infrastructures Cloud et on premise

Hardware : Maîtriser l’installation, la configuration, le dépannage et l’optimisation des composants matériels des serveurs physiques

Être à l’aise pour travailler dans un environnement agile, caractérisé par des itérations courtes et fréquentes

Pour postuler, envoyez votre CV et votre lettre de motivation par e-mail à candidature@elzei.fr

SRE / SITE RELIABILITY ENGINEER

  • Freelance
  • -
  • 400-450 €⁄j

ESENCA

Synthèse des principaux attendus de la mission :
– Déployer et maintenir les infrastructures cloud (GCP, Cloud data bases…)
– Supporter l’équipe dans le déploiement de leurs applications (Kubernetes sur GKE)
– Mettre en place et suivre le monitoring des différentes applications (Datadog)
– Continuer le déploiement de la stratégie d’infrastructure as code (Terraform)
– Animer la stratégie SRE/SLO du groupe
– Accompagner les product leaders et tech leaders sur toutes les problématiques techniques liées à l’architecture cloud des futures solutions
– Mettre en place et animer le DRP des produits
– En constante communication avec le Lead Ops et les Head of Ops de la plateforme, s’assurer du respect des bonnes pratiques en termes de Cloud, d’infrastructure et de sécurité.
– Effectuer les remédiations de sécurité lorsqu’elles touchent l’infrastructure
– Être force de proposition sur les sujets de monitoring, finops, amélioration continue

Compétences techniques :

GCP – Confirmé – Impératif
KUBERNETES – Confirmé – Impératif
DATADOG – Débutant – Souhaitable

Compétences luiguistiques :

Anglais Professionnel (Impératif)

Pour postuler, envoyez votre CV et votre lettre de motivation par e-mail à candidature@elzei.fr