itjobs.ca Logo
Telus logo

Gestionnaire, plateforme infonuagique

Telusabout 20 hours ago
Calgary, Alberta, Canada
Senior Level
Full-Time

About the role

Description Notre équipe et ce que nous accomplirons ensemble   Nous sommes le plus important fournisseur de services de TI dans le domaine des soins de santé au Canada et nous transformons le secteur. L’équipe de la plateforme infonuagique de TELUS Santé est passionnée par la résolution de problèmes complexes pour simplifier la vie des patients, des cliniciens et des équipes qui les servent. Nous élaborons des plateformes infonuagiques natives sécurisées à grande échelle sur GCP, AWS et Azure — et nous sommes fiers de bien faire les choses.   Nous évoluons vers un modèle opérationnel axé sur les agents. Des agents IA — et non des humains — gèrent les tâches routinières : approvisionnement de l’infrastructure, réponse aux demandes, application des mesures de protection et orientation des équipes dans les flux de travail en libre-service. Le volet de la sécurité est intégré à tout ce que nous faisons, et non simplement ajouté à la fin. Nos ingénieurs mettent l’accent sur la création et l’amélioration de ces agents et systèmes, plutôt que sur l’exécution de tâches manuelles. Nous recherchons un leader qui comprend ce changement et qui sait comment en prendre la direction.   En tant que gestionnaire, plateforme infonuagique, vous dirigerez nos fonctions d’ingénierie de plateforme et d’exploitation infonuagique. Le libre-service sur la plateforme est notre priorité absolue, et les flux de travail axés sur les agents sont le moyen d’y parvenir. Votre mandat consiste à créer les systèmes — agents, parcours modèles, cadres d’automatisation et mesures de sécurité — qui permettent aux équipes de produit et d’ingénierie d’interagir avec la plateforme infonuagique entièrement par l’intermédiaire d’interfaces pilotées par l’IA, sans jamais avoir besoin de produire un ticket ou d’attendre une intervention humaine.   La sécurité est une préoccupation de premier ordre pour ce poste. Vous serez responsable de la posture de sécurité de la couche de plateforme — en veillant à ce que l’identité, l’accès et les contrôles de conformité sont appliqués automatiquement par le code et les agents, plutôt que par un examen manuel. Il s’agit d’un double mandat : bâtir la plateforme axée sur les agents qui élimine les tâches opérationnelles fastidieuses, tout en faisant en sorte que la plateforme demeure sécurisée, conforme et digne de confiance pour l’organisation.Ce que vous ferez  

Bâtir la plateforme axée sur les agents  

Concevoir et diriger la mise en place d’un modèle opérationnel de plateforme axé sur les agents — où les agents IA (Claude, GitHub Copilot et des agents personnalisés) constituent l’interface principale entre les équipes produit et l’infrastructure infonuagique

Remplacer les flux de travail manuels associés aux tickets par un traitement des demandes piloté par des agents : les développeurs décrivent ce dont ils ont besoin en langage naturel ou via l’interface de ligne de commande (CLI), et les agents génèrent, valident et appliquent les modifications de Terraform ou de configuration requises

Créer des flux de travail d’agents qui guident les équipes produit tout au long de l’intégration à l’infrastructure, des demandes d’accès, de l’amorçage d’environnement et des vérifications de conformité — sans nécessiter l’intervention de l’équipe de la plateforme infonuagique

Implanter GitHub comme colonne vertébrale opérationnelle : les problèmes, les demandes de fusion, la documentation et les interactions avec les agents suivent tous un modèle natif de GitHub

Doter les agents d’une connaissance des normes relatives à la plateforme, des mesures de sécurité et du contexte organisationnel — afin qu’ils appliquent la politique automatiquement au lieu de transférer la responsabilité aux humains

Définir et communiquer la feuille de route des agents aux cadres supérieurs, aux équipes d’ingénierie et aux parties prenantes des produits

  Prendre en charge la sécurité et la conformité de la plateforme  

Assumer la responsabilité de la situation sur le plan de la sécurité de la couche de la plateforme infonuagique — en veillant à ce que les contrôles d’identité, d’accès et de réseau soient mis en œuvre de manière cohérente et appliqués grâce à l’automatisation sur GCP, AWS et Azure

Mettre en œuvre et maintenir des mesures de sécurité aux niveaux de l’organisation et du pipeline, en veillant à ce que toute infrastructure approvisionnée par la plateforme respecte les exigences de base en matière de sécurité et de conformité

Diriger la gouvernance de la gestion des identités et des accès (IAM) : liaison des rôles, approvisionnement des accès, rotation des clés, gestion des comptes de service et fédération d’identité de charge de travail — avec pour objectif d’automatiser ces contrôles grâce aux agents et à la politique sous forme de code

Collaborer avec l’équipe de sécurité pour garantir que les capacités de la plateforme sont conformes aux normes de sécurité de l’organisation et prennent en charge les exigences d’audit (pratiques conformes aux normes SOC 2, à la LPRPDE et à la loi HIPAA)

Intégrer la sécurité dans les parcours modèles en libre-service — afin que les équipes qui approvisionnent l’infrastructure via des modèles approuvés héritent automatiquement de valeurs par défaut sécurisées

Traiter les résultats de sécurité comme des problèmes d’ingénierie : prioriser la remédiation par le code, l’automatisation et l’application par les agents plutôt que par des cycles d’examen manuels

Prendre en charge la plateforme en libre-service et les parcours modèles  

Concevoir des cadres de « parcours modèles » rigoureux utilisant Terraform, Terragrunt et GitHub Actions qui standardisent et sécurisent les modèles d’infrastructure sur GCP, AWS et Azure

Construire et maintenir un marché de modules centralisé et une bibliothèque d’infrastructure sous forme de code que les équipes et les agents peuvent utiliser en toute confiance

Veiller à ce que toutes les capacités en libre-service soient accessibles aux agents — conçues pour une utilisation humaine et programmatique dès le premier jour

Établir des limites de soutien claires : les équipes utilisant le parcours modèle bénéficient d’un soutien complet; les configurations non standard sont prises en charge par les équipes elles-mêmes

  Diriger les opérations infonuagiques  

Assurer une couverture opérationnelle sur l’ensemble de l’écosystème multi-infonuagique : GCP, AWS et Azure

Diriger la gestion des incidents en mettant l’accent sur la remédiation durable — chaque incident important produit des guides d’exécution pour les agents, de l’automatisation ou de la documentation permettant d’éviter la récurrence

Réduire le nombre de demandes grâce au libre-service piloté par les agents, et non par l’augmentation des effectifs — traiter le nombre élevé de tickets comme un problème d’ingénierie à automatiser

Coordonner avec les équipes de fiabilité des sites (SRE) et d’observabilité pour s’assurer que les services de plateforme répondent aux attentes en matière de fiabilité et que les incidents sont acheminés et résolus efficacement

Stimuler l’excellence en ingénierie  

Bâtir et maintenir des pipelines CI/CD et l’infrastructure sous forme de code pour automatiser l’approvisionnement, la gestion de la configuration, la correction des vulnérabilités et l’application de la conformité

Contribuer à l’initiative de fabrique d’images modèles — en s’assurant que des images de base renforcées CIS et corrigées sont disponibles à la demande sur toutes les plateformes infonuagiques

Promouvoir une mentalité de « sécurité sous forme de code » au sein de l’équipe — l’application des politiques, les vérifications de conformité et les contrôles d’accès sont mis en œuvre dans les pipelines et les agents, et non dans des feuilles de calcul

  Diriger, coacher et développer votre équipe  

Gérer une équipe mixte d’ingénieurs de plateforme et d’ingénieurs en exploitation infonuagique, en mettant délibérément l’accent sur le développement des compétences en création d’agents, en automatisation et en ingénierie de la sécurité

Embaucher des ingénieurs stimulés par la création de systèmes pilotés par l’IA et axés sur la sécurité — et non seulement par l’exploitation de systèmes existants

Favoriser une culture d’apprentissage — créer un espace pour que l’équipe puisse se développer dans le développement axé sur les agents, la sécurité infonuagique, les certifications et l’infrastructure sous forme de code en plus de ses responsabilités quotidiennes

Aider à façonner et à faire évoluer les cérémonies d’équipe et les méthodes de travail, et contribuer à la manière dont l’équipe structure son rythme de livraison, ses rétrospectives et sa planification sans être le seul déterminant de l’exécution

  Collaborer à l’échelle de l’organisation  

Collaborer avec les équipes de produit, d’ingénierie, de sécurité et d’architecture pour harmoniser les capacités de la plateforme et des agents avec les priorités organisationnelles

Agir en tant que champion interne des flux de travail axés sur les agents — aider les équipes produit et d’ingénierie à comprendre comment interagir avec la plateforme par l’intermédiaire d’agents plutôt que par des processus manuels

Rendre compte de l’adoption de la plateforme, de l’utilisation des agents, de la situation sur le plan de la sécurité et des progrès réalisés dans la réduction des tâches fastidieuses auprès des cadres supérieurs

Qualifications   Ce dont vous aurez besoin   Leadership et mentalité  

5 ans et plus d’expérience progressive en ingénierie de plateforme infonuagique ou en exploitation infonuagique — avec au moins 2 ans dans un rôle de gestion de personnel ou de leadership technique

Une croyance authentique dans les flux de travail axés sur les agents et la sécurité, ainsi qu’une expérience éprouvée dans le développement de l’automatisation pour remplacer les processus manuels — non pas simplement pour les compléter

De l’expérience dans la direction d’équipes intervenant sur le plan de transformations : passage d’une approche privilégiant des opérations réactives axées sur les tickets à une plateforme proactive axée sur les agents

Solides compétences en communication — capable de traduire la complexité de la plateforme en récits clairs pour la haute direction et les parties prenantes de l’entreprise

À l’aise avec l’ambiguïté et la conduite du changement dans un environnement en constante évolution

  Profondeur technique  

Expérience pratique avec au moins deux des plateformes suivantes : GCP, AWS et Azure —solide compréhension de l’identité, du réseautage, du calcul et des contrôles de sécurité à grande échelle

Expertise approfondie de l’infrastructure en tant que code (Terraform, Terragrunt) et capacité à concevoir des bibliothèques de modules sécurisées, réutilisables et cohérentes

Expérience dans la création ou l’utilisation d’agents IA et de flux de travail axés sur les agents — incluant l’ingénierie de requêtes, l’utilisation d’outils et l’intégration d’agents avec les systèmes de CI/CD et les API d’infrastructure

Solide compréhension des fondamentaux de la sécurité infonuagique : IAM, RBAC, comptes de service, fédération d’identité de charge de travail, sécurité réseau et gestion des secrets

Expérience dans la mise en œuvre de politiques en tant que code et l’application automatisée de la conformité dans des environnements multinuages

Maîtrise d’au moins un langage de script ou de programmation (Python, Go, Bash) — vous écrivez du code, pas seulement en YAML

Expérience dans la création de plateformes libre-service destinées aux développeurs, incluant des outils CLI, des flux de travail GitHub Actions et des interfaces basées sur la discussion

  Excellence opérationnelle  

Expérience éprouvée dans la réduction des tâches opérationnelles répétitives grâce à l’automatisation — avec des exemples concrets de ce que vous avez construit et de la façon dont cela a permis de réduire la charge de travail de manière mesurable

Expérience dans la gestion des interventions en cas d’incident à grande échelle, incluant la facilitation de bilans rétrospectifs et le suivi des mesures correctives

Connaissance des pratiques de gestion des demandes et des flux de travail — et un instinct pour traiter le nombre élevé de demandes comme un problème d’ingénierie à automatiser

Compréhension des exigences de sécurité et de conformité dans les environnements de soins de santé réglementés (SOC 2, pratiques conformes à la loi HIPAA et à la LPRPDE)

Formation et certifications  

Baccalauréat en informatique, en génie ou dans un domaine technique connexe — ou expérience pratique équivalente

Certifications infonuagiques (requises — au moins une) : AWS Solutions Architect (associé ou professionnel), GCP Professional Cloud DevOps Engineer ou Azure Administrator Associate

Certifications infonuagiques (souhaitées — supplémentaires) : GCP Professional Cloud Architect, AWS DevOps Engineer Professional, Azure DevOps Engineer Expert

Développement et exploitation / Plateforme : CKA (administrateur Kubernetes certifié) ou titre de compétence équivalent au niveau praticien est un atout important

  Atouts  

Expérience dans la conception ou l’exploitation de systèmes axés sur les agents dans un contexte d’ingénierie de production — incluant l’utilisation d’outils de GML, l’orchestration d’agents ou l’automatisation des flux de travail pilotée par l’IA

Connaissance de GitHub Copilot, Claude ou d’outils de codage/opérations par IA similaires dans un cadre d’entreprise

Expérience des outils de gestion de l’état de sécurité dans le nuage de TELUS et de l’intégration des résultats de sécurité dans les flux de travail de correction automatisés

Expérience dans le soutien de programmes de modernisation de l’infrastructure à grande échelle ou d’adoption du nuage

Expérience en matière de fédération d’identité et d’administration de l’authentification unique (SSO) dans des environnements multinuages

Expérience dans le domaine des TI de soins de santé réglementés — compréhension des systèmes cliniques ou destinés aux patients

Expérience avec les principes FinOps et l’attribution des coûts infonuagiques

Connaissance des outils de collaboration et de développement en entreprise, tant en tant qu’utilisateur qu’en tant qu’administrateur

  Une connaissance avancée de l'anglais est requise, car vous serez appelé(e) la plupart du temps à interagir en anglais avec des parties internes (par ex. collègues ou parties prenantes); et à travailler dans un environnement informatique anglais dans le cadre des tâches liées à ce poste dont la portée est nationale.   #LI-REMOTE

About Telus

Telecommunications

Similar Jobs