AI DevOps / Infrastructure / Optimisation, Geneva
-
Geneva, Schweiz
-
Aufgegeben: vor weniger als einem Monat
-
Merken
Tes responsabilités
Déploiement&Orchestration :
Déployer, maintenir et optimiser des LLM sur Kubernetes en maximisant l’efficacité des ressources GPU / Compute.
CI/CD&Automatisation :
Améliorer et industrialiser nos pipelines Gitlab CI pour les modèles IA (build, test, déploiement, rollback). Piloter les déploiements via Flux CD (GitOps).
Monitoring&Observabilité :
Renforcer notre stack Prometheus / Grafana / Victoria Metrics pour une visibilité fine sur les performances, la consommation GPU, la latence, la disponibilité et de manière générale la santé des services IA.
Optimisation des ressources :
Travailler sur l’efficacité des coûts et des performances (autoscaling, scheduling, gestion des quotas, optimisation des images…)
Qualité&Fiabilité :
Garantir la robustesse, la sécurité et la reproductibilité des déploiements dans un environnement critique
Le profil qui nous fait vibrer :
Maîtrise des frameworks modernes de serving (ex : vLLM, TGI, TensorRT-LLM…)
Maîtrise de GitLab CI (pipelines, runners, variables, intégration avec Kubernetes).
Expérience confirmée en Kubernetes (operators, Helm, CRDs, networking, autoscaling).
Expérience avec Flux CD (GitOps, HelmReleases, Kustomize, automatisation des déploiements).
Expérience avec Prometheus / Grafana (dashboards, alerting, exporters).
Connaissance des infrastructures GPU (NVIDIA, CUDA, GPU scheduling, monitoring).
Appétence pour la qualité, la fiabilité et la performance.
Capacité à travailler en environnement critique (SLA élevé, haute disponibilité).
Bonne capacité à collaborer avec des équipes ML et Dev.
Un + si tu as des connaissances en :
Curiosité technique, goût pour les challenges innovants et l’optimisation.
Les contributions open source ou les side projects sont appréciés
Tu aimes travailler enéquipe, et fais preuve d’une communication positive
Ton humour, ta flexibilité et ton esprit d’équipe sont des atouts indispensables pour travailler dans le fun
La stack technique que l’on utilise :
LangChain
Pydantic-ai
vLLM
FastAPI
Gitlab
Sentry
Qdrant
Le poste :
Contratà durée indéterminée
Taux d’occupation : 80 - 100%
Localisation : Genève
Disponibilité : Au plus vite
#J-18808-Ljbffr
-
FirmennameInfomaniak Network SA
-
JobtitelAI DevOps / Infrastructure / Optimisation
Die Anzeige AI DevOps / Infrastructure / Optimisation wurde bei Locanto in der Rubrik Genf IT, EDV, Telekommunikation veröffentlicht.
In dieser Rubrik finden Sie weitere Anzeigen, wie Documentary Credits Officer, Genève, Ingénieur Qualité Produit, Genève oder Compliance Officer - Transaction Monitoring - Mission de 6 mois in Genève. Auf Locanto Kleinanzeigen gibt es insgesamt 6 Anzeigen in der Rubrik IT, EDV, Telekommunikation in Genf.
Möchten Sie noch mehr entdecken? Erweitern Sie Ihre Suche und durchstöbern Sie auch die Anzeigen in den umliegenden Regionen, wie IT, EDV, Telekommunikation in Veyrier, Chêne-Bougeries oder Onex. Es gibt noch weitere Kleinanzeigen im Umkreis von 15 km in dieser Rubrik. Klicken Sie hier, um sich die Anzeigen anzusehen.