Schweiz

AI DevOps / Infrastructure / Optimisation, Geneva

AI DevOps / Infrastructure / Optimisation, Geneva
Anzeigentext
AI DevOps / Infrastructure / Optimisation Contexte : Infomaniak développe une plateforme IA open source hébergée sur ses propres datacenters suisses. Nous déployons des modèles de langage à grande échelle et construisons des agents intelligents pour nos produits (kChat, kMeet, kDrive). Nous recherchons un·e AI DevOps pour concevoir, implémenter et optimiser nos agents IA, avec un focus sur la qualité, la fiabilité et l’expérience utilisateur.

Tes responsabilités

Déploiement&Orchestration :

Déployer, maintenir et optimiser des LLM sur Kubernetes en maximisant l’efficacité des ressources GPU / Compute.

CI/CD&Automatisation :

Améliorer et industrialiser nos pipelines Gitlab CI pour les modèles IA (build, test, déploiement, rollback). Piloter les déploiements via Flux CD (GitOps).

Monitoring&Observabilité :

Renforcer notre stack Prometheus / Grafana / Victoria Metrics pour une visibilité fine sur les performances, la consommation GPU, la latence, la disponibilité et de manière générale la santé des services IA.

Optimisation des ressources :

Travailler sur l’efficacité des coûts et des performances (autoscaling, scheduling, gestion des quotas, optimisation des images…)

Qualité&Fiabilité :

Garantir la robustesse, la sécurité et la reproductibilité des déploiements dans un environnement critique

Le profil qui nous fait vibrer :

Maîtrise des frameworks modernes de serving (ex : vLLM, TGI, TensorRT-LLM…)

Maîtrise de GitLab CI (pipelines, runners, variables, intégration avec Kubernetes).

Expérience confirmée en Kubernetes (operators, Helm, CRDs, networking, autoscaling).

Expérience avec Flux CD (GitOps, HelmReleases, Kustomize, automatisation des déploiements).

Expérience avec Prometheus / Grafana (dashboards, alerting, exporters).

Connaissance des infrastructures GPU (NVIDIA, CUDA, GPU scheduling, monitoring).

Appétence pour la qualité, la fiabilité et la performance.

Capacité à travailler en environnement critique (SLA élevé, haute disponibilité).

Bonne capacité à collaborer avec des équipes ML et Dev.

Un + si tu as des connaissances en :

Curiosité technique, goût pour les challenges innovants et l’optimisation.

Les contributions open source ou les side projects sont appréciés

Tu aimes travailler enéquipe, et fais preuve d’une communication positive

Ton humour, ta flexibilité et ton esprit d’équipe sont des atouts indispensables pour travailler dans le fun

La stack technique que l’on utilise :

LangChain

Pydantic-ai

vLLM

FastAPI

Gitlab

Sentry

Qdrant

Le poste :

Contratà durée indéterminée

Taux d’occupation : 80 - 100%

Localisation : Genève

Disponibilité : Au plus vite

#J-18808-Ljbffr
Highlights
Sicherheitstipps
Bei einer sofortige Zusage ohne persönliches Bewerbungsgespräch sollte Sie misstrauisch werden.
1 / 10
Weitere Informationen zur Anzeige

Die Anzeige AI DevOps / Infrastructure / Optimisation wurde bei Locanto in der Rubrik Genf IT, EDV, Telekommunikation veröffentlicht.

In dieser Rubrik finden Sie weitere Anzeigen, wie Documentary Credits Officer, Genève, Ingénieur Qualité Produit, Genève oder Compliance Officer - Transaction Monitoring - Mission de 6 mois in Genève. Auf Locanto Kleinanzeigen gibt es insgesamt 6 Anzeigen in der Rubrik IT, EDV, Telekommunikation in Genf.

Möchten Sie noch mehr entdecken? Erweitern Sie Ihre Suche und durchstöbern Sie auch die Anzeigen in den umliegenden Regionen, wie IT, EDV, Telekommunikation in Veyrier, Chêne-Bougeries oder Onex. Es gibt noch weitere Kleinanzeigen im Umkreis von 15 km in dieser Rubrik. Klicken Sie hier, um sich die Anzeigen anzusehen.