Ph3Job Description: /h3 pAll’interno dell’Area Hypercomputing Continuum siamo alla ricerca di un/una HPC AI Cloud Architect appassionato di infrastrutture innovative per l’addestramento e l’inferenza di modelli AI. Il candidato ideale ha esperienza concreta nella progettazione, implementazione e ottimizzazione di ambienti HPC e AI cloud-native su OpenStack, integrando le migliori soluzioni open source. /p h3Responsibilities: /h3 ul liProgettazione dell’architettura di infrastrutture HPC e AI per supportare carichi di lavoro complessi, training e inferenza modelli AI/ML e simulazioni avanzate, in ambienti OpenStack; /li liDefinizione di strategie per l’adozione di tecnologie emergenti (acceleratori, XPUs, GPU/TPU, high performance fabrics, storage NVMe, file system paralleli tipo Lustre/GPFS/BeeGFS); /li liImplementazione di cluster computazionali (CPU/GPU), orchestrazione container e VM (Kubernetes, Docker, Slurm, OpenStack), e ottimizzazione delle risorse per AI e HPC; /li liIntegrazione con ambienti DevOps/MLOps per workflow CI/CD di modelli AI, automazione e monitoraggio; /li liSeguire la standardizzazione delle infrastrutture tramite Infrastructure-as-Code (Terraform, Ansible, Kolla); /li liGestione e tuning di networking ad alta velocità (Infiniband, 200/400GbE), storage avanzato e data pipeline per big data e machine learning; /li liImplementare best practice per la sicurezza, monitoraggio, reliability (monitoraggio, logging, observability, SLO/SLAs) e business continuity; /li liCoordinamento di progetti di business continuity, disaster recovery e backup in ambienti HPC/AI; /li liCollaborare con data scientist, DevOps, ingegneri software e stakeholder di ricerca per costruire soluzioni AI/HPC altamente performanti e customizzate; /li liStesura della documentazione tecnica e supporto alle attività di compliance, sicurezza e auditing. /li /ul h3Title of study: /h3 pLaurea magistrale in Informatica, Ingegneria Informatica o discipline STEM affini. /p h3Seniority: /h3 pExpert: 3–5 anni di esperienza. /p h3Technical skills and knowledge: /h3 ul liEsperienza di almeno 3 anni nella progettazione e gestione di infrastrutture HPC e AI, preferibilmente in ambienti cloud ibridi e multi-tenant, e almeno uno sulle principali distribuzioni OpenStack; /li liEsperienza nella progettazione e configurazione di tecnologie HPC (cluster, scheduler, file system paralleli), architetture GPU/XPU e strumenti di orchestrazione (Kubernetes, Slurm, Docker); /li liEsperienza con acceleratori (GPU, CUDA) per AI/ML e pipeline di deployment di modelli di machine learning su cloud; /li liConoscenza di sistemi operativi Linux/Unix, scripting, networking avanzato (SDN, InfiniBand, RDMA) e soluzioni per il trasferimento dati ad alta velocità; /li liEsperienza nell’implementazione di workflow CI/CD e MLOps per training ed inferenza distributed; /li liCapacità di benchmarking, tuning, troubleshooting di ambienti HPC/AI e ottimizzazione delle risorse; /li liConoscenza di strumenti Infrastructure-as-Code, tecniche di tuning prestazionale e monitoraggio (Prometheus, Grafana); /li liCompetenze in storage ad alte prestazioni, interfacce NVMe-oF, SAN/NAS, data management. /li /ul h3Soft skills: /h3 ul liCollaborazione cross-funzionale e orientamento al risultato; /li liProattività, autonomia e attenzione alla qualità; /li liEsperienza in metodologie Agile (Scrum) e pratiche Lean/Kanban; /li liFlessibilità, problem solving e spirito di innovazione. /li /ul h3Language skills: /h3 pBuona conoscenza dell’inglese, scritto e parlato (B2). /p h3Other: /h3 pDisponibilità a trasferte nazionali e internazionali. /p /p #J-18808-Ljbffr