DevOps engineer - Site Reliability Engineer (SRE) - REMOTOSite Reliability Engineer (SRE) con esperienza nel supporto in produzione e forti competenze di automazione. Il candidato ideale sarà responsabile di garantire l'affidabilità, la disponibilità e le prestazioni dei sistemi di produzione, promuovendo al contempo l'automazione e l'eccellenza operativa.Responsabilità principali Fornire supporto operativo quotidiano agli ambienti di produzione, garantendo elevata disponibilità e affidabilità dei servizi criticiSviluppare, mantenere e migliorare script e strumenti di automazione utilizzando Bash, Python e Ansible, al fine di ottimizzare le attività operative e la gestione degli incidentiMonitorare le prestazioni dei sistemi, identificare proattivamente le problematiche e implementare soluzioni per prevenire interruzioni del servizioCollaborare con i team di sviluppo, QA e infrastruttura per implementare le best practice in ambito di deployment, monitoraggio e gestione degli incidentiPartecipare ai turnazioni di reperibilità (on-call) e rispondere agli incidenti di produzione, svolgendo analisi delle cause radice (root cause analysis) e supportando la risoluzioneGestire e migliorare le pratiche di configuration management, le pipeline CI/CD e le soluzioni di Infrastructure as CodeDocumentare i processi operativi, le procedure di troubleshooting e i flussi di automazione Competenze ed esperienza richieste Esperienza comprovata in ruoli di supporto alla produzione o SRE in ambienti complessi ad alta disponibilitàSolide competenze di automazione con padronanza di Bash, Python e AnsibleEsperienza con strumenti di monitoraggio e alerting (ad esempio Prometheus, Grafana, Elastic Stack, Datadog)Solida conoscenza dell'amministrazione e del troubleshooting di sistemi Linux/UnixFamiliarità con piattaforme cloud (ad esempio AWS) e tecnologie di containerizzazione (ad esempio Docker, Kubernetes)Esperienza con strumenti di configuration management e Infrastructure as Code (ad esempio Terraform, CloudFormation)Conoscenza dei fondamenti di networking, delle best practice di sicurezza e dei processi di gestione degli incidenti #J-18808-Ljbffr