STAM è attualmente alla ricerca di
Data Scientist /Data Engineer per sviluppo di attività e progetti all’interno del team Digital Solutions a Genova.
La risorsa sarà inserita in un team di Data Scientist and Data Engineer e contribuirà alla progettazione, sviluppo e manutenzione di pipeline di analisi di grandi quantità di dati strutturati e non strutturati.
In particolare, si occuperà di:
Data Engineering e Integrazione Dati:
Progettazione, sviluppo e ottimizzazione di pipeline ETL/ELT da sistemi enterprise, piattaforme smart metering, sistemi OT/IoT e sorgenti esterne
Integrazione e normalizzazione di dati strutturati, semi‑strutturati e near real‑time
Modellazione dati e ottimizzazione di architetture Lakehouse e Data Warehouse
Supporto evolutivo e manutenzione operativa di piattaforme dati esistenti
Gestione Data Platform in Cloud (AWS o equivalenti):
Gestione e governance di Data Lake su Amazon S3
Configurazione e ottimizzazione di ambienti analitici su Redshift (o tecnologie equivalenti)
Implementazione pipeline tramite Glue, Lambda, Step Functions
Monitoraggio performance, ottimizzazione costi e gestione sicurezza tramite IAM
Soluzioni Analitiche e Microsoft Fabric:
Implementazione e gestione ambienti Lakehouse e Data Warehouse su Microsoft Fabric
Sviluppo pipeline di ingestione e trasformazione dati
Utilizzo notebook per trasformazioni avanzate e preparazione dataset
Modellazione semantica e supporto allo sviluppo di reporting e dashboard
Sviluppo di soluzioni analitiche nel rispetto dei vincoli normativi (es. GDPR), architetturali e progettuali
Estrapolare valore informativo dai dati attraverso tecniche statistiche, matematiche, di machine learning e ricerca operative
Analisi di serie temporali (forecasting, anomaly detection, clustering) e modelli su dati tabellari in contesto energy & utility
Preparazione dataset e attività di feature engineering
Sviluppo e tuning di modelli di machine learning per:
previsione della domanda energetica
anomaly detection su reti e infrastrutture
ottimizzazione di processi e performance degli asset
Supporto alla messa in produzione e monitoraggio dei modelli
Collaborazione con stakeholder tecnici e di business per tradurre esigenze operative in soluzioni data‑driven
Requisiti accademici
Laurea magistrale in Informatica, Data Science, Ingegneria, Matematica o discipline affini
Esperienza
Almeno 4 anni di esperienza in ambienti cloud data platform e advanced analytics
Competenze tecniche - Python
solida esperienza nell’utilizzo del linguaggio e delle principali librerie per data processing e machine learning (es. PySpark, Pandas).
gestione del ciclo di vita del codice e degli strumenti di sviluppo (uv, hatch, ruff, pre-commit, pip-tools, pytest);
manipolazione e analisi di dataframe tramite librerie come pandas, polars, ibis e narwhals;
sviluppo di modelli di machine learning con scikit-learn, xgboost, SHAP e MLflow;
applicazione di tecniche di ricerca operativa tramite OR-Tools, CVXPY e PuLP;
creazione di visualizzazioni e dashboard con plotly, echarts e altair;
strumenti per analisi esplorativa e presentazione dei dati quali Jupyter, Marimo e Streamlit.
Competenze tecniche - SQL e database relazionali
Competenze nell’utilizzo di SQL e nella gestione di database quali SQLite, Oracle SQL, PostgreSQL, Presto/Trino e DuckDB.
Elaborazione distribuita dei dati
esperienza nell’impiego di Apache Spark e di framework per il calcolo distribuito.
Data streaming e orchestrazione workflow
Versionamento e gestione ciclo di vita pipeline dati
Monitoraggio, troubleshooting e performance tuning
Automazione workflow e integrazione API
Gestione qualità e affidabilità del dato
Esperienza Preferenziale – Settore Utility
Dati energetici e smart metering
Integrazione OT/IoT
Monitoraggio infrastrutture di rete
Analisi dati per sostenibilità ed efficienza energetica
Caratteristiche Professionali
Capacità di inserirsi rapidamente in ecosistemi tecnologici complessi
Approccio pragmatico e orientato alla delivery
Autonomia operativa e gestione delle priorità
Capacità di interazione con team multidisciplinari e stakeholder di business
Disponibilità a eventuali trasferte di breve/media durata
Coinvolgimento in ecosistemi dati enterprise su larga scala
Esposizione a casi d’uso avanzati in ambito energy analytics e AI applicata
Crescita qualificato in ambito cloud, lakehouse e machine learning #J-18808-Ljbffr