STAM è attualmente alla ricerca di Data Scientist /Data Engineer per sviluppo di attività e progetti all'interno del team Digital Solutions a Genova.
MAIN ACTIVITIES :
La risorsa sarà inserita in un team di Data Scientist and Data Engineer e contribuirà alla progettazione, sviluppo e manutenzione di pipeline di analisi di grandi quantità di dati strutturati e non strutturati.
In particolare, si occuperà di:
· Data Engineering e Integrazione Dati:
Ø Progettazione, sviluppo e ottimizzazione di pipeline ETL/ELT da sistemi enterprise, piattaforme smart metering, sistemi OT/IoT e sorgenti esterne
Ø Integrazione e normalizzazione di dati strutturati, semi-strutturati e near real-time
Ø Modellazione dati e ottimizzazione di architetture Lakehouse e Data Warehouse
Ø Supporto evolutivo e manutenzione operativa di piattaforme dati esistenti
· Gestione Data Platform in Cloud (AWS o equivalenti):
Ø Gestione e governance di Data Lake su Amazon S3
Ø Configurazione e ottimizzazione di ambienti analitici su Redshift (o tecnologie equivalenti)
Ø Implementazione pipeline tramite Glue, Lambda, Step Functions
Ø Monitoraggio performance, ottimizzazione costi e gestione sicurezza tramite IAM
· Soluzioni Analitiche e Microsoft Fabric:
Ø Implementazione e gestione ambienti Lakehouse e Data Warehouse su Microsoft Fabric
Ø Sviluppo pipeline di ingestione e trasformazione dati
Ø Utilizzo notebook per trasformazioni avanzate e preparazione dataset
Ø Modellazione semantica e supporto allo sviluppo di reporting e dashboard
Ø Sviluppo di soluzioni analitiche nel rispetto dei vincoli normativi (es. GDPR), architetturali e progettuali
· AI e Advanced Analytics
Ø Estrarre valore informativo dai dati attraverso tecniche statistiche, matematiche, di machine learning e ricerca operative
Ø Analisi di serie temporali (forecasting, anomaly detection, clustering) e modelli su dati tabellari in contesto energy & utility
Ø Preparazione dataset e attività di feature engineering
Ø Sviluppo e tuning di modelli di machine learning per:
Ø previsione della domanda energetica
Ø anomaly detection su reti e infrastrutture
Ø ottimizzazione di processi e performance degli asset
Ø Supporto alla messa in produzione e monitoraggio dei modelli
Ø Collaborazione con stakeholder tecnici e di business per tradurre esigenze operative in soluzioni data-driven
REQUIREMENTS :
· Laurea magistrale in Informatica, Data Science, Ingegneria, Matematica o discipline affini
· Almeno 4 anni di esperienza in ambienti cloud data platform e advanced analytics
Competenze Tecniche:
· Python: solida esperienza nell'utilizzo del linguaggio e delle principali librerie per data processing e machine learning (es. PySpark, Pandas).
o gestione del ciclo di vita del codice e degli strumenti di sviluppo (uv, hatch, ruff, pre-commit, pip-tools, pytest);
o manipolazione e analisi di dataframe tramite librerie come pandas, polars, ibis e narwhals;
o sviluppo di modelli di machine learning con scikit-learn, xgboost, SHAP e MLflow;
o applicazione di tecniche di ricerca operativa tramite OR-Tools, CVXPY e PuLP;
o creazione di visualizzazioni e dashboard con plotly, echarts e altair;
o strumenti per analisi esplorativa e presentazione dei dati quali Jupyter, Marimo e Streamlit.
· SQL e database relazionali: competenze nell'utilizzo di SQL e nella gestione di database quali SQLite, Oracle SQL, PostgreSQL, Presto/Trino e DuckDB.
· Elaborazione distribuita dei dati: esperienza nell'impiego di Apache Spark e di framework per il calcolo distribuito.