STAM è attualmente alla ricerca di Data Scientist /Data Engineer per sviluppo di attività e progetti all’interno del team Digital Solutions a Genova.
MAIN ACTIVITIES
La risorsa sarà inserita in un team di Data Scientist e Data Engineer e contribuirà alla progettazione, sviluppo e manutenzione di pipeline di analisi di grandi quantità di dati strutturati e non strutturati. In particolare, si occuperà di:
- Data Engineering e Integrazione Dati:
- Progettazione, sviluppo e ottimizzazione di pipeline ETL/ELT da sistemi enterprise, piattaforme smart metering, sistemi OT/IoT e sorgenti esterne
- Integrazione e normalizzazione di dati strutturati, semi‑strutturati e near real‑time
- Modellazione dati e ottimizzazione di architetture Lakehouse e Data Warehouse
- Supporto evolutivo e manutenzione operativa di piattaforme dati esistenti
- Gestione Data Platform in Cloud (AWS o equivalenti):
- Gestione e governance di Data Lake su Amazon S3
- Configurazione e ottimizzazione di ambienti analitici su Redshift (o tecnologie equivalenti)
- Implementazione pipeline tramite Glue, Lambda, Step Functions
- Monitoraggio performance, ottimizzazione costi e gestione sicurezza tramite IAM
- Soluzioni Analitiche e Microsoft Fabric:
- Implementazione e gestione ambienti Lakehouse e Data Warehouse su Microsoft Fabric
- Sviluppo pipeline di ingestione e trasformazione dati
- Utilizzo notebook per trasformazioni avanzate e preparazione dataset
- Modellazione semantica e supporto allo sviluppo di reporting e dashboard
- Sviluppo di soluzioni analitiche nel rispetto dei vincoli normativi (es. GDPR), architetturali e progettuali
- AI e Advanced Analytics:
- Estrarre valore informativo dai dati attraverso tecniche statistiche, matematiche, di machine learning e ricerca operativa
- Analisi di serie temporali (forecasting, anomaly detection, clustering) e modelli su dati tabellari in contesto energy & utility
- Preparazione dataset e attività di feature engineering
- Sviluppo e tuning di modelli di machine learning per:
- previsione della domanda energetica
- anomaly detection su reti e infrastrutture
- ottimizzazione di processi e performance degli asset
- Supporto alla messa in produzione e monitoraggio dei modelli
- Collaborazione con stakeholder tecnici e di business per tradurre esigenze operative in soluzioni data‑driven
REQUIREMENTS
- Laurea magistrale in Informatica, Data Science, Ingegneria, Matematica o discipline affini
- Almeno 4 anni di esperienza in ambienti cloud data platform e advanced analytics
- Competenze Tecniche:
- Python
- solida esperienza nell’utilizzo del linguaggio e delle principali librerie per data processing e machine learning (es. PySpark, Pandas).
- gestione del ciclo di vita del codice e degli strumenti di sviluppo (uv, hatch, ruff, pre-commit, pip-tools, pytest);
- manipolazione e analisi di dataframe tramite librerie come pandas, polars, ibis e narwhals;
- sviluppo di modelli di machine learning con scikit-learn, xgboost, SHAP e MLflow;
- applicazione di tecniche di ricerca operativa tramite OR-Tools, CVXPY e PuLP;
- creazione di visualizzazioni e dashboard con plotly, echarts e altair;
- strumenti per analisi esplorativa e presentazione dei dati quali Jupyter, Marimo e Streamlit.
- SQL e database relazionali : competenze nell’utilizzo di SQL e nella gestione di database quali SQLite, Oracle SQL, PostgreSQL, Presto/Trino e DuckDB.
- Elaborazione distribuita dei dati : esperienza nell’impiego di Apache Spark e di framework per il calcolo distribuito.
- Data Platform & Architetture
- AWS Data Services (S3, Redshift, Glue, Lambda, Step Functions, Kinesis, IAM)
- Microsoft Fabric
- Architetture Lakehouse
- Data streaming e orchestrazione workflow
- Engineering & Operations
- Versionamento e gestione ciclo di vita pipeline dati
- Monitoraggio, troubleshooting e performance tuning
- Automazione workflow e integrazione API
- Gestione qualità e affidabilità del dato
- Esperienza Preferenziale – Settore Utility
- Dati energetici e smart metering
- Integrazione OT/IoT
- Monitoraggio infrastrutture di rete
- Demand forecasting
- Asset performance management
- Analisi dati per sostenibilità ed efficienza energetica
- Caratteristiche Professionali
- Capacità di inserirsi rapidamente in ecosistemi tecnologici complessi
- Approccio pragmatico e orientato alla delivery
- Autonomia operativa e gestione delle priorità
- Capacità di interazione con team multidisciplinari e stakeholder di business
- Inglese fluente
- Disponibilità a eventuali trasferte di breve/media durata
WHAT YOU GET
- Coinvolgimento in ecosistemi dati enterprise su larga scala
- Esposizione a casi d’uso avanzati in ambito energy analytics e AI applicata
- Crescita competente in ambito cloud, lakehouse e machine learning…
#J-18808-Ljbffr