Data architect senior specialist

Padova

Speckand

Pubblicato il Pubblicato 3h fa

Descrizione

PpIn un contesto in costante evoluzione normativa e tecnologica, stiamo cercando un/a bData Architect /b da inserire nell’area Data Management. Il/la candidato/a sarà parte attiva nella progettazione e governo dell’architettura dati aziendale, contribuendo alla costruzione di una piattaforma dati moderna, scalabile e orientata al dato come asset strategico. /p h3Le principali responsabilità /h3 ul liProgettare e mantenere l’architettura della piattaforma dati (Data Lake, Data Warehouse, Lakehouse) su AWS e Databricks /li liDefinire standard, best practice e linee guida architetturali per la gestione e la governance del dato (data modeling, data lineage, data quality, data catalog) /li liDisegnare e supervisionare pipeline di ingestione, trasformazione e distribuzione dei dati utilizzando Apache Spark, Databricks e servizi AWS /li liGuidare la scelta delle tecnologie e dei pattern architetturali (batch, streaming, lambda/kappa architecture, medallion architecture) in base ai requisiti di business /li liSviluppare componenti e prototipi in Java e Python per validare soluzioni architetturali e accelerare l’adozione di nuovi pattern /li liCollaborare con i team di Data Engineering, Data Science, BI e Product per garantire coerenza architetturale e qualità dei dati end-to-end /li liPresidiare aspetti di sicurezza, compliance e data governance (GDPR, controllo degli accessi, cifratura, auditing) all’interno della piattaforma dati /li liValutare e introdurre nuove tecnologie e framework del panorama dati (Apache Iceberg, Delta Lake, dbt, Apache Kafka, Flink) in ottica di miglioramento continuo /li liCollaborare con i team di Data Science e AI/ML per progettare infrastrutture dati a supporto di modelli di Machine Learning e soluzioni di Intelligenza Artificiale Generativa (Feature Store, model serving, RAG pipeline, LLMOps) /li liSupportare l’adozione di servizi AWS AI/ML garantendo la disponibilità e la qualità dei dati necessari all’addestramento e all’inferenza dei modelli /li liEsperienza di almeno 3-5 anni in ambito architettura dati, data engineering o ruoli analoghi /li liLaurea in Informatica, Ingegneria Informatica, Matematica o discipline affini; certificazioni AWS (es. AWS Solutions Architect, AWS Data Analytics) o Databricks sono considerate un plus /li liSolida conoscenza di Apache Spark e Databricks (Spark SQL, Structured Streaming, Delta Lake, Unity Catalog) /li liCompetenze avanzate in Python e/o Java per lo sviluppo di pipeline dati e componenti di integrazione /li liEsperienza concreta con i principali servizi AWS per i dati: S3, Glue, Athena, Redshift, EMR, Kinesis, Lake Formation, Step Functions, IAM /li liConoscenza approfondita dei paradigmi di data modeling (relazionale, dimensionale, Data Vault) e dei formati di storage columnar (Parquet, ORC, Iceberg, Delta) /li liFamiliarità con strumenti di orchestrazione (Apache Airflow, Databricks Workflows) e di trasformazione dati (dbt) /li liConoscenza dei principi di data governance, data quality e metadata management; gradita esperienza con soluzioni di data catalog (es. Apache Atlas, AWS Glue Data Catalog, Databricks Unity Catalog) /li liComprensione delle architetture streaming (Apache Kafka, Kinesis Data Streams) e dei relativi pattern di integrazione /li liCapacità di lavorare in ambienti Agile/DevOps; conoscenza di IaC (Terraform, CloudFormation) e CI/CD per pipeline dati costituisce un plus /li liOttime capacità comunicative e relazionali, con attitudine al problem solving, alla collaborazione cross-funzionale e alla condivisione della conoscenza tecnica /li liConoscenza dei principali paradigmi e tecnologie di AI/ML applicati ai dati: MLflow, SageMaker, Databricks MLflow/AutoML, Vector Database (es. Pinecone, OpenSearch, pgvector) e architetture per Generative AI (RAG, embedding pipeline, LLM fine-tuning) /li liFamiliarità con il ciclo di vita end-to-end dei modelli ML (MLOps/LLMOps): versionamento dei dati e dei modelli, feature engineering, monitoraggio del modello in produzione e data drift detection /li /ul pModalità di lavoro: ibrida, con ampia possibilità di smart working.br/Sede di lavoro: San Donato Milanese, Padova, Roma o Mangone (CS) /p /p #J-18808-Ljbffr

Rispondere all'offerta

Crea una notifica

Salva