PbSyntax /b è una realtà imprenditoriale con più di 250 dipendenti, con sedi distribuite sul territorio nazionale (Piemonte, Lombardia, Emilia Romagna, Lazio, Puglia), in rapida evoluzione (incremento annuo della produzione maggiore del 20%), che opera nei settori emergenti e strategici (Information and Communication Technology, Impiantistica, Green energy and mobility), con l’obiettivo di favorire la crescita delle piccole, medie e grandi imprese, sia nel settore privato che pubblico (più di 1300 clienti). /ppbr/ppbPosizione aperta: /bData Analyst /ppbr/ppbAttività da svolgere: /b /pulliProgettare, sviluppare e mantenere pipeline dati scalabili e robuste per ingestion, trasformazione, arricchimento e storage (formati bParquet /b, bCSV /b), includendo processi bETL /b ed bELT /b. /liliGestire e ottimizzare ambienti di bdatalake /b e data warehouse per l’analisi e la conservazione dei dati. /liliImplementare algoritmi di banomaly detection /b, boutlier detection /b e bprevisioni /b su dati temporali e metriche. /liliSviluppare e mantenere componenti bMLOps/MLDevSecOps /b per la gestione, il versionamento e il monitoraggio dei modelli. /liliSperimentare e applicare modelli di bmachine learning /b (es. blogistic regression /b, brandom forest /b, bclustering /b, bforecasting /b) e tecniche statistiche avanzate. /liliLavorare su sistemi distribuiti di elaborazione dati e gestire stream real-time tramite bKafka /b o bJetStream/NATS /b. /liliProgettare e ottimizzare strutture dati in bPostgreSQL /b e database time-series come bTimescaleDB /b. /liliIntegrare soluzioni di storage vettoriale (es. bQdrant /b) e knowledge graph (bDgraph /b) per correlazioni, ontologie e arricchimenti avanzati. /liliCollaborare con team AI e Dev per integrare modelli e insight nei flussi dati. /li /ulpbr/ppbCompetenze richieste: /b /pulliOttima conoscenza di bPython /b per lo sviluppo di pipeline dati e algoritmi di machine learning. /liliPadronanza delle principali librerie per data science e ML: bpandas /b, bNumPy /b, bscikit-learn /b, bTensorFlow /b. /liliEsperienza nella progettazione e implementazione di processi bETL/ELT /b, gestione di bdatalake /b e architetture dati distribuite. /liliEsperienza con sistemi di messaggistica distribuita e stream processing (bKafka /b, bJetStream/NATS /b). /liliCompetenza nell’uso di bSQL /b, database relazionali (bPostgreSQL /b) e time-series (bTimescaleDB /b). /liliConoscenza di strumenti e metodologie di bMLOps/MLDevSecOps /b per l’intero ciclo di vita dei modelli. /liliEsperienza nella modellazione e gestione di bknowledge graph /b, ontologie e correlazioni causali. /liliConoscenza dei principi di bDomain-Driven Design (DDD) /b e bTest-Driven Development (TDD) /b. /liliFamiliarità con architetture bmicroservizi /b, container (bDocker /b) e orchestrazione (bKubernetes /b). /liliUtilizzo di bGit /b per il versionamento del codice e collaborazione. /liliEsperienza in ambienti bAgile/Scrum /b. /li /ulpbr/ppbCompetenze preferenziali: /b /pulliEsperienza nell’implementazione di pipeline complesse per l’elaborazione dati in tempo reale. /liliCapacità di progettare e mantenere sistemi di osservabilità e metriche (bPrometheus /b) e soluzioni per l’arricchimento dei dati. /li /ulpbr/ppRAL e inquadramento saranno definiti in sede di colloquio, in funzione della seniority e delle competenze. /ppbr/ppbVisita il nostro sito per conoscerci meglio /b /ppOfferta di lavoro rivolta ad entrambi i sessi, promuoviamo le pari opportunità. /p