Per una società nostra cliente, startup italiana fondata nel 2025, cresciuta rapidamente fino a 30 persone e finanziata con 3,2 milioni di euro per innovare il settore delle costruzioni, con l’obiettivo di diventare la piattaforma digitale di riferimento in Italia ed Europa., siamo alla ricerca di un\una:
FULL STACK ENGINEER (AI/LLM FOCUS)
Il candidato avrà le seguenti responsabilità:
* Ideare e costruire workflow agentici: progettazione dei prompt, coordinamento degli strumenti, ragionamento multi-step e messa in produzione.
* Sviluppare pipeline di ricerca RAG e semantica sfruttando database vettoriali e modelli di embedding per fornire contesto pertinente agli agenti di IA.
* Creare pipeline di document processing che convertano file non strutturati (fatture, report, moduli) in dati strutturati all’interno di database.
* Implementare sistemi di osservabilità e valutazione: tracciamento, monitoraggio degli esperimenti e analisi automatizzata della qualità degli output dei modelli LLM.
* Migliorare le strategie di gestione del contesto degli agenti: suddivisione dei contenuti, ricerca ibrida e ri-ranking per aumentare la qualità delle risposte.
* Operare su tutto lo stack tecnologico (React/Next.js, tRPC, PostgreSQL, funzioni serverless) quando necessario per abilitare funzionalità basate su IA.
Il candidato avrà i seguenti requisiti:
* Esperienza nello sviluppo di applicazioni in produzione basate su LLM: agenti intelligenti, utilizzo di strumenti esterni e generazione di output strutturati.
* Esperienza pratica con sistemi RAG: embedding, database vettoriali, ricerca ibrida e strategie di suddivisione dei contenuti (chunking).
* Conoscenza di TypeScript o forte motivazione ad apprenderlo: l’intero stack tecnologico è sviluppato in questo linguaggio.
* Esperienza con framework di orchestrazione per AI (come LangChain, Mastra, CrewAI o soluzioni analoghe).
* Ottima padronanza di SQL e database relazionali: capacità di scrivere query complesse e ottimizzare pipeline di dati.
* Conoscenza delle tecniche di prompt engineering: few-shot prompting, chain-of-thought e strutturazione avanzata degli output.
Requisiti preferenziali:
* Esperienza in MLOps: deploy di modelli su infrastrutture GPU serverless, CI/CD per sistemi AI e monitoraggio di modelli e agenti in produzione.
* Conoscenza di MCP (Model Context Protocol) o standard simili per l’integrazione e la distribuzione di strumenti.
* Esperienza nella realizzazione di agenti conversazionali multi-turno con gestione della memoria e dello stato.
Orario di lavoro: Full Time
Sede di lavoro: Milano (zona Lorenteggio)
L’inquadramento sarà commisurato al grado di autonomia acquisito.
La Selezione è rivolta ad ambo i sessi ai sensi dell’Art. 1 L. 903/77