Descrizione del ruolo
Siamo alla ricerca di un/una Senior Computer Vision Engineer da inserire nel team di percezione per lo sviluppo di sistemi di visione avanzati destinati al nostro robot umanoide.
La figura contribuirà alla progettazione e implementazione di pipeline di percezione basate su computer vision, deep learning e 3D vision, con particolare focus su stima della posa 3D degli oggetti, scene understanding e ottimizzazione dell’inferenza su GPU ed edge devices embedded a bordo del robot.
Il ruolo prevede attività ad alto impatto sul comportamento percettivo del robot, contribuendo direttamente alle capacità di manipolazione autonoma, interazione con l’ambiente e comprensione della scena.
La persona selezionata lavorerà su:
* integrazione software di modelli di object detection, segmentation e 3D pose estimation
* sviluppo di pipeline multi-stage di percezione (detection → refinement → pose estimation)
* elaborazione dati RGB-D e point cloud provenienti da sensori onboard
* sviluppo di pipeline robuste per robot operanti in ambienti dinamici e non strutturati
* deployment su hardware embedded (es. NVIDIA Jetson) integrato su piattaforme robotiche umanoidi
* conversione e ottimizzazione modelli (ONNX, TensorRT, quantizzazione FP16 / INT8)
* sviluppo di pipeline modulari in Python
* collaborazione con team software, AI e hardware per integrazione end-to-end del sistema percettivo del robot
Requisiti
* Laurea in Computer Science, Software Engineering, Robotics o discipline affini
* Almeno 2 anni di esperienza nello sviluppo software con focus su computer vision, perception robotica o sistemi di visione 3D
* Ottima conoscenza di Python Object-Oriented Programming, incluse librerie di multithreading e programmazione asincrona
* Esperienza con protocolli di streaming (es. WebRTC) e comunicazione IoT (es. MQTT)
* Esperienza pratica con pipeline RGB-D, elaborazione point cloud e librerie 3D (es. PCL)
* Esperienza nello sviluppo o integrazione di modelli deep learning per object detection, segmentation e pose estimation, utilizzando PyTorch o TensorFlow
* Esperienza nel deployment e nell’ottimizzazione di modelli su GPU ed edge device (es. ONNX Runtime, TensorRT, CUDA, NVIDIA Jetson)
* Esperienza con conversione modelli, quantizzazione (FP16 / INT8) e ottimizzazione inference real-time
* Ottima conoscenza di OpenCV
* Familiarità con workflow collaborativi basati su Git
Nice to have
* esperienza con calibrazione camere e setup multi-camera / RGB-D (es. RealSense, ZED)
* esperienza con ROS o ROS2
* esperienza con Docker o infrastrutture MLOps
* esperienza con pipeline CI/CD per modelli ML
* familiarità con Vision-Language Models (VLM) o modelli emergenti per robotica
* esperienza con ambienti di simulazione per testing perception (es. Gazebo o NVIDIA Isaac Sim)
Role Description
We are looking for a Senior Computer Vision Engineer to join our perception team and contribute to the development of advanced vision systems for humanoid robots operating in real-world environments.
The selected candidate will design and implement perception pipelines based on computer vision, deep learning, and 3D vision, with a strong focus on 3D object pose estimation, scene understanding, and GPU / edge inference optimization on embedded robotic platforms.
This role directly impacts the robot’s ability to perform autonomous manipulation, environment interaction, and visual scene understanding.
Responsibilities include:
* integration of deep learning models for object detection, segmentation, and 3D pose estimation
* development of multi-stage perception pipelines (detection → refinement → pose estimation)
* processing of RGB-D data and point clouds from onboard sensors
* development of robust perception pipelines for robots operating in dynamic, unstructured environments
* deployment on embedded hardware platforms (e.g. NVIDIA Jetson) integrated on humanoid robots
* model conversion and optimization (ONNX, TensorRT, FP16 / INT8 quantization)
* performance optimization for real-time onboard inference
* collaboration with software, AI, and hardware teams for end-to-end humanoid perception system integration
Nice to Have
* experience with camera calibration and multi-camera / RGB-D setups (e.g. RealSense, ZED)
* experience with ROS or ROS2
* experience with Docker or MLOps infrastructures
* experience with CI/CD pipelines for ML models
* familiarity with Vision-Language Models (VLMs) or emerging models for robotics
* experience with perception testing simulation environments (e.g. Gazebo or NVIDIA Isaac Sim)