
Les robots peinent encore à percevoir le monde réel
La démonstration sur le salon professionnel est sans faille : le robot glisse vers un bac, identifie l'objet, le saisit et le dépose exactement où il le faut. Puis l'équipement arrive sur site réel, et le monde cesse de se comporter comme lors du pilote. Ce fossé entre démonstration et déploiement reste l'un des obstacles les plus persistants en robotique industrielle. Les environnements contrôlés de laboratoire favorisent systématiquement la pile de perception : éclairage stable, positions d'objets fixées, arrière-plans neutres. Les entrepôts logistiques, les couloirs hospitaliers et les lignes de fabrication offrent l'inverse, éclairage variable, surfaces réfléchissantes, matériaux transparents, personnes en mouvement, vibrations de chariots élévateurs. Ce qui ressemble à une défaillance de planification ou de manipulation commence souvent par un problème de capteur ou d'estimation de confiance mal calibrée : un robot ne peut pas planifier de manière fiable autour d'une carte de profondeur qui est confiante mais fausse.
L'enjeu central est le passage des caméras 2D aux systèmes de vision 3D. Une image plate ne mesure pas la profondeur, elle peut l'inférer par des priors appris ou de la géométrie multi-vues, mais ces estimations s'effondrent dès que l'éclairage, la texture ou l'occultation varient. La robotique déployée repose désormais sur trois familles de capteurs de profondeur, chacune avec ses compromis précis. La lumière structurée projette un motif connu sur la scène et mesure sa déformation pour calculer la profondeur ; efficace en intérieur pour l'inspection, mais sensible à l'infrarouge ambiant et aux surfaces réfléchissantes. La stéréovision utilise deux caméras décalées pour estimer la disparité ; la stéréo active ajoute une projection infrarouge pour les scènes peu texturées, mais reste vulnérable au flou de mouvement et aux motifs répétitifs. Le time-of-flight (ToF) mesure le temps de retour de la lumière infrarouge et offre une compacité et une densité de profondeur utiles, mais souffre de réflexions multi-chemin et d'ambiguïté de portée. Aucune catégorie ne domine universellement : le bon choix dépend de la tâche, de la portée, des matériaux, du mouvement et de la tolérance aux pannes.
La tentation de compenser les limites capteur par l'IA, notamment les modèles d'estimation de profondeur à partir d'images monoculaires, est réelle mais trompeuse. Ces approches peuvent débruiter et compléter des cartes de profondeur partielles, mais elles ne remplacent pas une mesure physique fiable. Orbbec, fabricant basé en Chine avec une gamme de caméras RGB-D orientées robotique, navigation et picking, positionne son offre précisément sur ce constat : la perception robotique doit être fiable, spécifique à la tâche et mesurable dans des conditions opérationnelles réelles, pas dans un démonstrateur. La prochaine frontière du secteur n'est pas tant l'algorithme que la robustesse capteur dans des conditions dégradées, un défi que ni les VLA ni la fusion multi-modale ne résolvent encore à l'échelle du déploiement industriel.




