Les modèles d’IA peinent à lire l’heure : révélateur de leurs limites cognitives

18 juin 2025

Malgré leurs prouesses en génération de texte, en codage ou en création d’images, les modèles d’intelligence artificielle les plus avancés échouent encore sur des tâches que nous considérons comme élémentaires : lire une horloge analogique ou comprendre un calendrier. Une étude présentée lors de la conférence ICLR 2025 révèle que ces systèmes, tels que GPT-4o ou Llama 3.2-Vision, n’ont réussi à lire correctement l’heure que dans 38,7 % des cas, et à interpréter des dates calendaires que dans 26,3 % des cas .

Ces résultats soulignent une faiblesse fondamentale des modèles d’IA actuels : leur incapacité à raisonner spatialement et à manipuler des concepts abstraits comme le temps.


Des performances décevantes sur des tâches simples

L’étude menée par l’université d’Édimbourg a évalué 13 modèles d’IA multimodaux sur des tâches de lecture d’horloges analogiques et d’interprétation de calendriers. Les résultats sont sans appel : même les modèles les plus performants peinent à accomplir ces tâches avec précision.

Par exemple, lorsqu’on leur présente une horloge affichant 10h10, les modèles confondent fréquemment les aiguilles des heures et des minutes, ou interprètent mal leur orientation. La présence de chiffres romains ou de designs stylisés aggrave encore leurs performances .

Ces erreurs ne sont pas anodines : elles révèlent une compréhension superficielle des objets et des concepts, basée sur la reconnaissance de motifs plutôt que sur une véritable compréhension sémantique.


Une incapacité à raisonner spatialement

Les chercheurs attribuent ces échecs à des déficiences en raisonnement spatial. Contrairement aux humains, les modèles d’IA n’ont pas d’expérience sensorielle du monde. Ils ne peuvent pas manipuler d’objets, se déplacer dans l’espace ou expérimenter le temps qui passe. Cette absence d’incarnation limite leur capacité à comprendre des concepts qui reposent sur des relations spatiales ou temporelles.

Par exemple, pour lire une horloge, il faut comprendre que les aiguilles tournent autour d’un centre, que leur position indique une valeur temporelle, et que cette valeur évolue de manière cyclique. Ce type de raisonnement, qui nous semble naturel, est difficile à modéliser pour une IA qui n’a jamais vécu l’expérience du temps.


Des implications pour les applications de l’IA

Ces limitations ont des conséquences concrètes pour le développement et le déploiement de l’IA. Elles rappellent que, malgré leurs performances impressionnantes dans certains domaines, les modèles d’IA actuels restent fragiles et peu fiables pour des tâches nécessitant une compréhension profonde du monde.

Dans des secteurs comme la santé, la finance ou la logistique, où la précision et la compréhension contextuelle sont cruciales, ces faiblesses peuvent entraîner des erreurs coûteuses. Elles soulignent également l’importance de maintenir une supervision humaine dans l’utilisation de l’IA, en particulier pour des tâches critiques.


Vers une IA plus incarnée et compréhensive

Pour surmonter ces obstacles, les chercheurs explorent plusieurs pistes :

  • Enrichir les données d’entraînement : en exposant les modèles à une plus grande variété de situations et de représentations, on espère améliorer leur capacité à généraliser.
  • Intégrer des modules de raisonnement symbolique : en combinant apprentissage statistique et logique formelle, les modèles pourraient mieux manipuler des concepts abstraits.
  • Développer des IA incarnées : en dotant les modèles de capacités sensorielles et motrices, on leur permettrait d’acquérir une compréhension plus profonde du monde physique.

Ces approches visent à combler le fossé entre les performances impressionnantes des IA dans des tâches spécifiques et leur manque de compréhension générale.


Conclusion

Les difficultés des modèles d’IA à lire l’heure ou à interpréter un calendrier ne sont pas de simples curiosités techniques. Elles révèlent des limites profondes dans leur capacité à comprendre le monde de manière similaire aux humains.

Chez Tamento, nous sommes convaincus que l’IA doit être utilisée de manière éclairée et responsable. Nous accompagnons nos clients dans l’intégration de solutions d’IA adaptées, en tenant compte de leurs forces et de leurs limites. Contactez-nous pour discuter de vos projets et découvrir comment l’IA peut enrichir votre stratégie digitale.


Sources


Create your account