Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog
7 à voir

A la découverte des technologies

Les humains qui apprennent aux IA

Les humains qui apprennent aux IA

Qui apprend à l'Intelligence Artificielle ? Qui sont les "vrais" gens qui expliquent aux IA ce qu'elles doivent reconnaître ? Quel travail de préparation cela nécessite t-il ? Voilà ce que je vous propose d'explorer dans ce nouvel article autour de l'IA, à la découverte de la "labélisation".

 

Ça c'est un chat

Comme je l'expliquais dans un précédent article, pour qu'une Intelligence Artificielle apprenne, il faut lui présenter de nombreuses fois ce qu'on veut lui apprendre. Si par exemple on veut qu'une IA reconnaisse un  chat, il va falloir disposer de plusieurs milliers de photos de chats de forme, taille, couleur et position différentes dans des endroits différents et les présenter à notre Intelligence Artificielle.

Dans la forme la plus courante d'Intelligence Artificielle, le Deep Learning, le fait de présenter toutes ces photos permet à un réseau de neurones d'ajuster les poids des connexions entre les couches de neurones pour trouver la configuration idéale pour détecter un chat dans une image.

C'est magique non ?
Mais pour que cela marche, il faut évidemment avoir… plein de photos de chats.

Il faut donc que quelqu'un (un humain) identifie dans un ensemble de photos, les photos où il y a des chats. En fait, que cet humain fasse un peu ce que l'on fait avec les captchas qu'on trouve régulièrement sur le web.

(Crédit: HotHardware)

(Crédit: HotHardware)

Pour entraîner plus précisément notre intelligence artificielle, il peut même être intéressant d'indiquer où sont les chats dans les photos: soit en les encadrant par un polygone, soit en les détourant précisément.

 

Les humains qui apprennent aux IA

(extrait de Introduction to Deep Learning for Computer Vision)

Ce travail, qui doit être fait manuellement, est appelé "labélisation" car il consiste à attacher des labels/étiquettes à des images (ou des données autres).

C'est le travail de base pour faire de l'Intelligence Artificielle.


Banque de chats

Disposer de données labélisées est indispensable pour entraîner une Intelligence Artificielle.
Heureusement, il existe des banques d'images gratuites sur lesquelles le travail de labélisation a déjà été fait.

La plus célèbre banque d'image est ImageNet, elle contient plus 14 millions d'images labélisées dans plus de 20,000 catégories (comme des chats, des avions, des fraises, …).

Open Images, fourni par Google, propose plus de 9 millions d'images avec des objets encadrés/détourés.

Les humains qui apprennent aux IA

La banque d'image du COCO Consortium, soutenue par Microsoft et Facebook propose 200,000 images détourées avec un moteur de recherche en ligne qui permet de combiner les critères. Par exemple pour chercher des photos de chats avec des parapluies (si, si, c'est possible).

Les humains qui apprennent aux IA

Chacun cherche son chat

Mais qui fait ce travail de labélisation ? ce sont des humains. Le plus souvent des "petites mains" travaillant à la chaîne et qui n'ont pas spécifiquement de formation (tout le monde sait ce qu'est un chat) à qui on donne un outil simple pour faire le travail.

Amazon a même mis en place une plateforme dédiée pour recruter et faire réaliser ce travail: Amazon Mechanical Turk. C'est une plateforme de mise en relation de type crowdsourcing qui permet d'attribuer des "Human Intelligence Tasks" à des vrais humains et de collecter le résultat de leur travail contre de la rémunération.

 

Les humains qui apprennent aux IA

Les 14 millions d'images de la banque d'images d'ImageNet, par exemple, ont majoritairement étaient labélisées via la plate-forme Amazon Mechanical Turk.

Apple fait également appel à de la main d'œuvre non qualifiée pour faire de la labélisation. Ils ont ainsi fait la une de l'actualité en 2019 pour avoir confié à des humains des enregistrements d'utilisateurs de Siri afin d'améliorer l'efficacité de son IA. C'est à priori plus de 300 personnes qui réalisaient ces micro-tâches pour Apple avec une confidentialité relative (il s'agissait quand même d'écouter des conversations privées !).

Plus récemment, Tesla recrutait l'année dernière des personnes susceptibles de labéliser des vidéos de conduite afin d'améliorer son système de conduite autonome (voir l'annonce ci-dessous).

Les humains qui apprennent aux IA

Et comme l'utilisation de l'Intelligence Artificielle explose dans tous les secteurs d'activité, le marché de la labélisation est lui aussi en forte expansion. Selon différentes études, il est en croissance de 28% par an et pourrait atteindre pas moins 6 milliards de dollar d'ici 2026 !

Les humains qui apprennent aux IA

Conclusion

Pour apprendre, l'intelligence artificielle a besoin de données et ces données doivent être labélisées par des intelligences humaines.

Si n'importe qui peut reconnaître des chats, quant il s'agit de reconnaître des défauts sur un matériel ou identifier un bruit anormal, il est nécessaire que ce travail de labélisation soit fait par des experts. Cela nécessite de disposer d'un volume de données conséquent, des experts du domaine et des outils pour accompagner ce travail de labélisation.

C'est uniquement grâce à ces intelligences humaines que vous pourrez apprendre à une intelligence artificielle à faire son travail !

(Crédit image d'entête: © Antti via Flickr)

Article précédent Article suivant
Retour à l'accueil
Partager cet article
Repost0
Pour être informé des derniers articles, inscrivez vous :
Commenter cet article
F
ne dit-on pas que la pédagogie, c'est dire et redire les choses.
Répondre
F
Pour les être humain, c'est pareil... Pour ne pas repartir de l'âge de pierre, des parents et l'éducation nationale dépensent sans compter pour qu'un humain sorti de sa coquille, reconnaisse un COD, que le feu ça brule ou que l'eau ça noie.
Répondre
L
Oui enfin pour les humains il faut répéter moins quand même 😅