Observez la photo de chat ci-dessous :
Ce chat n’a jamais existé car cette photo a été générée par une intelligence artificielle ! De nos jours, il existe de même des programmes informatiques conçus pour générer du texte en réponse à des requêtes humaines. Comment ces prouesses sont-elles possibles ?
On peut classer l’intelligence artificielle en deux grandes catégories :
– l’intelligence artificielle discriminative : elle permet de répondre à des questions par « oui » ou « non » comme par exemple la question « Est-ce une photo de chat ? ».
– l’intelligence artificielle générative : elle permet de créer du texte, des images ou plus généralement des fichiers informatiques à partir d’un grand nombre d’exemples.
Ces deux intelligences collaborent et progressent ensemble : l’intelligence artificielle discriminative peut permettre par exemple de trier un grand nombre de photos pour retenir seulement les photos de chat. Ces photos de chats peuvent ensuite servir à entraîner l’intelligence artificielle générative afin qu’elle puisse créer d’autres exemples de photos de chats. Ces nouvelles photos de chats peuvent ensuite servir à entraîner l’intelligence artificielle discriminative et ainsi de suite, etc.
Pour comprendre les fondements mathématiques de l’intelligence artificielle on peut s’intéresser à un problème plus simple que celui des chats : reconnaître si une ellipse ressemble à un cercle. On commence par programmer l’intelligence artificielle discriminative, sa réponse est approchée par un nombre entre 0 et 1 (par exemple 1 signifie « oui » et 0 signifie « non »). Ce nombre qui peut être interprété comme une probabilité va être calculé en utilisant des applications affines qui seront appelées dans ce contexte des « neurones artificiels ». On mesure la réussite de notre programme par rapport à des réponses humaines avec une fonction d’erreur convexe. L’algorithme de la descente du gradient nous permet ensuite de déterminer le bon réglage des paramètres de nos neurones artificiels pour minimiser notre erreur.
La fonction d’erreur est en dimension deux semblable à une vallée dont il faut trouver l’endroit le plus bas. Pour y arriver, on commence par se placer à un endroit au hasard de cette vallée, on calcule l’opposé du gradient ce qui va nous indiquer une direction descendante autour de nous, on fait alors un pas dans cette direction puis on recommence ces calculs jusqu’à se retrouver tout en bas de la vallée. Pour avoir plus de détails sur le fonctionnement de l’intelligence artificielle, l’exemple des ellipses est détaillé dans un cours interactif : vous aurez accès à des cellules contenant des lignes de code en Python que vous pourrez exécuter et modifier à votre guise afin de faire vos propres expériences.
Pour suivre ce cours interactif cliquez sur le bouton suivant :