L'IA pour les nuls qui veulent y voir un peu plus clair

Aujourd’hui quand on parle d’IA on parle le plus souvent d’IA générative. Cette IA capable de créer du contenu original à partir de ce qu’elle a appris a été rendue très populaire auprès du grand public par Chat GPT et c’est certainement la forme d’IA la plus accessible pour ce dernier avec des cas d’usages évidents.

Mais l’IA est un domaine riche et assez ancien : les premiers travaux sur le sujet datent des années 50 mais est resté un sujet compliqué réservé aux spécialistes et un peu abscons pour le commun des mortels même si il y a une dizaine d’années IBM Waston plateforme d’intelligence artificielle hybride, qui combine NLP, machine learning, automatisation et raisonnement symbolique (Qu’est ce que l’informatique cognitive ? L’exemple d’IBM Watson) avait attiré l’attention.

Mais pour que l’IA devienne un sujet de société il aura logiquement fallu qu’elle rentre dans les foyers (merci ChatGPT) mais la médaille a un revers : à force de ne voir que ce type d’outil on oublie qu‘il existe pleins d’autres formes d’IA, à tel point que certains craignent que s’il existe une bulle de l’IA Générative son explosion pourrait faire mal à tout le secteur malgré le fait qu’il existe des types d’IA mures avec un business établi et qui font leurs preuves depuis longtemps (L’IA vers une impasse économique ?)

L’IA générative ne peut pas tout faire et cela tombe bien, elle n’est pas faite pour tout faire. L’autre jour faisais la liste des cas d’usages potentiels de l’IA pour une gouvernance d’entreprise et cela a été l’occasion de me rendre compte qu’à chaque cas correspondant un type d’IA qui avait son propre mode de fonctionnement.

N’étant pas un expert des technologies au sens « deep » du terme cela a été l’occasion de remettre les choses au clair et de parfaire ma culture en la matière. Mais je me suis également rendu compte que nombre de décideurs ou utilisateurs employaient le terme générique d’IA sans trop savoir ce qui se cache derrière, la variété et l’étendue du champ des possibles, ce qu’ils pourraient en faire…et même sans savoir qu’ils en utilisent parfois depuis des années sans le savoir. Un peu comme parler de couverts en pensant à une fourchette alors votre besoin est un couteau…

Je me suis donc dit que quitte a avoir ce travail pour moi autant partager cela avec ceux qui se posent les mêmes questions. Un article de vulgarisation que les experts trouveront sans doute pas assez fouillé, où ils trouveront des détails prêtant à discussion mais qui je l’espère sera utile à tous ceux qui se préoccupent avant tout des cas d’usages et veulent comprendre ce qu’il y a derrière tout cela.

Si on veut comprendre ce que fait l’IA (et ce qu’elle ne fait pas), il faut prendre un peu de recul et poser les bases et ce que nous allons faire ici.

En bref :

L’intelligence artificielle regroupe une diversité de formes et de finalités, bien au-delà de la seule IA générative popularisée par des outils comme ChatGPT : chaque type d’IA vise un objectif distinct, qu’il s’agisse de prédire, décrire, recommander, dialoguer ou agir de manière autonome.
Le fonctionnement de l’IA repose sur différentes méthodes d’apprentissage (supervisé, non supervisé, par renforcement, symbolique ou via deep learning), chacune adaptée à des besoins spécifiques et déterminant le type de tâche que l’IA peut accomplir.
À ces méthodes s’ajoutent des briques technologiques complémentaires (NLP, vision, OCR, RPA, GANs, modèles de diffusion, etc.) qui permettent de traiter des données variées et de construire des cas d’usage concrets dans tous les secteurs d’activité.
Certaines concepts méritent d’être clarifiées : un outil comme ChatGPT peut comprendre une consigne sans exemple ou s’adapter si on lui en donne quelques-uns, et il existe plusieurs manières pour une machine de produire un texte ou une image.
Pour appréhender l’IA de manière pertinente, il est essentiel de distinguer ses objectifs, ses modes d’apprentissage et ses outils, afin d’évaluer les usages réels et la valeur ajoutée concrète des solutions qui s’en réclament.

Les grandes familles d’IA : ce que l’IA cherche à faire

On peut commencer par distinguer l’IA selon sa finalité. Que cherche-t-elle à accomplir ? Pour quoi peut on s’en servir.

Pour cela un tableau vaut mieux que des grandes phrases.

Type d’IA	But	Exemples
IA prédictive	Prévoir ce qui va se passer	Prévision des ventes, détection de fraude
IA descriptive	Expliquer ce qui s’est passé	Analyse de sentiments, clustering de clients
IA générative	Créer du contenu	ChatGPT, DALL·E, Midjourney
IA prescriptive	Recommander une action	Recommandation de produits, GPS
IA conversationnelle	Dialoguer avec des humains	Chatbots, assistants vocaux
IA cognitive	Simuler le raisonnement humain	Systèmes experts, moteurs de règles
IA explicable	Rendre les décisions compréhensibles	SHAP, LIME, audits de modèles
IA adaptative	Apprendre en temps réel	Agents autonomes, IA embarquée
IA embarquée	Fonctionner localement, sans connexion	Objets connectés, caméras intelligentes
IA agentique	Agir de manière autonome dans un environnement	AutoGPT, copilotes métier, assistants proactifs

Et bien oui, quand vous utilisez un GPS pour trouver votre chemin il y a de l’IA dedans…

Une petite précision sur l’IA agentique puisque cela sera surement celle qui va rapidement transformer notre quotidien et qu’on a trop tendance à vouloir assimiler à une IA générative évoluée.

En fait ces IA ne sont pas elles-mêmes des modèles génératifs, mais elles s’appuient largement sur ces modèles (comme GPT) pour comprendre, raisonner, générer et interagir. Autrement dit : les modèles génératifs sont une brique clé qui rend les agents plus intelligents, plus adaptatifs, et plus autonomes mais on ne peut réduire ces IA à ces modèles.

Et l’AGI, l’intelligence artificielle générale ? Elle n’existe pas encore donc on verra plus tard.

Maintenant se pose la question de savoir comment elles fonctionnent pour y parvenir, ce qui explique que chacune a son terrain de jeu et ses limites.

Les grandes méthodes d’apprentissage : comment l’IA apprend

Je ne suis pas friand du terme « intelligence » parce que ce qui distingue avant tout l’IA c’est sa capacité à apprendre. Et elle le fait de diverses manières.

Méthode	Idée	Exemple d’application
Apprentissage supervisé	L’IA apprend avec des données étiquetées	Prédiction de churn, reconnaissance d’image, GPT, LLaMA, Copilot
Apprentissage non supervisé	L’IA découvre des groupes ou modèles cachés	Segmentation client, clustering
Apprentissage par renforcement	L’IA apprend par essais et erreurs	Jeu déchecs, robotique
Apprentissage symbolique	L’IA applique des règles logiques	Systèmes experts, moteurs d’inférence
Deep learning	L’IA apprend via des réseaux neuronaux profonds	Reconnaissance vocale, vision, GPT, LLaMA, Copilot
Few-shot / Zero-shot	L’IA généralise avec peu ou pas d’exemples	GPT, LLaMA, Copilot

On peut s’étonner de voir des IA Génératives dans la catégorie « few shots » (en tout cas ça a été mon cas) mais il faut comprendre qu’elles suivent plusieurs étapes.

Un outil comme ChatGPT a été pré-entraîné sur des milliards de textes (apprentissage auto-supervisé, via deep learning) : c’est ce qu’on appelle le pretraining : il apprend le langage, les structures, les concepts.

Mais ensuite, une fois entraîné, on peut l’utiliser en few-shot ou zero-shot.

Zero-shot car si on lui pose une question sans exemple il comprend et répond directement et few-shot car si on lui donnes quelques exemples il va adapter sa réponse au contexte. C’est le cas par exemple quand vous « éduquez » une IA à adopter un style donné.

C’est donc dans l’usage que le modèle est few-shot/zero-shot, pas dans son entraînement lui-même.

Ce que l’IA manipule : les briques technologiques

On parlé de la finalité, de la manière dont l’IA se dote du potentiel (connaissance) nécessaire pour l’atteindre, reste la manière dont elle utilise ce potentiel.

Elle va le mobiliser dans des briques technologiques dont chacune a son utilité, son fonctionnement, et ses cas d’usage métier.

Technologie	Utilité principale	Exemple	Cas d’usage métier
NLP (natural language processing)	Comprendre les textes	Analyse de commentaires	Support client, e-réputation, veille
OCR (Optical Character Recognition)	Lire du texte dans une image	Scanner une facture	Traitement de documents, archivage
Vision par ordinateur	Reconnaître des objets et des formes	Détection de défauts	Contrôle qualité, sécurité, comptage en magasin
LLM (Large Language Models)	Générer et comprendre le langage naturel	ChatGPT, Copilot	Assistance à la rédaction, agents intelligents
RPA (Robotic Process Automation)	Automatiser des tâches répétitives	Saisie de données	Back-office, RH, finance
GANs (Generative Adversarial Networks)	Générer des images	Création artistique	Publicité, design, prototypage
Modèles de diffusion	Créer des visuels réalistes	Midjourney, DALL·E	Illustration marketing, aide à la conception
Speech-to-text	Transcrire la voix	Sous-titrage automatique	Médias, santé, transcription juridique
Chatbots	Dialoguer automatiquement	FAQ automatisée	Service client, support interne
Systèmes experts	Raisonnement logique via règles	Diagnostic technique	Maintenance, fiscalité, juridique
Systèmes de recommandation	Suggérer un choix	Suggestions de films	E-commerce, RH, éducation en ligne
Outils d’explicabilité	Expliquer les décisions d’IA	SHAP, LIME	Conformité, audit modèles, assurance
IA embarquée	Fonctionner localement en temps réel	Caméra intelligente	Drones, objets connectés, automobile
NLG (Natural Language Generation)	Générer du texte automatiquement	Rapports automatiques	Finance, assurance, sport

Si vous vous demandez ce qui différencie les LLM du NLG sachez que je me suis également posé la question.

Disons que des LLM comme GPT 4 peuvent faire de la génération de contenu (assez évident à comprendre) mais qu’on peut faire du NLG sans LLM via des systèmes plus simples (règles, modèles statistiques…).

Prenons l’exemple d’un bulletin météo généré automatiquement. On va utilisera des données météorologiques contenues dans une base de données et ensuite un moteur de règles va les repositionner dans une phrase pour donner quelque chose comme « «Ce matin, le ciel sera partiellement couvert avec 18°C. L’après-midi, les températures grimperont à 23°C avec un vent modéré de sud-ouest. »

Pareil pour les GANs et les modèles de diffusion. Alors, si j’ai bien compris ce qu’on m’a expliqué, ce sont deux technologies qui permettent à l’IA de générer des images, mais elles fonctionnent de manières très différentes.

Les GANs, c’est un peu comme deux artistes en compétition : le premier invente une image, le deuxième doit dire si elle est vraie ou fausse, le premier essaie de tromper le deuxième, et ils s’améliorent à chaque tour avec pour résultat des images de plus en plus réalistes.

Les modèles de diffusion, eux, partent d’un gribouillis aléatoire (comme du bruit) et retirent petit à petit ce bruit jusqu’à faire apparaître une image nette. C’est plus lent, mais souvent plus stable et plus précis.

Aujourd’hui ce sont les modèles de diffusion qui dominent dans le monde de l’IA (DALL·E, Midjourney…) mais le nouveau générateur d’images de ChatGPT a récemment changé la donne en utilisant un « une approche prédictive multimodale intégrée, générant du contenu via un réseau neuronal unique entraîné simultanément sur texte, images et audio » totalement différente du processus de débruitage itératif propre des modèles par diffusion.

Conclusion (sans jargon)

Quand on pense « produit », beaucoup de solutions IA vont en fait intégrer différents types d’IA, donc différents modèles d’apprentissage au service de plusieurs briques pour satisfaire un cas d’usage donnée, surtout s’il est complexe.

Il n’existe pas une IA mais plusieurs types, avec des objectifs différents et ce que chacune fait dépend de la façon dont elle apprend.

Chaque technologie est donc une brique spécifique, au service d’un usage précis.

Ce n’est pas parce qu’une entreprise « fait de l’IA » que c’est nécessairement innovant. Ce qui compte, c’est pour quoi elle l’utilise, comment, et avec quelle valeur ajoutée concrète.

La prochaine fois qu’on vous parle d’IA, vous saurez (j’espère) poser la bonne question : de quel type d’IA s’agit-il, et pour quoi faire ?

Illustration : générée par IA via ChatGPT / DALL·E