Aujourd’hui quand on parle d’IA on parle le plus souvent d’IA générative. Cette IA capable de créer du contenu original à partir de ce qu’elle a appris a été rendue très populaire auprès du grand public par Chat GPT et c’est certainement la forme d’IA la plus accessible pour ce dernier avec des cas d’usages évidents.
Mais l’IA est un domaine riche et assez ancien : les premiers travaux sur le sujet datent des années 50 mais est resté un sujet compliqué réservé aux spécialistes et un peu abscons pour le commun des mortels même si il y a une dizaine d’années IBM Waston plateforme d’intelligence artificielle hybride, qui combine NLP, machine learning, automatisation et raisonnement symbolique (Qu’est ce que l’informatique cognitive ? L’exemple d’IBM Watson) avait attiré l’attention.
Mais pour que l’IA devienne un sujet de société il aura logiquement fallu qu’elle rentre dans les foyers (merci ChatGPT) mais la médaille a un revers : à force de ne voir que ce type d’outil on oublie qu‘il existe pleins d’autres formes d’IA, à tel point que certains craignent que s’il existe une bulle de l’IA Générative son explosion pourrait faire mal à tout le secteur malgré le fait qu’il existe des types d’IA mures avec un business établi et qui font leurs preuves depuis longtemps (L’IA vers une impasse économique ?)
L’IA générative ne peut pas tout faire et cela tombe bien, elle n’est pas faite pour tout faire. L’autre jour faisais la liste des cas d’usages potentiels de l’IA pour une gouvernance d’entreprise et cela a été l’occasion de me rendre compte qu’à chaque cas correspondant un type d’IA qui avait son propre mode de fonctionnement.
N’étant pas un expert des technologies au sens « deep » du terme cela a été l’occasion de remettre les choses au clair et de parfaire ma culture en la matière. Mais je me suis également rendu compte que nombre de décideurs ou utilisateurs employaient le terme générique d’IA sans trop savoir ce qui se cache derrière, la variété et l’étendue du champ des possibles, ce qu’ils pourraient en faire…et même sans savoir qu’ils en utilisent parfois depuis des années sans le savoir. Un peu comme parler de couverts en pensant à une fourchette alors votre besoin est un couteau…
Je me suis donc dit que quitte a avoir ce travail pour moi autant partager cela avec ceux qui se posent les mêmes questions. Un article de vulgarisation que les experts trouveront sans doute pas assez fouillé, où ils trouveront des détails prêtant à discussion mais qui je l’espère sera utile à tous ceux qui se préoccupent avant tout des cas d’usages et veulent comprendre ce qu’il y a derrière tout cela.
Si on veut comprendre ce que fait l’IA (et ce qu’elle ne fait pas), il faut prendre un peu de recul et poser les bases et ce que nous allons faire ici.
En bref :
- L’intelligence artificielle regroupe une diversité de formes et de finalités, bien au-delà de la seule IA générative popularisée par des outils comme ChatGPT : chaque type d’IA vise un objectif distinct, qu’il s’agisse de prédire, décrire, recommander, dialoguer ou agir de manière autonome.
- Le fonctionnement de l’IA repose sur différentes méthodes d’apprentissage (supervisé, non supervisé, par renforcement, symbolique ou via deep learning), chacune adaptée à des besoins spécifiques et déterminant le type de tâche que l’IA peut accomplir.
- À ces méthodes s’ajoutent des briques technologiques complémentaires (NLP, vision, OCR, RPA, GANs, modèles de diffusion, etc.) qui permettent de traiter des données variées et de construire des cas d’usage concrets dans tous les secteurs d’activité.
- Certaines concepts méritent d’être clarifiées : un outil comme ChatGPT peut comprendre une consigne sans exemple ou s’adapter si on lui en donne quelques-uns, et il existe plusieurs manières pour une machine de produire un texte ou une image.
- Pour appréhender l’IA de manière pertinente, il est essentiel de distinguer ses objectifs, ses modes d’apprentissage et ses outils, afin d’évaluer les usages réels et la valeur ajoutée concrète des solutions qui s’en réclament.
Les grandes familles d’IA : ce que l’IA cherche à faire
On peut commencer par distinguer l’IA selon sa finalité. Que cherche-t-elle à accomplir ? Pour quoi peut on s’en servir.
Pour cela un tableau vaut mieux que des grandes phrases.
Type d’IA | But | Exemples |
---|---|---|
IA prédictive | Prévoir ce qui va se passer | Prévision des ventes, détection de fraude |
IA descriptive | Expliquer ce qui s’est passé | Analyse de sentiments, clustering de clients |
IA générative | Créer du contenu | ChatGPT, DALL·E, Midjourney |
IA prescriptive | Recommander une action | Recommandation de produits, GPS |
IA conversationnelle | Dialoguer avec des humains | Chatbots, assistants vocaux |
IA cognitive | Simuler le raisonnement humain | Systèmes experts, moteurs de règles |
IA explicable | Rendre les décisions compréhensibles | SHAP, LIME, audits de modèles |
IA adaptative | Apprendre en temps réel | Agents autonomes, IA embarquée |
IA embarquée | Fonctionner localement, sans connexion | Objets connectés, caméras intelligentes |
IA agentique | Agir de manière autonome dans un environnement | AutoGPT, copilotes métier, assistants proactifs |
Et bien oui, quand vous utilisez un GPS pour trouver votre chemin il y a de l’IA dedans…
Une petite précision sur l’IA agentique puisque cela sera surement celle qui va rapidement transformer notre quotidien et qu’on a trop tendance à vouloir assimiler à une IA générative évoluée.
En fait ces IA ne sont pas elles-mêmes des modèles génératifs, mais elles s’appuient largement sur ces modèles (comme GPT) pour comprendre, raisonner, générer et interagir. Autrement dit : les modèles génératifs sont une brique clé qui rend les agents plus intelligents, plus adaptatifs, et plus autonomes mais on ne peut réduire ces IA à ces modèles.
Et l’AGI, l’intelligence artificielle générale ? Elle n’existe pas encore donc on verra plus tard.
Maintenant se pose la question de savoir comment elles fonctionnent pour y parvenir, ce qui explique que chacune a son terrain de jeu et ses limites.
Les grandes méthodes d’apprentissage : comment l’IA apprend
Je ne suis pas friand du terme « intelligence » parce que ce qui distingue avant tout l’IA c’est sa capacité à apprendre. Et elle le fait de diverses manières.
Méthode | Idée | Exemple d’application |
Apprentissage supervisé | L’IA apprend avec des données étiquetées | Prédiction de churn, reconnaissance d’image, GPT, LLaMA, Copilot |
Apprentissage non supervisé | L’IA découvre des groupes ou modèles cachés | Segmentation client, clustering |
Apprentissage par renforcement | L’IA apprend par essais et erreurs | Jeu déchecs, robotique |
Apprentissage symbolique | L’IA applique des règles logiques | Systèmes experts, moteurs d’inférence |
Deep learning | L’IA apprend via des réseaux neuronaux profonds | Reconnaissance vocale, vision, GPT, LLaMA, Copilot |
Few-shot / Zero-shot | L’IA généralise avec peu ou pas d’exemples | GPT, LLaMA, Copilot |
On peut s’étonner de voir des IA Génératives dans la catégorie « few shots » (en tout cas ça a été mon cas) mais il faut comprendre qu’elles suivent plusieurs étapes.
Un outil comme ChatGPT a été pré-entraîné sur des milliards de textes (apprentissage auto-supervisé, via deep learning) : c’est ce qu’on appelle le pretraining : il apprend le langage, les structures, les concepts.
Mais ensuite, une fois entraîné, on peut l’utiliser en few-shot ou zero-shot.
Zero-shot car si on lui pose une question sans exemple il comprend et répond directement et few-shot car si on lui donnes quelques exemples il va adapter sa réponse au contexte. C’est le cas par exemple quand vous « éduquez » une IA à adopter un style donné.
C’est donc dans l’usage que le modèle est few-shot/zero-shot, pas dans son entraînement lui-même.
Ce que l’IA manipule : les briques technologiques
On parlé de la finalité, de la manière dont l’IA se dote du potentiel (connaissance) nécessaire pour l’atteindre, reste la manière dont elle utilise ce potentiel.
Elle va le mobiliser dans des briques technologiques dont chacune a son utilité, son fonctionnement, et ses cas d’usage métier.
Technologie | Utilité principale | Exemple | Cas d’usage métier |
NLP (natural language processing) | Comprendre les textes | Analyse de commentaires | Support client, e-réputation, veille |
OCR (Optical Character Recognition) | Lire du texte dans une image | Scanner une facture | Traitement de documents, archivage |
Vision par ordinateur | Reconnaître des objets et des formes | Détection de défauts | Contrôle qualité, sécurité, comptage en magasin |
LLM (Large Language Models) | Générer et comprendre le langage naturel | ChatGPT, Copilot | Assistance à la rédaction, agents intelligents |
RPA (Robotic Process Automation) | Automatiser des tâches répétitives | Saisie de données | Back-office, RH, finance |
GANs (Generative Adversarial Networks) | Générer des images | Création artistique | Publicité, design, prototypage |
Modèles de diffusion | Créer des visuels réalistes | Midjourney, DALL·E | Illustration marketing, aide à la conception |
Speech-to-text | Transcrire la voix | Sous-titrage automatique | Médias, santé, transcription juridique |
Chatbots | Dialoguer automatiquement | FAQ automatisée | Service client, support interne |
Systèmes experts | Raisonnement logique via règles | Diagnostic technique | Maintenance, fiscalité, juridique |
Systèmes de recommandation | Suggérer un choix | Suggestions de films | E-commerce, RH, éducation en ligne |
Outils d’explicabilité | Expliquer les décisions d’IA | SHAP, LIME | Conformité, audit modèles, assurance |
IA embarquée | Fonctionner localement en temps réel | Caméra intelligente | Drones, objets connectés, automobile |
NLG (Natural Language Generation) | Générer du texte automatiquement | Rapports automatiques | Finance, assurance, sport |
Si vous vous demandez ce qui différencie les LLM du NLG sachez que je me suis également posé la question.
Disons que des LLM comme GPT 4 peuvent faire de la génération de contenu (assez évident à comprendre) mais qu’on peut faire du NLG sans LLM via des systèmes plus simples (règles, modèles statistiques…).
Prenons l’exemple d’un bulletin météo généré automatiquement. On va utilisera des données météorologiques contenues dans une base de données et ensuite un moteur de règles va les repositionner dans une phrase pour donner quelque chose comme « «Ce matin, le ciel sera partiellement couvert avec 18°C. L’après-midi, les températures grimperont à 23°C avec un vent modéré de sud-ouest. »
Pareil pour les GANs et les modèles de diffusion. Alors, si j’ai bien compris ce qu’on m’a expliqué, ce sont deux technologies qui permettent à l’IA de générer des images, mais elles fonctionnent de manières très différentes.
Les GANs, c’est un peu comme deux artistes en compétition : le premier invente une image, le deuxième doit dire si elle est vraie ou fausse, le premier essaie de tromper le deuxième, et ils s’améliorent à chaque tour avec pour résultat des images de plus en plus réalistes.
Les modèles de diffusion, eux, partent d’un gribouillis aléatoire (comme du bruit) et retirent petit à petit ce bruit jusqu’à faire apparaître une image nette. C’est plus lent, mais souvent plus stable et plus précis.
Aujourd’hui ce sont les modèles de diffusion qui dominent dans le monde de l’IA (DALL·E, Midjourney…) mais le nouveau générateur d’images de ChatGPT a récemment changé la donne en utilisant un « une approche prédictive multimodale intégrée, générant du contenu via un réseau neuronal unique entraîné simultanément sur texte, images et audio » totalement différente du processus de débruitage itératif propre des modèles par diffusion.
Conclusion (sans jargon)
Quand on pense « produit », beaucoup de solutions IA vont en fait intégrer différents types d’IA, donc différents modèles d’apprentissage au service de plusieurs briques pour satisfaire un cas d’usage donnée, surtout s’il est complexe.
Il n’existe pas une IA mais plusieurs types, avec des objectifs différents et ce que chacune fait dépend de la façon dont elle apprend.
Chaque technologie est donc une brique spécifique, au service d’un usage précis.
Ce n’est pas parce qu’une entreprise « fait de l’IA » que c’est nécessairement innovant. Ce qui compte, c’est pour quoi elle l’utilise, comment, et avec quelle valeur ajoutée concrète.
La prochaine fois qu’on vous parle d’IA, vous saurez (j’espère) poser la bonne question : de quel type d’IA s’agit-il, et pour quoi faire ?
Illustration : générée par IA via ChatGPT / DALL·E