L’IA pour les nuls qui veulent y voir un peu plus clair

-

Aujourd’hui quand on parle d’IA on parle le plus souvent d’IA générative. Cette IA capable de créer du contenu original à partir de ce qu’elle a appris a été rendue très populaire auprès du grand public par Chat GPT et c’est certainement la forme d’IA la plus accessible pour ce dernier avec des cas d’usages évidents.

Mais l’IA est un domaine riche et assez ancien : les premiers travaux sur le sujet datent des années 50 mais est resté un sujet compliqué réservé aux spécialistes et un peu abscons pour le commun des mortels même si il y a une dizaine d’années IBM Waston plateforme d’intelligence artificielle hybride, qui combine NLP, machine learning, automatisation et raisonnement symbolique (Qu’est ce que l’informatique cognitive ? L’exemple d’IBM Watson) avait attiré l’attention.

Mais pour que l’IA devienne un sujet de société il aura logiquement fallu qu’elle rentre dans les foyers (merci ChatGPT) mais la médaille a un revers : à force de ne voir que ce type d’outil on oublie qu‘il existe pleins d’autres formes d’IA, à tel point que certains craignent que s’il existe une bulle de l’IA Générative son explosion pourrait faire mal à tout le secteur malgré le fait qu’il existe des types d’IA mures avec un business établi et qui font leurs preuves depuis longtemps (L’IA vers une impasse économique ?)

L’IA générative ne peut pas tout faire et cela tombe bien, elle n’est pas faite pour tout faire. L’autre jour faisais la liste des cas d’usages potentiels de l’IA pour une gouvernance d’entreprise et cela a été l’occasion de me rendre compte qu’à chaque cas correspondant un type d’IA qui avait son propre mode de fonctionnement.

N’étant pas un expert des technologies au sens « deep » du terme cela a été l’occasion de remettre les choses au clair et de parfaire ma culture en la matière. Mais je me suis également rendu compte que nombre de décideurs ou utilisateurs employaient le terme générique d’IA sans trop savoir ce qui se cache derrière, la variété et l’étendue du champ des possibles, ce qu’ils pourraient en faire…et même sans savoir qu’ils en utilisent parfois depuis des années sans le savoir. Un peu comme parler de couverts en pensant à une fourchette alors votre besoin est un couteau…

Je me suis donc dit que quitte a avoir ce travail pour moi autant partager cela avec ceux qui se posent les mêmes questions. Un article de vulgarisation que les experts trouveront sans doute pas assez fouillé, où ils trouveront des détails prêtant à discussion mais qui je l’espère sera utile à tous ceux qui se préoccupent avant tout des cas d’usages et veulent comprendre ce qu’il y a derrière tout cela.

Si on veut comprendre ce que fait l’IA (et ce qu’elle ne fait pas), il faut prendre un peu de recul et poser les bases et ce que nous allons faire ici.

En bref :

  • L’intelligence artificielle regroupe une diversité de formes et de finalités, bien au-delà de la seule IA générative popularisée par des outils comme ChatGPT : chaque type d’IA vise un objectif distinct, qu’il s’agisse de prédire, décrire, recommander, dialoguer ou agir de manière autonome.
  • Le fonctionnement de l’IA repose sur différentes méthodes d’apprentissage (supervisé, non supervisé, par renforcement, symbolique ou via deep learning), chacune adaptée à des besoins spécifiques et déterminant le type de tâche que l’IA peut accomplir.
  • À ces méthodes s’ajoutent des briques technologiques complémentaires (NLP, vision, OCR, RPA, GANs, modèles de diffusion, etc.) qui permettent de traiter des données variées et de construire des cas d’usage concrets dans tous les secteurs d’activité.
  • Certaines concepts méritent d’être clarifiées : un outil comme ChatGPT peut comprendre une consigne sans exemple ou s’adapter si on lui en donne quelques-uns, et il existe plusieurs manières pour une machine de produire un texte ou une image.
  • Pour appréhender l’IA de manière pertinente, il est essentiel de distinguer ses objectifs, ses modes d’apprentissage et ses outils, afin d’évaluer les usages réels et la valeur ajoutée concrète des solutions qui s’en réclament.

Les grandes familles d’IA : ce que l’IA cherche à faire

On peut commencer par distinguer l’IA selon sa finalité. Que cherche-t-elle à accomplir ? Pour quoi peut on s’en servir.

Pour cela un tableau vaut mieux que des grandes phrases.

Type d’IAButExemples
IA prédictivePrévoir ce qui va se passerPrévision des ventes, détection de fraude
IA descriptiveExpliquer ce qui s’est passéAnalyse de sentiments, clustering de clients
IA générativeCréer du contenuChatGPT, DALL·E, Midjourney
IA prescriptiveRecommander une actionRecommandation de produits, GPS
IA conversationnelleDialoguer avec des humainsChatbots, assistants vocaux
IA cognitiveSimuler le raisonnement humainSystèmes experts, moteurs de règles
IA explicableRendre les décisions compréhensiblesSHAP, LIME, audits de modèles
IA adaptativeApprendre en temps réelAgents autonomes, IA embarquée
IA embarquéeFonctionner localement, sans connexionObjets connectés, caméras intelligentes
IA agentiqueAgir de manière autonome dans un environnementAutoGPT, copilotes métier, assistants proactifs

Et bien oui, quand vous utilisez un GPS pour trouver votre chemin il y a de l’IA dedans

Une petite précision sur l’IA agentique puisque cela sera surement celle qui va rapidement transformer notre quotidien et qu’on a trop tendance à vouloir assimiler à une IA générative évoluée.

En fait ces IA ne sont pas elles-mêmes des modèles génératifs, mais elles s’appuient largement sur ces modèles (comme GPT) pour comprendre, raisonner, générer et interagir. Autrement dit : les modèles génératifs sont une brique clé qui rend les agents plus intelligents, plus adaptatifs, et plus autonomes mais on ne peut réduire ces IA à ces modèles.

Et l’AGI, l’intelligence artificielle générale ? Elle n’existe pas encore donc on verra plus tard.

Maintenant se pose la question de savoir comment elles fonctionnent pour y parvenir, ce qui explique que chacune a son terrain de jeu et ses limites.

Les grandes méthodes d’apprentissage : comment l’IA apprend

Je ne suis pas friand du terme « intelligence » parce que ce qui distingue avant tout l’IA c’est sa capacité à apprendre. Et elle le fait de diverses manières.

MéthodeIdéeExemple d’application
Apprentissage superviséL’IA apprend avec des données étiquetéesPrédiction de churn, reconnaissance d’image, GPT, LLaMA, Copilot
Apprentissage non superviséL’IA découvre des groupes ou modèles cachésSegmentation client, clustering
Apprentissage par renforcementL’IA apprend par essais et erreursJeu déchecs, robotique
Apprentissage symboliqueL’IA applique des règles logiquesSystèmes experts, moteurs d’inférence
Deep learningL’IA apprend via des réseaux neuronaux profondsReconnaissance vocale, vision, GPT, LLaMA, Copilot
Few-shot / Zero-shotL’IA généralise avec peu ou pas d’exemplesGPT, LLaMA, Copilot

On peut s’étonner de voir des IA Génératives dans la catégorie « few shots » (en tout cas ça a été mon cas) mais il faut comprendre qu’elles suivent plusieurs étapes.

Un outil comme ChatGPT a été pré-entraîné sur des milliards de textes (apprentissage auto-supervisé, via deep learning) : c’est ce qu’on appelle le pretraining : il apprend le langage, les structures, les concepts.

Mais ensuite, une fois entraîné, on peut l’utiliser en few-shot ou zero-shot.

Zero-shot car si on lui pose une question sans exemple il comprend et répond directement et few-shot car si on lui donnes quelques exemples il va adapter sa réponse au contexte. C’est le cas par exemple quand vous « éduquez » une IA à adopter un style donné.

C’est donc dans l’usage que le modèle est few-shot/zero-shot, pas dans son entraînement lui-même.

Ce que l’IA manipule : les briques technologiques

On parlé de la finalité, de la manière dont l’IA se dote du potentiel (connaissance) nécessaire pour l’atteindre, reste la manière dont elle utilise ce potentiel.

Elle va le mobiliser dans des briques technologiques dont chacune a son utilité, son fonctionnement, et ses cas d’usage métier.

TechnologieUtilité principaleExempleCas d’usage métier
NLP (natural language processing)Comprendre les textesAnalyse de commentairesSupport client, e-réputation, veille
OCR (Optical Character Recognition)Lire du texte dans une imageScanner une factureTraitement de documents, archivage
Vision par ordinateurReconnaître des objets et des formesDétection de défautsContrôle qualité, sécurité, comptage en magasin
LLM (Large Language Models)Générer et comprendre le langage naturelChatGPT, CopilotAssistance à la rédaction, agents intelligents
RPA (Robotic Process Automation)Automatiser des tâches répétitivesSaisie de donnéesBack-office, RH, finance
GANs (Generative Adversarial Networks)Générer des imagesCréation artistiquePublicité, design, prototypage
Modèles de diffusionCréer des visuels réalistesMidjourney, DALL·EIllustration marketing, aide à la conception
Speech-to-textTranscrire la voixSous-titrage automatiqueMédias, santé, transcription juridique
ChatbotsDialoguer automatiquementFAQ automatiséeService client, support interne
Systèmes expertsRaisonnement logique via règlesDiagnostic techniqueMaintenance, fiscalité, juridique
Systèmes de recommandationSuggérer un choixSuggestions de filmsE-commerce, RH, éducation en ligne
Outils d’explicabilitéExpliquer les décisions d’IASHAP, LIMEConformité, audit modèles, assurance
IA embarquéeFonctionner localement en temps réelCaméra intelligenteDrones, objets connectés, automobile
NLG (Natural Language Generation)Générer du texte automatiquementRapports automatiquesFinance, assurance, sport

Si vous vous demandez ce qui différencie les LLM du NLG sachez que je me suis également posé la question.

Disons que des LLM comme GPT 4 peuvent faire de la génération de contenu (assez évident à comprendre) mais qu’on peut faire du NLG sans LLM via des systèmes plus simples (règles, modèles statistiques…).

Prenons l’exemple d’un bulletin météo généré automatiquement. On va utilisera des données météorologiques contenues dans une base de données et ensuite un moteur de règles va les repositionner dans une phrase pour donner quelque chose comme « «Ce matin, le ciel sera partiellement couvert avec 18°C. L’après-midi, les températures grimperont à 23°C avec un vent modéré de sud-ouest. »

Pareil pour les GANs et les modèles de diffusion. Alors, si j’ai bien compris ce qu’on m’a expliqué, ce sont deux technologies qui permettent à l’IA de générer des images, mais elles fonctionnent de manières très différentes.

Les GANs, c’est un peu comme deux artistes en compétition : le premier invente une image, le deuxième doit dire si elle est vraie ou fausse, le premier essaie de tromper le deuxième, et ils s’améliorent à chaque tour avec pour résultat des images de plus en plus réalistes.

Les modèles de diffusion, eux, partent d’un gribouillis aléatoire (comme du bruit) et retirent petit à petit ce bruit jusqu’à faire apparaître une image nette. C’est plus lent, mais souvent plus stable et plus précis.

Aujourd’hui ce sont les modèles de diffusion qui dominent dans le monde de l’IA (DALL·E, Midjourney…) mais le nouveau générateur d’images de ChatGPT a récemment changé la donne en utilisant un « une approche prédictive multimodale intégrée, générant du contenu via un réseau neuronal unique entraîné simultanément sur texte, images et audio » totalement différente du processus de débruitage itératif propre des modèles par diffusion.

Conclusion (sans jargon)

Quand on pense « produit », beaucoup de solutions IA vont en fait intégrer différents types d’IA, donc différents modèles d’apprentissage au service de plusieurs briques pour satisfaire un cas d’usage donnée, surtout s’il est complexe.

Il n’existe pas une IA mais plusieurs types, avec des objectifs différents et ce que chacune fait dépend de la façon dont elle apprend.

Chaque technologie est donc une brique spécifique, au service d’un usage précis.

Ce n’est pas parce qu’une entreprise « fait de l’IA » que c’est nécessairement innovant. Ce qui compte, c’est pour quoi elle l’utilise, comment, et avec quelle valeur ajoutée concrète.

La prochaine fois qu’on vous parle d’IA, vous saurez (j’espère) poser la bonne question : de quel type d’IA s’agit-il, et pour quoi faire ?

Illustration : générée par IA via ChatGPT / DALL·E

Bertrand DUPERRIN
Bertrand DUPERRINhttps://www.duperrin.com
Directeur People & Operations / Ex Directeur Consulting / Au croisement de l'humain, de la technologie et du business / Conférencier / Voyageur compulsif.
You don’t speak french ? No matter ! The english version of this blog is one click away.
1,743FansJ'aime
11,559SuiveursSuivre
26AbonnésS'abonner

Récent