Pourquoi un blog sur l'IA générative ?
Démocratiser les usages, s'interroger sur leurs conséquences
Fin 2022, le robot conversationnel ChatGPT était lancé par l’entreprise OpenAI sans tambour ni trompette, par un simple message posté sur Twitter.
Très vite, la nouvelle se répand comme une traînée de poudre bien au-delà de la communauté des spécialistes de l’intelligence artificielle, suscitant près de 250 000 messages sur Twitter en à peine trois jours. ChatGPT mettra seulement 60 jours pour atteindre le seuil de 100 millions d’utilisateurs, explosant au passage le précédent record détenu par TikTok.
Depuis, le soufflet est loin d’être retombé : un an après son lancement, le robot conversationnel d’OpenAI totalisait 1,7 milliard de visites par mois. Dans son sillage, d’autres modèles d’IA générative rencontrent un succès considérable, tels que Midjourney pour la création d’images.
Contrairement à ce que l’on pense, un tel succès n’avait pas du tout été prévu par ses créateurs, notamment parce que des modèles très proches en termes de performance avaient déjà été mis à disposition de la communauté des utilisateurs par l’entreprise. La veille de la sortie de ChatGPT, la responsable des ventes d’OpenAI raconte même qu’elle avait été avertie par un simple message d’un lancement « à bas bruit » permettant de donner un nouvel « aperçu » des recherches en cours, sans impact majeur sur les activités de l’entreprise.
Une technologie surpuissante et en apparence facile à prendre en main
Rétrospectivement, ce démarrage exceptionnel de ChatGPT tient à deux facteurs, qui forment d’ailleurs son nom.
D’abord, il y a bien sûr la performance des modèles « GPT », entraînés à l’aide d’une immense puissance de calcul sur une quantité énorme de données afin de lui permettre d’effectuer avec une efficacité redoutable un grand nombre de tâches que l’on pensait réservées aux humains – de la rédaction de poèmes au résumé de textes en passant par la création d’images ou encore la programmation informatique.
Il faut bien mesurer le caractère extraordinairement démocratique de cette innovation : moyennant une vingtaine d’euros par mois (avec ChatGPT) ou gratuitement (avec Bing/Copilot, intégré au navigateur Microsoft Edge), vous avez actuellement accès au modèle le plus puissant qui existe (GPT-4), au même titre que les plus grandes entreprises ou les chercheurs les plus qualifiés. Il n’y a tout simplement pas mieux sur le marché ! Rien à voir donc avec le modèle classique de diffusion des innovations – pensez par exemple à l’invention des premiers ordinateurs, réservés au départ aux élites militaires et universitaires et dont les modèles les plus puissants restent encore à ce jour totalement inaccessibles pour le grand public.
Mais au-delà de la puissance du modèle, l’autre clé du succès réside dans l’interface d’utilisation, qui prend la forme d’un chat. Plus besoin de compétence en programmation informatique pour utiliser l’IA : il suffit désormais à l’utilisateur de poser une question ou de rédiger une « consigne » (prompt) à ChatGPT dans sa langue maternelle pour voir apparaître en quelques secondes une réponse et entamer un dialogue.
De ce point de vue, l'avènement de ChatGPT marque une rupture majeure dans l'histoire de l'intelligence artificielle, en changeant fondamentalement la dynamique de la relation entre l'humain et la machine. Si l’IA est déjà omniprésente dans nos vies, l’humain était jusqu’à présent cantonné à un rôle de récepteur passif des décisions algorithmiques, souvent sans compréhension ni contrôle. Pensez par exemple au fil d’actualité que vous construit votre réseau social préféré ou aux recommandations de produits en ligne que vous trouvez sur Amazon ou Netflix. Le contraste est saisissant avec ChatGPT, qui donne le contrôle à ses utilisateurs dans leurs interactions avec l'intelligence artificielle en leur permettant de conduire la conversation en fonction de leurs intérêts et de leurs besoins.
Une technologie en réalité difficile à comprendre et à maîtriser
Si l’IA générative rend le pouvoir aux utilisateurs à travers une interface de chat intuitive, pourquoi se lancer dans la création d’un blog consacré à cette technologie ?
Après une utilisation intensive et un grand nombre d’échanges sur le sujet, ma conviction est que cette autonomie se révèle à double tranchant. Livrés à eux-mêmes, de nombreux utilisateurs ne parviennent pas à saisir pleinement le potentiel de ces nouveaux outils et finissent par abandonner en pensant qu’ils sont finalement assez peu utiles. Au point que certains experts appellent à abandonner le chatbot au profit d’autres formes d’interface.
Cette difficulté transparaît clairement à la lumière des premières enquêtes qualitatives menées auprès des usagers et dans les statistiques d’utilisation. En France, les utilisateurs mobilisent ChatGPT pour effectuer en moyenne 1,2 type de tâche, en se cantonnant le plus souvent à celles qui se rapprochent le plus de ce qu’ils connaissent déjà (ex : aide à la recherche, par analogie avec Google). Passé la curiosité de la nouveauté, l’intégration dans le quotidien reste finalement assez rare : si un Français sur trois a déjà essayé ChatGPT (36 %), seulement un sur sept (15 %) l’utilise chaque semaine et moins d’un sur vingt (4 %) chaque jour. Sans surprise, ce sont parmi ces utilisateurs réguliers que l’on trouve une utilisation plus polyvalente de l’outil (3,8 types de tâches parmi les Français qui utilisent l’outil plusieurs fois par mois).
Au-delà du vertige qui peut saisir les utilisateurs face à un outil aussi généraliste, les caractéristiques de cette technologie rendent difficile sa maîtrise par les utilisateurs.
Contrairement aux outils informatiques traditionnels, programmés explicitement par l’homme pour effectuer des tâches spécifiques, ces IA ont été créées pour apprendre par elles-mêmes à partir d’exemples – une branche de l’IA appelée « apprentissage-machine ». Dans le cas de ChatGPT, le modèle a été entraîné pour construire progressivement une séquence de mots en s’inspirant d’un vaste corpus de textes existants. De son point de vue, il n’existe aucune différence entre les types de tâches que vous lui demandez d’effectuer : à partir de votre consigne, il se contente simplement de construire, mot par mot, une réponse cohérente avec les textes sur lesquels il a été entraîné. Quand vous posez une question à ChatGPT, il ne suit donc pas une « feuille de route » écrite par ses créateurs pour une tâche précise mais essaye de deviner la réponse que vous attendez probablement. Pour cette raison, on l’assimile parfois à un simple « perroquet probabiliste », qui imite ce qu’il a appris du langage pendant sa phase d’entraînement.
Cette approche probabiliste, combinée à la très grande taille des modèles et à leur entraînement sur un corpus d’origine humaine, rend le fonctionnement interne de ces IA à la fois étrange et opaque, y compris pour ses créateurs. Pour ne prendre qu’un exemple, une équipe de chercheurs estime que les réponses fournies par les IA génératives sont meilleures lorsque vous indiquez dans votre consigne à quel point votre demande est d’une importance cruciale pour vous – un peu comme si vous faisiez appel à ses sentiments ! Un courant entier de l’IA, « l’interprétabilité mécanistique », se consacre même à la lourde tâche de comprendre comment les modèles construisent leurs réponses et traitent les informations, tandis que de nombreux utilisateurs partagent au quotidien leurs conseils plus ou moins avisés pour interroger efficacement les IA. Dans ces conditions, difficile pour un non spécialiste de s’y retrouver ! L’un des objectifs du blog sera ainsi de fournir les conseils les plus utiles pour bien démarrer, sans passer sous silence l’incertitude qui demeure en la matière mais en essayant de séparer le bon grain de l’ivraie.
Au-delà du découragement qu’il peut engendrer, ce mode de fonctionnement atypique est également susceptible de piéger les utilisateurs non avertis. Par exemple, ChatGPT n’a pas été conçu pour distinguer le vrai du faux mais uniquement pour construire une réponse probable à votre question. Il peut donc affirmer des contrevérités avec un aplomb formidable – et celles-ci sont d’autant plus dangereuses qu’elles sont construites pour être vraisemblables. Si vous lui demandez par exemple d’écrire une biographie d’un homme politique français dont il ne connaît pas la formation, il vous dira probablement qu’il est diplômé de Sciences Po et de l’ENA – car il s’agit du cursus le plus vraisemblable dans notre pays pour ce type de fonction.
Malheureusement, ces spécificités et leurs conséquences pratiques sont souvent mal comprises par les utilisateurs. Pire encore : alors que l’utilisation d’une technologie renforce généralement sa compréhension par les utilisateurs, c’est l’inverse qui semble se produire dans le cas de l’IA. En effet, plusieurs enquêtes ont montré que la proportion de sondés qui considèrent que les IA génératives disent toujours la vérité et ne sont pas biaisées est plus forte parmi les utilisateurs qu’au sein de la population générale.
Dans certains cas, les conséquences de ces incompréhensions peuvent être très lourdes. Un avocat a ainsi été suspendu pour avoir inventé des jugements dans sa requête, rédigée à l’aide de ChatGPT. Le risque est également massif pour les organisations, quand on sait que 55 % des travailleurs qui utilisent l’IA générative le font sans autorisation ni cadre.
Un autre objectif du blog sera donc de « regarder sous le capot », en s’efforçant de décrire de façon pédagogique et accessible le mode de fonctionnement concret de ces outils, afin de permettre de mieux interagir avec eux et d’en comprendre les pièges et les limites. Il s’agit à mon avis d’une étape indispensable pour tirer le meilleur parti de ces outils, au moins aussi importante que les « guides du prompting » qui fleurissent sur internet depuis plusieurs mois. Certains articles auront également pour but de réfléchir à la meilleure façon pour les organisations de former leurs personnels à ces nouveaux outils et de créer un cadre adapté à leur bonne utilisation.
Une analyse équilibrée de ses conséquences pour la société
Si la création de ce blog s'inscrit d’abord dans une démarche pédagogique et pratique visant à accompagner les utilisateurs dans l'exploration de cette technologie, elle répond aussi à la volonté d’analyser de manière équilibrée ses potentielles implications économiques et sociales.
Le sujet revêt une importance majeure en France, qui se singularise à l’échelle internationale par une défiance particulièrement marquée à l’égard de cette technologie.
La méfiance reste tout aussi forte quand on les interroge spécifiquement sur l’IA générative, ChatGPT se classant entre les élites et la mondialisation en termes d’opinion favorables.
De Marion Maréchal Le Pen à Jordan Bardella en passant par Eric Zemmour, l’extrême droite s’efforce d’ailleurs déjà de capitaliser politiquement sur les angoisses suscitées par l’IA, en particulier sur les réseaux sociaux.
Leur tâche est souvent facilitée par les médias, qui font généralement le choix de mettre en avant des analyses souffrant de deux défauts majeurs.
D’une part, elles se concentrent excessivement sur des risques ou opportunités de long terme, plutôt que sur les sujets de court terme qui se posent d’ores et déjà à nous.
D’autre part, elles sont souvent extrêmes dans leurs conclusions, en faisant de l’IA la solution à tous nos problèmes ou, à l’inverse, un danger mortel pour l’humanité.
Pensez par exemple à l’écho rencontré par les déclarations d’Elon Musk sur la « fin du travail » ou par la tribune signée par de nombreuses stars de l’IA appelant à un moratoire de six mois face au risque d’émergence d’une « super-intelligence » capable de concurrencer l’humain. A l’inverse, vous êtes sans doute passé à côté du fait que de premières études expérimentales montrent que l’IA générative réduit les inégalités au profit des travailleurs les moins productifs ou qu’un enregistrement vidéo fabriqué à l’aide de l’IA (deepfake) a joué un rôle majeur dans la dernière ligne droite des récentes élections organisées en Slovaquie.
Dans ce contexte, une série d’articles sera dédiée aux risques mais aussi aux opportunités liées à l’IA générative, en essayant d’en faire une analyse équilibrée tenant compte des premiers éléments empiriques et des régulations en cours d’élaboration. Sans vouloir gâcher la surprise, la tonalité générale du blog sera modérément optimiste, sans pour autant nier les difficultés et les incertitudes qui subsistent à plus long terme.
En complément, d’autres articles s’intéresseront à des transformations moins directement liées aux politiques publiques mais tout aussi essentielles. En effet, l’IA générative remet au goût du jour de très vielles controverses – qu’est-ce que la conscience ? quand peut-on parler de créativité ? qu’est-ce qui distingue l’homme de l’animal et de la machine ? – sur lesquelles philosophes et scientifiques s’affrontent depuis bien longtemps. Il s’agira aussi d’essayer d’en rendre compte, en revenant par exemple sur les premiers ouvrages philosophiques revisitant ces questions à la lumière des progrès de l’apprentissage-machine ainsi que sur les travaux scientifiques examinant les liens entre le fonctionnement du cerveau et de l’IA générative, à l’image des nombreux cours récemment consacrés à cette thématique par Stanislas Dehaene au Collège de France.
Par où commencer ?
Comme il est crucial de comprendre comment les IA génératives fonctionnent pour bien les utiliser, je recommande vivement de commencer par les deux articles fondamentaux sur l’apprentissage-machine et le fonctionnement de ChatGPT, avant de passer aux travaux pratiques avec le guide du “prompting”.
De quoi je me mêle ?
Arrivé au terme de ce premier article, ceux qui me connaissent pour mes publications concernant l’économie et les finances publiques pourraient être surpris de cette aventure sur le terrain de l’intelligence artificielle.
Il s’agit au départ d’un intérêt purement personnel, né de l’utilisation intensive des modèles d’intelligence artificielle générative à compter de la sortie de ChatGPT, notamment pour me perfectionner et m’aider dans l’analyse de données et la programmation. Plus récemment, j’ai eu l’opportunité de conduire une expérimentation sur l’IA générative au sein de l’organisation pour laquelle je travaille. Cette expérience m’a donné l’occasion de me confronter très concrètement aux difficultés de son déploiement à plus grande échelle au sein des entreprises et des administrations et des besoins de formation en la matière.
Parallèlement, de lointaines études en informatique et en mathématiques m’ont permis de « regarder sous le capot » pour essayer de comprendre le fonctionnement de ces modèles si étonnants. Bien que je ne sois pas un spécialiste de l’apprentissage-machine, j’ai donc bon espoir de pouvoir en expliciter les grands principes de fonctionnement aux non spécialistes. Alors que mon premier article sur l’IA abordait le sujet sous l’angle économique et social, le deuxième s’en éloignait fortement pour proposer une expérience originale visant à mesurer le « biais » politique de ChatGPT et en restituer les mécanismes sous-jacents.
C’est précisément l’objectif de ce blog de pouvoir croiser les approches, en abordant cette technologie à la fois du point de vue de l’utilisateur qui entend apprendre à s’en servir mais aussi du citoyen qui s’intéresse aux nombreux enjeux qu’elle soulève. Il s’agit donc finalement du blog d’un « généraliste bricoleur » - et non d’un expert de l’IA. J’ai la faiblesse de croire que ce n’est pas forcément un défaut, à condition de l’assumer clairement dès le départ.