🧠 Un deuxième cerveau ?
Jusqu’à présent, à intervalles réguliers, je m'astreignais à ranger mon Drive Google - là où je stocke mes notes - toutes mes notes - depuis des années.
Jusqu'à présent, ça ne servait pas à grande chose : avec la recherche intégrée, je retrouvais plus ou moins facilement les transcripts de vidéos, notes de conférences, brouillons d'articles et autres documents rédigés par le passé. Et puis...
TL;DR
L’IA générative ne permet pas seulement de générer des contenus, elle permet aussi de réorganiser l’accès à l’information… C’est notamment rendu possible par la technique du RAG, pour “génération augmentée par de la recherche”.
Connectée à une base de données comme Google Drive ou Notion, c’est un outil puissant pour gagner en productivité en facilitant la recherche dans les contenus et l’accès à l’information.
À terme, l’impact de ces outils pourrait être majeur pour la gestion des connaissances et des bases de données des entreprises. Certaines commencent déjà à en explorer les possibilités.
Après le NLP et les LLM, le RAG (pour “Retrieval Augmented Generation”) va-t-il être le nouvel acronyme à la mode dans le monde de l’IA ?
“C’est un ChatGPT qui écrit du texte mais à partir d’une documentation que tu lui fournis” explique Benoit Raphaël dans sa dernière newsletter, consacrée au sujet.
“En gros, avec le RAG, le modèle de langage utilise ses connaissances pour analyser et pour écrire, et va chercher dans les connaissances que tu lui donnes pour exploiter les bonnes infos dans sa rédaction. Comme ça tout le monde est content. Et ça règle 90% des problèmes que l’on rencontre avec ces outils d’IA” explique-t-il.
D’ailleurs, c’est cette newsletter qui m’a donné envie de me repencher* sur le sujet, en testant un outil (français en plus) qu’il conseille : Dust. La promesse : bénéficier d’un second cerveau ! Rien de moins.
Pour faire simple, le service se connecte à mon Google Drive (ou à Notion et Slack, mais je les utilise peu), puis une série d’assistants - basés sur les modèles d’OpenAI, Anthropic, Mistral ou Google, en fonction des préférences - que je peux personnaliser et paramétrer m’aident ensuite à faire sens de tout ce fouillis constitué des milliers de documents rédigés au fil des ans.
La recherche sémantique montre alors tout son intérêt. “Retrouve-moi tous les articles que j’ai écrits sur le sujet de la mode responsable”, “Résume-moi tel document”, “Quelles sont les personnes que j’ai rencontrées par le passé et que je pourrais solliciter pour parler des tendances dans la fintech ?”, “Quelles sont les startups que j’ai repérées sur le thème de la foodtech ?”, etc.
Bon, ça ne marche pas à tous les coups (que viennent faire des services de tonte de pelouse en réponse à ma requête sur la foodtech ?), mais c’est extrêmement prometteur, et surtout, très simple d’utilisation pour quelqu’un qui ne code pas. Il est probable que ce type d’outil soit intégré rapidement de façon native à Google Drive, Dropbox et autres solutions de stockage d’information.
Généralisé, ce type d’outil a le potentiel de transformer en profondeur l’accès à l’information. Accenture en fait d’ailleurs la première tendance de sa “Vision Technologique” 2024, présentée lors du CES.
La tendance "Je pense donc je suis" : une nouvelle vision de la connaissance” explique ainsi que “Le modèle d'interaction homme-données basé sur des recherches de type "bibliothécaire" laisse la place à un nouveau modèle : celui du conseiller. Au lieu d'effectuer des requêtes pour obtenir des résultats, les utilisateurs posent maintenant des questions aux chatbots d'IA générative.”
L’impact pour les entreprises pourrait être majeur, en particulier parce que (toujours selon cette étude), “les chatbots développés grâce aux LLM peuvent désormais jouer un rôle de conseillers et permettre aux entreprises de mettre entre les mains de chacun de leurs collaborateurs un outil doté d'une connaissance très étendue de l'organisation.”
En France, un exemple très concret est déjà donné par Castorama, dont j’ai récemment interrogé le Chief Marketing, Digital & Customer Officer, Romain Roulleau : l’enseigne a utilisé ses connaissances internes (guides, tutoriels, supports de formation des vendeurs, contenus liés aux produits) pour nourrir son outil “Hello Casto”. Celui-ci répond aux questions des clients sur les sujets de bricolage et jardinage (spoiler : ne comptez pas sur lui pour vous donner des conseils déco, mieux vaut rester dans les sujets techniques).
Pour en revenir à Dust, on peut avec cet outil aller un peu plus loin que la simple recherche documentaire. Rédaction de résumé ou de synthèses, détection de signaux faibles et de tendances, génération d'idées de contenu, suggestion d’améliorations pour des documents, traduction, gestion et suivi de projets… la liste est déjà assez large.
Je me suis ainsi créé un assistant qui relie mes newsletters et me donne des conseils d’amélioration, à partir de toutes les newsletters écrites précédemment. Un autre est spécialisé dans une thématique précise que je couvre souvent (il n’a accès qu’aux documents de mon Drive qui en parlent). Le graal, bien sûr, serait d’avoir un assistant qui écrive mes articles à ma place… Mais même si on s’en approche parfois un peu, ce n’est pas encore ça (ouf !).
Et puis, il y a encore de nombreuses limites, dont celle-ci, que rappelle le robot @Dust : “Il est important de se rappeler que les assistants Dust ne sont pas connectés à Internet et ne peuvent pas accéder à des informations en temps réel ou à des bases de données externes non synchronisées.”
Bref, tout ça est prometteur, mais reste encore en développement. Il faudra suivre de près comment ça évolue.
Benoit Zante
*“Repencher” parce que j’avais déjà testé des choses du même genre il y a quelques années. Mais on en était alors qu’à GPT3, et les résultats étaient loin d’être à la hauteur.