Grand angle

Comment et pourquoi intégrer chatGPT à votre site web ?

02 Mar. 2023

min.

Dévoilé au grand public en fin d’année dernière, chatGPT a fait grand bruit. Il est au centre de l’attention du grand public, des médias, mais aussi des autres acteurs de l’IA, en premier lieu Google.

Il faut dire qu’il fait un effet redoutable. Comme le dit avec justesse Tim O'Reilly, "ce n'est pas l'innovation qui compte, c'est l'adoption". Et c’est là la grande force du service : tout le monde peut se l’approprier et mesurer immédiatement son potentiel. L’effet d'entraînement a été tel qu’en moins de deux mois, chatGPT a désormais atteint 100 millions d’utilisateurs actifs.

Très vite, les annonces ont fusé : Microsoft a annoncé investir $10 milliards et intégrer le service au sein de son navigateur Bing (en beta à l’heure où nous écrivons ces lignes). Presque immédiatement après la sortie de chatGPT, Google a dévoilé Bard, son service concurrent, dont la sortie est imminente, et dont les performances s’annoncent pour le moment moins émerveillantes.

L’impact sur la production de contenus, le référencement naturel et la découvrabilité des produits est très important également, même s’il reste encore à mesurer. Cependant, la communauté des experts du référencement s’intéresse de très près à l’outil, tant pour comprendre comment il peut les assister voire les remplacer un jour (pas vraiment en l’état, de notre point de vue). Des centaines d’articles ont déjà été rédigés sur ce sujet, donc nous ne reviendrons pas sur ce point.

Il reste cependant un sujet qui est relativement peu creusé : comment exploiter ce service sur vos interfaces numériques ? 
Et surtout, pour quels cas d’usages concrets ?

Comment fonctionne chatGPT ?

ChatGPT est un modèle de langage étendu, entraîné sur des données provenant de multiples sources, dont de nombreuses ont été supervisées par des utilisateurs humains, permettant de converser avec l’application de manière naturelle et humaine. C’est en quelque sorte l’aboutissement des chatbots conversationnels qui ont émergé avec l’arrivée des assistants vocaux (Google Home, Siri…); à la différence que ChatGPT se concentre exclusivement sur le texte et non la voix. À noter que le jeu de données actuel se limite à 2021 et qu’il ne cite pas ses sources (a contrario de la version sur le navigateur Bing). Ainsi, si vous demandez des choses à propos d'événements trop récents, ChatGPT risque de créer des informations de toutes pièces, la plupart du temps parfaitement fausses.

Néanmoins, bien que ChatGPT soit un outil puissant, il n'est pas parfait. Il peut parfois manquer de précision et interpréter à tort des phrases, en particulier celles qui ont des nuances subtiles ou du sarcasme, voire complètement inventer des informations, en général pour aller dans le sens de la personne qui pose la question (à l’exception des cas où il a été explicitement bridé par ses concepteurs, par exemple, pour éviter d’expliquer pourquoi la terre est plate). ChatGPT peut même aller jusqu'à citer des articles scientifiques qui n’existent pas pour corroborer ses dires. En un sens, il peut s’avérer être le meilleur fabricant de fausses informations que l’on connaisse ! Cela vient du fait qu’il s’agit avant tout d’un modèle de langage conçu pour associer des mots selon différents degrés de probabilité plutôt qu’un modèle d’intelligence artificielle à proprement parler. De plus, il reste généraliste : il n’a pas été explicitement entraîné sur un domaine ou un secteur particulier.

Quelles sont les capacités d’intégration de chatGPT ?

ChatGPT est basé sur un modèle généraliste, GPT-3 (Generative Pre-trained Transformer 3), et ne dispose pas d’une API à proprement parler.

Quelle est la différence entre ChatGPT et GPT-3 ? ChatGPT est un modèle conversationnel basé sur le set d’APIs de GPT-3, développées par la société OpenAI, qui sont sous licence propriétaire.

ChatGPT est a été optimisé pour être une IA conversationnelle tandis que GPT-3 est davantage adapté à des tâches de modélisation de données. Bien que les deux modèles soient basés sur la même architecture et utilisent un mode d’apprentissage similaire, la différence majeure entre chatGPT et GPT-3 est liée aux utilisations ciblées pour chaque modèle.

L’API de GPT-3 permet de configurer différents modèles (ou moteurs) afin de recevoir les réponses les plus adaptées aux demandes tout en optimisant son ROI. Par exemple, le moteur “ADA” est le plus rapide et coûte $0.0004 pour 1000 requêtes tandis que “Vinci” est le moteur le plus précis et coûte $0.02 pour la même volumétrie.

Cependant, à date, ces modèles ne peuvent travailler que sur un set de données prédéfini et non dynamique. Par exemple, si votre bot est entraîné pour répondre à la question “quels sont vos horaires d’ouverture ?”, que vous l’avez entraîné à répondre “09h-19h” et que vos horaires changent, il faudra ré-entraîner le modèle.

MAIS DU COUP, JE NE PEUX PAS INTÉGRER CHATGPT À MON SITE WEB ?

Et bien non, pas en tant que tel ! Du moins, pas encore. OpenAI travaille à la conception d’une API dédiée, conjointement avec notre partenaire Microsoft qui vise à intégrer le modèle chatGPT à son catalogue de services disponible sous Azure (et qui intègre d’ores et déjà les API de GPT-3).

Reste à voir à quoi ressemblera la fameuse API chatGPT et surtout de sa capacité à s’intégrer avec un set de données tiers. C'est bien là tout l’enjeu : il faudrait pouvoir injecter et étendre le savoir du modèle, tout en étant certain que ce savoir aura la priorité sur d'éventuelles hallucinations du modèle. 

Nous pouvons d’ores et déjà imaginer des cas d’usages intéressants pour fournir à vos clients (et à vous-même) des expériences avancées d'IA conversationnelles taillées sur-mesure :

  • Le plus évident : concevoir des agents virtuels qui soient capables d'interagir de manière naturelle avec les utilisateurs, en vue de leur offrir des expériences personnalisées. Cette forme d'IA peut être utilisée dans de nombreux contextes différents, notamment dans le service client, les achats en ligne, la publicité, l'éducation et les applications RH internes.
  • Gérer la personnalisation : chatGPT peut vous aider à créer des campagnes de génération de prospects en invitant les utilisateurs à poser des questions en rapport avec leurs centres d'intérêt.
  • Search : intégrer chatGPT à votre moteur de recherche pour le rendre plus conversationnel !

Finalement, ChatGPT est une version plus conversationnelle de GPT-3, car capable de garder le contexte et de fournir un modèle de langage naturel amélioré. C'est en quelque sorte une excellente démo de ce qu’il est possible de faire avec GPT-3 !

EN ATTENDANT LA SORTIE DE L’API DE CHATGPT, EST-CE QUE CELLES DE GPT-3 PEUT M’ÊTRE UTILE ?

Oui ! GPT-3 fournit des services pour les tâches de copywriting, de classification, d’analyse syntaxique et de structuration de texte.

Nous croyons beaucoup aux capacités de GPT-3 à structurer la donnée. Il peut en effet convertir des données non structurées en un format structuré, ce qui peut aider à extraire des informations clés dans le texte (ce qu’on appelle des entités).

Petit exemple sur une description de produit avec l’entrée suivante :

La Hero World Cup 90 SC est une chaussure de ski développée par Rossignol et taillée pour les champions junior ! 

Inspirée de la gamme Race, la Hero World Cup 90 SC reprend la technologie Dual Core qui vient moduler de manière très précise à la fois la progressivité du flex, l’appui arrière et le rebond. Elle améliore également les transmissions latérales pour une efficacité optimale. 

Son flex intermédiaire de 90 représente le meilleur compromis entre confort et performance. Le chausson Full Custom T2 est doté d'un rembourrage haute densité pour optimiser la précision et la performance. 

La Hero World Cup 90 SC est la chaussure idéale pour les jeunes compétiteurs qui veulent progresser !

Et la sortie suivante :

{
  "marque": "Rossignol",
  "modèle": "Hero World Cup 90 SC",
  "niveau": "compétition junior",
  "technologie": [
    "Dual Core",
    "transmissions latérales améliorées"
  ],
  "flex": 90,
  "chausson": {
    "modèle": "Full Custom T2",
    "rembourrage": "haute densité"
  },
  "caractéristiques": [
    "progressivité du flex modulée de manière très précise",
    "appui arrière et rebond modulés",
    "meilleur compromis entre confort et performance",
    "optimisation de la précision et de la performance"
  ]
}

En d’autres termes, vous pouvez, à partir d’une source de données plus ou moins structurée, générer un texte cohérent. C’est particulièrement utile pour un PIM (product information manager) où l’on pourrait générer automatiquement de belles descriptions de produit à partir d’une API ! L’inverse est aussi vrai, par ailleurs.

Si ce cas d’usage s’applique particulièrement bien au e-commerce, il peut s’appliquer à tout type d’entrepôt de données (base de données, datawarehouse…) et de flux (APIs, microservices…) pour fédérer la donnée et en sortir un texte cohérent. Particulièrement utile pour unifier vos silos de données et créer des parcours digitaux sans couture !

INTÉRESSANT ! MAIS ON NE POUVAIT PAS DÉJÀ FAIRE ÇA AVANT ?

Oui, mais pas avec ce degré de simplicité d’accès. La révolution apportée par de chatGPT réside dans sa capacité à vulgariser l’utilisation par le grand public d’une IA conversationnelle et ainsi suggérer de nouveaux usages, mais il existe bel et bien des modèles alternatifs, plus pertinents, car entraînés sur des jeux de données maîtrisés. 

Par exemple, nous avons travaillé avec la solution Syllabs pour générer plus de 10 000 descriptifs produits pour Grand Optical, sur la base de leurs données techniques.
Vous pouvez visiter la page https://www.syllabs.com/fr/interview/lagence-smile-automatise-les-descriptifs-produits-de-son-client-grand-optical/ pour en savoir plus.

Par ailleurs, nous sommes en contact avec, Contentside, un éditeur français proposant un modèle d'IA à entraîner sur vos jeux de données et notamment utilisé dans les médias (https://www.contentside.com/presse-en-ligne/).
N’hésitez pas à contacter nos experts data pour en savoir plus !

Guillaume Lanthier

Guillaume Lanthier

Responsable AI Factory