ChatGPT : une nouvelle approche du traitement du langage

Les origines de ChatGPT

Le NLP (Natural Langage Processing) est une discipline qui s’intéresse à la compréhension, la manipulation et la génération du langage naturel par les machines. ChatGPT bénéficie ainsi d’un héritage pluri-centenaire, dont un ancêtre notable : les chaînes de Markov. Elles ont été créées par le mathématicien russe Andreï Markov en 1910. Les chaînes de Markov représentent un concept probabiliste permettant d’imaginer quel mot a plus de chances de se trouver après une chaîne de caractères donnée.

Qu’est-ce que ChatGPT ?

Retour vers le futur : ChatGPT a été lancé par l’organisation à but non lucratif OpenAI, co-créée par -entre autres- Elon MUSK (Tesla, SpaceX) et Reid HOFFMAN (LinkedIn), à San Francisco fin 2015. En 2019, OpenAI crée une filiale lucrative et Microsoft investit 1 milliard de dollars dans l’entreprise. OpenAI lance Dall-E en 2021, un modèle de génération d’images, et fin 2022, ChatGPT voit le jour. En début d’année 2023, Microsoft réinvestit dans OpenAI à hauteur de 10 milliards de dollars.

Bien que ChatGPT soit un modèle impressionnant, il existe des idées reçues erronées sur ses capacités. Contrairement à ce que l’on peut lire, ChatGPT n’est pas programmé pour répondre aux questions. N’ayant ni sentiment ni jugement, il ne peut pas se comporter comme un être doté de conscience. Mais il peut le mimer, si vous l’y poussez.

Comment fonctionne-t-il ?

Pour mieux comprendre ce phénomène, il faut noter que le fonctionnement de ChatGPT est basé sur l’entraînement à l’aide de centaines de milliards de jetons. Il s’agit de blocs de texte réduits en chaînes d’environ 4 caractères. Cela lui permet de construire une approche probabiliste très précise de notre langage. Une fois l’entraînement terminé, ChatGPT est capable d’attribuer un sens aux informations qu’il reçoit (nos requêtes) en fonction du nombre et de l’ordre des jetons. Il peut ainsi prédire la suite du texte qu’il estime la plus probable.

Avant d’obtenir la génération de textes souhaitée, vous devrez ainsi rédiger un prompt : une requête constituée d’une chaîne de caractères. Le prompt peut contenir différents types de contenus, tels que du texte, de la ponctuation, des chiffres, des URLs et même des emojis.

Afin de maximiser les chances d’obtenir une réponse pertinente, il est recommandé de fournir des instructions claires et concises. Mais également, de préciser le contexte de la demande, de choisir des mots simples et éviter les termes trop techniques ou à double sens. Il est important de rester factuel en évitant les questions impliquant des émotions ou un point de vue subjectif. En outre, ChatGPT utilise des « jetons » pour comprendre la portée de votre prompt. Cela lui permet de proposer une réponse probable en fonction du contexte qu’il a identifié.

En gardant ces éléments en tête, vous pourrez écrire un prompt efficace vous permettant d’obtenir des réponses précises et utiles de ChatGPT.

Vous voici prêt à rédiger vos rapports, articles, mails ou même votre code informatique !

 

Sources :

Neuroflash.com 

Lebigdata.fr