ChatGPT, OpenAI, NPL.. Ces derniers mois, impossible d’ignorer ces noms qui sont mentionnés partout. Ils sont les dernières innovations pour le grand public en matière d’intelligence artificielle et font beaucoup parler d’eux. Caractérisés par leur qualité et croissance rapide, il peut être difficile de s’y retrouver. En quelques minutes, nous revenons sur l’origine de ces modèles.
Modèle de traitement du langage
Vous avez sûrement compris ce qu’ils sont capables de faire, mais savez-vous vraiment qui ils sont ?
Ils sont catégorisés comme des modèles de traitement du langage. Il s’agit d’un domaine de l’intelligence artificielle qui vise à permettre aux machines de comprendre, d’interpréter et de générer du texte, de façon à imiter la communication humaine.
Le traitement du langage naturel n’est pas nouveau : doucement, il s’est même immiscé dans tout l’informatique que nous utilisons quotidiennement et ce depuis des années. C’est le cas des assistants vocaux comme Siri ou Cortana qui se sont invités dans nos smartphones et ordinateurs. Mais aussi les traducteurs et correcteurs automatiques, les assistants virtuels à l’instar d’Alexa et Google Assistant. Ou encore le tri des e-mails en spam ou la modération automatique sur les réseaux sociaux, sans oublier les systèmes de recommandation qui analysent nos préférences.
Un aperçu de ChatGPT, le modèle de Open AI
ChatGPT s’inscrit donc dans la grande lignée des modèles de langage naturel. Il est basé sur le modèle GPT-3 entraîné par OpenAI, entreprise spécialisée déjà connu pour ses modèles précédents notamment GPT-3 en 2020, et Dall-E dans la génération d’images.
ChatGPT utilise des réseaux de neurones artificiels pour comprendre et générer des réponses en langage naturel à partir de données textuelles.
Le modèle a été entraîné grâce à une grande quantité de données textuelles, notamment Wikipédia, ce qui lui permet de comprendre et de générer des réponses à une grande variété de questions et de sujets. Également, dans une certaine limite, il peut garder en mémoire la conversation et la prendre en compte pour contextualiser ses réponses futures. Il peut donc être entraîné légèrement par chaque utilisateur.
La technique deep learning appelée Transformer lui permet d’analyser des relations entre les mots et les phrases pour comprendre le sens d’un texte.
ChatGPT est considéré comme l’un des modèles de langage naturel les plus avancés et les plus performants à ce jour, notamment depuis l’arrivée du modèle GPT-4 qui serait 100 fois plus puissant que son prédécesseur, GPT-3.5.
Un paysage concurrentiel
À noter que ChatGPT, et plus généralement OpenAI, ne sont pas les seuls sur le marché.
Si Microsoft a préféré investir chez OpenAI, ce qui lui vaut une intégration dans ses outils (le navigateur Bing et probablement la suite Office). D’autres entreprises ont fait le pari d’entraîner leurs propres modèles : Google avec BERT, ou encore BLOOM né de l’alliance de six entreprises, notamment PyTorch et Nvidia.
La concurrence est telle qu’on constate chez OpenAI une volonté d’omettre des informations concernant les méthodes de formation et l’architecture de ses modèles dans les rapports techniques. En plus de ne pas être open-source, pour des raisons avancées de confidentialité et de sécurité.
Une question éthique
La question du remplacement de notre travail par des intelligences artificielles devient omniprésente. La transition totale est encore lointaine, mais il faut envisager une adaptation dans nos méthodes de travail et surtout opter pour la transparence quant à l’utilisation. Par exemple, cet article a été rédigé à partir d’un plan établi avec ChatGPT. Une réponse étant rarement suffisante, le plan a été peaufiné avec des ajouts personnels, avant de passer à une rédaction entièrement humaine (promis).
Une efficacité mitigée
Après plusieurs essais, ChatGPT dévoile ses défauts et il faut savoir les reconnaître pour l’utiliser efficacement. Par exemple, il peut être répétitif dans ses formulations, notamment pour citer plusieurs éléments. Il est dépendant de la question posée, si celle-ci comporte des fautes d’orthographe, ChatGPT va refaire les mêmes erreurs dans sa réponse. Le reste du temps, il est au contraire irréprochable en orthographe.
Il faut faire attention à son égo, ChatGPT veut être tellement serviable qu’il répondra… même s’il n’a pas la réponse, quitter à raconter n’importe quoi. Et ce, avec un aplomb sans égal ! Un conseil serait donc de ne pas le croire entièrement sur parole et d’éviter de lui poser des questions contradictoires, surtout sur des sujets non maîtrisés.
Si ses compétences rédactionnelles sont louables, il faut savoir qu’il est aussi particulièrement efficace en développement web. Il parvient à comprendre et expliquer du code, ou même en écrire pour le développement d’une petite fonctionnalité. Il est également efficace pour corriger les bugs, en lui donnant le code d’erreur et le contexte par exemple. Cela évite d’aller chercher dans les documentations et c’est donc un gain de temps, notamment pour recouper plusieurs contraintes de versions. Au sein d’une même conversation, ChatGPT saura même rebondir avec le contexte des questions précédentes, mais cette mémoire est limitée et à court terme.
Sa plume n’est pas remarquable, il manque de répartie et je vous laisse juger, mais son humour laisse de marbre…
Pourquoi ChatGPT ne prend-il jamais de vacances ? Parce qu’il est toujours en mode réponse automatique !
ChatGPT
À tester soi-même
Pour se rendre compte de ses capacités, rien de tel que de l’essayer soi-même. Il est possible de l’essayer gratuitement en créant un compte (avec numéro de téléphone) sur https://chat.openai.com/.