La recette pour créer gratuitement une Intelligence Artificielle toujours à votre service
ChatGPT, MidJourney, DALL-E... autant de noms inconnus du public il y a encore quelques mois, mais qui font les gros titres aujourd'hui. Ces Intelligences Artificielles permettent de rédiger des articles sur n'importe quel sujet, ou encore de générer automatiquement de véritables œuvres d'art. C'est tentant, pas vrai ? On aimerait tous avoir à notre disposition notre propre IA, stagiaire numérique disponible à toute heure du jour et de la nuit. Voici en exclusivité la recette pour concocter à votre tour une Intelligence Artificielle.
🥣 Préparation : 2 semaines
🔥 Cuisson : 1 à 3 mois
💪 Difficulté : Modéré
💸 Coût : € - mais tout dépend du résultat attendu
Ingrédients :
- Plusieurs milliards de milliards de phrases et de textes provenant de différentes sources disponibles en ligne (articles de presse, livres, documents officiels, conversations en ligne, pages Web, etc.).
Au passage, remercier en pensée les journalistes, blogueurs, et autres créateurs de contenus qui ont si bien structuré leur contenu, pour être correctement référencé·es sur Google... un jeu d'enfant pour une IA d'aller les "emprunter" (sans en créditer les auteurs).
- Des algorithmes ou systèmes permettant de créer des architectures de réseaux de neurones volumineux.
Ces systèmes sont devenus assez communs, et sont d'ailleurs très utilisés par la communauté Open Source. Vous trouverez ce produit dans n'importe quel magasin d’accessoires d'IA.
- Des serveurs informatiques puissants pour effectuer de gros volumes de calculs.
Microsoft (l'un des investisseurs d'OpenAI, l'entreprise qui développe ChatGPT) fournit une forte puissance de calcul avec son cloud Azure. ChatGPT doit sûrement chauffer plusieurs piscines olympiques à l'heure actuelle.
- Des algorithmes de traitement automatique du langage NLP (Natural Language Processing ou Traitement du Language Naturel) permettant de générer des réponses à des questions posées ou à des textes.
Préparation :
- Commencez par récolter des données en grande quantité dans la jungle verdoyante du Web. Pour un résultat aux petits oignons, assurez-vous d'explorer une grande variété de sources.
- Effectuez un tri dans ces données, afin de conserver autant que possible du contenu de qualité pour entraîner l'IA (on pense fort à Tay, l'intelligence artificielle devenue raciste et misogyne - en une seule journée ! - sur Twitter).
- Dans un autre récipient, initialisez un réseau de neurones adaptés pour apprendre et intégrer toutes les connaissances précédemment récoltées.
- Placez ce mélange dans des serveurs informatiques surpuissants, afin que l'IA puisse grossir sans manquer de ressources. Rappelez-vous qu'agglomérer autant de connaissances, puis les comprendre et les manipuler nécessite beaucoup d'énergie et d'opérations mathématiques.
- Saupoudrez la préparation d'algorithmes de traitement automatique du langage. Ces interfaces entre l'homme et la machine permettent à celle-ci de comprendre le sens des mots, de les traduire en anglais et de réaliser l'action demandée.
- Intégrez au fur et à mesure vos données pour entraîner votre modèle. Prévoyez quelques jours à quelques mois, en fonction de l'étendue des données à faire ingérer à l'IA.
- L'astuce du chef : au Kenya, il serait possible d'entraîner votre IA pour 2 dollars de l'heure afin qu'elle devienne plus étique. Une petite astuce utilisée par OpenAI, comme nous le dévoile le Times.
- Pour finir, testez et améliorez votre modèle en utilisant des données supplémentaires et en indiquant les bons comme les mauvais résultat. L'IA apprend au fur et à mesure... bonne dégustation !
CAS PRATIQUE :
ChatGPT a intégré 45 Teraoctet de données texte compressées. En supprimant les doublons, ses équipes ont obtenu une masse de texte de 570 Go (selon cet article de BBC Science), correspondant à 300 milliards de mots.
Quand on évoque des serveurs superpuissants, on parle d'ordinateurs permettant de gérer 175 milliards de paramètres différents pour ChatGPT. Cela signifie que cette IA est capable de comprendre un texte très large et d'y faire des opérations.
Un exemple pour illustrer cette notion de "paramètre" : si on demande à ChatGPT d'écrire un résumé sur le numérique responsable, il récupère dans sa base de connaissances toutes les informations sur ce sujet. Ces données sont des paramètres qu'il manipule pour produire un résultat concis.
100 000€
Selon un chercheur de l'université du Maryland, c'est le coût par jour correspondant aux frais d'hébergement de ChatGPT. Imaginez les infrastructures et la consommation électrique nécessaires au fonctionnement de cette IA...
(Source : Twitter)Selon OpenAI, la version 4 de ChatGPT sera en mesure de gérer mille milliards de paramètres. Ceci devrait lui permettre d'être plus rapide et précis dans ses réponses. Quant aux ressources nécessaires, on n'ose pas y penser.
[Photo de couverture : DeepMind - récupéré sur Unsplash]
Soutenez-nous en partageant l'article :