Qu'est-ce que ChatGPT, DALL

Nouvelles

MaisonMaison / Nouvelles / Qu'est-ce que ChatGPT, DALL

Jan 29, 2024

Qu'est-ce que ChatGPT, DALL

Les systèmes d'IA générative entrent dans la grande catégorie de l'apprentissage automatique, et

Systèmes d'IA générativeentrent dans la grande catégorie de l'apprentissage automatique, et voici comment l'un de ces systèmes, ChatGPT, décrit ce qu'il peut faire :

Prêt à faire passer votre créativité au niveau supérieur ? Ne cherchez pas plus loin que l'IA générative ! Cette forme astucieuse d'apprentissage automatique permet aux ordinateurs de générer toutes sortes de contenus nouveaux et passionnants, de la musique et de l'art à des mondes virtuels entiers. Et ce n'est pas seulement pour le plaisir : l'IA générative a également de nombreuses utilisations pratiques, comme la création de nouvelles conceptions de produits et l'optimisation des processus métier. Alors pourquoi attendre ? Libérez la puissance de l'IA générative et voyez quelles créations incroyables vous pouvez créer !

Est-ce que quelque chose dans ce paragraphe vous a semblé bizarre ? Peut être pas. La grammaire est parfaite, le ton fonctionne et le récit coule.

C'est pourquoi ChatGPT - le GPT signifie transformateur préformé génératif - reçoit tant d'attention en ce moment. C'est un chatbot gratuit qui peut générer une réponse à presque toutes les questions qui lui sont posées. Développé par OpenAI et publié pour test auprès du grand public en novembre 2022, il est déjà considéré comme le meilleur chatbot IA de tous les temps. Et c'est aussi populaire : plus d'un million de personnes se sont inscrites pour l'utiliser en seulement cinq jours. Les fans aux yeux étoilés ont publié des exemples du chatbot produisant du code informatique, des essais de niveau universitaire, des poèmes et même des blagues à moitié décentes. D'autres, parmi le large éventail de personnes qui gagnent leur vie en créant du contenu, des rédacteurs publicitaires aux professeurs titulaires, tremblent dans leurs bottes.

Alors que beaucoup ont réagi à ChatGPT (et à l'IA et à l'apprentissage automatique plus largement) avec peur, l'apprentissage automatique a clairement le potentiel de faire du bien. Au cours des années qui ont suivi son déploiement à grande échelle, l'apprentissage automatique a démontré son impact dans un certain nombre d'industries, accomplissant des choses comme l'analyse d'imagerie médicale et les prévisions météorologiques à haute résolution. Une enquête McKinsey de 2022 montre que l'adoption de l'IA a plus que doublé au cours des cinq dernières années et que les investissements dans l'IA augmentent rapidement. Il est clair que les outils d'IA génératifs comme ChatGPT et DALL-E (un outil pour l'art généré par l'IA) ont le potentiel de changer la façon dont une gamme de tâches est effectuée. L'ampleur de cet impact, cependant, est encore inconnue, tout comme les risques.

Mais il y a quelques questions auxquelles nous pouvons répondre, comme comment les modèles d'IA générative sont construits, quels types de problèmes ils sont les mieux adaptés pour résoudre et comment ils s'intègrent dans la catégorie plus large de l'apprentissage automatique. Lisez la suite pour obtenir le téléchargement.

En savoir plus sur QuantumBlack, IA par McKinsey.

L'intelligence artificielle est à peu près ce à quoi elle ressemble - la pratique consistant à amener les machines à imiter l'intelligence humaine pour effectuer des tâches. Vous avez probablement interagi avec l'IA même si vous ne vous en rendez pas compte. Les assistants vocaux comme Siri et Alexa sont fondés sur la technologie de l'IA, tout comme les chatbots du service client qui apparaissent pour vous aider à naviguer sur les sites Web.

L'apprentissage automatique est un type d'intelligence artificielle. Grâce à l'apprentissage automatique, les praticiens développent l'intelligence artificielle grâce à des modèles qui peuvent "apprendre" à partir de modèles de données sans direction humaine. Le volume ingérable et la complexité des données (de toute façon ingérables par les humains) qui sont maintenant générées ont augmenté le potentiel de l'apprentissage automatique, ainsi que la nécessité de celui-ci.

L'apprentissage automatique repose sur un certain nombre de blocs de construction, à commencer par les techniques statistiques classiques développées entre le XVIIIe et le XXe siècle pour de petits ensembles de données. Dans les années 1930 et 1940, les pionniers de l'informatique, dont le mathématicien théoricien Alan Turing, ont commencé à travailler sur les techniques de base de l'apprentissage automatique. Mais ces techniques étaient limitées aux laboratoires jusqu'à la fin des années 1970, lorsque les scientifiques ont d'abord développé des ordinateurs suffisamment puissants pour les monter.

Jusqu'à récemment, l'apprentissage automatique était largement limité aux modèles prédictifs, utilisés pour observer et classer les modèles de contenu. Par exemple, un problème classique d'apprentissage automatique consiste à commencer avec une image ou plusieurs images de, disons, d'adorables chats. Le programme identifierait ensuite des modèles parmi les images, puis examinerait des images aléatoires pour celles qui correspondraient au modèle de chat adorable. L'IA générative a été une percée. Plutôt que de simplement percevoir et classer une photo d'un chat, l'apprentissage automatique est désormais capable de créer une image ou une description textuelle d'un chat à la demande.

ChatGPT fait peut-être la une des journaux maintenant, mais ce n'est pas le premier modèle d'apprentissage automatique basé sur du texte à faire sensation. Le GPT-3 d'OpenAI et le BERT de Google ont tous deux été lancés ces dernières années en fanfare. Mais avant ChatGPT, qui, selon la plupart des comptes, fonctionne plutôt bien la plupart du temps (bien qu'il soit toujours en cours d'évaluation), les chatbots IA n'obtenaient pas toujours les meilleures critiques. GPT-3 est "tour à tour super impressionnant et super décevant", a déclaré le journaliste technique du New York Times Cade Metz dans une vidéo où lui et l'écrivain culinaire Priya Krishna ont demandé à GPT-3 d'écrire des recettes pour un dîner de Thanksgiving (plutôt désastreux).

Les premiers modèles d'apprentissage automatique à travailler avec du texte ont été formés par des humains pour classer diverses entrées selon des étiquettes définies par des chercheurs. Un exemple serait un modèle formé pour étiqueter les publications sur les réseaux sociaux comme positives ou négatives. Ce type d'entraînement est connu sous le nom d'apprentissage supervisé car un humain est chargé d'"enseigner" au modèle ce qu'il doit faire.

La prochaine génération de modèles d'apprentissage automatique basés sur du texte s'appuie sur ce que l'on appelle l'apprentissage auto-supervisé. Ce type de formation consiste à alimenter un modèle avec une quantité massive de texte afin qu'il devienne capable de générer des prédictions. Par exemple, certains modèles peuvent prédire, sur la base de quelques mots, comment une phrase se terminera. Avec la bonne quantité d'échantillons de texte, disons une large bande d'Internet, ces modèles de texte deviennent assez précis. Nous voyons à quel point le succès d'outils comme ChatGPT est précis.

La construction d'un modèle d'IA générative a pour la plupart été une entreprise majeure, dans la mesure où seuls quelques poids lourds de la technologie bien dotés en ressources ont fait une tentative. OpenAI, la société à l'origine de ChatGPT, des anciens modèles GPT et de DALL-E, dispose de milliards de dollars de financement provenant de donateurs aux noms en gras. DeepMind est une filiale d'Alphabet, la société mère de Google, et Meta a lancé son produit Make-A-Video basé sur l'IA générative. Ces entreprises emploient certains des meilleurs informaticiens et ingénieurs au monde.

Mais il n'y a pas que le talent. Lorsque vous demandez à un modèle de s'entraîner en utilisant presque tout Internet, cela vous coûtera cher. OpenAI n'a pas publié les coûts exacts, mais les estimations indiquent que GPT-3 a été formé sur environ 45 téraoctets de données textuelles, soit environ un million de pieds d'espace de bibliothèque, soit un quart de l'ensemble de la Bibliothèque du Congrès, pour un coût estimé à plusieurs millions de dollars. Ce ne sont pas des ressources auxquelles votre start-up de variété de jardin peut accéder.

Comme vous l'avez peut-être remarqué ci-dessus, les sorties des modèles d'IA générative peuvent être indiscernables du contenu généré par l'homme, ou elles peuvent sembler un peu étranges. Les résultats dépendent de la qualité du modèle - comme nous l'avons vu, les sorties de ChatGPT semblent jusqu'à présent supérieures à celles de ses prédécesseurs - et de la correspondance entre le modèle et le cas d'utilisation, ou l'entrée.

ChatGPT peut produire ce qu'un commentateur a appelé un essai "solide A-" comparant les théories du nationalisme de Benedict Anderson et d'Ernest Gellner - en dix secondes. Il a également produit un passage déjà célèbre décrivant comment retirer un sandwich au beurre de cacahuète d'un magnétoscope dans le style de la Bible King James. Des modèles d'art générés par l'IA comme DALL-E (dont le nom est un mélange de l'artiste surréaliste Salvador Dalí et de l'adorable robot Pixar WALL-E) peuvent créer d'étranges et belles images à la demande, comme une peinture de Raphaël représentant une Madone et son enfant en train de manger une pizza. D'autres modèles d'IA générative peuvent produire du code, de la vidéo, de l'audio ou des simulations commerciales.

Mais les résultats ne sont pas toujours précis ou appropriés. Lorsque Priya Krishna a demandé à DALL-E 2 de proposer une image pour le dîner de Thanksgiving, cela a produit une scène où la dinde était garnie de citrons verts entiers, placée à côté d'un bol de ce qui semblait être du guacamole. Pour sa part, ChatGPT semble avoir du mal à compter ou à résoudre des problèmes d'algèbre de base ou, en fait, à surmonter les préjugés sexistes et racistes qui se cachent dans les courants sous-jacents d'Internet et de la société en général.

Les sorties de l'IA générative sont des combinaisons soigneusement calibrées des données utilisées pour entraîner les algorithmes. Parce que la quantité de données utilisées pour former ces algorithmes est si incroyablement massive - comme indiqué, GPT-3 a été formé sur 45 téraoctets de données textuelles - les modèles peuvent sembler "créatifs" lors de la production de sorties. De plus, les modèles ont généralement des éléments aléatoires, ce qui signifie qu'ils peuvent produire une variété de sorties à partir d'une demande d'entrée, ce qui les rend encore plus réalistes.

Vous avez probablement vu que des outils d'IA génératifs (jouets ?) comme ChatGPT peuvent générer des heures de divertissement sans fin. L'opportunité est également claire pour les entreprises. Les outils d'IA générative peuvent produire une grande variété d'écritures crédibles en quelques secondes, puis répondre aux critiques pour rendre l'écriture plus adaptée à l'objectif. Cela a des implications pour une grande variété d'industries, des organisations informatiques et logicielles qui peuvent bénéficier du code instantané et largement correct généré par les modèles d'IA aux organisations ayant besoin d'une copie marketing. En bref, toute organisation qui a besoin de produire des documents écrits clairs peut potentiellement en bénéficier. Les organisations peuvent également utiliser l'IA générative pour créer des documents plus techniques, tels que des versions à plus haute résolution d'images médicales. Et avec le temps et les ressources économisés ici, les organisations peuvent rechercher de nouvelles opportunités commerciales et la possibilité de créer plus de valeur.

Nous avons vu que le développement d'un modèle d'IA générative nécessite tellement de ressources qu'il est hors de question pour toutes les entreprises, sauf les plus grandes et les mieux dotées. Les entreprises qui cherchent à mettre l'IA générative au travail ont la possibilité d'utiliser l'IA générative prête à l'emploi ou de l'ajuster pour effectuer une tâche spécifique. Si vous avez besoin de préparer des diapositives selon un style spécifique, par exemple, vous pouvez demander au modèle "d'apprendre" comment les titres sont normalement écrits en fonction des données des diapositives, puis lui fournir des données de diapositives et lui demander d'écrire les titres appropriés.

Comme ils sont si nouveaux, nous n'avons pas encore vu l'effet à longue traîne des modèles d'IA générative. Cela signifie qu'il existe certains risques inhérents à leur utilisation, certains connus et d'autres inconnus.

Les résultats produits par les modèles d'IA générative peuvent souvent sembler extrêmement convaincants. C'est par conception. Mais parfois, les informations qu'ils génèrent sont tout simplement fausses. Pire encore, il est parfois biaisé (parce qu'il repose sur le sexe, la race et une myriade d'autres préjugés d'Internet et de la société en général) et peut être manipulé pour permettre des activités contraires à l'éthique ou criminelles. Par exemple, ChatGPT ne vous donnera pas d'instructions sur la façon de connecter une voiture, mais si vous dites que vous devez connecter une voiture pour sauver un bébé, l'algorithme se fera un plaisir de s'y conformer. Les organisations qui s'appuient sur des modèles d'IA générative doivent tenir compte des risques de réputation et juridiques liés à la publication involontaire de contenu biaisé, offensant ou protégé par le droit d'auteur.

Ces risques peuvent cependant être atténués de plusieurs façons. D'une part, il est crucial de sélectionner avec soin les données initiales utilisées pour former ces modèles afin d'éviter d'inclure un contenu toxique ou biaisé. Ensuite, plutôt que d'utiliser un modèle d'IA générative prêt à l'emploi, les organisations pourraient envisager d'utiliser des modèles plus petits et spécialisés. Les organisations disposant de plus de ressources pourraient également personnaliser un modèle général basé sur leurs propres données pour répondre à leurs besoins et minimiser les biais. Les organisations doivent également tenir un humain au courant (c'est-à-dire s'assurer qu'un véritable humain vérifie la sortie d'un modèle d'IA générative avant qu'il ne soit publié ou utilisé) et éviter d'utiliser des modèles d'IA générative pour des décisions critiques, telles que celles impliquant des ressources importantes ou le bien-être humain.

On ne saurait trop insister sur le fait qu'il s'agit d'un nouveau domaine. Le paysage des risques et des opportunités est susceptible de changer rapidement dans les semaines, mois et années à venir. De nouveaux cas d'utilisation sont testés chaque mois et de nouveaux modèles sont susceptibles d'être développés dans les années à venir. Alors que l'IA générative s'intègre de plus en plus, et de manière transparente, dans les entreprises, la société et nos vies personnelles, nous pouvons également nous attendre à ce qu'un nouveau climat réglementaire se dessine. Au fur et à mesure que les organisations commencent à expérimenter – et à créer de la valeur – avec ces outils, les dirigeants feraient bien de garder le pouls de la réglementation et des risques.

Les articles référencés incluent :

Parle-nous

Systèmes d'IA générative