banner

Blog

Jun 14, 2023

Comment Auto

MISE À JOUR 19:55 HAE / 06 JUIN 2023

par Kyt Dotson

Les chatbots d'intelligence artificielle tels que ChatGPT d'OpenAI LP ont récemment atteint un paroxysme de popularité, non seulement pour leur capacité à tenir des conversations humaines, mais aussi parce qu'ils peuvent effectuer des tâches de connaissance telles que la recherche, les recherches et la génération de contenu.

Il y a maintenant un nouveau concurrent qui prend d'assaut les médias sociaux et qui étend les capacités de l'offre d'OpenAI en automatisant encore plus ses capacités : Auto-GPT. Il fait partie d'une nouvelle classe d'outils d'IA appelés "agents d'IA autonomes" qui tirent parti de la puissance de GPT-3.5 et GPT-4, les technologies d'IA génératives derrière ChatGPT, pour aborder une tâche, s'appuyer sur ses propres connaissances et connecter des applications et services pour automatiser les tâches et effectuer des actions au nom des utilisateurs.

ChatGPT peut sembler magique aux utilisateurs pour sa capacité à répondre aux questions et à produire du contenu basé sur les invites de l'utilisateur, comme résumer de gros documents ou générer des poèmes et des histoires ou écrire du code informatique. Cependant, il est limité dans ce qu'il peut faire car il est capable de faire une seule tâche à la fois. Au cours d'une session avec ChatGPT, un utilisateur peut demander à l'IA une seule question à la fois et affiner ces invites ou questions peut être un voyage lent et fastidieux.

Auto-GPT, créé par le développeur de jeux Toran Bruce Richards, supprime ces limitations en permettant aux utilisateurs de donner à l'IA un objectif et un ensemble d'objectifs à atteindre. Ensuite, il génère un bot qui agit comme une personne, en utilisant le modèle GPT d'OpenAI pour exécuter des invites d'IA afin d'approcher cet objectif. En cours de route, il apprend à affiner ses invites et ses questions afin d'obtenir de meilleurs résultats à chaque itération.

Il dispose également d'une connectivité Internet afin de recueillir des informations supplémentaires à partir des recherches. De plus, il dispose d'une mémoire à court et à long terme via des connexions à la base de données afin de pouvoir suivre les sous-tâches. Et il utilise GPT-4 pour produire du contenu tel que du texte ou du code si nécessaire. Auto-GPT est également capable de se mettre au défi lorsqu'une tâche est incomplète et de combler les lacunes en modifiant ses propres invites pour obtenir de meilleurs résultats.

Selon Richards, bien que les chatbots IA actuels soient extrêmement puissants, leur incapacité à affiner leurs propres invites à la volée et à automatiser les tâches est un goulot d'étranglement. "Cette inspiration m'a amené à développer Auto-GPT, qui peut appliquer le raisonnement de GPT-4 à des problèmes plus larges et plus complexes qui nécessitent une planification à long terme et plusieurs étapes", a-t-il déclaré à Vice.

Auto-GPT est disponible en open source sur GitHub. Il nécessite une clé d'interface de programmation d'application d'OpenAI pour accéder à GPT-4. Et pour l'utiliser, les utilisateurs devront installer Python et un environnement de développement tel que Docker ou VS Code avec une extension Dev Container. Par conséquent, il faudra peut-être un peu de savoir-faire technique pour démarrer, bien qu'il existe une documentation de configuration complète.

Dans une interface texte, Auto-GPT demande à l'utilisateur de donner à l'IA un nom, un rôle, un objectif et jusqu'à cinq buts qu'elle doit atteindre. Chacun d'entre eux définit la manière dont les agents d'IA aborderont l'action souhaitée par l'utilisateur et comment il fournira le produit final.

Tout d'abord, l'utilisateur définit un nom pour l'IA, tel que "RestaurantMappingApp-GPT", puis définit un rôle, tel que "Développer une application Web qui fournira des cartes interactives pour les restaurants à proximité". L'utilisateur peut ensuite définir une série d'objectifs, tels que "Écrire un back-end en Python" et "Programmer un front-end en HTML", ou "Offrir des liens vers des menus si disponibles" et "Lien vers des applications de livraison".

Une fois que l'utilisateur a appuyé sur Entrée, Auto-GPT commencera à lancer des agents, qui produiront des invites pour GPT-4, puis aborderont le rôle d'origine et chacun des différents objectifs. Enfin, il commencera alors à affiner et à parcourir les différentes invites qui lui permettront de se connecter à Google Maps en utilisant Python ou JavaScript.

Pour ce faire, il divise le travail global en tâches plus petites pour travailler sur chacune, et il utilise un robot d'IA de surveillance principal qui agit en tant que "gestionnaire" pour s'assurer qu'ils se coordonnent. Cette invite particulière demande au bot de créer une application quelque peu complexe qui pourrait mal tourner si elle ne suit pas un certain nombre de pièces mobiles différentes, il peut donc prendre un grand nombre d'étapes pour y arriver.

À chaque étape, chaque instance d'IA va "narrer" ce qu'elle fait et même se critiquer afin d'affiner ses invites en fonction de son approche vers l'objectif donné. Une fois qu'elle atteint un objectif particulier, chaque instance finalisera son processus et renverra sa réponse à la tâche de gestion principale.

Essayer d'obtenir ChatGPT ou même le GPT-4 plus avancé et basé sur un abonnement pour le faire sans supervision nécessiterait un grand nombre d'étapes manuelles qui devraient être suivies par un être humain. Auto-GPT les fait tout seul.

Les capacités d'Auto-GPT sont bénéfiques pour les développeurs néophytes qui cherchent à progresser dans le jeu, a déclaré Brandon Jung, vice-président de l'écosystème chez le fournisseur d'outils de complétion de code AI Tabnine Ltd., à SiliconANGLE.

"L'un des avantages est que c'est une bonne introduction pour ceux qui débutent dans le codage, et cela permet un prototypage rapide", a déclaré Jung. "Pour les cas d'utilisation qui ne nécessitent pas d'exactitude ou qui ont des problèmes de sécurité, cela pourrait accélérer le processus de création sans avoir à faire partie d'un système plus large qui comprend un expert pour examen."

Pouvoir créer rapidement des applications, y compris tout le code en une seule fois, à partir d'une simple série d'invites de texte, apporterait de nombreux nouveaux modèles de code aux développeurs. Essentiellement, leur fournir des solutions rapides et des bases sur lesquelles s'appuyer. Cependant, ils devraient d'abord passer par un examen approfondi avant d'être mis en production.

Ce n'est qu'un exemple des capacités d'Auto-GPT. Grâce à ses capacités, il offre de vastes possibilités qui sont actuellement explorées par les développeurs, les chefs de projet, les chercheurs en IA et toute autre personne pouvant télécharger son code source.

"Il existe de nombreux exemples de personnes utilisant Auto-GPT pour effectuer des études de marché, créer des plans d'affaires, créer des applications, automatiser des tâches complexes dans la poursuite d'un objectif, comme planifier un repas, identifier des recettes et commander tous les ingrédients, et même exécuter des transactions. au nom de l'utilisateur », a déclaré Sheldon Monteiro, directeur produit de la société de transformation numérique Publicis Sapient, à SiliconANGLE.

Grâce à sa capacité à effectuer des recherches sur Internet, Auto-GPT peut être chargé d'effectuer des études de marché rapides telles que "Trouvez-moi cinq claviers de jeu à moins de 200 $ et répertoriez leurs avantages et leurs inconvénients". Grâce à sa capacité à diviser une tâche en plusieurs sous-tâches, l'IA autonome pourrait alors rechercher rapidement plusieurs sites d'examen, produire un rapport d'étude de marché et revenir avec une liste de claviers de jeu qui reviennent en dessous de ce montant et fournir leurs prix ainsi que informations à leur sujet.

Un utilisateur de Twitter nommé MOE a créé un bot Auto-GPT nommé "Isabella" qui peut analyser de manière autonome les données du marché et sous-traiter à d'autres IA. Pour ce faire, il utilise le framework AI Lang-chain pour collecter des données de manière autonome et effectuer une analyse des sentiments sur différents marchés.

autogpt essayait de créer une application pour moi, a reconnu que je n'avais pas Node, a cherché sur Google comment installer Node, a trouvé un article stackoverflow avec un lien, l'a téléchargé, l'a extrait, puis a créé le serveur pour moi.

Ma contribution? J'ai regardé. pic.twitter.com/2QthbTzTGP

– Varun Mayya (@VarunMayya) 6 avril 2023

Étant donné qu'Auto-GPT a accès à Internet et qu'il peut effectuer des actions au nom de l'utilisateur, il peut également installer des applications. Dans le cas de l'utilisateur de Twitter Varun Mayya, qui a demandé au bot de créer un logiciel, il a découvert qu'il n'avait pas installé Node.js - un environnement qui permet à JavaScript d'être exécuté localement plutôt que dans un navigateur Web. En conséquence, il a cherché sur Internet, découvert un didacticiel StackOverflow et l'a installé pour lui afin qu'il puisse continuer à créer l'application.

Auto-GPT n'est pas le seul agent autonome AI actuellement disponible. Un autre qui est devenu à la mode est BabyAGI, qui a été créé par Yohei Nakajima, un capital-risqueur et chercheur en intelligence artificielle. AGI fait référence à "l'intelligence générale artificielle", un type hypothétique d'IA qui aurait la capacité d'effectuer n'importe quelle tâche intellectuelle - mais aucune IA existante n'est proche. BabyAGI est un système de gestion des tâches basé sur Python qui utilise l'API OpenAI, comme Auto-GPT, qui priorise et construit de nouvelles tâches vers un objectif.

Il existe également AgentGPT et GodMode, qui sont beaucoup plus conviviaux dans la mesure où ils utilisent une interface Web au lieu de nécessiter une installation sur un ordinateur, de sorte qu'ils sont accessibles en tant que service. Ces services réduisent la barrière à l'entrée en simplifiant la tâche des utilisateurs, car ils ne nécessitent aucune connaissance technique pour être utilisés et effectueront des tâches similaires à Auto-GPT, telles que la génération de code, la réponse aux questions et la recherche. Cependant, ils ne peuvent pas écrire de documents sur l'ordinateur ni installer de logiciel.

Ces outils ont cependant des inconvénients, a averti Monteiro. Les exemples sur Internet sont triés sur le volet et peignent la technologie sous un jour éclatant. Malgré tous les succès, de nombreux problèmes peuvent survenir lors de son utilisation.

"Il peut rester coincé dans des boucles de tâches et devenir confus", a déclaré Monteiro. "Et ces boucles de tâches peuvent devenir assez coûteuses, très rapides avec les coûts des appels d'API GPT-4. Même si cela fonctionne comme prévu, cela peut prendre une séquence assez longue d'étapes de raisonnement, chacune consommant du GPT-4 coûteux. jetons."

L'accès à GPT-4 peut coûter de l'argent qui varie en fonction du nombre de jetons utilisés. Les jetons sont basés sur des mots ou des parties de phrases envoyés via le chatbot. Les frais varient de trois cents par 1 000 jetons pour les invites à six cents par 1 000 jetons pour les résultats. Cela signifie que l'utilisation d'Auto-GPT pour exécuter un projet complexe ou rester coincé dans une boucle sans surveillance pourrait finir par coûter quelques dollars.

Dans le même temps, le GPT-4 peut être sujet à des erreurs, appelées "hallucinations", qui pourraient entraîner des problèmes au cours du processus. Il pourrait proposer des actions totalement incorrectes ou erronées ou, pire, produire un code non sécurisé ou désastreusement mauvais lorsqu'on lui demande de créer une application.

"[Auto-GPT] a la capacité d'exécuter la sortie précédente, même si quelque chose ne va pas, il continue", a déclaré Bern Elliot, éminent analyste vice-président chez Gartner. "Il a besoin de contrôles solides pour éviter qu'il ne déraille et continue. Je m'attends à ce qu'une mauvaise utilisation sans garde-corps appropriés entraîne des résultats dommageables, inattendus et imprévus."

Le côté développement logiciel pourrait être tout aussi problématique. Même si Auto-GPT ne commet pas d'erreur qui l'amène à produire du code cassé, ce qui entraînerait simplement l'échec du logiciel, il pourrait créer une application criblée de problèmes de sécurité.

"Auto-GPT ne fait pas partie d'un cycle de développement logiciel complet - tests, sécurité, etc. - et n'est pas non plus intégré à un IDE", a déclaré Jung, mettant en garde contre les problèmes potentiels qui pourraient résulter d'une mauvaise utilisation de l'outil. "Abstrait la complexité, c'est bien si vous construisez sur une base solide. Cependant, ces outils, par définition, ne construisent pas de code fort et encouragent la mise en production de code mauvais et non sécurisé."

Des outils tels que Auto-GPT, BabyAGI, AgentGPT et GodMode sont encore expérimentaux, mais il y a des implications plus larges dans la façon dont ils pourraient être utilisés pour remplacer des tâches de routine telles que la planification de vacances ou le shopping, a expliqué Monteiro.

À l'heure actuelle, Microsoft a même développé des exemples simples d'un plugin pour Bing Chat. Il permet aux utilisateurs de lui demander de leur proposer des suggestions de dîner qui auront son IA – qui est alimentée par GPT-4 – déroulera une liste d'ingrédients, puis lancera Instacart pour les préparer pour la livraison. Bien qu'il s'agisse d'un pas dans la direction de l'automatisation, les robots tels que Auto-GPT se dirigent vers un avenir potentiel de comportements totalement autonomes.

Un utilisateur pourrait demander à Auto-GPT de parcourir les magasins locaux, de préparer des listes d'ingrédients, de comparer les prix et la qualité, de configurer un panier et même de compléter des commandes de manière autonome. À ce stade expérimental, de nombreux utilisateurs peuvent ne pas être disposés à autoriser le bot à utiliser leur carte de crédit et à livrer les commandes tout seul, de peur qu'il ne se détraque et leur envoie plusieurs centaines de bouquets de basilic.

Un avenir similaire où une IA le fera pour les agents de voyages utilisant Auto-GPT n'est peut-être pas loin. "Donnez-lui vos paramètres - plage, voyage maximum de quatre heures, classe d'hôtel - et votre budget, et il se fera un plaisir de faire toute la navigation sur le Web pour vous, en comparant les options en quête de votre objectif", a déclaré Monteiro. "Une fois terminé, il vous présentera ses conclusions et vous pourrez également voir comment il en est arrivé là."

Au fur et à mesure que ces outils commencent à mûrir, ils ont une réelle chance de fournir aux utilisateurs un moyen d'automatiser les tâches banales étape par étape qui se produisent sur Internet. Cela pourrait avoir des implications intéressantes, en particulier dans le commerce électronique.

"Comment les entreprises s'adapteront-elles lorsque ces agents naviguent sur des sites et éliminent votre produit de la considération établie avant même qu'un humain ne voie la marque ?" dit Monteiro. "Du point de vue du commerce électronique, si les gens commencent à utiliser les outils Auto-GPT pour acheter des biens et des services en ligne, les détaillants devront adapter leur expérience client."

MERCI

Comment Auto-GPT va révolutionner les chatbots IA tels que nous les connaissons

La stratégie cloud "Starlink" d'Oracle devient intéressante

Le stock de Couchbase tombe sur une perte plus large et des conseils souples

La puissance des superclouds : l'analyse par TheCUBE de la vision de Cisco pour un avenir plus simple et plus sûr

CrowdStrike ajoute plus de fonctionnalités de cybersécurité pour protéger les environnements cloud

Cisco simplifie son portefeuille de produits avec la nouvelle plate-forme Cisco Networking Cloud

Comment Auto-GPT va révolutionner les chatbots IA tels que nous les connaissons

AI - PAR KYT DOTSON . IL Y A 1 MIN

La stratégie cloud "Starlink" d'Oracle devient intéressante

BIG DATA - PAR L'AUTEUR INVITÉ. IL Y A 3 MINUTES

Le stock de Couchbase tombe sur une perte plus large et des conseils souples

BIG DATA - PAR MIKE WHEATLEY . IL Y A 24 MINUTES

La puissance des superclouds : l'analyse par TheCUBE de la vision de Cisco pour un avenir plus simple et plus sûr

AI - PAR CHAD WILSON . IL Y A 2 HEURES

CrowdStrike ajoute plus de fonctionnalités de cybersécurité pour protéger les environnements cloud

SÉCURITÉ - PAR MARIA DEUTSCHER . IL Y A 3 HEURES

Cisco simplifie son portefeuille de produits avec la nouvelle plate-forme Cisco Networking Cloud

NUAGE - PAR MARIA DEUTSCHER . IL Y A 4 HEURES

"TheCUBE est un partenaire important de l'industrie. Vous faites vraiment partie de nos événements et nous apprécions vraiment votre venue et je sais que les gens apprécient également le contenu que vous créez" - Andy Jassy MERCI
PARTAGER