MENU

L’IA se rapproche de l’intelligence générale humaine

L’IA se rapproche de l’intelligence générale humaine

Technologies |
Par Jean-Pierre Joosting, A Delapalisse



H2O.ai annonce que son agent h2oGPTe s’est assuré la première place du tableau de référence GAIA (General AI Assistants) avec un score sans précédent de 65% – surclassant l’agent Google Langfun à 49%, Microsoft Research à 38%, et Hugging Face à 33%.

Ce résultat remarquable au benchmark GAIA montre que H2O.ai domine le domaine émergent des agents d’intelligence artificielle polyvalents, établissant ainsi un nouvel étalon-or pour l’industrie.

H2O.ai annonce que son agent h2oGPTe s’est assuré la première place du tableau de référence GAIA (General AI Assistants) avec un score sans précédent de 65% – surclassant l’agent Google Langfun à 49%, Microsoft Research à 38%, et Hugging Face à 33%.

Cette réussite remarquable montre que H2O.ai domine le domaine émergent des agents d’intelligence artificielle polyvalents, établissant ainsi un nouvel étalon-or pour l’industrie.

Le benchmark GAIA mesure l’utilité des systèmes d’IA dans la résolution de tâches du monde réel qui demandent beaucoup de temps, de réflexion et d’efforts à des humains qualifiés. Il s’agit de centaines de défis qui nécessitent des recherches laborieuses, l’analyse de données, le traitement de documents et le raisonnement. Les répondants humains titulaires d’un diplôme obtiennent un score de 92 % et ont besoin de plusieurs jours de travail pour résoudre les 300 problèmes de l’ensemble des tests.

L’agent h2oGPTe a surpassé ses concurrents en offrant une robustesse, une précision et une efficacité constantes, ce qui montre qu’il est prêt pour les cas d’utilisation en entreprise qui dépendent fortement d’assistants humains qualifiés.

Sri Ambati, fondateur et PDG de H2O.ai, a commenté : « Nous annonçons aujourd’hui que l’IA n’est qu’à 30 % d’égaler l’intelligence générale humaine sur l’échelle GAIA. Les questions ouvertes de GAIA sont une meilleure mesure de l’intelligence que MMLU, qui repose sur des choix multiples. Il y a tout juste un an, l’ensemble de l’écosystème Gen AI était à peine capable de dépasser un dixième de précision sur l’un des critères les plus difficiles de l’AGI.

« Les créateurs de H2O.ai ont construit l’agent d’IA h2oGPTe en utilisant les meilleurs modèles au monde pour le raisonnement, l’image multimodale, la vidéo, la compréhension du langage, la génération de code et l’exécution afin de battre le benchmark GAIA avec un bond de 15% de précision par rapport au record précédent établi par les chercheurs de Google Deepmind en utilisant le même Claude-3.5-Sonnet. L’agent h2oGPTe a également battu de 27 % l’agent Magentic-1 de Microsoft Research qui utilisait le modèle o1 d’OpenAI. »

« Agentic AI se nourrit de SaaS et grâce à la disponibilité générale de h2oGPTe Agentic AI, toutes nos entreprises clientes peuvent résoudre un large éventail de problèmes sophistiqués dans le domaine des affaires et de la recherche ».

Le succès de H2O.ai sur GAIA souligne sa philosophie de simplicité et d’adaptabilité, notamment :

  • Raisonnement et planification avancés pour résoudre des tâches complexes dans le monde réel.
  • Compréhension multimodale du texte, des images et de l’audio pour une compréhension transparente du contexte.
  • Intégration d’outils d’entreprise tels que l’exécution Python et DriverlessAI pour l’analyse prédictive et la prise de décision.

Enterprise h2oGPTe 1.6 inclut la fonction Agent et est disponible sur tous les clouds publics, les clouds privés virtuels et pour les déploiements sur site – https://h2o.ai/platform/enterprise-h2ogpte.

Blog technique

Si vous avez apprécié cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à :    ECI sur Google News

Partager:

Articles liés
10s