La société Hailo, basée à Tel Aviv, a officiellement lancé le Hailo-10H, son dernier processeur d’intelligence artificielle conçu pour exécuter des modèles d’intelligence artificielle génératifs directement sur la puce, sans dépendre d’une infrastructure en cloud. La nouvelle puce est disponible à la commande, apportant un support natif pour les modèles de grands langages (LLM) et les modèles de vision-langage (VLM) pour les applications Edge.
Pour les lecteurs d’eeNews Europe/ ECInews travaillant dans les domaines de l’IA embarquée, de l’automobile et de la conception industrielle, ce développement est remarquable et mérite qu’on s’y intéresse. Il combine une inférence de haute performance, une faible consommation d’énergie et la prise en charge de modèles d’IA de pointe, le tout dans un format compact et convivial.
L’IA générative Edge, sans besoin du cloud
Le Hailo-10H s’appuie sur le succès du Hailo-8 de la société, en passant de l’IA de vision à des charges de travail d’IA générative complètes. Il permet l’exécution sur l’appareil de LLM et VLM avancés, avec des applications pratiques dans les cockpits automobiles, les passerelles domestiques intelligentes, les infrastructures de télécommunications et les systèmes de vente au détail. Avec un traitement en temps réel et une latence ultra-faible, le Hailo-10H offre des performances d’IA sans les problèmes de coût, de bande passante et de confidentialité de l’inférence basée sur le cloud.
Orr Danon, PDG et cofondateur de Hailo, a déclaré: « Avec le Hailo-10H désormais disponible à la commande, nous franchissons une nouvelle étape importante dans notre mission qui consiste à rendre l’IA accessible à tous. Il s’agit du premier processeur d’IA discret à apporter de véritables performances d’IA générative Edge, en combinant une grande efficacité, un bon rapport coût-efficacité et un écosystème logiciel robuste. »
Fait important pour les concepteurs européens, le Hailo-10H respecte les réglementations en matière de confidentialité des données en maintenant le traitement sur l’appareil. Il est également qualifié pour l’automobile (AEC-Q100 Grade 2), ce qui en fait un candidat viable pour les plates-formes de véhicules à venir, la production s’accélérant pour les modèles de 2026.
Performance et efficacité énergétique
Ciblant les applications limitées par la puissance et la taille, le Hailo-10H ne consomme que 2,5 W tout en permettant l’inférence sur des modèles à deux paramètres avec une latence de moins d’une seconde pour le premier jeton et un débit supérieur à 10 jetons par seconde. Pour la vidéo, il prend en charge la détection d’objets 4K en temps réel à l’aide de modèles tels que YOLOv11m.
La puce est entièrement compatible avec les outils de développement établis de la société, qui bénéficie d’une base d’utilisateurs mondiale de plus de 10 000 développeurs. Cette compatibilité simplifie la migration à partir de conceptions antérieures et accélère l’intégration de nouveaux projets.
L’IA générative passant rapidement des centres de données dans le cloud aux systèmes embarqués, le Hailo-10H représente une étape clé. Les développeurs de produits dans de nombreux secteurs verticaux peuvent désormais explorer les interfaces en langage naturel, la perception multimodale et les fonctions d’IA respectueuses de la vie privée, entièrement Edge.
Si vous avez apprécié cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à :
ECI sur Google News