Keysight lance KAI Inference Builder, une plateforme d’émulation d’inférence IA pour valider et optimiser les infrastructures d’IA de nouvelle génération
Émuler, analyser, optimiser : une nouvelle approche pour l’inférence IA à grande échelle
Keysight Technologies présente Keysight AI Inference Builder (KAI Inference Builder), une plateforme d’émulation conçue pour valider les infrastructures IA optimisées pour l’inférence, un enjeu critique dans un marché où le déploiement de modèles IA augmente bien plus vite que leur entraînement.
La solution sera démontrée au NVIDIA GTC 2026, directement intégrée à l’environnement de jumeau numérique NVIDIA DSX Air AI Factory, offrant une approche avant déploiement inédite pour optimiser l’infrastructure IA.
Pourquoi une plateforme dédiée à l’inférence IA ?
Le secteur de l’IA est passé :
- de l’entraînement des LLM,
→ à l’exécution massivement distribuée des inférences.
Or, l’inférence est :
- hautement dynamique,
- extrêmement sensible à la latence,
- souvent imprévisible,
- difficile à reproduire via des outils classiques (trafic synthétique, benchmarks GPU…).
Ces limites compromettent :
- le dimensionnement des clusters,
- l’efficacité opérationnelle,
- le coût total de possession,
- la rapidité de mise en production.
KAI Inference Builder résout ces défis en émulant des charges de travail IA réalistes, spécifiques à chaque vertical métier.
Avantages clés de KAI Inference Builder
Conçu pour l’ère de l’inférence
Partie intégrante de la gamme Keysight Artificial Intelligence (KAI), la plateforme :
- émule des charges de travail IA réalistes à grande échelle,
- valide la performance de bout en bout,
- analyse la sécurité, l’évolutivité et les goulots d’étranglement.
Idéal pour les fournisseurs cloud IA, les hyperscalers et les fabricants de matériel.
Analyse ciblée par vertical métier
Contrairement aux approches génériques, KAI Inference Builder modélise les charges d’inférence :
- de la finance,
- de la santé,
- de l’industrie,
- des applications temps réel.
Chaque profil métier a ses propres contraintes de latence, de séquence d’appels, de taille de contexte, de sécurité — et KAI les reproduit fidèlement.
Validation & optimisation de bout en bout
La plateforme analyse toute la chaîne :
- demande →
- orchestrateur IA →
- réseau →
- compute →
- stockage →
- réponse du modèle.
Elle permet :
- d’identifier les inefficacités,
- d’éviter les retours arrière coûteux,
- d’optimiser la performance avant mise en production.
Isolation précise des sous‑systèmes
Grâce à une émulation uniquement côté client, KAI Inference Builder permet de :
- cibler les goulots d’étranglement (réseau, compute, GPU, sécurité…),
- éviter le surprovisionnement,
- réduire les coûts d’infrastructure,
- améliorer l’efficacité globale.
Intégration complète avec NVIDIA DSX Air
Lors du NVIDIA GTC, Keysight dévoile :
- la simulation de charges IA dans NVIDIA DSX Air,
- la validation des infrastructures avant installation physique,
- la possibilité de tester une IA Factory dans le cloud NVIDIA.
Ram Periakaruppan, VP & GM Network Test & Security Solutions, Keysight : « L’inférence est le cœur du ROI des systèmes IA modernes. KAI Inference Builder offre une visibilité complète avant même l’installation du matériel. »
Amit Katz, VP Networking, NVIDIA : « L’intégration avec DSX Air élimine la volatilité et prépare les centres IA à des déploiements fiables et performants. »
Cette information transforme la manière de concevoir les infrastructures d’inférence :
- plus de validation à l’aveugle,
- plus de risques lors des mises à l’échelle,
- plus de millions dépensés en surprovisionnement.
KAI Inference Builder permet :
- d’optimiser l’investissement,
- de fiabiliser les déploiements IA,
- de modéliser le futur comportement d’un data center IA avant son existence physique.
Si vous avez apprécié cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à :
ECI sur Google News