
Le logiciel libre KIOXIA fait progresser l’IA RAG
Dans le cadre d’un effort continu visant à améliorer la facilité des recherches dans les bases de données vectorielles d’IA au sein des systèmes RAG (retrieval-augmented generation) en optimisant l’utilisation des disques durs SSD, Kioxia Corporation a annoncé une mise à jour de son logiciel KIOXIA AiSAQ™ (All-in-Storage ANNS with Product Quantisation).
Cette nouvelle version open-source introduit des contrôles flexibles, permettant aux architectes de systèmes de définir le point d’équilibre entre la performance de recherche et le nombre de vecteurs, qui sont des facteurs opposés dans la capacité fixe de stockage SSD dans le système. L’avantage qui en résulte permet aux architectes des systèmes RAG d’affiner l’équilibre optimal des charges de travail spécifiques et de leurs exigences sans aucune modification matérielle.
Introduit pour la première fois en janvier 2025, le logiciel KIOXIA AiSAQ utilise un nouvel algorithme de recherche par approximation du plus proche voisin (ANNS) optimisé pour les disques SSD, éliminant ainsi le besoin de stocker les données d’index dans la DRAM. En permettant des recherches vectorielles directement sur les disques SSD et en réduisant les besoins en mémoire hôte, la technologie RAG de KIOXIA AiSAQ permet aux bases de données vectorielles d’évoluer, en grande partie sans les restrictions causées par la capacité limitée de la DRAM.
Lorsque la capacité installée du disque SSD dans le système est fixe, l’augmentation des performances de recherche (requêtes par seconde) nécessite une plus grande capacité de disque SSD consommée par vecteur. Il en résulte un plus petit nombre de vecteurs. Inversement, pour maximiser le nombre de vecteurs, la consommation de capacité du disque SSD par vecteur doit être réduite, ce qui se traduit par une baisse des performances. L’équilibre optimal entre ces deux conditions opposées varie en fonction de la charge de travail spécifique. Pour trouver l’équilibre approprié, le logiciel KIOXIA AiSAQ introduit des options de configuration flexibles. La dernière mise à jour permet aux administrateurs de sélectionner l’équilibre optimal pour différentes charges de travail au sein du système RAG. En outre, la mise à jour fait de la technologie KIOXIA AiSAQ un ANNS basé sur un SSD adapté non seulement aux applications RAG, mais aussi à d’autres applications gourmandes en vecteurs, telles que les recherches sémantiques hors ligne.
Avec la demande croissante de services d’IA évolutifs, les disques SSD offrent une alternative pratique à la DRAM pour gérer le débit élevé et la faible latence exigés par les systèmes RAG. Le logiciel KIOXIA AiSAQ permet de répondre efficacement à ces exigences, en permettant une IA générative à grande échelle sans être contraint par des ressources de mémoire limitées.
Le logiciel libre KIOXIA AiSAQ AI RAG peut être téléchargé à l’adresse https://github.com/kioxia-jp/aisaq-diskann.
