- Kioxia представляет новый проект под названием AiSAQ, целью которого является замена оперативной памяти твердотельными накопителями для обработки данных ИИ.
- SSD-накопители большего размера (читай: более 100 ТБ) могут улучшить RAG при меньших затратах, чем использование только хранилища.
- Сроки не указаны, но ожидается, что конкуренты Kioxia предложат аналогичные технологии.
Большие языковые модели часто дают правдоподобные, но фактически неверные результаты — другими словами, они что-то изобретают. Эти «галлюцинации» могут повлиять на надежность выполнения важных информационных задач, таких как медицинская диагностика, юридический анализ, финансовая отчетность и научные исследования.
Поисково-дополненная генерация (RAG) смягчает эту проблему за счет интеграции внешних источников данных, позволяя LLM получать доступ к информации в реальном времени во время генерации, уменьшая количество ошибок и повышая контекстуальную точность, основывая выходные данные на текущих данных. Эффективная реализация RAG требует значительных ресурсов памяти и хранилища, и это особенно актуально для больших векторных данных и индексов. Традиционно эти данные хранились в DRAM, которая является быстрой, но дорогой и ограниченной по емкости.
Чтобы решить эти проблемы, ServeTheHome сообщает, что японский гигант хранения данных Kioxia представил на выставке CES в этом году AiSAQ — метод приближенного поиска ближайшего соседа (ANNS) с квантованием продукта, который использует твердотельные накопители высокой емкости для хранения векторных данных и индексов. Kioxia утверждает, что AiSAQ значительно снижает использование DRAM по сравнению с DiskANN и обеспечивает более экономичный и масштабируемый подход к поддержке крупных моделей искусственного интеллекта.
Более доступный и экономичный
Переход на хранилище на базе твердотельных накопителей позволяет обрабатывать большие наборы данных без высоких затрат, связанных с интенсивным использованием DRAM.
Хотя доступ к данным с твердотельных накопителей может привести к небольшой задержке по сравнению с DRAM, компромисс включает более низкую стоимость системы и улучшенную масштабируемость, что может обеспечить более высокую производительность и точность модели, поскольку большие наборы данных обеспечивают более богатую основу для обучения и вывода.
Используя твердотельные накопители высокой емкости, AiSAQ удовлетворяет потребности RAG в хранении данных, одновременно способствуя достижению более широкой цели — сделать передовые технологии искусственного интеллекта более доступными и экономичными. Kioxia не объявила, когда планирует запустить AiSAQ, но она уверена, что конкуренты, такие как Micron и SK Hynix, будут разрабатывать нечто подобное.
ServeTheHome заключает: «В настоящее время все основано на искусственном интеллекте, и Kioxia также продвигает это вперед. На самом деле RAG будет важной частью многих приложений, и если есть приложение, которому требуется доступ к большому количеству данных, но оно используется не так часто, это станет прекрасной возможностью для чего-то вроде Kioxia AiSAQ».