На главную страницу
О журнале План выхода Подписка Интернет-Магазин Реклама Контакты и реквизиты English На главную страницу Карта сайта Поиск по сайту Обратная связь

перейти к Содержанию номера
№ 3 (123)   май–июнь 2025 г.
Раздел: Искусственный интеллект и машинное обучение
Исследование производительности векторных баз данных
Research on the Performance of Vector Databases
Борис Сергеевич Горячкин1, кандидат технических наук, доцент
B. S. Goryachkin1, PhD (Eng.), Associate Professor
Артем Андреевич Сухобоков2, кандидат технических наук
A. A. Sukhobokov2, PhD (Eng.)
Евсей Евгеньевич Киричков1 
E. E. Kirichkov1
1 Московский государственный технический университет им. Н. Э. Баумана
2 SAP America, Inc
1 Bauman Moscow State Technical University 2 SAP America, Inc.

Предыдущая статьяСледующая статья

УДК 004.65

Рост объемов и сложности данных требует эффективных решений для хранения и поиска многомерных векторных представлений. Векторные базы данных становятся ключевым компонентом современных систем искусственного интеллекта, однако методы объективной оценки их возможностей в различных прикладных сценариях остаются малоизученными. Цель работы заключается в проведении сравнительного исследования производительности популярных векторных баз данных (Qdrant, Milvus, Weaviate) с использованием стандартизированного тестового окружения на основе контейнеризации Docker и оценка влияния различных конфигураций на их эффективность. Установлено, что производительность векторных баз данных существенно зависит от используемых параметров индексирования и поиска HNSW (M, efConstruction, ef). Продемонстрировано, как изменение конфигураций влияет на производительность систем. Определены значимые различия между системами по ключевым метрикам (скорости обработки запросов (RPS), точности поиска и времени загрузки данных), что позволяет выбрать наиболее эффективное решение для конкретных задач и объемов данных. Результаты исследования могут быть использованы разработчиками систем хранения данных, алгоритмов машинного обучения, а также исследователями, стремящимися повысить производительность приложений в таких областях, как компьютерное зрение, обработка естественного языка и рекомендательные системы. Предложенная методология тестирования будет полезна при оценке производительности новых решений в области векторного поиска.

< ... >

Ключевые слова: клавиатурный почерк, биометрическая аутентификация, корреляционный анализ, корреляция, экспоненциальное сглаживание векторные базы данных, производительность, HNSW, поиск ближайших соседей, Milvus, Qdrant, Weaviate, тестирование, docker, машинное обучение

The purpose of the work is а conduct a comparative performance study of popular vector databases using a standardized test environment based on Docker containerization and evaluate the impact of different configurations on their performance. It is found that the performance of vector databases depends significantly on the HNSW indexing and search parameters used (M, efConstruction, ef). Demonstrated how changing configurations affects the performance of the systems. Significant differences between systems in key metrics: query processing speed (RPS), search accuracy and data loading time are determined, which allows choosing the most efficient solution for specific tasks and data volumes. The results of the study can be used by developers of data storage systems, machine learning algorithms, as well as by researchers seeking to improve the performance of applications in computer vision, natural language processing, and recommender systems.

Keywords: vector databases, performance, hnsw, nearest neighbour search, milvus, qdrant, weaviate, testing, docker, machine learning
warning!   Полную версию статьи смотрите на страницах журнала «Защита информации. Инсайд»

Обращайтесь!!!
e-mail:    magazine@inside-zi.ru
тел.:        +7 (921) 958-25-50, +7 (911) 921-68-24


Предыдущая статья    СОДЕРЖАНИЕ НОМЕРА    Следующая статья

| Начало | О журнале | План выхода | Подписка | Интернет-магазин | Реклама | Координаты |

Copyright © 2004-2025 «Защита информации. Инсайд». Все права защищены
webmaster@inside-zi.ru

   Rambler's Top100    Технологии разведки для бизнеса