벡터 데이터베이스
Vector database에 관한 시리즈의 일부 |
머신러닝 데이터 마이닝 |
---|
VDBMS(vector database management system) 또는 간단히 벡터 데이터베이스 또는 벡터 저장소는 다른 데이터 항목과 함께 벡터(고정 길이의 숫자 목록)를 저장할 수 있는 데이터베이스입니다. 벡터 데이터베이스는 일반적으로 하나 이상의 ANN(Proximate Neighbor) 알고리즘을 구현하므로 [1][2]쿼리 벡터로 데이터베이스를 검색하여 가장 가까운 데이터베이스 레코드를 검색할 수 있습니다.
벡터는 고차원 공간에서 데이터를 수학적으로 표현한 것입니다. 이 공간에서 각 차원은 데이터의 특징에 해당하며 정교한 데이터를 표현하기 위해 수만 개의 차원이 사용될 수 있습니다. 이 공간에서 벡터의 위치는 벡터의 특성을 나타냅니다. 단어, 구 또는 전체 문서, 이미지, 오디오 및 기타 유형의 데이터를 모두 벡터화할 수 있습니다.[3]
이러한 특징 벡터는 특징 추출 알고리즘, 단어 임베딩[4] 또는 딥 러닝 네트워크와 같은 기계 학습 방법을 사용하여 원시 데이터에서 계산될 수 있습니다. 목표는 의미론적으로 유사한 데이터 항목이 서로 가까운 특징 벡터를 수신하는 것입니다.
벡터 데이터베이스는 유사성 검색, 다중 모드 검색, 추천 엔진, 대규모 언어 모델(LLM) 등에 사용할 수 있습니다.[5]
벡터 데이터베이스는 또한 대규모 언어 모델의 도메인별 응답을 개선하기 위한 방법인 RAG(Retrieve-Augmented Generation)를 구현하는 데 사용됩니다. 관심 도메인을 설명하는 텍스트 문서가 수집되고 각 문서에 대해 특징 벡터("embedding"이라고 함)가 일반적으로 딥 러닝 네트워크를 사용하여 계산되고 벡터 데이터베이스에 저장됩니다. 사용자 프롬프트가 주어지면 프롬프트의 특징 벡터가 계산되고 데이터베이스가 가장 관련성이 높은 문서를 검색하기 위해 쿼리됩니다. 그런 다음 이것들은 대규모 언어 모델의 컨텍스트 창에 자동으로 추가되고 대규모 언어 모델은 이 컨텍스트가 주어진 프롬프트에 대한 응답을 생성합니다.[6]
벡터 검색 기법
고차원 벡터에서 유사성 검색을 위한 가장 중요한 기술은 다음과 같습니다.
그리고 이 기술들의 조합.[citation needed]
최근 벤치마크에서 HNSW 기반 구현은 최고의 성능을 발휘합니다.[7][8] 유사성 검색 및 응용에 관한 국제 회의, SISAP 및 신경 정보 처리 시스템 회의(NeurIPS)와 같은 회의는 대규모 데이터베이스에서 벡터 검색에 관한 대회를 주최합니다.
벡터 데이터베이스 목록
이름. | 면허증. |
---|---|
아파치 카산드라[9][10] | 아파치 라이선스 2.0 |
크로마[11][12] | 아파치 라이선스 2.0[13] |
Azure Cosmos DB 통합[14] | 독점(Managed Service) |
카우치베이스[15][16] | BSL 1.1[17] |
탄성검색[18] | 서버 측 공용 라이센스, 탄력 라이센스[19] |
FAISS[20] | MIT 라이선스[21] |
라마[22] 인덱스 | MIT 라이선스[23] |
밀부스[24][25] | 아파치 라이선스 2.0 |
몽고DB 아틀라스[26] | 서버 측 공용 라이센스(관리 서비스) |
오픈 검색[27][28][29] | 아파치 라이선스 2.0[30] |
솔방울[31] | 독점(Managed Service) |
pg[32] 벡터가 포함된 포스트그레스 | 포스그레SQL 라이센스[33] |
쿼드런트[34] | 아파치 라이선스 2.0[35] |
레디스 스택[36][37] | Redis 소스 사용 가능 라이센스[38] |
초현실적DB[39] | BSL 1.1[40] |
베스파[41] | 아파치 라이선스 2.0[42] |
위비에이티브[43] | BSD 3-Clause[44] |
참고문헌
- ^ Roie Schwaber-Cohen. "What is a Vector Database & How Does it Work". Pinecone. Retrieved 18 November 2023.
- ^ "What is a vector database". Elastic. Retrieved 18 November 2023.
- ^ "Vector database - Azure Cosmos DB". learn.microsoft.com. 2023-12-26. Retrieved 2024-01-11.
- ^ Evan Chaki (2023-07-31). "What is a vector database?". Microsoft.
A vector database is a type of database that stores data as high-dimensional vectors, which are mathematical representations of features or attributes.
- ^ "Vector database - Azure Cosmos DB". learn.microsoft.com. 2023-12-26. Retrieved 2024-01-11.
- ^ Lewis, Patrick; Perez, Ethan; Piktus, Aleksandra; Petroni, Fabio; Karpukhin, Vladimir; Goyal, Naman; Küttler, Heinrich (2020). "Retrieval-augmented generation for knowledge-intensive NLP tasks". Advances in Neural Information Processing Systems 33: 9459–9474. arXiv:2005.11401.
- ^ Aumüller, Martin; Bernhardsson, Erik; Faithfull, Alexander (2017), Beecks, Christian; Borutta, Felix; Kröger, Peer; Seidl, Thomas (eds.), "ANN-Benchmarks: A Benchmarking Tool for Approximate Nearest Neighbor Algorithms", Similarity Search and Applications, Cham: Springer International Publishing, vol. 10609, pp. 34–49, doi:10.1007/978-3-319-68474-1_3, ISBN 978-3-319-68473-4, retrieved 2024-03-19
- ^ Aumüller, Martin; Bernhardsson, Erik; Faithfull, Alexander (2017). Beecks, Christian; Borutta, Felix; Kröger, Peer; Seidl, Thomas (eds.). "ANN-Benchmarks: A Benchmarking Tool for Approximate Nearest Neighbor Algorithms". Similarity Search and Applications. Cham: Springer International Publishing: 34–49. doi:10.1007/978-3-319-68474-1_3. ISBN 978-3-319-68474-1.
- ^ "5 Hard Problems in Vector Search, and How Cassandra Solves Them". TheNewStack. 2023-09-22. Retrieved 2023-09-22.
- ^ "Vector Search quickstart". Retrieved 2023-11-21.
- ^ Palazzolo, Stephanie. "Vector database Chroma scored $18 million in seed funding at a $75 million valuation. Here's why its technology is key to helping generative AI startups". Business Insider. Retrieved 2023-11-16.
- ^ MSV, Janakiram (2023-07-28). "Exploring Chroma: The Open Source Vector Database for LLMs". The New Stack. Retrieved 2023-11-16.
- ^ "chroma/LICENSE at main · chroma-core/chroma". GitHub.
- ^ "Vector database - Azure Cosmos DB". learn.microsoft.com. 26 December 2023. Retrieved 2024-01-10.
- ^ "Couchbase aims to boost developer database productivity with Capella IQ AI tool". VentureBeat. 2023-08-30.
- ^ "Investor Presentation Third Quarter Fiscal 2024". Couchbase Investor Relations. 2023-12-06.
- ^ Anderson, Scott (2021-03-26). "Couchbase Adopts BSL License". The Couchbase Blog. Retrieved 2024-02-14.
- ^ Kerner, Sean (23 May 2023). "Elasticsearch Relevance Engine brings new vectors to generative AI". VentureBeat. Retrieved 18 November 2023.
- ^ "elasticsearch/LICENSE.txt at main · elastic/elasticsearch". GitHub.
- ^ "Faiss". 2023-09-22. Retrieved 2024-02-13.
- ^ "faiss/LICENSE". GitHub. Retrieved 2024-02-13.
- ^ Wiggers, Kyle (2023-06-06). "LlamaIndex adds private data to large language models". TechCrunch. Retrieved 2023-10-29.
- ^ "llama_index/LICENSE at main · run-llama/llama_index". GitHub. Retrieved 2023-10-29.
- ^ "Open Source Vector Database – Milvus – LFAI & DATA". Retrieved 29 October 2023.
- ^ Liao, Ingrid Lunden and Rita (2022-08-24). "Zilliz raises $60M, relocates to SF". TechCrunch. Retrieved 2023-10-29.
- ^ "Introducing Atlas Vector Search: Build Intelligent Applications with Semantic Search and AI Over Any Type of Data". MongoDB. 2023-06-22.
- ^ "Using OpenSearch as a Vector Database". OpenSearch.org. 2023-08-02. Retrieved 2024-02-07.
- ^ Pan, James Jie; Wang, Jianguo; Li, Guoliang (2023-10-21), Survey of Vector Database Management Systems, arXiv:2310.14021, retrieved 2024-02-07
- ^ "AWS debuts new AI-powered data management and analysis tools". SiliconANGLE. 2023-07-26. Retrieved 2024-02-07.
- ^ "OpenSearch license". github.
- ^ "Pinecone leads 'explosion' in vector databases for generative AI". VentureBeat. 2023-07-14. Retrieved 2023-10-29.
- ^ "pgvector". GitHub. Retrieved 2023-11-27.
- ^ "pgvector/License". GitHub. Retrieved 2023-11-27.
- ^ Sawers, Paul (2023-04-19). "Qdrant, an open source vector database startup, wants to help AI developers leverage unstructured data". TechCrunch. Retrieved 2023-10-29.
- ^ "qdrant/LICENSE at master · qdrant/qdrant". GitHub. Retrieved 2023-10-29.
- ^ "Using Redis as a Vector Database with OpenAI OpenAI Cookbook". cookbook.openai.com. Retrieved 2024-02-10.
- ^ "Redis as a vector database quick start guide". Redis. Retrieved 2024-01-31.
- ^ "Search and query". Redis. Retrieved 2024-02-10.
- ^ Wiggers, Kyle (2023-01-04). "SurrealDB raises $6M for its database-as-a-service offering". TechCrunch. Retrieved 2024-01-19.
- ^ "SurrealDB License FAQs The ultimate multi-model database". SurrealDB. Retrieved 2024-02-14.
- ^ Riley, Duncan (4 October 2023). "Yahoo spins off AI scaling engine Vespa as an independent company". siliconANGLE. Retrieved 18 November 2023.
- ^ "vespa/LICENSE at master · vespa-engine/vespa". GitHub.
- ^ "Weaviate reels in $50M for its AI-optimized vector database". SiliconANGLE. 2023-04-21. Retrieved 2023-10-29.
- ^ "weaviate/LICENSE at master · weaviate/weaviate". GitHub. Retrieved 2023-10-29.