KAIST, 기업용 AI 에이전트 정확도 최대 78% 향상 및 처리 속도 최대 20배 개선
기업의 방대한 데이터를 읽고 이해하는 AI 에이전트의 가장 큰 약점은 ‘환각(Hallucination·사실과 다른 정보를 그럴듯하게 생성하는 현상)'이다. KAIST 연구진이 문서와 데이터, 개체 간 관계를 한 번에 이해할 수 있는 차세대 데이터베이스 기술을 개발해 AI 답변 정확도를 최대 78% 높이고 처리 속도는 최대 20배 향상시키며 기업용 AI 상용화의 핵심 난제 해결에 나섰다.
KAIST(총장 이광형)는 전산학부 김민수 교수 연구팀이 교원창업기업인 (주)그래파이와 협력하여 벡터 DB, 그래프 DB, 관계형 DB 기능을 하나의 데이터베이스 관리 시스템(DBMS)에 통합한 차세대 데이터베이스 기술 '아카식DB(AkasicDB)'와 이를 기반으로 한 새로운 검색증강생성(RAG, Retrieval-Augmented Generation) 기법 '옴니RAG(Omni RAG)'를 개발했다고 6월 19일 밝혔다.

아카식DB는 벡터 DB(문서나 이미지의 의미를 숫자 벡터로 변환해 유사한 정보를 찾는 DB), 그래프 DB(사람·기업·제품 등 개체 간 관계를 저장·분석하는 DB), 관계형 DB(표 형태의 데이터를 체계적으로 관리하는 전통적인 DB)의 기능을 하나의 데이터베이스 관리 시스템(DBMS, Database Management System·데이터를 저장·관리·검색하는 소프트웨어)에서 통합 실행할 수 있도록 설계됐으며, 이를 기반으로 개발된 옴니RAG는 문서의 의미 정보와 개체 간 관계, 구조화된 데이터를 동시에 활용해 생성형 AI의 답변 정확도를 높인다.
최근 AI 에이전트는 기업이 보유한 방대한 문서와 전문 지식을 검색한 뒤 이를 바탕으로 답변을 생성하는 RAG 기술을 기반으로 빠르게 확산되고 있다. 그러나 실제 기업 데이터는 문서, 표, 개체 간 관계 등 다양한 형태로 분산돼 있어 AI가 이를 종합적으로 이해하고 활용하기 어렵다. 이 때문에 AI가 충분한 근거 없이 사실과 다른 답변을 생성하는 환각 문제가 발생하며, 이는 기업용 AI 확산을 가로막는 핵심 과제로 꼽혀 왔다.
기존 RAG는 사용자의 질문과 문서를 벡터로 변환한 뒤 의미적으로 유사한 문서를 검색해 대규모언어모델(LLM, Large Language Model·방대한 데이터를 학습해 인간과 유사한 언어를 생성하는 AI 모델)에 제공하는 방식이 일반적이다. 이러한 방식은 비정형 문서 검색에는 효과적이지만, 문서 속 개체 간 관계나 특정 기간·유형·범위와 같은 구조화된 조건을 함께 고려해야 하는 복합 질의에는 한계가 있었다.
예를 들어 "작년에 체결된 계약서 중 A사와 관련된 조항을 찾고, 해당 조항이 어떤 제품 공급 이슈와 연결되는지 설명해 달라"는 질의는 문서 의미를 찾는 벡터 검색, 개체 간 관계를 탐색하는 그래프 검색, 날짜와 유형을 필터링하는 관계형 질의가 동시에 필요하다. 기존 시스템에서는 이를 위해 여러 종류의 데이터베이스를 별도로 구축하고 응용프로그램 계층에서 결과를 결합해야 했기 때문에 관리 복잡성과 응답 지연이 발생했다.

연구팀은 이러한 문제를 해결하기 위해 벡터 유사도 검색, 그래프 탐색, 관계형 필터링을 하나의 질의와 실행 계획 안에서 통합 수행하는 옴니RAG를 제안했다. 옴니RAG는 문서의 의미 정보, 지식 그래프의 관계 정보, 표 형태 데이터의 구조적 조건을 동시에 활용해 보다 정확한 근거를 찾아내고 AI의 환각 현상을 크게 줄인다.
이를 지원하기 위해 개발된 아카식DB는 그래프 DB, 벡터 DB, 관계형 DB를 하나의 엔진으로 통합한 새로운 구조를 채택했다. 사용자는 벡터 검색, 그래프 탐색, 관계형 필터링이 결합된 복합 RAG 질의를 하나의 SQL/GQL 질의문으로 표현할 수 있으며, 아카식DB는 이를 단일 실행 계획으로 최적화해 처리한다는 설명이다.
이러한 통합 구조를 통해 아카식DB는 불필요한 중간 결과 생성과 데이터 이동을 최소화해 LLM의 토큰 사용량을 크게 줄이고 응답 지연시간도 단축한다. 실험 결과 기존 시스템에서 최대 21.3초가 소요되던 복합 검색 질의를 1초 이내로 처리해 최대 20배 이상의 성능 향상을 달성했다. 또한 옴니RAG는 기존 RAG 대비 답변 정확도를 최대 78% 향상시키는 것으로 나타났다. 이는 기업용 AI 에이전트의 핵심 과제인 환각 문제를 크게 완화할 수 있음을 보여준다.
김민수 교수는 "AI 에이전트가 기업의 방대한 데이터를 정확하게 이해하고 활용하기 위해서는 벡터, 그래프, 관계형 데이터를 하나의 시스템에서 통합 처리할 수 있는 데이터 인프라가 필수적"이라며, "아카식DB는 AI 에이전트 시대를 위한 차세대 데이터베이스 기술로, 국방·제조·금융·법률·과학기술 등 고도의 신뢰성이 요구되는 분야에서 핵심 데이터 인프라로 활용될 것으로 기대한다"고 말했다.
<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>







