[ 스타트업] 밸리언트데이터 김종현 대표 “데이터 품질 검증, 도메인 커스터마이징이 빠른 저희에게 맡겨 주세요 ”

2023-02-07
신윤오 기자, yoshin@elec4.co.kr

세계 최고 AI 데이터 검증 플랫폼 기업 꿈꿔

주식회사 밸리언트데이터의 비전은 ‘세계 최고의 AI 데이터 검증 플랫폼 제공 회사’가 되는 것이다. 이에 밸리언트데이터(www.valiantdata.co.kr)는 데이터 검증 솔루션 제품군을 중심으로 사업 영역을 확장하고 있다.

데이터 검증 솔루션으로 ‘인공지능 데이터 라벨링 구문정확성 및 통계적 다양성 시험도구’를 개발하여, 한국정보통신기술협회(TTA)에 소프트웨어를 납품하였다. 한국지능정보사회진흥원(NIA)에서 주관하는 ‘인공지능 데이터 구축 사업’의 구문정확성 시험과 통계적 다양성 시험을 위탁받아 수행하고 있다.
 
김종현 대표, 밸리언트데이터
 
"저희 제품은 데이터 품질 규칙을 자동으로 생성해주는 도구를 경쟁력으로 내세워 데이터 구축에 필요한 손쉬운 컨설팅이 가능합니다. 사용자 인터페이스를 통해 가볍고 쉬운 데이터 생성 및 검증에 초점을 맞추어 자동화된 도구를 제공하고 있습니다."


또한 대한전기협회(KEA)의 ‘발전소 IoT 안전장비 적합성 시험센터 구축’ 용역 사업의 일환으로 발전소 IoT 안전장비의 표준 통신 프로토콜 검증 및 표준 데이터 모델 검증을 목적으로 하는 시험도구 개발을 진행하고 있다.

이처럼 시험도구 소프트웨어를 중심으로 인공지능 관련한 다양한 솔루션을 개발하여 제공하고 있다.


Q.  데이터의 품질 문제를 검증한다는 사업 아이템을 구체적으로 설명해 주세요.

A.  2020년도 한국정보화진흥원이 주관하는 '인공지능 학습용 데이터 구축 2차 사업'을 (신촌)세브란스병원, 연세암병원 컨소시엄과 함께 '자궁경부암 진단 영상 인공지능 데이터 구축 사업'에 참여하였습니다. 데이터 구축 사업을 진행하면서 데이터 품질에 대한 관심이 높아졌지요.

인공지능 학습용 데이터 구축 결과물은 최종 단계에서 품질 검증이 진행됩니다. 많은 시간과 크라우드 워커를 고용하여 구축된 데이터는 다양한 종류의 휴먼 에러의 가능성이 있습니다. 이러한 데이터의 품질 문제를 개발 중간 단계에서 확인하고 검증할 수 있다면, 정부와 기업 입장에서 많은 수고와 비용을 절약할 수 있을 것이라 생각했습니다.

이에 표준 형태(JSON, XML)의 데이터에 대한 형식 검사와 데이터 모델에 대한 검사를 할 수 있는 도구를 만들게 되었습니다. 또한 개발 과정에서는 자동화된 도구를 통해 데이터 검사규칙(스키마)을 생성하고, 조건을 추가하고, 검증할 수 있는 새로운 기능도 추가하게 되었습니다.


Q.  데이터 품질을 검증을 같이 하는 회사도 늘어나는데, 이 중에서 밸리언트데이터의 경쟁력은 무엇이라고 생각하는지.

A.  회사의 주력제품인 ‘인공지능(AI) 라벨링 데이터 구문정확성 및 통계적 다양성 검증 도구(PASSBUCKET)’는 현재 ‘인공지능 데이터 구축 사업’의 시험 도구 및 위탁 시험 업체로 매출을 올리고 있습니다. 해당 사업에서 선도적으로 시험 수행을 하는 굴지의 경쟁사가 존재합니다만 우리 회사는 경쟁사를 경쟁의 상대로 보지 않고 서로 협력하여, 해당 업체가 수행 할 수 없는 시험을 수행하고 있습니다.

중앙정부의 대규모 품질 검증 시험은 시장 선도 업체가 주로 하지만, 산업 도메인 별로 필요한 데이터 구축 컨설팅 및 데이터 검증은 컨설팅이 수반되는 데이터 품질 검증이 요구되기 때문에 밸리언트데이터와 같이 소규모지만 도메인 커스터마이징이 빠른 업체가 유리하다고 생각합니다.

특히 저희 제품은 데이터 품질 규칙을 자동으로 생성해주는 도구를 경쟁력으로 내세워 데이터 구축에 필요한 손쉬운 컨설팅이 가능합니다. 사용자 인터페이스를 통해 가볍고 쉬운 데이터 생성 및 검증에 초점을 맞추어 자동화된 도구를 제공하고 있습니다.


 내가 보는 디지털 전환이란 

제가 보는 디지털 전환은 데이터 상호운용성이다. 상호운용성이라 함은 다양한 기기, 시스템에서 약속된 프로토콜 혹은 데이터 모델이 호환되어 동작하는 것을 말한다. 지난 시간동안에는 통신 프로토콜 위주로 상호운용성이 중요시 되었었다. 가령, Wi-Fi, Bluetooth 통신과 같은 표준 통신 규격이다. 

초기에는 상호 운용성을 위해 많은 노력과 시행착오가 필요했지만, 지금은 중국의 작은 업체에서도 관련 기술이 포함된 제품 개발을 할 수 있을 정도이다.디지털 전화도 마찬가지이다. 산업 도메인에서 상호운용이 가능한 데이터 모델을 수집하고, 공통 부분을 표준화하고, 이를 다시 보급하는 것이 디지털 전환의 핵심이라고 생각한다.



Q.  인력 구성 면이나 개발 환경 면에서 회사의 경쟁력이 있다면.

A.  저희 회사의 경쟁력은 구성원입니다. 백엔드, 프론트 개발부터 정부기관에서의 표준화, 시험, 인증 경험을 가진 대표를 주축으로 구성원은 각자의 비전이 있습니다. 또한 사람과 인성이 먼저라는 생각으로, 좋은 팀원이 하나씩 모여 하나의 조직 구성하여 고객사가 요구하는 기술 개발 사항을 최적의 솔루션으로 보답하고 있습니다.
각 개인 구성원 별로는 각 분야에서 성장이라는 키워드를 가지고, 5년 후 모습을 꿈꾸며 업무에 임하고 있습니다. 또한 팀원 간의 자율과 소통을 중시하여 각자 가진 비전과 실력에 대한 공유를 많이 합니다. 개인의 자율과 역량을 중시하며, 각자 가장 잘 할 수 있는 일을 찾아 할수 있도록 회사 차원에서 노력하고 있습니다.
클라우드가 대세인 요즘 시대에 자체 개발 서버를 구축하여, 개발자 역량을 자유롭게 성장 시킬 수 있도록 개발단계를 갖추고 있습니다. 또한 도커 기반의 배포 시스템을 통해 개발부터 운영까지 모두 경험 할수 있는 인프라를 구축하고 있습니다.


Q.  데이터 하나로 회사가 성장하고 있는데, 그 성장의 배경을 꼽는다면요.

A.  데이터는 수 십 년 전에도 존재했고, 앞으로도 존재할 예정입니다. 모든 시스템은 데이터를 중심으로 동작하고 있습니다.
다만 그동안에는 데이터에 대해 기술 개발 목적의 일부였으며, 공유가 필요없는 솔루션 형태였기 때문에 중요성이 부각되지 못했습니다. 하지만 지금은 정보의 양이 너무 많고, 급격한 변화 속에 살고 있기 때문에 데이터에 대한 필요성이 급격히 중요해졌습니다.

저희 회사의 핵심은 데이터입니다. 밸리언트데이터의 성장 배경에는 데이터에 대한 인사이트를 기반으로 솔루션을 설계하는데 있습니다. 그동안 산업 도메인에서 개발자의 전유물이였던 데이터 영역이 통신 인프라 및 IT 기술의 발전과 사회 환경적 변화로 운영 담당자까지 알아야 하는 상황이 되었습니다. 수년간 도메인 분야에 종사했던 운영 담당자는 당황할 수 밖에 없습니다. 이러한 각 도메인의 담당자에게 쉽고, 유용한 데이터 관련 인사이트와 솔루션을 제공하는 것이 저희 회사의 성장 배경인 것 같습니다.


Q.  고객에 대한 생각도 남다른 듯 보입니다만.

한번 찾은 고객은 있어도, 한번만 찾은 고객을 없도록 찾아주시는 고객에게 최선을 다하고, 100을 원하시면 200, 300을 돌려드리자는 마음으로 고객 응대를 하고 있습니다.

이는 저희 회사의 경영철학인 저희가 가진 데이터 플랫폼을 통해 전 세계적으로 선의의 힘을 이루기 위해, 누군가에게 도움이 되는 회사가 되는 것을 비전으로 운영하고 있습니다.

기술적으로는 최신의 프론트엔드 기술로 고객 담당자들에게 쉽고 편리한 인터페이스를 제공하고 있으며, 백엔드 기술로는 C기반의 통신장비를 개발했던 기술을 기반으로 빅데이터 인프라 구축 노하우까지 다양하게 갖추고 있어 고객사가 요구하는 요구사항에 맞는 솔루션 컨설팅을 하고 있습니다.


Q.  회사를 경영해 오면서 마냥 쉽지만은 않았을 것 같습니다. 어떤 어려움이 있었으며 이를 어떻게 극복하고 있는지요.

A.  마케팅입니다. 저희 제품은 이미 사업 초기부터 중소기업 지원 및 데이터가 생소한 도메인 전문가에게 보급할 생각으로 개발되었습니다. 하지만 견고한 제품 개발을 위해 인건비를 사용하고, 주요 사업 추진하다보니, 제품이 소비자에게 다가갈 수 있도록 하는 마케팅 영역에 신경을 크게 쓰지 못했습니다. 지난 한해 국가주도의 다양한 데이터 검증 경험을 바탕으로 저희 도구는 더욱 견고해졌습니다. 이를 바탕으로 올해는 공격적인 마케팅을 진행할 예정입니다.
 

Q.  향후 기업의 로드맵과 목표를 무엇인가요.

A.  저희 회사에서는 도메인 별로 표준 통신 프로토콜과 이와 연계된 데이터 모델에 대한 표준화 작업에 적극적으로 참여할 예정이며, 도메인 별로 제정되는 기술 표준화와 시험 표준화 동향을 팔로우업하여 국제 공인시험소를 운영할 계획입니다.
통신 프로토콜 시험도구와 함께 데이터 모델 및 프로파일 시험을 필수적인 시대로 접어들 때 즈음, 밸리언트데이터는 한발 더 도약할 것으로 확신합니다.



# 우리 회사 핵심 제품은요

기계학습 모델별로 유의변수의 영향도 분석

밸리언트데이터의 주요 솔루션으로는 ‘인공지능 데이터 자동 모델링 및 컨설팅 툴킷’이 있다. 다종의 유의변수와 종속변수를 CSV 형태로 입력하면, 7가지의 기계학습모델에 대한 성능평가를 자동으로 진행하고, 각 기계학습 모델별로 유의변수의 영향도를 분석해주는 자동화 도구를 개발하여 현장에 사용하고 있다.

이와 관련하여 정부사업으로는 중소기업벤처부에서 주관하는 ‘자동차 부품산업을 위한 가치사슬 플랫폼 기술 개발’에 참여하여 한솔코에버(주), 생산기술연구원, 경부테크노파크 컨소시엄으로 오디오 AI 기반 기계설비 고장 진단 기술 개발에 참여하고 있다. 산업통산자원부에서 주관하는 디지털 혁신 중견기업 육성 사업에 참여하여, (주)코맥스와 ‘디지털 공동주택 교통안전을 위한 AI 기반 교통량예측, 위험성 평가 및 사용자 서비스 솔루션 개발’을 진행하고 있다.

1. 인공지능(AI) 라벨링 데이터 구문정확성 및 통계적 다양성 검증도구(PASSBUCKET)

• 개발 동기: ▲인공지능 학습용 데이터 개방을 위한 데이터 품질 향상 ▲인공지능 학습용 라벨링데이터의 오류로 인한 인공지능 모델 학습 개발 자원 낭비(인력, 전기, 디버깅 시간 등).
• 주요 기능: ▲인공지능 학습용 데이터 통계 분포 분석 ▲데이터 구조 오류 검증 - 선언된 구문규칙(스키마) 준수 검증 ▲데이터 형식 오류 검증 - 허용범위, 표현방식 준수 검증 등.

2. 표준기반 e-IoT 프로토콜 에뮬레이터

• 개발 동기: ▲발전소 IoT 안전장비 적합성 시험 센터 운영을 위한 기술 개발 ▲e-IoT 기반 통신 프로토콜의 데이터 프레임을 직관적으로 파악하기 위한 통신 프로토콜 에뮬레이터 개발
• 주요 기능: ▲e-IoT디바이스/게이트웨이/플랫폼 기능 구현(서버-클라이언트) ▲e-IoT 플랫폼 stateful 에뮬레이팅기능 구현▲인공지능 IoT 디바이스/플랫폼 프로토콜 메시지 송신 및 수신 기능 등

3. 기계학습 인공지능(AI) 검증 및 컨설팅 툴 킷

• 개발 동기: ▲스마트공장 현장 제조실행시스템(MES)데이터 분석을 위한 범용성 인공지능 분석 도구 필요 ▲제조 현장 별 상이한 데이터 구조로 인한 인공지능 솔루션 개발의 자원 낭비 심각.
• 주요 기능: ▲제조실행시스템(MES) 데이터 입력 기능 ▲데이터 항목별 Feature, Label, Timestamp 가변 형식 지정 ▲기계학습 기반 인공지능 모델 8개 분석 동시, 선택 수행 기능 등
 

<저작권자©스마트앤컴퍼니. 무단전재-재배포금지>


100자평 쓰기

관련 기사

오피니언
2023 및 2024 베스트 제품
스타트업이 뜬다
기술 리포트가 뜬다