음성인식, 자연어처리, 생성AI 기반 다국어 자막 서비스 제공
처음 시작은 지역 주민들의 의견을 수집하여 지역구 국회의원에게 전달하는 정치 플랫폼 서비스였다. 서비스는 지역 국회의원들의 관심을 받으며 성장했지만, 수익화하는데 실패했고 곧 이어 여러 난관에 부딪혔다. 위기는 기회라고 했던가.
문상준 대표, 멜로우컴퍼니
“우리 제품의 경쟁력은 자연어처리 엔진을 포함한 전/후처리 기술들에 있습니다. 이 기술들은 영어 및 한국어 원문의 전처리 과정을 거치며, 기계 번역 및 최종 번역 결과물이 만들어지는 전 과정에서 화자의 원래 의도를 유지하도록 설계되었습니다. 이는 번역 과정에서 의미의 정확성을 크게 향상시킵니다.”
"우리가 원래 잘하는 게 뭐였지“
전문성을 살릴 수 있는 분야로 전환하기로 결정했다. 대표는 삼성 무선사업부와 기계번역 회사에서 음성인식 및 자연어 처리 경험을 쌓았고, CTO 역시 삼성에서 10년 이상 비디오 플레이어 개발을 담당하지 않았나. 자신들에게 익숙하고 경쟁력 있는 분야로 콘텐츠 번역 서비스를 시작한 것이 지금의 기반이 되었다.
멜로우컴퍼니(대표 문상준)는 AI 기술을 활용하여 영상 콘텐츠에 대한 다국어 자막 서비스를 제공하는 인공지능 스타트업이다. 삼성전자 무선사업부를 포함한 주요 IT 기업 출신 개발자들이 함께 모인 팀으로 음성인식, 자연어처리 그리고 생성AI 기술을 활용하여 한국어 또는 영어 콘텐츠를 10개의 다른 언어로 자동 번역하는 서비스를 운영하고 있다.
SubHub 서비스 화면
Q. 멜로우컴퍼니는 AI 기술을 활용한 다국어 자막 서비스를 제공하는 스타트업이라 들었다. 여기에 남다른 자부심이 있다면.
전체 팀원중 대다수가 개발자로 구성되어 있으며, AI 기술을 깊게 이해하고 활용할 수 있는 장점을 가진 회사라고 말씀드리고 싶습니다.
회사 설립 당시부터 사회에 의미 있는 서비스를 만들고자 하는 목표를 가지고 있었는데요. 콘텐츠 크리에이터들이 하나의 콘텐츠를 만들기 위해 들이는 노력과 시간이 상당합니다. 그런 노력의 결과물을 통해 해외 시청자들과 더 많이 소통하고 더 많은 관심과 보상을 받을 수 있도록 우리 서비스가 기여하고 있다고 생각하며 큰 자부심을 느끼고 있습니다.
Q. 다국어 자막 서비스는 이미 여러 곳에서 서비스하고 있는 것으로 아는데, 회사가 그런 서비스와 다른 점은 무엇인가. 경쟁력과 차별을 꼭 집어 말한다면.
현재 콘텐츠 번역 시장에서는 생성 AI를 활용한 서비스가 두드러지는 추세로, SubHub도 이미 이러한 기술을 채택하고 있습니다. 그러나 중요한 것은 단순히 생성 AI를 사용한다는 것이 아니라, 이를 얼마나 효과적으로 활용하고 타 기술과 어떻게 통합하는가 입니다. 이러한 접근 방식은 최종 자막 품질에 큰 영향을 미칩니다.
우리 제품의 경쟁력은 자연어처리 엔진을 포함한 전/후처리 기술들에 있습니다. 이 기술들은 영어 및 한국어 원문의 전처리 과정을 거치며, 기계 번역 및 최종 번역 결과물이 만들어지는 전 과정에서 화자의 원래 의도를 유지하도록 설계되었습니다. 이는 번역 과정에서 의미의 정확성을 크게 향상시킵니다.
또한, 사용자가 자막을 편집하는 데 드는 수고를 최소화하도록 제품을 설계했습니다. 사용자가 필요한 경우 쉽게 자막을 편집하고 문제가 되는 부분을 식별할 수 있도록 하는 것이 우리 제품의 핵심 차별점입니다. 이를 통해 사용자 경험을 극대화하고 번역의 정확성과 효율성을 동시에 제공하는 것이 우리 서비스의 경쟁력이라고 생각합니다.
Q. 인공지능 관련 기술을 다루는 것만큼 개발 인력도 다를 것 같은데, 인력난이 심한 상황 속에서 멜로우컴퍼니의 상황은 어떤지. 또다른 성장 배경이 있다면.
우리 회사의 가장 큰 경쟁력 중 하나는 바로 전문성을 갖춘 팀원들입니다. 우리 팀은 10년 이상의 개발 경험을 보유한 전문가들로 구성되어 있으며, 특히, 음성 인식, 자연어 처리, 비디오 콘텐츠 분야에 대한 깊은 이해와 실무 경험을 보유하고 있습니다. 이러한 전문성을 바탕으로 음성인식 엔진, 자연어처리 엔진 등을 빠르게 개발하여 콘텐츠 번역서비스로 피벗팅할 수 있었고, 지난 5월에 본엔젤스로부터 투자를 유치하고 팁스까지 선정될 수 있었습니다.
저희 서비스가 정식으로 런칭되기 전부터, 국내의 주요 Big 3 MCN 중 하나인 트레져헌터와 함께 베타 서비스를 진행해왔습니다. 현재까지도, 소속 크리에이터들에게 지속적으로 서비스를 제공하고 있습니다. 뿐만 아니라, 온라인 강의 서비스를 제공하는 교육기업과 증권 방송 기업들과의 협력도 진행 중에 있습니다. 저희가 이러한 성과를 이룰 수 있었던 배경에는, 전문적인 경험을 갖춘 팀이 고객의 요구사항을 신속하게 파악하고 해결함으로써, 기술적 역량을 인정받은 결과라고 생각합니다.
“우리 회사에서는 이를 AI와 디지털 기술을 활용해
언어 장벽을 허무는 것으로 구체화하고 있습니다.
SubHub는 생성 AI 기술을 기반으로 실시간 번역과
AI 기반 회의록 작성 같은 디지털 플랫폼을 지
속적으로 개발하고 있습니다.
이를 통해, 고객에게 최상의 편의성을 제공하고자
하는 것이 우리의 목표입니다.”
Q. 회사를 발전시켜 나간다는 게 쉽지 않다. 가장 큰 어려움은 무엇이었으며 어떻게 극복할 수 있었는가.
저희가 직면했던 가장 큰 도전은 서비스 사용자 확보였습니다. B2C 서비스 런칭 전, 콘텐츠 제작 기업을 주요 고객으로 설정했고, 그들에게 접근하기 위해 주로 콜드 이메일과 콜드 콜 방식을 활용했습니다. 하지만 이러한 방법은 들인 노력에 비해 만족스러운 결과를 얻기 어려웠습니다.
하지만, 초기 창업 패키지에 선정된 후 수원대와 한국산업지능화협회의 도움으로 여러 중견기업들과의 1:1 미팅 기회를 얻게 되었습니다. 이를 통해 SubHub에 참여하는 기업고객들을 확보할 수 있었고, 특정 중견기업과는 글로벌 비즈니스 AI 회의록 프로젝트에서 협력할 수 있는 기회를 얻게 되었습니다. 이 자리를 통해 감사의 인사를 전하고 싶습니다.
Q. 디지털 전환과 회사의 목표는 크게 다르지 않을 것 같다. 앞으로의 계획은.
디지털 전환은 기업이 혁신적인 디지털 기술을 기존 산업 구조에 통합함으로써 비즈니스 모델과 프로세스를 변모시키는 과정입니다.
우리 회사에서는 이를 AI와 디지털 기술을 활용해 언어 장벽을 허무는 것으로 구체화하고 있습니다. SubHub는 생성 AI 기술을 기반으로 실시간 번역과 AI 기반 회의록 작성 같은 디지털 플랫폼을 지속적으로 개발하고 있습니다. 이를 통해, 고객에게 최상의 편의성을 제공하고자 하는 것이 우리의 목표입니다.
'Don't be afraid of language. Just use SubHub.' 이 슬로건을 통해, 우리의 AI 번역 서비스가 글로벌 콘텐츠 제작자와 시청자 사이의 소통을 원활하게 하고, 문화적 다양성과 이해를 증진시키는 데 기여하길 바랍니다. 우리의 비전은 전 세계 어디서나 콘텐츠를 즐기고 서로의 문화를 이해할 수 있는 포용적인 디지털 환경을 조성하는 것입니다
우리 회사 핵심 제품은요
영상 파일을 업로드하면 10가지 언어로 자막 생성해
SubHub는 AI기반 다국어 영상번역 서비스이다. 한국어 또는 영어 콘텐츠에 대한 유튜브 URL을 입력하거나 영상 파일을 서비스에 업로드하면 영상 번역 AI가 영상내 음성을 인식하고 10가지 언어로 자막을 생성하여 제공한다.
유튜브 채널을 운영하는 크리에이터의 경우에는 SubHub에 유튜브 채널을 등록하고 자막을 신청하면, 자막이 완성되는대로 YouTube에 자막이 자동으로 등록되는 기능도 제공한다.
서비스의 장점은
첫 번째로, 높은 자막 퀄리티이다. 한국어 및 영어 음성인식 정확도가 매우 우수하고, 음성인식 후 바로 기계번역 처리되는 일반적인 자막 서비스와 달리 원문에 대한 전처리 과정을 거치도록 설계되어 있어 오번역이 현저히 줄어든다.
마지막 처리 단계에서 생성 AI가 자막을 한 번 더 보완하면서 95% 수준의 AI 자막 결과를 자막 신청 후 10분 이내에 제공할 수 있다.
두 번째 장점은 사용자가 직접 자막을 편집할 수 있도록 PC기반 자막 편집 프로그램을 제공한다는 것이다. 영상을 확인하면서 원문 자막과 번역 자막을 편집할 수 있고, YouTube에 자막을 바로 업로드 할 수 있는 다양한 사용자 편의 기능을 제공한다.
<저작권자©스마트앤컴퍼니. 무단전재-재배포금지>