추론 강화학습 적용한 ‘One Model 4.0’ 연구, 상위 4% 논문으로 평가 및 현장 발표 진행
SK텔레콤(CEO 정재헌)이 개인의 행동 맥락을 이해하고 추천 이유까지 설명하는 AI 추천 모델 연구 성과를 인정받아, 세계적 권위의 AI 학회 무대에 올랐다.
SKT는 싱가포르 엑스포에서 열린 국제인공지능학회 AAAI 2026에서 자체 개발 AI 추천 모델 관련 연구 논문이 현장 발표(Oral Session) 논문으로 선정돼, 1월 24일 직접 발표를 진행했다고 밝혔다.

AAAI는 NeurIPS, ICML, ICLR과 함께 세계 최고 수준의 AI 학회로 평가받는다. 올해 AAAI 2026에는 약 2만4,000편의 논문이 제출됐으며, 채택률은 18%로 전년 대비 크게 낮아졌다. 이 가운데 SKT의 논문은 전체 제출 논문 중 상위 약 4%에만 주어지는 현장 발표 대상으로 선정돼 연구 우수성을 인정받았다.
이번에 발표된 연구는 SKT가 자체 개발한 LLM(대규모 언어 모델) 기반 AI 추천 모델 ‘One Model’ 버전 4.0에 관한 내용이다. 특히 최근 AI 연구 분야에서 주목받고 있는 ‘추론 능력 강화학습(Reasoning Reinforcement Learning)’을 실제 상용 서비스 환경에 적용한 방법을 제시했다는 점에서 학계의 관심을 받았다.
‘One Model 4.0’은 고객의 클릭 이력, 이용 패턴, 관심사 등 다양한 행동 데이터를 종합적으로 이해한 뒤, ▲어떤 상품·서비스를 추천할지 ▲왜 해당 추천이 도출됐는지 ▲고객에게 전달할 메시지를 어떻게 구성할지까지 자연어로 생성하는 AI 추천 모델이다.
기존 추천 시스템이 결과 중심이었다면, ‘One Model 4.0’은 추천 과정의 맥락과 이유를 함께 설명하는 ‘설명 가능한 추천 AI’로 진화했다는 점이 특징이다. 이를 위해 AI가 여러 추론 경로를 스스로 생성·평가하며 판단 과정을 개선해 나가는 강화학습 방식을 도입해 추천의 설득력과 정확도를 높였다.
또한 SKT는 LLM 기반 추론 능력에 기존 협업 필터링 방식에서 활용해 온 선호도 점수를 결합해, 사용자의 일관된 취향과 AI의 추론 능력을 동시에 반영하는 구조로 모델을 고도화했다.
이 연구는 학술 성과에 그치지 않고 실제 서비스에 적용돼 성과를 검증했다는 점에서도 의미가 크다. ‘One Model 4.0’은 현재 요금제 추천, T월드, T멤버십, T다이렉트샵 등에 적용돼 있으며, 이전 버전 대비 클릭률 등 고객 반응이 최대 2배까지 향상된 것으로 나타났다. SKT는 연내 T우주 등 다른 서비스로도 적용 범위를 확대할 계획이다.
앞서 ‘One Model’은 2023년 첫 상용 버전 공개 이후 지속적으로 고도화돼 왔다. 버전 1.0 연구는 CIKM 2023에 채택됐으며, 버전 2.0은 SIGIR 2024에서 우수 논문상을 수상했다. 이후 버전 3.0은 CIKM 2025 워크숍을 통해 공개되며 학계의 주목을 받았다.
석지환 SKT AT/DT Data담당은 “이번 연구를 통해 SKT의 AI 추천 기술이 학문적 완성도와 실서비스 적용 가능성을 동시에 인정받았다”며, “앞으로도 연구 성과가 실제 상품과 서비스로 이어지는 실질적인 AI 연구를 지속해 나가겠다”고 말했다.
<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>















