새로운 배치 선택으로 21% 및 59% 향상
딥러닝(심층 학습)의 비약적인 발전으로 다양한 응용에서 머신러닝(기계 학습)의 성능을 크게 앞지르고 있다. 심층 학습에서 다루는 심층 신경망은 높은 표현력으로 높은 정확도를 달성할 수 있지만, 그로 인해 최적의 성능을 얻기 위한 학습 과정도 더욱 복잡해지고 어렵게 되었다.
KAIST(총장 신성철) 전산학부 이재길 교수 연구팀은 딥러닝 모델의 예측정확도와 훈련 속도가 대폭 향상된 새로운 모델 학습 기술을 개발했다고 밝혔다.
딥러닝 모델을 학습하는 과정은 반복적으로 모델의 매개변수를 최적화하는 단계로 이뤄진다. 반복마다 훈련 데이터로부터 일부(예: 32개) 데이터를 선정해 최적화에 사용하는데 이때 선정된 데이터 샘플을 배치(batch)라 부른다. 무작위로 배치를 선택하면 최고의 정확도가 항상 보장되지 않기 때문에 이런 문제점을 개선하기 위해 최근 인공지능 학계에서는 더 나은 배치 선택 방법에 관한 연구가 활발히 진행되고 있다.
최적의 배치(batch) 구성
이재길 교수 연구팀이 개발한 기술은 심층 학습 모델의 학습 진행 상황에 맞게 최적의 배치를 구성하도록 하는 기술이다.
배치 선택에서는 현재 모델 학습 단계에 가장 도움이 되는 데이터를 효과적으로 선택해야 한다. 도움이 될지를 판단하기 위해 이재길 교수팀이 개발한 방법은 해당 데이터에 대한 이전 추론 결과를 활용한다. 단계별 추론단계에서 결과가 매우 일관적일 경우, 해당 데이터가 너무 쉬어 계속 맞추거나 반대로 너무 어려워 전혀 맞추지 못한다고 볼 수 있다.
연구팀은 새로 개발한 배치 선택 방법론을 ‘최신 편향(Recency Bias)’이라고 이름을 붙이고 이미지 데이터에 널리 활용되는 다양한 합성 곱 신경망(CNN)의 학습에 적용했다. 그 결과, 기존 방법론 대비, 예측정확도(이미지 분류 문제)에서 최대 21% 오류를 감소시키는 한편 훈련 속도(심층 신경망 미세 조정 문제)에서는 최대 59% 시간을 단축했다.
제1 저자인 송환준 박사과정 학생은 “이번 연구는 심층 학습의 핵심 기술” 이라면서 “다양한 심층 신경망에 폭넓게 적용할 수 있어 심층 학습의 전반적인 성능 개선에 기여할 것”이라고 밝혔다. 연구팀을 지도한 이재길 교수도 “이 기술이 텐서플로우(TensorFlow) 혹은 파이토치(PyTorch)와 같은 기존의 심층 학습 라이브러리에 추가되면 기계 학습 및 심층 학습 학계에 큰 파급효과를 낼 수 있다”고 기대했다.
<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>