모바일 컴퓨팅 시장서 PC/서버 시장으로
ARM vs. Intel: 가열되는 아키텍처 경쟁
  • 2012-06-04
  • 윤범진 기자, master@elec4.co.kr

다양한 프로세서 코어 개발을 추진함과 동시에 라이선시 기업 수를 계속해서 늘려가고 있는 ARM. 세계 최대 반도체 칩 메이커인 인텔도 모바일 컴퓨팅 시장에서만큼은 ARM과 힘겨운 경쟁을 하고 있다. 그러나, 본 게임은 이제부터 시작이다.

영어에 “Wag the dog”라는 말이 있다. 꼬리가 몸통을 흔든다는 말이다. 이러한 현상이 프로세서 시장에서도 벌어지고 있다. 마이크로소프트(MS)와 함께 ‘윈텔 동맹’을 결성해 PC 시대를 지배해온 인텔은 오랫동안 프로세서 시장의 패권자로 군림해왔다. 그러나, 천하의 인텔도 모바일 컴퓨팅 시장에서만큼은 ARM의 기세를 꺾지 못하고 있다. 그런데도 전통적인 컴퓨터 시장을 제외한 소위 임베디드 시장을 움직여온 보이지 않는 ‘권력(ARM)’의 존재를 아는 사람은 많지 않다. 전 세계 일반 핸드폰의 95%, 스마트폰의 85%가 ARM 프로세서를 기반으로 디자인되고 있는데도 말이다(그림 1 참조).
인텔 진영과 ARM 진영은 프로세서 시장의 사실상 양대 축이라고 말할 수 있다. 그간 두 진영은 각각 PC와 모바일 컴퓨팅 시장을 주무르며 서로의 영역을 다져왔다. 그 균형이 깨지기 시작한지는 그리 오래 되지 않았다. 2010년부터 본격적으로 양진영 간 팽팽한 긴장감이 감돌기 시작했다. PC 시장에서 모바일 시장으로 영역을 확대하려는 인텔 진영과 이를 방어하려는 ARM 진영 간의 경쟁이 수면 위로 떠오르기 시작한 것이다. 인텔은 CES 2010에서 자사의 아톰(Atom) 프로세서와 그래픽 프로세서(GPU)를 하나의 패키지에 통합해 크기와 전력소모 면에서 장점을 꾀한 모바일 플랫폼 ‘무어스타운(Moorestown)’을 탑재한 스마트폰을 실제 구현해 경쟁이 본격화 될 것임을 예고했다. 당시 무어스타운을 탑재한 핸드폰을 최초로 선보인 회사는 LG전자(그림 2). LG전자는 4.8인치 1024×480 해상도의 풀 터치스크린 디스플레이와 리눅스 기반의 모블린(Moblin) 2.1을 탑재한 GW990 모델을 개발했다. 한편, ARM 계열에서는 퀄컴이 스마트폰용으로 개발한 1 GHz의 스냅드래곤(Snapdragon) 애플리케이션 프로세서를 선보였다.


경계 파괴
현재 ARM 진영은 인텔 x86 아키텍처가 압도적인 점유율을 차지하고 있는 PC/서버 장비 시장을, 인텔을 비롯한 x86 진영은 ARM 진영의 텃밭이라고 할 수 있는 핸드폰 및 태블릿 시장에 공세를 강화하고 있다. 사실상 이 경쟁의 시작은 지금으로부터 4년 전인 2008년으로 거슬러 올라간다. 그해 인텔은 1세대 아톰 프로세스 플랫폼인 멘로우(Menlow)를 발표하며 ARM 아키텍처가 지배하고 있는 모바일 시장에 선전포고를 했다. 그러나 결과는 ‘찻잔 속 태풍’ 수준에 그쳤다. 절치부심한 인텔은 2010년 5월에 1세대보다 대기전력을 1/50 수준으로 낮추고 전력 소모량을 최소화 한 2세대 아톰 프로세서 기반 플랫폼(코드명 무어스타운)을 공개했다. 하지만 무어스타운마저도 ARM의 기세를 꺾기엔 역부족이었다. 무어스타운이 밀린 진짜 이유는 성능이라기보다는 저전력 실현의 실패라고 할 수 있다.
전열을 재정비한 인텔은 2011년 아톰 프로세서 기반의 모바일 칩셋 ‘메드필드(Medfield)’를 발표하며 자존심 회복을 선언했다(그림 3). 2013년 출시 예정인 메드필드 Z2580은 종전 스마트폰용 싱글 코어 제품에 비해 그래픽 성능이 더욱 강화되며 전력 효율에도 신경을 써 준비를 하고 있는 것으로 알려졌다. 인텔은 CES 2012에서 메드필드 칩셋을 사용한 레퍼런스 폰이 브라우저마크 테스트에서 구글의 레퍼런스 폰 갤럭시 넥서스(Galaxy Nexus)보다 빠른 스코어를 기록했다고 발표하기도 했다. 메드필드 Z2580을 채택한 제품은 2013년부터 레노보 K800을 시작으로 오렌지, ZTE, 모토로라 등 다양한 제조사에서 순차적으로 선보일 예정이다.
인텔은 현재 아톰 기반 싱글 코어 프로세서를 스마트폰용으로 제공하고 있다. 이 경우에도 멀티 코어 ARM 기반의 CPU에 비해서도 더 높은 성능을 보이지만 안드로이드 기반의 스마트폰 기준으로 봤을 때 ARM 제품에 비해 상대적으로 소비전력이 높은 것이 사실이다.
이에 대해, 흔들림 없이 자기 페이스를 지켜온 ARM은 2010년 9월에 스마트폰부터 서버까지 적용 가능한 프로세서 코어 Cortex-A15를 발표했다. 또한 마이크로소프트는 CES 2011에서 Windows OS의 차기 버전인 Windows 8이 엔비디아, 퀄컴, 텍사스 인스트루먼트(TI)의 ARM 기반 SoC에서도 동작할 것이라고 발표했다(그림 4). 이는 지난 30년간 이어졌던 ‘윈텔 동맹’의 붕괴를 알리는 선언과도 다름없는 일대 사건이라고도 할 수 있다.


ARM vs. 인텔 제국
x86 계열 프로세서의 맹주 인텔과 MS 간 동맹은 햇수로 30년 넘게 끈끈한 연대를 형성해왔다. 이 동맹관계가 금이 가기 시작한 건 스마트폰과 태블릿 PC로 대표되는 모바일 혁명이 일면서다. 실제로 시장조사 기관 IDC에 따르면, 2010년에 스마트폰 판매 대수(1억 20만 대)가 처음으로 PC 판매 대수(9,200만 대)를 넘어섰다. 요즘 잘 나간다는 스마트폰의 85%는 ARM 아키텍처에 기반을 두고 있다.
모바일 컴퓨팅 시장에서 ARM 아키텍처는 사실상 독점적 지위를 누리고 있다. 인텔과 달리, 반도체 칩을 직접 제조하지 않는 ARM은 고객사와 경쟁하지 않는 비즈니스 모델이다. 따라서,  매출은 IP를 라이선스한 고객사(라이선시, licensee)의 실적에 크게 의존한다.
ARM의 라이선스 방식은 두 가지, 일반 라이선스와 아키텍처 라이선스로 나뉜다. 일반 라이선스(사용권)를 소유한 기업은 미리 설계된 프로세서 IP 코어를 자사의 시스템 칩(SoC)에 내장하게 된다. 이 경우 제품 개발은 용이하나, 타사 제품과의 차별화에 한계가 있을 수 있다. 그러나 일반 라이선스라고 해서 차별화가 불가능한 것은 아니다. 예컨대 ARM 프로세서 디자인 회사 인트린시티(Intrinsity)가 제공하는 동적 로직 및 신호 코딩 기술인 Fast14를 이용하는 방법이 있다.
삼성전자는 자사의 Cortex-A8를 탑재한 허밍버드(Hummingbird) 프로세서에 적용하기 위해 인트린시티로부터 Fast14의 라이선스를 취득했다. 2010년 4월에 인트린시티가 애플에 인수되면서, Fast14는 애플의 Cortex-A8를 기반으로 한 A4에 구현됐다. Fast14을 통해, 애플과 삼성의 프로세서는 동일한 공정 기술이면서도  다른 Cortex-A8 일반 라이선스 기업보다 훨씬 높은 동작 속도를 구현했다.
한편, 아키텍처 라이선스를 소유한 기업은 자체적인 마이크로아키텍처를 설계할 수 있는 등의 설계 자유도는 높지만, 그에 따른 칩 설계상의 문제가 증가하게 된다. 당연히 ARM 명령어 세트의 전체 버전과의 호환성을 유지해한다. 그 외에 독자적인 명령어 세트의 개발과 기본 회로의 변경이나 확장이 가능하다. 현재 ARM 아키텍처 라이선스를 소유한 기업은 인텔, 마벨 테크놀로지 그룹, 마이크로소프트, 엔비디아, 퀄컴, 인피니언 테크놀로지 등이 있다. 퀄컴은 ARM Cortex 패밀리의 명령어 세트인 ARMv7에 기반을 둔 애플리케이션 프로세서 전용 스콜피온(Scorpion)을 개발했다.
스콜피온의 제조 공정은 당초 65 nm 이었지만 45 nm 공정으로 변경됐다. 2010년 중반엔 독자적으로 듀얼 코어화를 달성했다. 발표된 제품으로는 1.2 GHz의 MSM8260과 MSM8660이 있다. 스콜피온의 기능은 듀얼 코어인 것과 Cortex-A9의 아웃 오브 오더 실행을 일부 지원하고 있기 때문에 Cortex-A8과 Cortex-A9의 중간에 위치한다고 할 수 있다. 또한 스콜피온 아키텍처를 탑재한 모바일 프로세서 스냅드래곤은 Cortex-A8, Cortex-A9과 마찬가지로 FPU(Floating-Point Unit)과 NEON 고급 SIMD 명령어 세트를 구현하고 있다. 그러나, FPU가 파이프라인 형식으로 실현돼 있다는 것과 NEON의 연산 비트 수가 Cortex-A9의 2배인 128비트로 되어 있다는 점이 다르다(그림 5).

ARM 역사를 다시 쓴 ‘Cortex-A’
x86 아키텍처와 경쟁하는 ARM 주력 제품인 애플리케이션 프로세서 코어 Cortex-A 시리즈의 첫 제품은 2005년 10월에 발표된 Cortex-A8이다. 당시 Cortex-A8(코드명 타이거)는 2,000 DMIPS 성능과 65 nm 기술로 300 mW 이하의 전력을 소비하는 ARMv7 아키텍처에 기반해서 설계됐다. Cortex-A8는 ARM 최초로 두 명령을 동시에 실행하는 듀얼-이슈(dual-issue) 수퍼스칼라 구조라는 혁신이 단행됐다. 파이프라인의 단수도 ARM11의 8단에서 13단으로 늘림으로써 IPC(Instruction Per Clock, 클록당 처리 가능한 명령어 수)의 효율을 높이면서도 처리 성능은 메가헤르츠(MHz)당 2.0 DMIPS까지 높였다. 또한 기존의 코드 압축 기술인 Thumb에 비해 처리 속도가 30% 빨라지고 32비트 코드에 비해 메모리 사용률을 30% 적게 한 Thumb-2 기술과 H.264와 같은 미디어 코덱을 가속화하는 NEON 신호 처리 확장 기술이 최초로 구현됐다.
2007년 10월 발표된 Cortex-A9는 성능을 2.5 DMIPS/MHz까지 높였다. 코어당 파이프라인 단수는 8단으로 줄였지만 여러 명령어를 동시에 실행하는 수퍼스칼라 구조와 아웃 오브 오더 실행을 사용해 IPC의 평균치를 향상시키는 데 성공했다. Cortex-A9 이후 발표된 Cortex-A 시리즈 제품은 쿼드 코어까지 지원한다. 2010년 9월에 발표한 Cortex-A15(코드명 이글)은 서버 시장에서 x86과의 경쟁까지도 염두에 둔 쿼드 코어 제품이다(그림 6).

인텔의 대응
ARM은 다양한 프로세서 코어 개발을 추진함과 동시에 라이선스 기업의 수를 꾸준히 늘려가고 있다. 또한 Windows 8의 ARM 아키텍처에 대한 지원까지도 결정됐다. 이러한 ARM 진영의 파상공세에 인텔이 컴퓨터 시장에서 철퇴를 맞을 것이란 관측도 있다. 그러나, 인텔은 이런 공세에 대응할 수 있는 충분한 자산을 소유하고 있는 회사라는 점을 잊지 말아야 한다. 예를 들어, 인텔의 경영진은 아톰 프로세서의 제조 공정을 14 nm까지 미세화할 계획까지 발표했다(그림 7, 8). 아톰의 최신 제품인 핸드폰 전용의 메드필드와 태블릿 전용의 오크 트레일(Oak Trail)은 32 nm 공정에서 제조된다. 또한 오크 트레일은 MS의 Windows 7에서 인식할 수 있는 PCI(Peripheral Component Interconnect) 버스를 지원한다.



인텔뿐만 아니라, AMD와 VIA 테크놀로지스도 x86 아키텍처를 기반으로 저전력을 특징으로 하는 제품을 적극적으로 개발하고 있다. AMD는 2010년 9월에 발표한 저전력 프로세서 코어 밥캣(Bobcat)을, 그래픽 기능을 통합한 프로세서 제품 퓨전(Fusion)에 채용했다. VIA도 듀얼 코어 CPU인 Nano X2를 발표했다.
한편, x86 진영의 업체들이 ARM 진영에서도 맹활약할 가능성이 높다. 인텔은 엑스스케일(Xscale)을 마벨에 매각한 2006년 중반에 ARM에 라이선스를 반환했다. 그러나, 2010년 8월 인피니언 테크놀로지스(Infineon Technologies)의 무선 통신 부문을 인수함으로써 다시 ARM 아키텍처를 라이선스했다. VIA도 넷북 등의 모바일 기기용으로 ARM 아키텍처를 이용한 SoC를 개발하고 있다.

Everywhere ARM
ARM의 프로세서 원천기술을 바탕으로 현재 엔비디아, 텍사스 인스트루먼트, 애플, 삼성전자, 퀄컴 등이 애플리케이션 프로세서를 개발하고 있다.
엔비디아는 2003년 8월에 휴대기기용 GPU 벤더 미디어큐(MediaQ)와 2006년 11월에  iPod용 프로세서 제조사로 유명한 포털플레이어(PortalPlayer)의 인수를 통해 ARM 아키텍처를 이용한 SoC 개발을 위한 기술을 확보했다. 엔비디아가 개발한 1세대 테그라 (Tegra) 1은 ARM11 코어를 탑재했으며, MS의 휴대용 멀티미디어 플레이어 Zune HD와 핸드폰 킨(KIN)에 탑재되는 등 일정 부분 성공을 거뒀다. 2세대 제품인 테그라 2는 듀얼 코어 Cortex-A9 프로세서 코어를 채용했다. 2011년 11월 공식 발표된 테그라 3는 쿼드 코어 제품으로, 그동안 프로젝트 ‘칼-엘(Kal-El)’로 알려졌던 모바일 애플리케이션 프로세서다(그림 9). 테그라 3는 테그라 2에 비해 최고 3배 빨라진 그래픽 성능과 최대 61%의 전력 소비를 감소시켜 12시간 동안 HD급 비디오 재생이 가능하다. 특히, 엔비디아가 현재 특허 출원중인 vSMP(variable Symmetric Multi-Processing, 가변 대칭형 다중처리)라는 새로운 기술을 채택해 저전력을 요구하는 작업은 쿼드 코어 외에 다섯 번째 코어인 ‘컴패니언(Companion)’ 코어를 통하여 처리해 전력 소모량이 듀얼 코어보다도 낮아진다.
TI는 ARM의 가장 오랜 라이선시 기업 중 하나다. TI가 개발해 온 SoC는 ARM 프로세서 코어와 이미지네이션 테크놀로지(Imagination Techno
logies)의 그래픽 프로세서 IP PowerVR를 통합한 제품이 유명하다. 그 동안 직접 개발한 전용 기능 블록과 범용 DSP 성능을 보완한 것도 있다. TI는 지금까지 ARM이 새로운 프로세서 코어를 발표할 때마다 가장 먼저 도입한 업체이기도 하다.
TI는 MWC(Mobile World Cogress) 2011에서 LG전자의 옵티머스 3D와 리서치인모션(Research In Motion Limited, RIM)의 첫 번째 태블릿 단말기인 블랙베리 플레이북 (BlackBerry PlayBook) 등을 위한 OMAP4 제품군의 첫 제품인 OMAP4430을 양산하고 있음을 밝혔다. OMAP4430은 엔비디아의 테그라 2와 마찬가지로 1 GHz로 동작하는 2개의 Cortex-A9 코어를 탑재하고 있다. 두 개의 코어가 1 M바이트의 L2 캐시를 공유하는 것도 동일하다. 테그라 2와 다른 기능으로는 약 300 MHz로 동작하는 PowerVR SGX 540이다. 이 동작 속도는 PowerVR SGX 540을 탑재한 경쟁사의 SoC보다 약 50% 빠르다. 또 메인 메모리는 400 MHz로 동작하는 2개의 32비트 저전력(LP) DDR2 SDRAM이다. 두 개의 Cortex-A9 프로세서는 MPE(미디어 프로세싱 엔진)의 형태로, NEON의 SIMD 명령어 세트에 의한 부동소수점을 채용한 벡터 연산을 지원하고 있다(그림 10).



TI는 2010년 12월 OMAP4430을 향상시킨 OMAP4440을 발표했다. OMAP4430과 마찬가지로 OMAP4440도 45 nm 공정으로 제조된다. TI에 따르면, OMAP4440은 Cortex-A9의 클록 속도를 1.5 GHz로 높인 것 외에 OMAP4430에 비해 전체적인 그래픽 성능을 25% 향상시켰다.
Cortex-A9 개발에서 엔비디아에 뒤진 바 있는 TI는 ARM 최신 애플리케이션 프로세서 코어인 Cortex-A15에 대해서는 발빠른 행보를 보이고 있다.
TI가 발표한 OMAP5는 첫 번째 제품에서 Cortex-A15를 듀얼 코어로 탑재하고 동작 주파수는 최대 2 GHz로 올렸다. 2개의 코어가 공유하는 L2 캐시 용량은 OMAP4의 2배인 2 MB 이다. 그래픽 프로세서는 PowerVR SGX 544를 채용했다. 제조 공정은 28 nm. OMAP5는 영상 및 이미지 처리, 디지털 신호 처리, 디스플레이 처리, 보안 처리에 대해 각각 전용의 기능 블록을 가지고 있다. 또한, ARM의 마이크로컨트롤러(MCU)용 프로세서 코어 Cortex-M4를 2개 사용해 실시간 처리에 대응하고 있다(그림 11). 현재 OMAP5는 스마트폰 전용의OMAP5430과 태블릿 전용의 OMAP5432라는 두 종류가 준비돼 있다.


애플은 iPad, iPhone, iPod 터치, 2세대 Apple TV 등에 ARM 프로세서 코어에 기반을 둔 SoC인 A4를 탑재하고 있다. 애플의 A4 개발은 2008년 P.A. Semi와 2010년 인트린시티(Intrinsity) 두 회사의 인수를 계기로 급속하게 진행됐다. A4는 1개의 Cortex-A8 코어와 PowerVR SGX 535, 용량 640 K바이트의 L2 캐시 메모리를 갖추고 있다(그림 12). A4는 iPhone 4와 1세대 iPad, 4세대 iPod 터치, 2세대 Apple TV에 채용됐다. 프로세서 동작 주파수는 기기에 따라 다른데, iPod 터치는 800 MHz, iPad는 1 GHz이다.



iPhone과 iPod 터치에 사용된 A4는 이전 세대 모델에 탑재된 삼성 ARM 아키텍처 기반 SoC를 대체했다.
애플과 마찬가지로 삼성 반도체 부문도 자사의 휴대전화 전용으로 모바일 프로세서 허밍버드(Hummingbird)를 공급하고 있다. 삼성은 MWC 2011에서 자사의 차세대 SoC인 엑시노스(개발 코드명 오리온)를 탑재한 스마트폰 GALAXY S II를 발표했다. 듀얼 코어 구성의 Cortex-A9 코어를 1 GHz로 작동시키는 엑시노스(Exynos)는 허밍버드에서 채용한 PowerVR 대신에 ARM이 자체 개발한 그래픽 프로세서인 Mali 400MP를 도입했다. 현재, Mali-400MP 대비 10배 향상된 그래픽 성능을 제공하는 Mali-T658 GPU도 출시된 상태다. Mali-T604를 기반으로 개발된 Mali-T658은 최대 8개 코어까지 확장이 가능하며, 각 코어 내 연산 파이프라인을 두 배로 늘림으로써 극적인 성능 향상에 성공했다. 이 GPU는 ARMv8 아키텍처와도 호환된다.
퀄컴과 마벨 테크놀로지는 ARM 프로세서 IP에 대한 아키텍처 라이선스를 보유하고 있다. 따라서 일반 라이선스가 있는 경쟁사에 비해 설계 유연성이 있다고 할 수 있다.
퀄컴의 스콜피온 아키텍처 기반 SoC는 여러 세대의 공정 기술을 넘어 제조되고 있다. 스콜피온은 지난 몇 년 동안 수많은 고객의 다양한 핸드폰에 채용됐다. 이어, 퀄컴은 MWC 2011에서 독자 개발한 차세대 프로세서 코어 크레이트(Krait)를 발표했다. 크레이트는 ARMv7 명령어 세트와 호환성을 유지하고 있다. 초기 제품은 28 nm 공정으로 제조되며 동작 주파수는 최대 2.5 GHz이다. 크레이트는 퀄컴 고유의 그래픽 프로세서 아드레노(Adreno)를 제공한다.
최초의 제품은 싱글 코어인 MSM8930으로, 그래픽 프로세서는 기존 아드레노보다 6배 이상의 성능을 가진 Adreno 305이다. MSM8960는 2011년 2분기에 샘플 출시가 시작된 제품이다. 이 제품은 2개의 프로세서 코어를 독립적으로 제어할 수 있으며 기존 아드레노보다 8배 높은 성능을 제공하는 Adreno 225를 탑재했다. 가장 성능이 높은 쿼드 코어 구성의 APQ8064는 그래픽 프로세서인 Adreno 320도 쿼드 코어 구성으로 기존 아드레노보다 성능을 최대 15배까지 높일 수 있다.
마벨의 현 ARM 프로세서 코어 기반 SoC 설계팀은 대부분 2006년 중반에 인수한 인텔의 엑스스케일 사업 부문에서 이적해 온 사람들이다. 마벨은 인텔로부터 획득한 엑스스케일 PXA 시리즈를 확장해 ARMADA 패밀리를 개발하고 있다. 마벨은 CES 2012에서 구글 TV 전용의 ARM 기반의 SoC인 ARMADA 1500을 전시한 바 있다.

<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>



  • 100자평 쓰기
  • 로그인

세미나/교육/전시
TOP