전력 밀도가 오늘날 데이터 센터의 유일한 문제는 아니며, 운영비 역시 지난 몇 년간 서버 수가 증가함에 따라 대두된 또 하나의 문제이다. 데이터 센터에서 에너지 효율을 높이기 위해 전력 상한설정(Capping)과 같은 다양한 기법을 도입했지만 전력 레벨의 정확한 측정 성능은 여전히 중요한 요소로 남아 있다. 본 글에서는 서버에서 보호 및 전력 측정에 사용된 통합 솔루션으로 구현되는 면적, 비용, 절전량 및 기타 이점들을 개별 구현과 비교해 본다.
조이 테일러(Joy Taylor) / 내셔널 세미컨덕터 기술 마케팅 엔지니어
제리 스틸(Jerry Steele) / 내셔널 세미컨덕터 전략 애플리케이션 엔지니어
아날로그 전류 감지, 필터링 및 캘리브레이션(calibration) 회로에 기반하여 베이스보드 관리 컨트롤러(Baseboard Management Controller, BMC)에 내장된 ADC로 신호를 공급하는 전력측정 방식이 오랜 세월 고성능 서버에 사용되어 왔다.
션트저항(Shunt Resistance) 자체가 캘리브레이션 루프에 포함되지는 않지만, 이 시스템은 기본적으로 캘리브레이션 회로를 사용하여 최상의 정확도를 지원한다. 이 회로의 소자 수와 보드 점유 공간 요구 사항은 높다.
전력 밀도가 오늘날 데이터 센터의 유일한 문제는 아니며, 운영비 역시 지난 몇 년간 서버 수가 증가함에 따라 대두된 또 하나의 문제이다. 데이터 센터에서 에너지 효율을 높이기 위해 전력 상한설정(Capping)과 같은 다양한 기법을 도입했지만 전력 레벨의 정확한 측정 성능은 여전히 중요한 요소로 남아 있다.
서론
서버에서 전력 측정 오차의 중요성은 잘 알려져 있다. 최근 발표된 여러 연구에서 서버 소자 수준에서 절전량 1와트에 대한 캐스케이드 효과(cascade effect)를 산정한 결과, 시설 에너지 소비량에서 2.84와트를 절감할 수 있다.
예를 들어 5% 오차가 30와트를 나타내는 600와트 서버를 생각해보자. 이는 시설 에너지 소비량에 원치 않는 85.2와트의 에너지 낭비를 의미한다. 서버 1,000대가 구비된 일반적인 데이터 센터에서 낭비되는 에너지는 85.2kW에 달하게 된다.
전력 정확도 오차를 2%로 줄이면 34kW 에너지가 낭비된다. 즉, 절전율이 60%이다. 데이터 센터에서 서버 수 증가에 따른 부정확성이 낳는 재정적 문제는 수백만 달러의 전기료가 추가된 전기세 고지서이다. 미국 내 데이터 센터의 연간 운영비는 33억 달러 수준으로 추정된다.
전력 관리 오차에서 고려할 사항이 몇 가지 있는데, 전체 컴퓨팅 전력의 최종 사용자를 잃게 할 수 있는 전력 상한설정 레벨에서 오차가 주된 것이다. 기타 고려 사항으로는 필요한 시스템 전력과 냉각 여유도이다.
서버의 전력과 성능은 계속 증가하며, 서버의 핵심 기능에 사용되는 회로 보드 점유공간도 증가하므로 전력 관리 및 모니터링을 포함하여 회로 지원 용도로 남겨지는 공간이 감소된다. 모니터링의 필요성에는 의문의 여지가 없다. 이미 설명한 재정적 이점 외에, 간단한 사실은 최종 사용자가 전력 소비 정보를 요구하고 있다는 점이다. 이러한 전력 모니터링 시스템이 성능 손실 없이 서버 내부에서 차지하는 공간을 줄일 필요가 있다.
이상의 고려 사항을 염두에 두고, 개별 구현과 비교하여 통합 솔루션의 주요한 장점을 요약하면 다음과 같다.
1. 보드 면적과 비용
2. 전력 계산 및 정확도
3. 시스템 아키텍처 영향력
4. 개선된 보호/신뢰성 역량
BOM 원가는 자재에 한정된 것임에 주의해야 한다. 인건비, 자재이동 및 연관된 어셈블리 비용은 포함되지 않는다. 모든 방식에서 동일한 소자들은 포함되지 않는데, 예를 들어 션트 저항은 모든 방식에서 필요하며 동일한 보드 점유공간과 원가를 소요한다.
1. 보드 면적과 원가 비교
세 가지 방식의 간략한 비교도를 (그림 1)에서 보여준다.
2. 전력 정확도 및 계산 비교
보편적인 기존의 시스템은 하나의 명령으로 전압과 전류를 판독할 수 있지만 전력 계산, 평준화, 설정값 조치를 제공하는 처리는 여전히 필요하다. 그렇다고 해도 평준화 수준은 데이터 판독의 연속도 및 주기와 직접적인 관계가 있다.
온-보드 전력 계산 및 평준화 기능을 제공함으로써 LM25066은 계산 과부하 없이 ‘시스템이 여유 있을 때’ 데이터를 판독할 수 있게 한다. LM25066은 또한 전력 상한설정을 트리거하는 데 사용할 수 있는 전력 감시 설정값도 제공한다. 이러한 기능은 모두 기존 시스템으로 성취되는 정확도와 동일한 수준으로 제공된다.
전류 측정
서버 전력을 측정하기 위해 수집하는 필수적인 데이터 요소는 서버로 유입되는 전류 측정값이다. 전류 측정은 하이 사이드 션트 전류 감지를 통해야 하기 때문에 간단한 계측 작업이 아니다. 이러한 하이 사이드 전류 시스템은 로우 사이드 시스템의 션트와 같은 방법으로 분로되는 접지를 가질 수 없다.
사용 가능한 다양한 자기 감지 방법을 고려하는 것도 좋지만 최상의 정확도 요구는 이제 션트를 포함한 전체 측정 시스템에 대해 3% 미만으로 엄격해졌으며, 1/5을 초과하는 동적 입력 범위 요건을 갖는다(양호한 정확도란 입력 전압의 20% 지점으로 낮춰야 함을 의미).
전체 전력 측정에서 3% 달성은 각 채널, 전압 측정 및 전류 측정 채널의 오차가 1% 미만이어야 함을 의미한다. 나머지 1%는 일반적으로 사용 가능한 전류 감지용 1% 공차 션트 저항의 사용에서 비롯된다. 이러한 정확도의 하이 사이드 감지는 전류 감지에서 매우 높은 동상 제거 기능을 요구한다.
다음은 총 오차 계산에서 고려할 사항이다.
1) 오차 총계 산출 방법. 비상관 오차에서는 제곱의 합에 대한 제곱근법을 사용하는 것이 일반적이다. 개인에 따라 까다로운 최악의 사례가 확실한 직접 합산법을 선호하기도 하지만, 이 글에서의 모든 비상관 오차 요약에서는 제곱의 합에 대한 제곱근법을 사용한다.
2) 전압 채널 및 전류 채널의 오차를 서로 곱하여 전력 오차를 계산한다. 보통 총 3% 미만의 작은 오차 값은 오차의 단순 합산 값에 근접한다. 총 오차를 계산하려면 먼저 계측 오차와 션트 오차를 모두 갖는 전류 채널의 총 오차를 계산한다.
여기서,
RSERR=션트 저항 공차
IIERR= 전류 채널 계측 공차
한 예로, 1% 오차가 지정된 계측 시스템과 함께 1% 션트를 사용하는 시스템의 경우, 전류 측정 채널에서 총 오차는 1.4%이다.
전력 측정의 총 오차는 다음 (식 2)로 계산된다.
여기서,
VERR=전압 채널 계측 공차
PERR=전력 측정의 총 오차
전류 채널의 오차가 1.4%, 전압 채널의 오차가 1%인 시스템의 전체 전력 측정 오차는 2.4%로, 두 채널의 총 오차를 합산한 결과에 매우 근접한다.
(그림 2)에서 보듯이 허용되는 수준의 총 전체 정확도를 제공하려면 전체 3% 이상의 전력 정확도를 산출하기 위해 전압 및 전류 계측 채널에서 1% 이상의 정확도가 요구된다.
하이 사이드 요건이 적용되는 이러한 전류에서 자기 전류 감지 방법을 종종 고려하게 된다. 그러나 현재 최첨단 자기 감지 방법으로 달성 가능한 전류 측정 정확도는 5%에 불과하다. 션트 저항을 사용한 전류 감지가 계속 1% 전류 측정 정확도를 달성한다.
션트 강하가 낮을수록 손실과 열 발생량이 감소하여 작은 션트를 사용하여 점유공간을 줄일 수 있는 반면, 큰 션트 강하를 사용할 때 전류 감지 정확도가 항상 향상된다. 비법은 션트 손실과 높은 정확도 요건 사이 최적의 절충점을 찾는 것이다.
전압 측정
전압 감지는 복잡하지 않고 아날로그-디지털 컨버터의 분압기만큼 단순하다. 그러나 분압기에는 2개의 저항, 정확도에 두 저항이 미치는 영향, 그리고 통합 솔루션의 장점을 높여줄 세부사항들이 있다. 전압 변동 때문에 전압 채널은 정확해야 한다. 서버의 전압이 일정한 편이라고 가정해도 좋지만 120mV의 변동은 1%에 해당함을 고려해야 한다.
전류 감지 및 분압기에 대해 만족스러운 솔루션에 도달한 후에도 아날로그-디지털 변환(ADC) 문제는 여전히 남아 있다. ADC에 많은 옵션을 사용할 수 있는데, 대부분 BMC에 사용되는 프로세서에 통합되는 것이다.
하지만 오프셋, 게인 오차, 선형성 등의 ADC 성능은 그리 좋게 나타나지 않는다. 이러한 매개변수 또는 적어도 게인 매개변수는 ADC 레퍼런스의 영향을 직접적으로 받는다. 프로세서에 내장된 레퍼런스는 언제나 낮은 성능 레퍼런스로, 캘리브레이션을 사용하지 않는 한 제한적인 온도 범위에서도 필요한 정확도를 제공하지 못한다. LM25066과 같은 전력 측정 디바이스를 통해 핫스왑에 통합된 ADC와 달리, 추가적인 ADC 오차를 고려해야 한다.
통합형 핫스왑 및 전력 측정 솔루션
(그림 3)에서 통합 방식에 다음을 결합함으로써 실현되는 이점을 보여준다.
1) 전류 및 전력 제한 기능을 통해 MOSFET 전력 방출을 한정하는 기능을 제한하면서 소자 다운스트림을 위해 전압 스파이크 및 돌입 전류에 대한 강력한 보호를 제공하는 첨단 핫스왑 회로.
2) 25mV 전체 범위를 갖는 1% 정확도 하이 사이드 전류 감지 기능은 보드 수준에서 전력 방출을, 시스템 수준에서 낭비된 과부하 전력 전달을 감소시킨다.
3) 1% 정확도 내장 분압 및 감지 방식을 채용하면 전압 및 전류의 내부 계산을 통해 데이터 센터 이용에 귀중한 매개변수인 전력 원격측정 및 평준화를 제공할 수 있다.
4) 샘플링 앤 홀드 방식을 채용한 내장 ADC가 전압과 전류 동시 샘플링을 허용하여 최상의 전력 측정 정확도를 지원한다.
샘플링 고려 사항
전압 변동에 대한 논의는 자연스럽게 샘플링 주제로 넘어간다. 이 측정에 아날로그-디지털 컨버터(ADC)가 사용되므로 샘플링된 시스템이다. 여기서 전력을 측정하는 것이며 전력은 주어진 시간에 전압과 전류를 곱한 결과이기 때문에 샘플링 타이밍 고려 사항이 등장한다.
원가가 중요한 요소이므로 하나의 ADC를 사용하여 신호를 멀티플렉싱하는 것이 바람직하다. 하지만 (그림 4)에 나온 기존 시스템은 정확히 동일한 지점에서 시간에 맞춰 이러한 샘플을 취할 수 없다. (그림 4)에서는 점선 연결로 동시 샘플링 시스템도 보여준다. 샘플을 취하기 위해 샘플링/홀드 커패시터에 값의 동일한 순간 저장 시 S1과 S2가 근접된다. 그러면 ADC가 각 채널을 순차적으로 변환할 수 있다.
(그림 5)에서 샘플링 타이밍의 중요성을 보여준다. 한 번에 매개변수를 하나씩만 샘플링할 수 있는 시스템에서, 샘플링된 전압은 전류의 샘플링 시점에 존재한 전압과 일치하지 않는다. 이로 인해 전력 측정 오차가 발생할 수 있으므로 전압에서 120mV 변동은 1% 오차에 해당하고 그러한 변동이 자주 발생한다.
전력 계산
많은 최종 사용자가 계산 부담을 덜기 위해서 바로 사용 가능한 전력 데이터를 준비해 놓으려고 한다. 즉, 계측 IC가 전압과 전류를 곱하여 전력 계산을 수행해야 한다(한 가지 고려할 사항은 전력의 보고 단위이며, 이에 대해 가장 편리한 해결책은 상대적 전력 계산을 수행하는 것이다).
전류 값(대부분의 IC에서 실제로는 션트 전압 값으로 표시)과 전압이 모두 전체 범위인 경우, 두 값의 곱셈으로 전체 범위 전력 레지스터가 산출된다. 당연히 사용된 션트 저항의 정확한 값 인수인 LBS 값을 지정하는 것은 사용자에게 달려 있다.
이러한 유형의 보고 방식은 IC 데이터를 ‘실제 환경’ 숫자로 변환하기 위한 계수를 감안하는 직접 보고 형식을 사용하는 PMBus에 기꺼이 수용된다. 고정된 내부 분압기에 의해 제공되는 전압 측정 스케일링과 같은 일정한 계수는 제조업체에서 지정한다. 전류 계수는 최종 사용자가 계산해야 하는데, 그 이유는 사용된 전류 션트 저항의 정확한 값에 비례하기 때문이다.
평준화 및 전력 계산
전류 측정은 노이즈가 심한 편이며, 디지털 시스템에서 평준화는 노이즈 판독값을 매끄럽게 한다. 그러나 평준화 방법론이 전력 측정 정확도에 바로 영향을 미치는 것은 아니다. 전력 측정에서 평준화된 측정을 위한 방법은 두 가지로 보인다.
평준화의 첫째 예는 전류 판독값 몇 개의 평균을 산출하고 전압 판독값 몇 개의 평균을 산출한 다음, 두 값을 곱하여 평균 전력을 산출하는 방법이다.
값이 천천히 변하는 시스템에서는 이 방법이 정확할 수 있다. 그러나 실제로 서버 시스템에서 전류와 전압은 빠른 속도로 변할 수 있다. 1% 변동을 놓칠 경우 해당하는 오차가 발생할 수 있음을 명심한다. 전압 및 전류의 순간 샘플을 곱한 후 전력 평균을 산출함으로써 이러한 오차를 줄이고 정확도를 최대화할 수 있다.
어느 경우에도, 평준화가 마이크로컨트롤러/프로세스에서 샘플링 시간과 부담, 샘플링 시간을 효과적으로 증가시켜서 평준화가 디바이스 외부에서 수행되는 경우에 유효한 값이 사용 가능하게 되는 사이 시간을 연장시킨다.
데이터 저장 및 알람
전력 상한설정(Capping)은 서버 계측에서 알람 기능을 이용할 수 있는 기능 중 하나이다. 또한, 핫스왑 등의 전력 제어 기능이 원격측정과 결합되므로 임박한 결함 조건을 시스템에 알리는 데 사용할 수 있는 한도를 설정할 수 있다. 피크 값과 함께 결함이 발생할 때 존재한 값도 저장할 수 있다. 이는 결함 순간 시스템 조건에 대한 데이터를 산출하는 ‘블랙박스’ 기능을 제공한다.
인터페이스
SMBus는 시스템 내에서 통신 수단으로 데이터 센터, 서버 및 통신 인프라 환경 도처에 널리 퍼져 있다. SMBus는 내장형이며 일반적으로 I2C 버스와 호환된다. 최근 개발 버스는 PMBus로, SMBus의 물리적 레이어를 사용하고 전력 관리 시스템 및 집적 회로와 통신에 사용되는 프로토콜을 정의한다. PMBus는 기본적으로 서버 원격측정 계측기와 통신 수단으로 장착된다.
PMBus가 제공하는 가장 중요한 개선 사항은 아마도 패킷 오차 검사 및 오류 검사 방법일 것이다. 많은 I2C 및 SMBus 사용자들이 기록값과 판독값이 올바른 데이터를 제시 또는 산출했는지 알 방법이 없다는 사실을 안타까워해왔다. 그 밖의 이점으로 수많은 알람 및 데이터 포인트를 판독하는 특수 명령들이 있고, 시간이 흐르면서 서버 계측과 관련하여 더 많이 정의될 것이다.
3. 시스템 아키텍처 영향
LM25066의 펌웨어 아키텍처는 I2C 및 SMBus 설계를 채용한 솔루션과 유사하므로 고객 시스템에서 아키텍처 영향을 최소화할 수 있다. 모든 하드웨어 및 버스 프로토콜이 SMBus에서와 동일하다. PMBus는 향후 플랫폼 유연성을 지원하기 위해 다양한 제조업체 사이에 표준화된 명령을 유지하는 데 필요한 특정 명령 포인터 위치를 추가한다.
BMC가 전력을 계산하고 평균을 산출하는 부담에서 벗어나므로 BMC 요구 사항이 완화된다. LM25066에 의해 전력이 계산되고 평균이 산출되므로 BMC는 여유 있을 때 LM25066을 판독한다. 종종 캘리브레이션 루틴을 실행해야 하는 부담도 없어진다.
4. 개선된 보호/신뢰성 역량
LM25066은 논리적 통합 보드 면적 감소를 특징으로 하는 이 전력 모니터링 시스템에 핫스왑을 통합한다. LM25066에는 핫스왑 기능의 일부로 다음과 같은 MOSFET 보호 기능이 있다.
· MOSFET 전력 방출 제한
· MOSFET 열적 보호
· MOSFET 고장 검출
서버 계측의 유용한 기능으로 온도 보고 기능이 있으며, LM25066은 요건에 따라 온도 센서로 원격 정션(트랜지스터)을 사용해야 한다. 이를 사용하는 한 가지 방법은 MOSFET의 열적 제한에 대비하여 MOSFET 근처에 장착하는 것이다. 또는 거의 모든 목적으로 거의 모든 위치에서 온도를 보고하는 데 사용할 수 있다.
이는 LM25066가 실제로 MOSFET에서 전압 강하, MOSFET의 전류 및 아날로그 멀티플라이어를 사용하여 MOSFET의 전력 방출을 계산하는 MOSFET 전력 방출 제한 기능에 결합된다. 더 좋은 보호 방법은 없고, MOSFET 안전 작동 영역에 가장 적합한 방법이다. 이 보호 기능을 사용하면 더 작은 MOSFET을 지정할 수 있다.
결론
많은 서버 제조업체가 에너지 점유공간은 줄이면서 데이터 센터 용량은 증가시켜야 하는 과제에 직면해 있다. 동일한 크기의 랙 공간에서 처리 전력을 증가시키는 일이 보드 수준 전력 밀도 과제를 낳는다. 동시에 데이터 센터에서 에너지 효율을 높이기 위해 전력 상한설정(Capping) 등의 기법을 도입했지만 전력 레벨의 정확한 측정 성능은 여전히 중요한 요소로 남아 있다.
내셔널 LM25066은 개별 구현과 비교하여 보드 공간과 원가를 상당히 절감해주고 온보드 처리 엔진을 오프로드할 수 있는 전력 모니터링 정확도 및 성능을 제공한다. LM25066은 시스템 아키텍처에 중대한 영향을 미치지 않고 향후 호환성을 지원하기 위한 업계 표준 명령 집합을 사용하여 필요한 정확도와 성능을 PMBus 인터페이스에 제공한다. 강력한 MOSFET 보호 및 모니터링 성능을 통하여 가장 경제적이면서 신뢰할 수 있는 전력 제어 솔루션을 제공하는 기능을 보장한다.
<저작권자(c)스마트앤컴퍼니. 무단전재-재배포금지>