메모리 및 캐시 성능 테스트
[SiSoftware Sandra XIIc - Cache and Memory]
다른 메모리 부문 성능 테스트 결과를 확인하기에 앞서 Sandra XIIc의 Cache and Memory 벤치마크 테스트 결과부터 살펴보자.
익히 알려져 있듯 AMD는 K8 해머 마이크로아키텍쳐 이후로 메모리 컨트롤러를 CPU 내부에 두고 있기 때문에, 그간 메모리 관련 성능 테스트에 있어서는 FSB 구조를 사용하는 인텔 CPU 제품들에 항상 우세를 지켜왔었다. 그렇지만 CPU L1 / L2 캐시 성능의 경우 인텔은 코어 마이크로아키텍쳐의 코어 2 듀오 / 쿼드 시리즈를 탄생시키면서 기존 넷버스트 마이크로아키텍쳐 프로세서들과 비교해 큰 폭의 성능 개선을 이뤄낸 바 있고, 비록 L1 캐시 용량이 절반이긴 해도 캐시 구성의 구조상 캐시 성능 자체에 있어서는 AMD Athlon X2/FX 시리즈에 상대적인 우위를 보여왔다.
AMD 페넘이 이번에 새로이 K10 마이크로아키텍쳐를 도입하긴 했다지만 그러한 경향은 여전히 이어지고 있어서, 위 그래프와 표에서 보듯 L1 / L2 캐시 구간(테스트 블럭 사이즈 2kB ~ 16MB)의 대역폭 측정 결과는 인텔 코어 2 쿼드 Q6600이 AMD 페넘 아제나 9500을 50% 이상의 차이로 앞서고 있다. 그렇지만 테스트 블럭 사이즈가 64MB 이상인 구간으로 넘어가면 메모리 컨트롤러를 내장한 AMD CPU의 위력이 나타나면서, 페넘 9500이 켄츠필드 Q6600을 10% 가량 상회하는 결과를 보여준다. 또한 참고로 기존 Athlon 64 X2 브리즈번 4800+(시스템 구성 : DFI nForce4-Ultra AM2 메인보드/ 디직스 PC2-5300U 1GB RAM x 2/ 메모리 클럭 DDR 628 MHz/ 메모리 타이밍 5-5-5-13-1T)와 비교해볼 때도, 이번 AMD 페넘은 비록 쿼드-코어 CPU와 듀얼-코어 CPU라는 차이를 감안해도 상당한 개선이 이뤄졌음이 인정된다.
[Lavalys EVEREST v3.20.1170 - Cache & Memory Benchmark]
위는 Lavalys EVEREST의 Cache & Memory Benchmark 중 L1~L3 캐시와 메모리 레이턴시(Latency : 지연시간), 그리고 메모리 읽기/ 쓰기/ 복사 테스트 항목의 결과를 정리한 것이다.
그런데 여기서 AMD 페넘 9500의 레이턴시 테스트를 보면 전에 없던 L3 캐시 항목이 추가되었는데 이는 K10 마이크로아키텍쳐 도입에 따른 변화로, AMD 페넘 아제나 쿼드-코어 CPU는 각 코어당 128KB의 L1 캐시(데이터 캐시 64KB + 명령어 캐시 64KB)와 512KB의 L2 캐시, 그리고 4개의 실행코어가 함께 사용하는 L3 공유 캐시 2MB를 두고 있다.
L3 캐시의 도입은 그 설계 목적상 보다 빠른 실행 속도를 보장하기 위한 것이다. 하지만 이번 페넘은 L1 / L2 캐시가 CPU 클럭과 동일한 스피드로 작동하는 것과는 달리 L3 캐시는 CPU 내부에 있는 메모리 컨트롤러(노스브릿지 ; NB, North-Bridge)와 동일클럭으로 작동하게 되어 있고, 이 노스브릿지 작동클럭은 CPU 작동클럭과는 상관없이 1,800 MHz가 레퍼런스로서 고정되어 있다(물론 별도 세팅을 통해 노스브릿지 클럭을 오버클럭시킬 수는 있음). 그에 따라 CPU 내부 레지스터에서 시스템 메모리로의 접근시 L1 / L2 캐시뿐만 아니라 L3 캐시에까지 필요한 데이터가 있는지 체크하는 데 추가적인 레이턴시(지연시간)가 필요하기 때문에, AMD 페넘은 자사의 기존 프로세서들에 비해서는 메모리 액세스 레이턴시(Access Latency ; 접근 지연시간)가 다소 늘어날 수밖에 없는 구조가 되었다.
위 레이턴시 측정 결과 차트에서도 가장 우측에 있는 메모리 레이턴시 측정결과를 보면 AMD 페넘 9500이 인텔 Q6600에 비해서는 레이턴시가 빠르지만, DDR 800 MHz(5-5-5-15-2T)가 아닌 DDR 628 MHz(5-5-5-13-1T)로 세팅된 브리즈번 4800+에 비해서는 오히려 느려진 것을 확인할 수 있다. 그리고 여기서 별도로 소개하지는 않지만 여타 측정 프로그램에서도 역시 이번에 발표된 페넘이 기존 K8 해머 마이크로아키텍쳐의 CPU들보다는 메모리 레이턴시가 약간 뒤쳐지는 공통적인 결과를 나타냈다.
다음으로 싱글 코어, 싱글 스레드를 이용해 테스트가 진행되는 Lavalys EVEREST의 메모리 읽기/ 쓰기/ 복사 대역폭 테스트 결과 차트를 보면, AMD 페넘 9500이 브리즈번 4800+에 다소 앞서는 모습이다. 인텔 Q6600은 역시나 CPU 외부에 별도로 노스브릿지(메모리 컨트롤) 칩을 두는 구조로 인해, 메모리 쓰기 테스트 항목을 제외하면 전반적으로 AMD CPU들에 밀리는 경향을 보이고 있다.
[SiSoftware Sandra XIIc - Memory Bandwidth]
Sandra의 Memory Bandwidth(메모리 대역폭) 벤치마크는 STREAM이라는 유명 벤치마크에 기반한 메모리 대역폭 측정툴로서, 앞선 EVEREST가 싱글 코어 / 싱글 스레드를 이용해 테스트를 진행하는 것과는 달리 멀티-코어 / 멀티-스레드를 모두 지원한다. 여기서는 이전까지와는 달리 인텔 Q6600과 AMD 페넘 9500이 거의 비슷한 측정치를 나타낸 것을 확인할 수 있다.
Super Pi / mod1.5 XS
흔히 CPU 성능 측정툴로서 많이 애용되는 Super Pi mod1.5 XS의 1백만 자리와 4백만 자리 테스트 결과에서는 캐시 구조와 용량의 차이로 인해, 이번 K10 마이크로아키텍쳐의 AMD 페넘 9500도 역시 과거 K8 해머 마이크로아키텍쳐 CPU들과 마찬가지로 인텔 코어 마이크로아키텍쳐 CPU들에 비해서는 취약한 모습을 여지없이 드러내고 있다. 인텔 Q6600이 50% 넘는 차이로 AMD 페넘 9500을 앞서고 있다.
3D 렌더링 성능 테스트
[CINEBENCH R10 - CPU Benchmark]
MAXON社의 유명한 3D 렌더링 성능 측정 프로그램인 CINEBENCH R10의 CPU Benchmark는 HDD 스왑 없이 CPU와 메모리만으로 테스트를 진행한다.
이전에도 인텔 코어 2 시리즈 CPU들은 이 테스트에서 AMD Athlon 64 X2 시리즈보다 뛰어난 성능을 보여 왔는데, 이번 인텔 Q6600과 AMD 페넘 9500 사이의 비교에서도 인텔이 한층 우수한 퍼포먼스를 보여주고 있다. 다만 싱글-CPU 테스트에서는 두 CPU의 벤치마크 스코어 차이가 약 33%이지만, 멀티-CPU(x CPU) 테스트에서는 그 차이가 약 24%로 줄어든 것을 보면 역시 메모리 컨트롤러를 내장한 AMD 페넘 9500이 보다 효율적인 메모리 활용 능력을 갖췄다고 할 수 있다.
[Autodesk 3ds Max 9 (32-bit)]
Autodesk社의 3ds Max 9 (32-bit)를 이용한 렌더링 테스트(Scene 샘플 예제 : Dragon_Character_Rig.Max, 렌더링 해상도 : 1920x1080 HDTV, 싱글 프레임 렌더링)에서도 인텔 Q6600은 48초만 소요함으로써, 57초가 소요된 AMD 페넘 9500보다 15.7% 가량 빠른 속도를 보여준다. 두 CPU의 작동클럭 차이가 약 9%임을 감안해도 인텔 쿼드-코어 켄츠필드 프로세서의 렌더링 성능이 더 뛰어나다고 할 수 있는 것이다.
|