전원 7

POWER7
전원 7
Power7 4ghz 9119 8way chipTop sonic84 IMG 1422.jpg
IBM 9119의 IBM Power7 4 GHz 8방향 CPU(디라이드)
일반 정보
개시.2010
설계자IBM
성능
최대 CPU 클럭 속도2.4GHz~4.25GHz
캐시
L1 캐시32 + 32 KB / 코어
L2 캐시256 KB/코어
L3 캐시4 MB/코어
아키텍처 및 분류
테크놀로지 노드45 nm
명령 집합Power ISA (Power ISA v.2.06)
물리 사양
코어
  • 4, 6, 8
역사
전임자전원 6
후계자전원 8

슈퍼 스칼라 멀티 코어 마이크로 프로세서는 POWER6과 POWER6+. POWER7 IBM에 의해 IBM의 로체스터 MN를 포함한 여러 사이트, 오스틴, TX, 에섹스 정션, VT;T.J. 왓슨 연구 센터, NY, Bromont, QC[1]와 IBM독일에서 개발되었다 성공했다 전원 ISA2.06명령어 집합 구조 2010년 발표를 토대로의 POWER7 것이다.리검색 및 개발 GmbH, Böblingen, 독일 연구소.IBM은 POWER7 기반 서버를 2010년 [2][3]2월 8일에 발표했습니다.

IBM 9119의 IBM Power7 4 GHz 8방향 CPU 및 IHS
IBM 9119의 IBM Power7 4GHz 8방향 CPU IHS 상단
IBM 9119의 IBM Power7 4GHz 8방향 CPU 하단
IBM Power7 4 GHz 8방향 CPU 이동식 인터포저(IBM 9119)

역사

IBM은 HPCS 프로젝트에서 2010년 말까지 페타스케일 슈퍼컴퓨터 아키텍처를 개발하기 위해 2006년 11월에 2억4천400만 달러의 DARPA 계약을 따냈습니다.계약서에는 또한 아키텍처가 상업적으로 이용 가능해야 한다고 명시되어 있습니다.계약을 따낸 IBM의 제안서인 PERCS(Productive, Easy-Use, Reliable Computer System)는 POWER7 프로세서, AIX 운영 체제 및 General Parallel File [4]System을 기반으로 합니다.

IBM과 DARPA가 공동으로 개발한 기능 중 하나는 POWER7 클러스터의 글로벌 공유 메모리 공간을 지원하도록 주소 지정 및 페이지 테이블 하드웨어를 변경하는 것입니다.이를 통해 과학자들은 메시지 전달을 사용하지 않고도 하나의 시스템인 것처럼 클러스터를 프로그래밍할 수 있습니다.생산성의 관점에서,[5] 일부 과학자들은 클러스터에서 사용되는 MPI나 다른 병렬 프로그래밍 기술에 익숙하지 않기 때문에, 이것은 필수적입니다.

설계.

POWER7 슈퍼스케어 멀티코어 아키텍처는 POWER6 설계에서 크게 진화한 것으로, 멀티코어와 동시 멀티스레딩(SMT)[6]을 통한 전력 효율에 중점을 두고 있습니다.POWER6 아키텍처는 전력 효율을 희생하면서 프로세서 주파수를 최대화할 수 있도록 처음부터 구축되었습니다.놀라운 5GHz를 달성했습니다.POWER6는 각각 양방향 동시 멀티스레딩(SMT)이 가능한 듀얼 코어 프로세서를 탑재하고 있지만 IBM POWER 7 프로세서는 최대 8개의 코어와 코어당 4개의 스레드를 탑재하여 총 32개의 동시 [7]스레드를 지원합니다.

IBM은 ISCA 29에서[8] 전력 효율의 비용으로 파이프라인 단계당 FO4 지연이 10-20개인 고주파 설계를 통해 최고 성능을 달성했다고 밝혔습니다.그러나 POWER6 바이너리 부동소수점 유닛은 "6사이클, 13-FO4 파이프라인"[9][clarification needed]을 실현합니다.따라서 POWER5 및 POWER6 설계와 마찬가지로 POWER7 CPU의 파이프라인이 다시 변경되었습니다.이 재작업은 2005년 인텔이 P4 7세대 x86 마이크로아키텍처를 떠난 것과 비슷합니다.

사양

POWER7은 마이크로칩당 4, 6, 또는8개의 물리 코어를 1~32웨이 설계에 탑재할 수 있습니다.최대 1024대의 SMT와 Power ISA 및/또는 다양한 시스템 아키텍처에 관한 확장 사양/서브 사양을 지원하는 인터페이스가 약간 다릅니다.예를 들어 Supercomputing(HPC) System Power 775에서는 256개의 물리 코어와 1024개의 [10]SMT를 갖춘 32웨이 쿼드칩 모듈(QCM)로 패키지화되어 있습니다.또한 8코어 프로세서에서 코어의 절반을 끌 수 있는 특별한 TurboCore 모드도 있지만 이들 4코어는 모든 메모리 컨트롤러와 L3 캐시에 클럭 속도를 높여 액세스할 수 있습니다.이로 인해 각 코어의 퍼포먼스가 향상됩니다.이는 병렬 퍼포먼스를 저하시켜도 가장 빠른 시퀀셜 퍼포먼스를 필요로 하는 워크로드에 중요합니다.TurboCore 모드는 "코어당 라이센스가 부여된 애플리케이션의 소프트웨어 비용을 절반으로 절감하는 동시에 [11]해당 소프트웨어의 코어당 성능을 높일 수 있습니다."새로운 IBM Power 780 확장 가능한 하이엔드 서버는 새로운 TurboCore 워크로드 최적화 모드를 갖추고 POWER6 기반 [11]시스템의 코어당 최대 2배의 성능을 제공합니다.

각 코어는 4방향 동시 멀티스레딩(SMT)이 가능합니다.POWER7에는 약 12억개의 트랜지스터가 있으며 45nm 공정으로 제작된 567mm의2 대형 트랜지스터입니다.POWER6와 눈에 띄는 차이점은 POWER7이 명령을 순서대로 실행하는 것이 아니라 순서대로 실행한다는 것입니다.POWER6에 비해 최대 주파수는 감소하지만 (4.25GHz 대 5.0GHz), 각 코어는 POWER6보다 퍼포먼스가 높고 각 프로세서의 코어 수는 최대 4배입니다.

POWER7의 [12][13]사양은 다음과 같습니다.

  • 45 nm SOI 프로세스, 567 mm2
  • 12억 의 트랜지스터
  • 3.0~4.25GHz 클럭 속도
  • 쿼드칩 모듈당 최대 4개의 칩
    • 칩당 4, 6 또는 8개의 C1 코어
      • C1 코어당 SMT 스레드 4개(2010년 4월 출시) AIX 6.1 TL05 이상에서 사용 가능)
      • C1 코어당 12개의 실행 유닛:
        • 2 고정 소수점 단위
        • 2개의 로드/스토어 유닛
        • 2소켓 부동소수점 유닛×4
        • VSX를 지원하는 벡터 유닛x 1
        • 10진수 부동소수점 단위x 1
        • 브랜치 유닛x 1
        • 상황 레지스터 유닛 1개
    • 32+32KB L1 명령 및 데이터 캐시(코어당)[14]
    • 256 KB L2 캐시 (C1 코어당)
    • C1 코어당 4 MB L3 캐시(최대 32 MB 지원)캐시는 표준 SRAM만큼[5] 셀당 트랜지스터 수가 필요하지 않으므로 SRAM과 동일한 영역을 사용하면서 더 큰 캐시를 허용합니다.

기술사양에는 다음 사항이 추가로 [15]명시되어 있습니다.

각 POWER7 프로세서 코어는 사용 가능한 실행 경로의 고효율화를 추진하기 위해 적극적인 주문형(OoO) 명령 실행을 구현합니다.POWER7 프로세서에는 일련의 큐에 사이클당 최대 6개의 명령을 디스패치할 수 있는 명령 시퀀스 유닛이 있습니다.명령 실행 유닛에는 사이클당 최대 8개의 명령을 발행할 수 있습니다.

이를 통해 다음과 같은 이론적인 단일 정밀도(SP) 퍼포먼스 수치를 얻을 수 있습니다(4.14GHz 8 코어 실장 기준).

  • 코어당 최대 99.36 GFLOPS
  • 칩당 최대 794.88 GFLOPS

코어당 4개의 64비트 SIMD 유닛과 128비트 SIMD VMX 유닛은 사이클당 12개의 멀티플 애드 처리를 할 수 있어 사이클당 24개의 SP FP ops를 제공합니다.4.14GHz에서는 41억4000만*24=99.36SP GFLOPS, 8코어에서는 794.88SP GFLOPS가 됩니다.

최대 이중 정밀도(DP) 성능은 최대 SP 성능의 약 절반입니다.

비교를 위해 인텔의 2013 Haswell 아키텍처 CPU는 사이클당 16DP FLOP 또는 32SP FLOP를 실행할 수 있습니다(8/16DP/SP는 2×256비트 AVX2 FP 벡터 [16]유닛에 걸쳐 다중 추가 확산).3.4GHz (i7-4770)에서는 코어당 108.8 SP GFLOPS, 435.2 SP GFLOPS의 피크 퍼포먼스로 인텔의 터보 부스트 테크놀로지의 효과나 이점을 고려하지 않고 코어당 거의 비슷한 수준의 퍼포먼스를 제공합니다.

POWER7과 i7-4770은 SPEC CPU2006 부동소수점 벤치마크(싱글 스레드)에서 비슷한 점수를 획득하여 이론적으로 피크 퍼포먼스 비교도 실시되고 있습니다.POWER7은 71[17].5, i7-4770은 74.0입니다[18].

POWER7 칩은 일부 벤치마크(파형, 선인장)에서 i7을 크게 웃돌고 있습니다(2~5배).ADM, lbm)을 사용하는 한편, 그 외의 대부분의 경우는 현저하게 느려집니다(2x-3x).이는 2개의 칩/메인보드/메모리 시스템 간의 주요 아키텍처 차이를 나타냅니다.: 다양한 워크로드를 염두에 두고 설계되었습니다.

그러나 전체적으로 보면 POWER7의 부동소수점 성능은 Haswell i7과 비슷하다고 할 수 있다.

POWER7+

IBM은 2012년 8월 Hot Chips 24 컨퍼런스에서 POWER7+ 프로세서를 발표했습니다.더 빠른 속도, 더 많은 캐시 및 통합 가속기를 갖춘 업데이트된 버전입니다.32 nm 제조 [19]공정으로 제조됩니다.

POWER7+ 프로세서와 함께 출하된 최초의 상자는 IBM Power 770 및 780 서버입니다.칩은 최대 80MB의 L3 캐시(10MB/코어), 향상된 클럭 속도(최대 4.4GHz), [20]코어당 20개의 LPAR를 갖추고 있습니다.

상품들

2011년 10월 현재 IBM Power Systems "Express" 모델(710, 720, 730, 740 및 750), 엔터프라이즈 모델(770, 780 및 795) 및 고성능 컴퓨팅 모델(755 및 775)을 포함한 POWER7 기반 시스템의 범위입니다.엔터프라이즈 모델에 따라 캐퍼시티 온 디맨드 기능이 다릅니다.최대 사양은 아래 표에 나와 있습니다.

IBM POWER7 및 POWER7+ 서버
이름. 소켓 수 코어 수 CPU 클럭 주파수
710 Express 1 6 4.2GHz
710 Express 1 8 4.2GHz
720 Express (8202-E4B, POWER7)[21] 1 8 3.0GHz
720 Express (8202-E4D, POWER7+)[22] 1 8 3.6GHz
730 Express 2 12 4.2GHz
730 Express 2 16 3.6GHz 또는 4.2GHz
740 Express 2 12 4.2GHz
740 Express 2 16 3.6GHz 또는 4.2GHz
750 Express 4 24 3.72GHz
750 Express 4 32 3.22GHz 또는 3.61GHz
755 4 32 3.61GHz
770 8 48 3.7GHz
770 8 64 3.3GHz
775(노드당) 32 256 3.83GHz
780(MaxCore 모드) 8 64 3.92GHz
780(터보코어 모드) 8 32 4.14GHz
780 (4 소켓노드) 16 96 3.44GHz
795 32 192 3.72GHz
795(MaxCore 모드) 32 256 4.0 GHz
795(터보코어 모드) 32 128 4.25GHz

IBM은 또한 5개의 POWER7 기반 BladeCenter를 [23]제공합니다.사양은 아래 표에 나와 있습니다.

IBM POWER7 블레이드 서버
이름. 코어 수 CPU 클럭 주파수 블레이드 슬롯 필요
BladeCenter PS700 4 3.0GHz 1
BladeCenter PS701 8 3.0GHz 1
BladeCenter PS702 16 3.0GHz 2
BladeCenter PS703 16 2.4GHz 1
BladeCenter PS704 32 2.4GHz 2

POWER7 프로세서를 사용하는 슈퍼컴퓨터 프로젝트는 다음과 같습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Authier, Isabelle (17 February 2011). "IBM Bromont au coeur de Watson". Cyberpresse. Cyberpresse. Retrieved 17 February 2011.
  2. ^ "IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services". IBM. 8 February 2010. Retrieved 13 September 2010.
  3. ^ "New POWER7 workload optimizing systems". YouTube. IBM. 5 February 2010. Archived from the original on 8 February 2011. Retrieved 22 February 2010.
  4. ^ "Cray, IBM picked for U.S. petaflop computer effort". EE Times. Retrieved 22 November 2006.
  5. ^ a b "Hot Chips XXI Preview". Real World Technologies. Retrieved 17 August 2009.
  6. ^ Kanter, David. "New Information on POWER7". Retrieved 11 August 2011.
  7. ^ Varhol, Peter (9 February 2010). "IBM Launches POWER 7 Processor February 9, 2010". Retrieved 11 August 2011.
  8. ^ "ISCA 29 Conference Notes". Retrieved 11 August 2011.
  9. ^ "IBM Tips Power6 Processor Architecture". Information Week. 6 February 2006. Retrieved 6 February 2006.
  10. ^ "IBM Power Systems 775 HPC Solution" (PDF). Retrieved 28 April 2020.
  11. ^ a b "IBM Unveils New POWER7 Systems To Manage Increasingly Data-Intensive Services". IBM.com. Retrieved 11 August 2011.
  12. ^ "IBM in Education – Business & Technology Solutions". IBM. Archived from the original on 4 October 2012. Retrieved 8 July 2009.
  13. ^ "IBM's 8-core POWER7: twice the muscle, half the transistors". Ars Technica. September 2009. Retrieved 1 September 2009.
  14. ^ "Bluewater HW specifications". National Center for Supercomputing Applications. Retrieved 31 December 2009.
  15. ^ "IBM Power 770 and 780 Technical Overview and Introduction" (PDF). IBM. Retrieved 21 August 2011.
  16. ^ Anand Lal Shimpi (5 October 2012). "Intel's Haswell Architecture Analyzed: Building a New PC and a New Intel". Anandtech.
  17. ^ "SPEC CFP2006 Result, IBM Power 780 Server (3.86 GHz, 16 core)".
  18. ^ "SPEC CFP2006 Result, Intel DH87MC Motherboard (Intel Core i7-4770)".
  19. ^ 핫칩: IBM Power7 업데이트
  20. ^ 등록부:Power7+ 서버 출시
  21. ^ "IBM Power 720 and 740 Technical Overview and Introduction" (PDF). IBM Redbooks. IBM. 3 December 2012. p. 9. Retrieved 13 May 2021.
  22. ^ "IBM Power 720 and 740 Technical Overview and Introduction" (PDF). IBM Redbooks. IBM. 16 May 2013. p. 9. Retrieved 3 June 2021.
  23. ^ "IBM Power Systems hardware - Blade servers". IBM. Retrieved 30 January 2012.

외부 링크