전력 처리 요소
Power Processing ElementPOWER, PowerPC 및 Power ISA 아키텍처 |
---|
NXP(이전의 Freescale 및 Motorola) |
IBM |
|
IBM/닌텐도 |
기타 |
관련 링크 |
회색으로 취소됨, 이탤릭체로 기록됨 |
일반 정보 | |
---|---|
시작됨 | 2005 |
중단됨 | 현재 |
마케팅 대상 | IBM, Sony, Microsoft |
설계자 | IBM |
일반 제조업체 | |
퍼포먼스 | |
최대 CPU 클럭 속도 | 2.8GHz ~ 3.2GHz |
캐시 | |
L1 캐시 | 32KB 명령 + 32KB 데이터 |
건축과 분류 | |
적용 | 게임 콘솔, HPC |
기술 노드 | 90 nm ~ 45 nm |
마이크로아키텍처 | PPU |
명령 집합 | 파워PC 2.02 |
물리적 사양 | |
코어스 |
|
GPU | XCGPU 모델에서 Xenos. |
제품, 모델, 모델 | |
변종 | |
역사 | |
후계자 | IBM A2 |
전력 처리 요소(PPE)는 전력 처리 장치(PPPU)와 512KB L2 캐시로 구성된다.대부분의 경우 PPU는 PPE에서 사용된다.PPU는 IBM이 주로 게임 콘솔 플레이스테이션 3와 Xbox 360에서 사용하도록 설계한 64비트 듀얼 스레드 방식의 PowerPC 2.02 마이크로프로세서 코어지만, 레코드 설정 IBM Roadrunner와 같은 슈퍼컴퓨터의 고성능 컴퓨팅에서도 응용 프로그램을 찾아냈다.
PPU는 세 가지 다른 프로세서 설계에서 주 CPU 코어로 사용된다.
- 소니의 플레이스테이션 3 게임 콘솔에서 주로 사용되는 셀 브로드밴드 엔진(Cell BE)이다.PPE를 사용하며 90nm, 65nm, 45nm의 세 가지 버전으로 나온다.
- 향상된 FPU와 메모리 하위 시스템을 갖춘 Cell BE의 버전인 PowerXCell 8i.단 65nm 버전으로만 제작됐다.
- Microsoft의 Xbox 360 내부에 있는 3가지 핵심 구성과 1MB L2 캐시에 사용되는 XCPU.90nm와 65nm 버전, ATI의 통합 그래픽 프로세서가 탑재된 45nm XCGPU 등 3가지 버전으로 나온다.
주요 특징
- 64비트 이중 섀시 코어
- 3.2GHz 표준 클럭레이트
- 32KB L1 명령 캐시
- 32KB L1 데이터 캐시
- 512KB 통합 L2 캐시, PPE 변종에서의 8방향 세트 연관.
- 64비트 PowerPC ISA v.2.02(POWER4 및 Power)와 호환PC 970)[1]
- AltiVec SIMD 기능
실행 단위
주문형
PPU는 주문형 프로세서지만 값비싼 재주문 하드웨어 없이도 주문 외 실행의 일부 이점을 얻을 수 있는 몇 가지 독특한 특징을 가지고 있다.L1 캐시 누락에 도달하면 캐시 누락을 지나 실행될 수 있으며, 명령이 실제로 로드에 의존할 때만 중지된다.L2 캐시가 고장 난 상태로 최대 8개의 로드 지침을 전송할 수 있다.그것은 지시 지연 파이프 즉, 통상적으로 파이프라인의 나머지 부분을 지탱하지 않고 파이프라인 스톨을 유발하는 지시를 실행할 수 있는 측면 경로를 가지고 있다.명령 지연 파이프라인은 주문되지 않은 로드/스토어에 사용되며, 캐시 누락은 이동하는 동안 여기에 배치된다.
PPE의 파이프라인
PPE에는 마이크로코드가 11단계, 분기 예측이 4단계 추가 가능한 23단계 일반 파이프라인이 있다.[2]
멀티스레딩
PPU는 두 개의 하드웨어 스레드를 동시에 실행한다.코드 실행을 위한 메인 레지스터는 예외 및 인터럽트 처리 레지스터와 마찬가지로 중복되며 몇 개의 필수 배열과 대기열이 있다.동시에 예외를 생성하고 개별 분기 기록에 대해 분기 예측을 수행할 수 있다.그러나 실행 엔진과 캐시는 복제되지 않기 때문에 여전히 단일 코어 설계에 불과하다.[3]
부동소수점용량
64비트 이중 정밀 부동 소수점 단위와 128비트 VMX 단위(AltiVec 명령어 세트 사용)는 부동 소수점 곱셈을 할 수 있고 64비트 이하가 되기 때문에 이론적으로 사이클당 12개의 부동 소수점 연산을 수행할 수 있다.그것은 32억 클럭 사이클 × 12 = 384억 플로팅 포인트 운영/초를 제공한다.
PPU는 파워XCell 8i 프로세서에서 강화되어 슈퍼컴퓨터의 고성능 컴퓨팅에 맞춘 단일 사이클 이중 정밀 부동 소수점 연산을 할 수 있다.
Xbox 360의 XCPU에 있는 VMX 유닛은 128개의 레지스터로 개선되었으며 일반 AltiVec과 완전히 호환되지는 않는다.
참조
- ^ Koranne, Sandeep (2009). Practical Programming on the Cell Broadband Engine. Springer Science & Business Media. p. 17. ISBN 9781441903082.
- ^ 셀 광대역 엔진 아키텍처 및 첫 구현
- ^ 제2장 - 전력 처리 요소(PPE)