셀(마이크로프로세서)
Cell (microprocessor)POWER, PowerPC 및 Power ISA 아키텍처 |
---|
NXP(구 Freescale 및 Motorola) |
IBM |
|
IBM/닌텐도 |
다른. |
관련 링크 |
회색으로 취소됨, 이탤릭체로 기록됨 |
셀은 범용 파워를 조합한 멀티코어 마이크로프로세서 마이크로아키텍처입니다.멀티미디어 및 벡터 프로세싱 애플리케이션 및 기타 많은 형태의 전용 컴퓨팅을 [1]대폭 가속화하는 합리화된 코프로세싱[1] 요소를 갖춘 적당한 성능의 PC 코어.
이것은 소니, 도시바, 그리고 "STI"로 알려진 연합체인 IBM에 의해 개발되었다.아키텍처 설계와 첫 번째 구현은 2001년 3월부터 4년간 텍사스 오스틴에 있는 STI Design Center에서 이루어졌으며, Sony는 4억 [2]달러에 가까운 예산을 책정했다고 보고했습니다.셀은 Cell Broadband Engine Architecture(Cell Broadband Engine Architecture)의 약자로 보통 Cell BEA(Cell Broadband Engine Architecture) 또는 Cell BE(Cell BEA
셀의 첫 번째 주요 상용 애플리케이션은 2006년에 출시된 소니의 플레이스테이션3 게임기였다.2008년 5월 셀 기반의 IBM Roadrunner 슈퍼컴퓨터는 최초의 TOP500 LINPACK 1.0 페타플롭스 [3][4]시스템이 되었습니다.Mercury Computer Systems는 또한 셀을 기반으로 한 디자인을 개발했다.
Cell 아키텍처에는 전력 효율을 중시하고 낮은 레이텐시보다 대역폭을 우선하며 프로그램코드의 단순성보다 피크 계산 스루풋을 우선시하는 메모리 일관성 아키텍처가 포함되어 있습니다.이러한 이유로 Cell은 소프트웨어 [5]개발을 위한 도전적인 환경으로 널리 알려져 있습니다.IBM은 Cell [6]칩용 개발 프로그램을 지원하는 Linux 기반 개발 플랫폼을 제공합니다.
역사
2000년 중반,[7] 소니 컴퓨터 엔터테인먼트, 도시바, IBM은 프로세서의 설계와 제조를 위해 "STI"로 알려진 제휴를 맺었다.
STI 디자인 센터는 2001년 [8]3월에 문을 열었다.이 셀은 POWER4 프로세서용 설계 도구의 확장 버전을 사용하여 4년에 걸쳐 설계되었습니다.세 회사의 400명 이상의 엔지니어가 IBM 설계 [8]센터 중 11곳의 중요한 지원을 받으며 오스틴에서 함께 일했습니다.이 기간 동안 IBM은 셀 아키텍처, 제조 프로세스 및 소프트웨어 환경과 관련된 많은 특허를 출원했습니다.광대역 엔진의 초기 특허 버전은 4개의 "처리 요소"로 구성된 칩 패키지로, 현재 전력 처리 요소(PPE)로 알려진 것에 대한 특허의 설명이었습니다.각 프로세싱 엘리먼트는 칩에 8개의 "Synergistic Processing Elements(SPE)"를 포함합니다.이 칩 패키지는 4GHz의 클럭 속도로 동작하며 32개의 SPE가 각각 32기가 FLOPS(FP8의 1/4 정밀도)를 제공하는 것으로 되어 있었습니다.이거는 이론상 광대역엔진이 1테라 FLOPS의 물리 컴퓨팅 성능을 발휘하는 것을 의미합니다.
PPE가 4개, SPE가 32개인 설계는 실현되지 않았습니다.대신 소니와 IBM은 PPE 1개와 SPE 8개로 디자인만 제작했다.이 작은 설계인 셀 광대역 엔진 또는 셀/BE는 90 nm SOI [9]프로세스를 사용하여 제작되었습니다.
2007년 3월 IBM은 65nm 버전의 Cell/BE가 뉴욕 [9][10]East Fishkill에 있는 공장(현재는 GlobalFoundries)에서 생산 중이며, Bandai Namco Entertainment는 357 아케이드 보드에 Cell/BE 프로세서를 사용한다고 발표했습니다.
2008년 2월, IBM은 45 nm [11]공정으로 Cell 프로세서를 제작하기 시작할 것이라고 발표했습니다.
2008년 5월 IBM은 65nm 기능 크기로 Cell 프로세서의 고성능 이중 정밀 부동 소수점 버전인 PowerXCell 8i를 [12]발표했습니다.
2008년 5월, Opteron 및 PowerXCell 8i 기반의 슈퍼 컴퓨터인 IBM Roadrunner 시스템은 세계 최초로 페타플롭스(petaFLOPS)를 달성한 시스템이 되었으며, 2009년 3분기까지 세계에서 가장 빠른 컴퓨터였습니다.Green500 리스트로 대표되는 세계에서 가장 에너지 효율이 높은 슈퍼컴퓨터 3대도 마찬가지로 PowerXCell 8i를 기반으로 합니다.
2009년 8월에 45 nm Cell 프로세서가 Sony의 PlayStation 3 [13]Slim과 함께 출시되었습니다.
2009년 11월까지 IBM은 32개의[14][15] APU를 갖춘 Cell 프로세서의 개발을 중단했지만 여전히 다른 Cell [16]제품을 개발하고 있었습니다.
상용화
![]() | 이 문서는 갱신할 필요가 있습니다.(2010년 11월) |
2005년 5월 17일, Sony Computer Entertainment는 PlayStation 3 [17][18][19]콘솔에 탑재될 Cell 프로세서의 사양을 확인하였습니다.이 셀 구성에서는 코어에 1개의 PPE가 있고 [19]실리콘에8개의 물리 SPE가 있습니다.PlayStation 3에서는 테스트 프로세스 중에 1개의 SPE가 록아웃되어 제조 수율 향상에 도움이 되고 다른 1개의 SPE가 OS용으로 예약되어 6개의 SPE가 게임 [20]코드로 사용됩니다.도입 시의 목표 클럭 주파수는 3.2GHz입니다.[18]초기 설계는 90nm SOI 공정을 사용하여 제작되었으며,[9] 초기 대량 생산은 뉴욕 이스트 피시킬에 있는 IBM 공장에서 예정되어 있습니다.
코어와 스레드 간의 관계는 일반적인 혼란의 원인입니다.PPE 코어는 듀얼 스레드이며 소프트웨어에서 2개의 독립된 실행 스레드로 나타나며 각 액티브 SPE는 1개의 스레드로 나타납니다.Sony가 설명한 PlayStation 3 구성에서는 Cell 프로세서가 9개의 독립된 실행 스레드를 제공합니다.
2005년 6월 28일 IBM과 Mercury Computer Systems는 의료 이미징, 산업 검사, 항공우주 및 방위, 지진 처리 및 [21]통신과 같은 임베디드 애플리케이션을 위한 셀 기반 컴퓨터 시스템을 구축하는 파트너십 계약을 발표했습니다.이후 Mercury는 블레이드, 기존 랙 서버 및 Cell [21]프로세서를 탑재한 PCI Express 액셀러레이터 보드를 출시했습니다.
2006년 가을, IBM은 특정 애플리케이션에서 뛰어난 성능을 발휘하는 더블 셀 BE 프로세서를 사용하는 QS20 블레이드 모듈을 출시하여 모듈당 FP8 1/4 정밀도에서 410기가 FLOPS의 정점에 도달했습니다.PowerXCell 8i 프로세서를 기반으로 한 QS22는 IBM Roadrunner 슈퍼컴퓨터에 사용되었습니다.Mercury와 IBM은 8개의 액티브 SPE와 함께 완전히 활용된 Cell 프로세서를 사용합니다.2008년 4월 8일 Fixstars Corporation은 PowerXCell 8i [22]프로세서를 탑재한 PCI Express 액셀러레이터 보드를 출시했습니다.
소니의 고성능 미디어 컴퓨팅 서버 ZEGO는 3.2GHz 셀/B를 사용합니다.E프로세서
개요
Cell Broadband Engine(Cell)은 일반적인 데스크톱 프로세서(Athlon 64 및 Core 2 패밀리 등)와 NVIDIA 및 ATI 그래픽스 프로세서(GPU)와 같은 보다 특수한 고성능 프로세서의 하이브리드로 설계된 마이크로프로세서입니다.긴 이름은 현재와 미래의 온라인 배포 시스템의 구성 요소로서 의도된 사용을 나타냅니다. 따라서 HDTV 시스템뿐만 아니라 고화질 디스플레이 및 기록 장비에도 사용될 수 있습니다.또한 프로세서는 디지털 이미징 시스템(의료, 과학 등) 및 물리적 시뮬레이션(과학 및 구조 엔지니어링 모델링 등)에 적합할 수 있습니다.
간단한 분석에서, Cell프로세서 4가지 요소:외부 입력 및 출력 구조로 분할될 수 있다면, 메인 프로세서 전원 처리 요소(PPE)8를 완전히 co-processors은 상승 처리 요소 또는 SPEs고 전문 high-라고 불리는(는 양방향PowerPC에서 202핵심 simultaneous-multithreaded)[23]요구했다.밴드EIB(Element Interconnect Bus)라고 불리는 PPE, 입출력 요소 및 SPE를 연결하는 폭 원형 데이터 버스.
MPEG 스트림의 디코딩/인코딩, 3차원 데이터의 생성 또는 변환, 데이터의 푸리에 분석 등 수학적으로 부하가 높은 태스크에 필요한 고성능을 달성하기 위해 Cell 프로세서는 EIB를 통해 SPE와 PPE를 결합하고 완전 캐시 DMA(직접 메모리)를 통해 양쪽 메인 메모리에 대한 액세스를 제공합니다.및 기타 외부 데이터 스토리지로 이동합니다.EIB를 최대한 활용하고 계산과 데이터 전송을 오버랩하기 위해 9개의 처리 요소(PPE 및 SPE) 각각에 DMA 엔진이 장착되어 있습니다.SPE의 로드/스토어 명령은 자체 로컬 스크래치패드 메모리에만 액세스할 수 있으므로 각 SPE는 메인 메모리 및 다른 SPE의 로컬 메모리와 데이터를 주고받을 때 전적으로 DMA에 의존합니다.DMA 동작은 최대 16KB 크기의 단일 블록 영역 또는 2 ~2048의 블록 목록을 전송할 수 있습니다.Cell 아키텍처의 주요 설계 결정 중 하나는 칩 내 데이터 전송의 중심 수단으로서 DMA를 사용하는 것입니다.이는 [24]칩 내 데이터 처리의 최대 비동기 및 동시성을 가능하게 하기 위한 것입니다.
PPE는 기존 운영체제를 실행할 수 있으며 SPE를 제어할 수 있으며 SPE에서 실행되는 프로세스의 시작, 중지, 중단 및 스케줄이 가능합니다.이를 위해 PPE에는 SPE 제어와 관련된 추가 지침이 있습니다.SPE와 달리 PPE는 표준 로드/스토어 명령을 통해 SPE의 메인 메모리와 로컬 메모리를 읽고 쓸 수 있습니다.튜링의 완전한 아키텍처를 가지고 있음에도 불구하고, SPE는 완전히 자율적이지 않고 그들이 유용한 작업을 하기 전에 그것들을 프라이밍할 것을 PPE에 요구한다.시스템의 「마력」의 대부분은 시너지 효과가 있는 처리 요소로부터 나오기 때문에, 데이터 전송 방법으로서 DMA 를 사용하는 것과 각 SPE 의 로컬 메모리 풋 프린트의 제한은, 이 마력을 최대한으로 활용하고 싶은 소프트웨어 개발자에게 큰 과제가 됩니다.최대한의 퍼포먼스를 얻기 위해서, 프로그램의 세심한 수동 조정이 필요합니다.이 CPU로부터.
PPE 및 버스 아키텍처에는 다양한 수준의 메모리 보호를 제공하는 다양한 동작 모드가 포함되어 있어 SPE 또는 PPE에서 실행되는 특정 프로세스에 의해 메모리 영역을 액세스로부터 보호할 수 있습니다.
PPE와 SPE는 모두 고정폭 32비트 명령 포맷을 가진 RISC 아키텍처입니다.PPE에는 64비트 General Purpose Register Set(GPR; 범용 레지스터 세트), 64비트 Floating Point Register Set(FPR; 부동소수점 레지스터 세트) 및 128비트 Altivec 레지스터 세트가 포함되어 있습니다.SPE에는 128비트 레지스터만 포함되어 있습니다.8비트~64비트 크기의 스칼라 데이터 타입 또는 다양한 정수 및 부동소수점 형식의 SIMD 계산에 사용할 수 있습니다.PPE 와 SPE 의 양쪽 모두의 시스템 메모리 주소는, 이론적인 주소 범위인64 2 바이트(16 엑사바이트 또는 1677만7216 테라바이트)의 64 비트치로 표시됩니다.실제로는 이들 비트가 모두 하드웨어에 구현되는 것은 아닙니다.SPU(Synergistic Processor Unit) 프로세서 내부의 로컬 스토어 주소는 32비트 단어로 표현됩니다.Cell 관련 문서에서는 워드는 항상 32비트, 더블워드는 64비트, 쿼드워드는 128비트를 의미합니다.
PowerXCell 8i
2008년 IBM은 PowerXCell [25]8i라고 불리는 Cell의 개정 버전을 발표했는데, 이는 IBM의 QS22 블레이드 서버에서 사용할 수 있습니다.PowerXCell은 65nm 프로세스로 제조되어 최대 32GB의 슬롯 DDR2 메모리를 지원하며 SPE의 2배 정밀 부동소수점 퍼포먼스를 최대 12.8GFLOPS에서 최대 102.4GFLOPS로 대폭 향상시킵니다.이러한 퍼포먼스는 공교롭게도 8개의 SPE에서 최대 성능과 동일합니다.비슷한 시기에 발매된 ssor.2008-2009년 세계에서 가장 빠른 IBM Roadrunner 슈퍼컴퓨터는 12,240개의 PowerXCell 8i 프로세서와 6,562개의 AMD Opteron [26]프로세서로 구성되었습니다.PowerXCell 8i 탑재 슈퍼컴퓨터도 Green500 리스트에서 상위6대의 '친환경' 시스템을 모두 장악하여 세계에서 [27]가장 높은 MFLOPS/W 비율의 슈퍼컴퓨터를 보유하고 있습니다.QS22 및 슈퍼컴퓨터 외에 PowerXCell 프로세서는 PCI Express 카드의 액셀러레이터로도 사용할 수 있으며 QPACE 프로젝트의 핵심 프로세서로 사용됩니다.
PowerXCell 8i는 RAMBUS 메모리 인터페이스를 삭제하고 DDR2 인터페이스와 확장 SPE를 대폭 추가했기 때문에 칩 레이아웃을 재작업해야 했습니다.그 결과 칩 다이와 [28]패키징이 모두 커졌습니다.
아키텍처
셀 칩은 다양한 구성을 가질 수 있지만 기본 구성은 1개의 "Power Processor Element"("PPE")와 여러 개의 "Synergistic Processing Element"("SPE")[29]로 구성된 멀티 코어 칩입니다.PPE 및 SPE는 "Element Interconnect Bus"(EIB)라는 내부 고속 버스를 통해 서로 연결됩니다.
전력 프로세서 요소(PPE)
PPE는[30][31][32] PowerPC 기반의 듀얼 이슈 쌍방향 동시 멀티스레드 CPU 코어로, 연산 워크로드의 대부분을 처리하는8개의 SPE의 컨트롤러로서 기능하는 23단계 파이프라인이 있습니다.PPE는 순서가 맞지 않는 실행 기능이 제한되어 있어 로드를 순서대로 실행할 수 없고 실행 파이프라인이 지연됩니다.PPE는 다른 64비트 PowerPC 프로세서와 유사하기 때문에 기존 운영체제에서 동작합니다.SPE는 벡터화된 부동소수점 코드를 실행하도록 설계되어 있습니다.PPE에는 64KiB 레벨1 캐시(32KiB 명령 및 32KiB 데이터)와 512KiB 레벨2 캐시가 포함되어 있습니다.캐시 행의 크기는 128바이트입니다.또한 IBM은 완전히 단일 정밀도 부동 소수 점(Altivec 1배정 밀도 부동 소수 점 벡터를 지원하지 않습니다.)에 파이프 라인은 알티벡(VMX)unit[33], 32비트 고정 포인트 단위 64비트 레지스터 파일과 실 하중과 상가 단위(회선 선정 장치), 64비트 Floating-Point 단위(최초 생산 단위), 파출소 단위(BRU)과 파출소 ISO이미지는 당(FXU)를 포함하고 있다.인하.이온 유닛(BXU)[30]PPE는 다음 3개의 주요 유닛으로 구성됩니다.명령 유닛(IU), 실행 유닛(XU) 및 벡터/스칼라 실행 유닛(VSU)입니다.IU에는 L1 명령 캐시, 분기 예측 하드웨어, 명령 버퍼 및 종속성 검사 로직이 포함되어 있습니다.XU에는 Integer Execution Unit(FXU; 정수 실행 유닛) 및 Load-Store Unit(LSU; 로드스토어 유닛)이 포함되어 있습니다.VSU에는 FPU 및 VMX의 모든 실행 리소스가 포함되어 있습니다.각 PPE는 스칼라 퓨전 다중 추가 명령을 사용하여 클럭 사이클당 2배의 정밀도 작업을 완료할 수 있습니다.즉, 3.2GHz에서 6.4GFLOPS로 변환되는 클럭 사이클당 8개의 단일 정밀도 작업을 수행할 수 있습니다.3.2GHz의 [34]PS
Xbox 360의 제논
PPE는 Cell 프로세서용으로 특별히 설계되었지만, 개발 중에 Microsoft는 IBM에 Xbox 360용 고성능 프로세서 코어를 요구했습니다.IBM은 VMX128 [35][36]확장이 추가된 PPE의 약간 수정된 버전을 기반으로 트라이코어 제논 프로세서를 준수하여 만들었습니다.
시너지 처리 요소(SPE)
각 SPE는 'Synergistic Processing Unit',[37] SPU 및 'Memory Flow Controller', MFC(DMA, MMU 및 버스인터페이스)로 구성된 이중 프로세서입니다.SPE에는 분기 예측 하드웨어가 없습니다(따라서 [38]컴파일러에 큰 부담이 됩니다).각 SPE에는 홀수 파이프라인과 짝수 파이프라인으로 나누어진6개의 실행 유닛이 있습니다.SPU는 128비트 SIMD 조직을[33][39][40] 가진 특수 개발 명령 세트(ISA)를 실행하여 단일 및 이중 정밀 명령을 수행합니다.최신 세대의 Cell에서는 각 SPE에는 명령 및 데이터용 256KiB 내장 SRAM이 포함되어 있습니다.이 Sony의 문서에서는 VRAM을 나타내는 "로컬 메모리"로 오인되지 않도록 합니다.이 SRAM은 PPE에 표시되며 소프트웨어로 직접 수신처 지정이 가능합니다.각 SPE는 최대 4 GiB의 로컬스토어 메모리를 지원할 수 있습니다.로컬 스토어는 소프트웨어에 대해 투과적이지 않고 로드할 데이터를 예측하는 하드웨어 구조를 포함하지 않기 때문에 기존 CPU 캐시와 같이 작동하지 않습니다.SPE에는 128비트, 128엔트리 레지스터 파일이 포함되어 있으며 90nm 프로세스에서는 14.5mm입니다2.SPE는 1개의 클럭사이클로 16개의 8비트 정수, 8개의 16비트 정수, 4개의 32비트 정수 또는4개의 단정도 부동소수점 숫자에 대해 동작할 수 있으며 메모리 동작도 가능합니다.SPU는 시스템메모리에 직접 액세스 할 수 없습니다.SPU에 의해 형성된 64비트 가상 메모리주소를 SPU에서SPE Memory Flow Controller(MFC; 메모리플로우 컨트롤러)로 전달하고 시스템주소 공간 내에서 DMA 동작을 셋업 할 필요가 있습니다.
일반적인 사용 시나리오 중 하나에서는 시스템이 SPE에 작은 프로그램(스레드와 유사)을 로드하여 복잡한 작동의 각 단계를 처리하기 위해 SPE를 함께 연결합니다.예를 들어 셋톱박스는 DVD, 비디오 및 오디오 디코딩, 디스플레이를 읽기 위한 프로그램을 로드하고 데이터가 SPE에서 SPE로 전달되어 최종적으로 TV에 표시됩니다.또 다른 방법은 입력 데이터 세트를 분할하여 여러 SPE가 같은 종류의 동작을 병렬로 실행하는 것입니다.3.2GHz에서 각 SPE는 이론적으로 25.6GFLOPS의 단정도 성능을 제공합니다.
Cell 프로세서의 전반적인 부동소수점 성능은 동시대 PC에 비해 상대적으로 높기 때문에 Pentium 4나 Athlon 64와 같은 CPU에서 SIMD 유닛의 능력을 약화시키는 것으로 보입니다.단, 시스템의 부동소수점 능력만을 비교하는 것은 1차원 어플리케이션 고유의 메트릭입니다.Cell 프로세서와 달리 이러한 데스크톱 CPU는 일반적으로 개인용 컴퓨터에서 실행되는 범용 소프트웨어에 더 적합합니다.인텔 및 AMD 프로세서는 클럭당 여러 명령을 실행할 뿐만 아니라 브랜치 프레딕터를 갖추고 있습니다.Cell은 컴파일러의 지원을 받아 이를 보완하도록 설계되었으며, 여기서 분기 준비 명령이 작성됩니다.퍼스널 컴퓨터에서 사용되며 과학 컴퓨팅에서 자주 사용되는 배정도 부동소수점 연산의 경우 셀의 퍼포먼스는 몇 배 정도 떨어지지만 여전히 20.8GFLOPS(SPE당 1.8GFLOPS, PPE당 6.4GFLOPS)에 도달합니다.배정도용으로 특별히 설계된 PowerXCell 8i 베리안트는 배정도 계산 [41]시 102.4GFLOPS에 도달합니다.
IBM의 테스트에 따르면 SPE는 최적화된 병렬 [34]행렬 곱셈을 실행하면서 이론적인 피크 성능의 98%에 도달할 수 있습니다.
도시바는 4개의 SPE로 구동되는 공동 프로세서를 개발했지만, 소비자 가전제품에서 3D 및 영화 효과를 가속화하기 위해 설계된 SpursEngine이라고 불리는 PPE는 개발하지 않았습니다.
각 SPE의 로컬메모리는 [42]256KB입니다SPE에는 합계 2MB의 로컬메모리가 있어요
EIB(Element Interconnect Bus)
EIB는 Cell 프로세서의 내부 통신 버스로서 다양한 온칩 시스템 요소(PPE 프로세서, 메모리 컨트롤러(MIC), 8개의 SPE 코프로세서 및 2개의 오프칩 I/O 인터페이스)를 연결하여 PS3의 총 12명의 참가자를 대상으로 합니다(SPU의 수는 산업 애플리케이션에 따라 다를 수 있습니다).EIB에는 신호등 세트로서 기능하는 조정 유닛도 포함되어 있습니다.일부 문서에서 IBM은 EIB 참가자를 '단위'라고 부릅니다.
EIB는 현재 쌍으로 역회전하는 4개의 16바이트 폭 단방향 채널로 구성된 순환 링으로 구현되어 있습니다.트래픽 패턴이 허가되면 각 채널은 최대 3개의 트랜잭션을 동시에 전송할 수 있습니다.EIB는 시스템클럭 레이트의 절반으로 동작하기 때문에 유효 채널환율은 2개의 시스템클럭마다 16바이트입니다4개의 링 각각에 3개의 액티브한 트랜잭션이 있는 경우 최대 순간 EIB 대역폭은 클럭당 96바이트(12개의 동시 트랜잭션×16바이트 폭/전송당 2개의 시스템클럭)입니다.이 수치는 IBM 문헌에서 자주 인용되지만, 단순히 프로세서 클럭 속도로 이 수치를 조정하는 것은 비현실적입니다.중재단위는 추가적인 제약을 가한다.
EIB 수석 설계자인 IBM 선임 엔지니어 David Krolak은 동시성 모델에 대해 설명합니다.
링은 3사이클마다 새로운 동작을 시작할 수 있습니다.각각의 전송은 항상 8박자로 이루어집니다.이것은 델이 심플하게 한 것 중 하나입니다.작은 작업을 하면 제대로 작동하지 않습니다.이 선로를 달리는 8량 열차를 생각하면 서로 마주치지 않는 한 [43]선로에서는 공존할 수 있습니다.
EIB의 각 참가자는 1개의 16바이트 읽기 포트와1개의 16바이트 쓰기 포트를 가지고 있습니다.1명의 참가자에 대한 제한은 EIB 클럭당 16바이트의 속도로 읽고 쓰는 것입니다(단순함을 위해 시스템클럭당 8바이트로 간주되는 경우가 많습니다.각 SPU 프로세서에는 SPU의 계속적인 계산을 방해하지 않고 다양한 엔드포인트에 대한 트랜잭션의 긴 시퀀스를 스케줄링할 수 있는 전용 DMA 관리 큐가 포함되어 있습니다.이러한 DMA 큐는 로컬 또는 리모트에서도 관리할 수 있어 제어 모델의 유연성을 높일 수 있습니다.
데이터는 링 주위를 단계적으로 EIB 채널로 흐릅니다.참가자가 12명이기 때문에 채널에서 원점까지의 총 스텝 수는 12개입니다.6단계는 참가자 쌍 사이의 가장 긴 거리입니다.EIB 채널은 6단계 이상을 필요로 하는 데이터를 전송할 수 없습니다.이러한 데이터는 다른 방향으로 원을 도는 짧은 경로를 사용해야 합니다.패킷 송신에 관여하는 스텝의 수는 전송 지연에 거의 영향을 주지 않습니다.스텝을 구동하는 클럭 속도는 다른 고려 사항에 비해 매우 빠릅니다.그러나 통신 거리가 길어지면 사용 가능한 동시성이 줄어들기 때문에 EIB의 전반적인 성능에 해가 됩니다.
IBM은 EIB를 보다 강력한 크로스바로 구현하고자 했지만 리소스를 확보하기 위해 채택한 순환 구성이 Cell 칩 전체의 성능에 제한적인 요소가 되는 경우는 거의 없습니다.최악의 경우 프로그래머는 EIB가 높은 동시성 수준에서 기능할 수 있는 통신 패턴을 스케줄하기 위해 각별히 주의해야 합니다.
David Krolak은 다음과 같이 설명했습니다.
개발 초기에는 여러 사람이 크로스바 스위치를 도입했습니다.버스 설계 방식대로라면 칩에 실리콘 공간을 더 많이 할애할 수 있다면 실제로 EIB를 꺼내 크로스바 스위치를 장착할 수 있습니다.연결과 영역 간의 균형을 찾아야 했고, 완전한 크로스바 스위치를 설치할 공간이 충분하지 않았습니다.그래서 우리는 이 고리 구조를 생각해 냈습니다. 매우 흥미롭다고 생각합니다.영역 제약에 적합하면서도 대역폭이 [43]매우 우수합니다.
대역폭 평가
3.2GHz에서는 각 채널은 25.6GB/s의 속도로 흐릅니다.EIB가 접속되어 있는 시스템 요소에서 EIB를 분리하여 표시하면 이 흐름률로 12개의 동시 트랜잭션을 달성하면 307.2 GB/s의 추상 EIB 대역폭이 됩니다.이러한 견해에 따라, 많은 IBM 출판물은 사용 가능한 EIB 대역폭을 "300 GB/s 이상"으로 묘사합니다.이 수치는 프로세서 [44]주파수로 스케일링된 최대 순간 EIB 대역폭을 나타냅니다.
단, 버스에 받아들여지는 패킷의 조정 메커니즘에는 다른 기술적 제약사항이 있습니다.IBM Systems Performance 그룹은 다음과 같이 설명했습니다.
EIB 상의 각 유닛은 버스 사이클마다 16바이트의 데이터를 동시에 송수신할 수 있습니다.EIB 전체의 최대 데이터 대역폭은 시스템 내의 모든 유닛에서 주소가 스누핑되는 최대 환율(버스 사이클마다 1개)에 의해 제한됩니다.각 스누핑 주소 요구는 최대 128바이트까지 전송할 수 있으므로 3.2GHz에서 EIB의 이론상 피크 데이터 대역폭은 128Bx1.6GHz = 204.8GB/[34]s입니다.
이 인용문은 IBM이 이 메커니즘과 그 영향에 대해 공개한 모든 내용을 나타냅니다.세그먼트 또는 페이지 변환 장애에서의 EIB 조정 유닛, 스누핑 메커니즘 및 인터럽트 생성에 대해서는 IBM이 [citation needed]아직 공개하지 않은 매뉴얼세트에는 잘 설명되어 있지 않습니다.
실제로 유효한 EIB 대역폭은 관련된 링 참여자에 의해 제한될 수도 있습니다.9개의 프로세싱 코어는 각각 25.6GB/s의 읽기 및 쓰기를 동시에 지원할 수 있지만 메모리 인터페이스 컨트롤러(MIC)는 XDR 메모리 채널 쌍에 연결되어 읽기 및 쓰기를 조합한 최대 흐름 25.6GB/s를 지원합니다.또한 2개의 IO 컨트롤러는 25.6GB/s의 최대 입력 속도를 지원하는 것으로 알려져 있습니다.Mbined 출력 속도 35 GB/s
혼란을 가중시키기 위해 일부 오래된 간행물에서는 4GHz 시스템클럭을 가정한EIB 대역폭을 언급하고 있습니다.이 레퍼런스 프레임에 의해 EIB 대역폭 수치는 즉시 384 GB/s, 조정 제한 대역폭 수치는 256 GB/s가 됩니다.
가장 자주 인용되는 이론적인 204.8 GB/s 수치로 간주되는 것은 모두 염두에 두는 것이 가장 좋습니다.IBM Systems Performance 그룹은 3.2GHz로 실행되는 Cell 프로세서에서 197GB/s의 SPU 중심 데이터 흐름을 달성한다는 것을 입증했습니다. 따라서 [45]이 수치는 실제 사례에서도 적절한 수치입니다.
메모리 및 I/O컨트롤러
셀에는 Rambus XDR 메모리에 인터페이스하는 듀얼채널 Rambus XIO 매크로가 포함되어 있습니다.Memory Interface Controller(MIC; 메모리인터페이스 컨트롤러)는 XIO 매크로와는 별도로 IBM에 의해 설계되었습니다.XIO-XDR 링크는 핀당 3.2기가비트/초로 동작합니다.2개의 32비트 채널은 이론상 최대 25.6GB/s를 제공할 수 있습니다.
Rambus 설계이기도 한 I/O 인터페이스는 FlexIO로 알려져 있습니다.유연성IO 인터페이스는 12개의 레인으로 구성되어 있으며 각 레인은 단방향 8비트 와이드 포인트 투 포인트 패스입니다.5개의 8비트 와이드 포인트 투 포인트 패스는 Cell에 대한 인바운드레인이고 나머지 7개는 아웃바운드레인입니다이는 이론적으로 2.6GHz에서 62.4GB/s(발신 36.4GB/s, 착신 26GB/s)의 최대 대역폭을 제공합니다.유연성IO 인터페이스는 3.2GHz로 독립적으로 클럭할 수 있습니다.4개의 착신 레인과 4개의 발신 레인이 메모리 일관성을 지원합니다.
사용 가능한 응용 프로그램
비디오 처리 카드
Leadtek 등의 일부 회사는 H.264, MPEG-2 및 MPEG-4 비디오의 "[46]실시간보다 빠른" 트랜스코딩을 가능하게 하기 위해 Cell 기반의 PCI-E 카드를 출시했습니다.
블레이드 서버
2007년 8월 29일, IBM은 BladeCenter QS21을 발표했습니다. 측정된 와트당 1.05기가 부동 소수점 운영 수(기가플로스)를 생성하며, 최고 성능은 약 460GFLOPS입니다. 지금까지 가장 효율적인 컴퓨팅 플랫폼 중 하나입니다.1개의 BladeCenter 섀시로 6.4 테라 플로팅 포인트 연산/초(teraFLOPS) 및 25.8 테라 FLOPS를 표준 42U [47]랙에서 달성할 수 있습니다.
2008년 5월 13일, IBM은 BladeCenter QS22를 발표했습니다.QS22에는 PowerXCell 8i 프로세서가 탑재되어 있어 QS21의 5배의 정밀도 부동소수점 퍼포먼스와 최대 32GB의 DDR2 메모리를 [48]탑재할 수 있습니다.
IBM은 2012년 [49]1월 12일부로 Cell 프로세서를 기반으로 하는 블레이드 서버 라인을 중단했습니다.
PCI Express 보드
여러 회사가 IBM PowerXCell 8i를 사용하는 PCI-e 보드를 제공합니다.퍼포먼스는 2.8GHz에서 179.2 GFlops(SP),[50][51] 89.6 GFlops(DP)로 보고됩니다.
콘솔 비디오 게임
소니의 플레이스테이션 3 비디오 게임 콘솔은 소니가 프로세서 제조 수율을 높일 수 있도록 하기 위해 3.2GHz로 측정되며 8개의 작동 SPE 중 7개를 포함하는 Cell 프로세서의 첫 생산 어플리케이션이었다.7개의 SPE 중 1개는 [20]OS에 의해 예약되어 있기 때문에 개발자가 액세스할 수 있습니다.
홈시네마
도시바는 셀을 이용해 HDTV를 생산했다.그들은 48개의 표준 화질 MPEG-2 스트림을 1920×1080 [52][53]화면에 동시에 디코딩하는 시스템을 제시했다.이를 통해 시청자는 화면에 동시에 표시되는 수십 개의 섬네일 비디오를 기반으로 채널을 선택할 수 있습니다.
슈퍼컴퓨팅
IBM의 슈퍼컴퓨터 IBM Roadrunner는 Cell 프로세서뿐만 아니라 General Purpose x86-64 Opteron의 하이브리드 모델이었다.이 시스템은 표준 LINPACK 벤치마크를 사용하여 1.026페타플롭스 속도를 유지한 최초의 슈퍼컴퓨터로서 2008년 6월 Top 500 리스트에서 1위를 차지했습니다.IBM Roadrunner는 65nm 기술을 사용하여 제조된 PowerXCell 8i 버전의 Cell 프로세서와 128비트 레지스터에서 2배 정밀 계산을 처리할 수 있는 향상된 SPU를 사용하여 [54][55]칩당 102 GFLOPS에 도달했습니다.
클러스터 컴퓨팅
PlayStation 3 콘솔 클러스터는 셀 블레이드를 기반으로 하는 하이엔드 시스템의 매력적인 대안입니다.테네시 대학 컴퓨터 과학부에 있는 잭 동가라가 이끄는 혁신 컴퓨팅 연구소(Innovative Computing Laboratory)는 이러한 애플리케이션을 상세하게 [56]조사했습니다.Terasoft Solutions는 Dongara의 조사를 구현한 Yellow Dog Linux가 프리 인스톨된 8노드 및 32노드 PS3 클러스터를 판매하고 있습니다.
2007년 [57]10월 17일 Wired에 의해 처음 보고된 바와 같이, 클러스터 구성에서 PlayStation 3을 사용하는 흥미로운 응용 프로그램은 매사추세츠 다트머스 대학의 물리학과 천체물리학자인 Gaurav Khanna에 의해 구현되었습니다.Gaurav Khanna는 슈퍼컴퓨터에서 사용된 시간을 8개의 PlayStation 3s 클러스터로 대체했습니다.그 후, PlayStation 3 Gravity Grid라고 불리는 이 기계의 다음 세대는 16개의 기계로 이루어진 네트워크를 사용하며, 섭동 이론을 이용한 바이너리 블랙홀 병합인 의도된 애플리케이션을 위해 Cell 프로세서를 활용합니다.특히 이 성단은 작은 크기의 물체를 포착하는 거대한 초대질량 블랙홀의 천체물리학적 시뮬레이션을 수행하고 관련 과학 연구 [58]문헌에 여러 차례 발표된 수치 데이터를 생성했다.PlayStation 3에서 사용하는 Cell 프로세서 버전에는 사용자가 사용할 수 있는 메인 CPU와 6개의 SPE가 있으며, Gravity Grid 머신에는 16개의 범용 프로세서와 96개의 벡터 프로세서가 있습니다.이 기계는 제작하는 데 1회 비용이 9,000달러이며 블랙홀 시뮬레이션에 적합하다. 그렇지 않으면 기존의 슈퍼컴퓨터에서 실행당 6,000달러가 들 것이다.블랙홀 계산은 메모리를 많이 사용하지 않고 현지화 가능성이 높기 때문에 이 아키텍처에 적합합니다.Khanna는 시뮬레이션을 통해 클러스터 성능이 인텔 Xeon 코어 기반의 기존 Linux 클러스터 성능보다 100 이상 높다고 주장했습니다.PS3 Gravity Grid는 2007년,[59] 2008년,[60][61] 2009년 [62][63][64]및 [65][66]2010년에 걸쳐 언론의 주목을 받았습니다.
바르셀로나 소재 Universitat Pompeu Fabra의 컴퓨터 생화학 및 생물물리학 연구소는 2007년에 Cell 프로세서를 위해 특별히 설계된 CellMD 소프트웨어를 기반으로 한 공동 컴퓨팅용 PS3GRID라고[67] 하는 BOINC 시스템을 도입했습니다.
미국 공군 연구소는 고해상도 위성 이미지 분석을 위해 "콘도르 클러스터"라는 별명을 가진 1700대 이상의 PlayStation 3 클러스터를 배치했습니다.공군은 콘도르 클러스터가 [68]용량 면에서 세계에서 33번째로 큰 슈퍼컴퓨터라고 주장한다.그 연구소는 그 슈퍼컴퓨터를 대학들이 [69]연구를 위해 사용할 수 있도록 개방했다.
분산 컴퓨팅
50만대 이상의 PlayStation 3 콘솔의 컴퓨팅 능력을 통해 분산 컴퓨팅 프로젝트 Folding@home은 기네스 세계기록에 의해 세계에서 가장 강력한 분산 네트워크로 인정받고 있습니다.최초의 기록은 2007년 9월 16일에 달성되었습니다.프로젝트는 지금까지 분산 컴퓨팅 네트워크에 의해 달성된 적이 없었던1 페타플롭스를 넘어섰습니다.게다가 PS3 만이 2007년 9월 23일에 petaFLOPS 를 달성할 수 있었습니다.이에 비해 당시 세계에서 두 번째로 강력한 슈퍼컴퓨터였던 IBM의 BlueGene/L은 약 478.2 테라FLOPS로 작동했습니다. 즉, Folding@home의 컴퓨팅 성능은 BlueGene/L의 약 2배입니다(BlueGene/L의 CPU 인터커넥트는 네트워크에서는 100만 배 이상 빠릅니다).2011년 5월 7일 현재 Folding@home은 약 9.3 x 86 petaFLOPS로 구동되며, 액티브 PS3에서만 1.6 petaFLOPS가 생성됩니다.
메인프레임
IBM은 2007년 4월 25일 자사의 Cell Broadband Engine Architecture 마이크로프로세서를 회사의 메인프레임 [70]라인에 통합하기 시작할 것이라고 발표했습니다.이것은 게임 프레임으로 이어졌다.
패스워드 크래킹
프로세서의 아키텍처는 기존 [71]프로세서보다 하드웨어 지원 암호화의 무차별 공격 애플리케이션에 더 적합합니다.
소프트웨어 엔지니어링
Cell은 유연성이 있기 때문에 다양한 컴퓨팅 [72]패러다임에만 국한되지 않고 리소스를 활용할 수 있는 몇 가지 가능성이 있습니다.
작업 큐
PPE는 작업 큐를 유지하고 SPE에서 작업을 스케줄링하며 진행 상황을 모니터링합니다.각 SPE는 작업을 가져와 실행하고 PPE와 동기화하는 역할을 하는 "mini kernel"을 실행합니다.
SPE 셀프 멀티태스킹
미니 커널과 스케줄링은 SPE에 분산되어 있습니다.작업은 기존 운영 체제에서처럼 뮤텍스 또는 세마포어를 사용하여 동기화됩니다.Ready to Run 태스크는 SPE가 실행할 때까지 큐에서 대기합니다.SPE는 이 설정의 모든 작업에 공유 메모리를 사용합니다.
스트림 처리
각 SPE는 개별 프로그램을 실행합니다.데이터는 입력 스트림에서 SPE로 전송됩니다.SPE가 처리를 종료하면 출력 데이터가 출력 스트림으로 전송됩니다.
이를 통해 스트림 처리를 위한 유연하고 강력한 아키텍처가 제공되며 각 SPE에 대해 개별적으로 명시적인 스케줄링이 가능합니다.다른 프로세서도 스트리밍 작업을 수행할 수 있지만 로드된 커널에 의해 제한됩니다.
오픈 소스 소프트웨어 개발
2005년에 IBM [73]개발자는 Linux 커널에서 Cell 지원을 가능하게 하는 패치를 제출했습니다.Arnd Bergmann(상기 패치 개발자 중 한 명)은 Linux Tag [74]2005의 Linux 기반 Cell 아키텍처에 대해서도 설명했습니다.릴리스 2.6.16(2006년 3월 20일)에서 Linux 커널은 Cell [75]프로세서를 공식적으로 지원합니다.
PPE와 SPE는 모두 라이브러리에서 제공되는 공통 API를 사용하여 C/C++로 프로그래밍할 수 있습니다.
Fixstars Solutions는 PlayStation [76]3뿐만 아니라 IBM 및 Mercury Cell 기반 시스템용 Yellow Dog Linux를 제공합니다.Terra Soft는 전략적으로 Mercury와 제휴하여 Linux Board Support Package for Cell을 제공하고 IBM BladeCenter JS21 및 Cell QS20 및 Mercury Cell 기반 [77]솔루션을 비롯한 다양한 Cell 플랫폼에서 소프트웨어 애플리케이션을 지원 및 개발했습니다.또한 Terra Soft는 Y-HPC(High Performance Computing) Cluster Construction and Management Suite와 Y-Bio 유전자 배열 분석 도구도 관리하고 있습니다.Y-Bio는 패키지 관리를 위해 RPM Linux 표준을 기반으로 구축되었으며 생물정보학 연구자들이 보다 [78]효율적으로 작업을 수행할 수 있도록 지원하는 도구를 제공합니다.IBM은 SPE 리소스에 대한 액세스 및 사용을 단순화하는 Linux용 의사 파일 시스템 "스푸프"를 개발했습니다.IBM은 현재 Linux 커널 및 GDB 포트를 유지하고 있으며 Sony는 GNU 툴 체인(GCC, binutils)[79]을 유지하고 있습니다.
2005년 11월, IBM은 시뮬레이터와 다양한 도구로 구성된 "Cell Broadband Engine (CBE) Software Development Kit Version 1.0"을 웹 사이트에 공개했습니다.Fedora Core 4용 최신 커널 및 툴의 개발 버전은 바르셀로나 슈퍼컴퓨팅 센터의 [80]웹사이트에 있습니다.
2007년 8월 Mercury Computer Systems는 고성능 [81]컴퓨팅용 PlayStation 3 소프트웨어 개발 키트를 출시했습니다.
2007년 11월 Fixstars Corporation은 셀용 OpenCV API를 가속화하는 것을 목표로 새로운 "CVCell" 모듈을 출시했습니다.일련의 소프트웨어 계산 테스트에서는 3.2GHz Cell 프로세서의 실행 시간이 2.4GHz Intel Core 2 [82]Duo의 같은 소프트웨어에 비해 6배에서 27배 빨라졌습니다.
갤러리
셀/B의 다양한 세대의 그림.E. 프로세서와 PowerXCell 8i.이미지는 축척되지 않습니다(All Cell/B).E. 패키지는 42.5×42.5mm, PowerXCell 8i는 47.5×47.5mm입니다.
「 」를 참조해 주세요.
- 셀 프로세서의 STI 컴피턴스 센터
- Adapteva Epiphany 아키텍처는 로컬 스토어 및 DMA와 유사한 네트워크 온 칩이지만 더 많은 코어와 더 쉬운 오프 코어 통신을 제공합니다.
- Vision Processing Unit(비전 처리 유닛)은 유사한 기능을 가진 새로운 클래스의 프로세서입니다.
- MPSoc
- 옥토파일러
- 제논(프로세서)
- IBM 파워PC
레퍼런스
- ^ a b Gschwind, Michael; Hofstee, H. Peter; Flachs, Brian; Hopkins, Martin; Watanabe, Yukio; Yamazaki, Takeshi (2006). "Synergistic Processing in Cell's Multicore Architecture". IEEE Micro. IEEE. 26 (2): 10–24. doi:10.1109/MM.2006.41. S2CID 17834015.
- ^ "Cell Designer talks about PS3 and IBM Cell Processors". Archived from the original on August 21, 2006. Retrieved March 22, 2007.
- ^ Gaudin, Sharon (June 9, 2008). "IBM's Roadrunner smashes 4-minute mile of supercomputing". Computerworld. Archived from the original on December 24, 2008. Retrieved June 10, 2008.
- ^ Fildes, Jonathan (June 9, 2008). "Supercomputer sets petaflop pace". BBC News. Retrieved June 9, 2008.
- ^ Shankland, Stephen (February 22, 2006). "Octopiler seeks to arm Cell programmers". CNET. Retrieved March 22, 2007.
- ^ "Cell Broadband Engine Software Development Kit Version 1.0". LWN. November 10, 2005. Retrieved March 22, 2007.
- ^ Krewell, Kevin(2005년 2월 14일).'셀이 각광을 받다'마이크로프로세서 리포트
- ^ a b "Introduction to the Cell multiprocessor". IBM Journal of Research and Development. August 7, 2005. Archived from the original on February 28, 2007. Retrieved March 22, 2007.
- ^ a b c "IBM Produces Cell Processor Using New Fabrication Technology". X-bit labs. Archived from the original on March 15, 2007. Retrieved March 12, 2007.
- ^ "65nm CELL processor production started". PlayStation Universe. January 30, 2007. Archived from the original on February 2, 2007. Retrieved May 18, 2007.
- ^ Stokes, Jon (February 7, 2008). "IBM shrinks Cell to 45nm. Cheaper PS3s will follow". Arstechnica.com. Retrieved September 19, 2012.
- ^ "IBM Offers Higher Performance Computing Outside the Lab". IBM. Retrieved May 15, 2008.
- ^ "Sony answears our questions about the new PlayStation 3". Ars Technica. August 18, 2009. Retrieved August 19, 2009.
- ^ "Will Roadrunner Be the Cell's Last Hurrah?". October 27, 2009. Archived from the original on October 31, 2009.
- ^ "SC09: IBM lässt Cell-Prozessor auslaufen". HeiseOnline. November 20, 2009. Retrieved November 21, 2009.
- ^ "IBM have not stopped Cell processor development". DriverHeaven.net. November 23, 2009. Archived from the original on November 25, 2009. Retrieved November 24, 2009.
- ^ Becker, David (February 7, 2005). "PlayStation 3 chip has split personality". CNET. Retrieved May 18, 2007.
- ^ a b Thurrott, Paul (May 17, 2005). "Sony Ups the Ante with PlayStation 3". WindowsITPro. Archived from the original on September 30, 2007. Retrieved March 22, 2007.
- ^ a b Roper, Chris (May 17, 2005). "E3 2005: Cell Processor Technology Demos". IGN. Retrieved March 22, 2007.
- ^ a b Martin Linklater. "Optimizing Cell Core". Game Developer Magazine, April 2007. pp. 15–18.
To increase fabrication yields, Sony ships PlayStation 3 Cell processors with only seven working SPEs. And from those seven, one SPE will be used by the operating system for various tasks, This leaves six SPEs and 1 PPE for game programmers to use.
- ^ a b "Mercury Wins IBM PartnerWorld Beacon Award". Supercomputing Online. April 12, 2007. Retrieved May 18, 2007.[데드링크]
- ^ "Fixstars Releases Accelerator Board Featuring the PowerXCell 8i". Fixstars Corporation. April 8, 2008. Archived from the original on January 5, 2009. Retrieved August 18, 2008.
- ^ Koranne, Sandeep (2009). Practical Programming on the Cell Broadband Engine. Springer Science & Business Media. p. 17. ISBN 9781441903082.
- ^ Gschwind, Michael (2006). "Chip multiprocessing and the cell broadband engine". ACM. Retrieved June 29, 2008.
- ^ Cell Broadband Engine Programming Handbook Including the PowerXCell 8i Processor (PDF) (1.11 ed.). May 12, 2008. Archived from the original (PDF) on March 11, 2018. Retrieved March 10, 2018.
- ^ "IBM announces PowerXCell 8i, QS22 blade server". Beyond3D. May 2008. Archived from the original on June 16, 2008. Retrieved June 10, 2008.
- ^ "The Green500 List - November 2009". Archived from the original on February 23, 2011.
- ^ "Packaging the Cell Broadband Engine Microprocessor for Supercomputer Applications" (PDF). Archived from the original (PDF) on January 4, 2014. Retrieved January 4, 2014.
- ^ "Cell Microprocessor Briefing". IBM, Sony Computer Entertainment Inc., Toshiba Corp. February 7, 2005.
- ^ a b Kim, Hyesoon (Spring 2011). "CS4803DGC Design and Programming of Game Console" (PDF).
- ^ Koranne, Sandeep (2009). Practical Computing on the Cell Broadband Engine. Springer Science+Business Media. p. 19.
- ^ Hofstee, H. Peter (2005). "All About the Cell Processor" (PDF). Archived from the original (PDF) on September 6, 2011.
- ^ a b "Power Efficient Processor Design and the Cell Processor" (PDF). IBM. February 16, 2005.
- ^ a b c "Cell Broadband Engine Architecture and its first implementation". IBM developerWorks. November 29, 2005. Retrieved April 6, 2006.
- ^ Alexander, Leigh (January 16, 2009). "Processing The Truth: An Interview With David Shippy]". Gamasutra.
- ^ Last, Jonathan V. (December 30, 2008). "Playing the Fool". Wall Street Journal.
- ^ SPU Application Binary Interface Specification (PDF). July 18, 2008. Archived from the original (PDF) on November 18, 2014. Retrieved January 24, 2015.
- ^ "IBM Research - Cell". IBM. Retrieved June 11, 2005.
- ^ "Synergistic Processing in Cell's Multicore Architecture" (PDF). IEEE Micro. March 2006. Retrieved November 1, 2006.
- ^ "A novel SIMD architecture for the Cell heterogeneous chip-multiprocessor" (PDF). Hot Chips 17. August 15, 2005. Archived from the original (PDF) on July 9, 2008. Retrieved January 1, 2006.
- ^ "Cell successor with turbo mode - PowerXCell 8i". PPCNux. November 2007. Retrieved June 10, 2008.
- ^ OpenMP on Cell 지원, IBM T. J Watson Research
- ^ a b "Meet the experts: David Krolak on the Cell Broadband Engine EIB bus". IBM. December 6, 2005. Retrieved March 18, 2007.
- ^ "Cell Multiprocessor Communication Network: Built for Speed" (PDF). IEEE. Archived from the original (PDF) on January 7, 2007. Retrieved March 22, 2007.
- ^ "Cell Broadband Engine Architecture and its first implementation". Ibm.com. November 29, 2005. Retrieved September 19, 2012.
- ^ "Leadtek PxVC1100 MPEG-2/H.264 Transcoding Card".
- ^ "IBM Doubles Down on Cell Blade" (Press release). Armonk, New York: IBM. August 29, 2007. Retrieved July 19, 2017.
- ^ "IBM Offers High Performance Computing Outside the Lab" (Press release). Armonk, New York: IBM. May 13, 2008. Retrieved July 19, 2017.
- ^ Morgan, Timothy Prickett (June 28, 2011). "IBM to snuff last Cell blade server". The Register. Retrieved July 19, 2017.
- ^ "Fixstars Press Release". Archived from the original on January 5, 2009. Retrieved August 18, 2008.
- ^ "Cell-based coprocessor card runs Linux". Archived from the original on May 2, 2009.
- ^ "Toshiba Demonstrates Cell Microprocessor Simultaneously Decoding 48 MPEG-2 Streams". Tech-On!. April 25, 2005.
- ^ "Winner: Multimedia Monster". IEEE Spectrum. January 1, 2006. Archived from the original on January 18, 2006. Retrieved January 22, 2006.
- ^ "Beyond a Single Cell" (PDF). Los Alamos National Laboratory. Archived from the original (PDF) on July 8, 2009. Retrieved April 6, 2017.
- ^ "The Potential of the Cell Processor for Scientific Computing". ACM Computing Frontiers. 2005. Retrieved April 6, 2017.
- ^ "SCOP3: A Rough Guide to Scientific Computing On the PlayStation 3" (PDF). Computer Science Department, University of Tennessee. Archived from the original (PDF) on October 15, 2008. Retrieved May 8, 2007.
- ^ Gardiner, Bryan (October 17, 2007). "Astrophysicist Replaces Supercomputer with Eight PlayStation 3s". Wired. Retrieved October 17, 2007.
- ^ "PS3 Gravity Grid". Gaurav Khanna, Associate Professor, College of Engineering, University of Massachusetts Dartmouth.
- ^ "PS3 cluster creates homemade, cheaper supercomputer".
- ^ Highfield, Roger (February 17, 2008). "Why scientists love games consoles". The Daily Telegraph. London. Archived from the original on September 6, 2009.
- ^ Peckham, Matt (December 23, 2008). "Nothing Escapes the Pull of a PlayStation 3, Not Even a Black Hole". The Washington Post.
- ^ Malik, Tariq (January 28, 2009). "Playstation 3 Consoles Tackle Black Hole Vibrations". Space.com.
- ^ Lyden, Jacki (February 21, 2009). "Playstation 3: A Discount Supercomputer?". NPR.
- ^ Wallich, Paul (April 1, 2009). "The Supercomputer Goes Personal". IEEE Spectrum.
- ^ "The PlayStation powered super-computer". BBC News. September 4, 2010.
- ^ Farrell, John (November 12, 2010). "Black Holes and Quantum Loops: More Than Just a Game". Forbes.
- ^ "PS3GRID.net".
- ^ "Defense Department discusses new Sony PlayStation supercomputer".
- ^ "PlayStation 3 Clusters Providing Low-Cost Supercomputing to Universities". Archived from the original on May 14, 2013.
- ^ "IBM Mainframes Go 3-D". eWeek. April 26, 2007. Retrieved May 18, 2007.
- ^ "PlayStation speeds password probe". BBC News. November 30, 2007. Retrieved January 17, 2011.
- ^ "CELL: A New Platform for Digital Entertainment". Sony Computer Entertainment Inc. March 9, 2005. Archived from the original on October 28, 2005.
- ^ Bergmann, Arnd (June 21, 2005). "ppc64: Introduce Cell/BPA platform, v3". Retrieved March 22, 2007.
- ^ "The Cell Processor Programming Model". LinuxTag 2005. Archived from the original on November 18, 2005. Retrieved June 11, 2005.
- ^ Shankland, Stephen (March 21, 2006). "Linux gets built-in Cell processor support". CNET. Retrieved March 22, 2007.
- ^ "Terra Soft to Provide Linux for PLAYSTATION3". Archived from the original on March 30, 2009.
- ^ Terra Soft - Linux for Cell, PlayStation PS3, QS20, QS21, QS22, IBM System p, Mercury Cell 및 Apple PowerPC 2007년 2월 23일 Wayback Machine에서 아카이브
- ^ "Y-Bio". August 31, 2007. Archived from the original on September 2, 2007.
- ^ "Arnd Bergmann on Cell". IBM developerWorks. June 25, 2005.
- ^ "Linux on Cell BE-based Systems". Barcelona Supercomputing Center. Archived from the original on March 8, 2007. Retrieved March 22, 2007.
- ^ "Mercury Computer Systems Releases Software Development Kit for PLAYSTATION(R)3 for High-Performance Computing". PRNewswire-FirstCall. August 3, 2007.
- ^ ""CVCell" - Module developed by Fixstars that accelerates OpenCV Library for the Cell/B.E. processor". Fixstars Corporation. November 28, 2007. Archived from the original on July 17, 2010. Retrieved December 12, 2008.