굴착기(마이크로아키텍처)
Excavator (microarchitecture)일반 정보 | |
---|---|
개시. | 2015년 6월 [1] ) | , 전(
공통 제조원 | |
아키텍처 및 분류 | |
테크놀로지 노드 | 28 nm 벌크 실리콘(GF28A)[2] |
명령 집합 | AMD64(x86-64) |
물리 사양 | |
소켓 | |
제품, 모델, 변종 | |
코어명 |
|
역사 | |
전임자 | 증기 롤러 – 15h 패밀리 (3세대) |
후계자 | 선 |
AMD Excluverator Family 15h는 AMD APU 프로세서 및 일반 CPU에서 사용되는 Steamroller Family 15h의 뒤를 잇기 위해 AMD가 개발한 마이크로 아키텍처입니다.2011년 10월 12일 AMD는 4세대 불도저에서 파생된 코어의 코드네임으로 Excluverator를 발표했습니다.
주류 애플리케이션용 Excluverator 기반 APU는 Carrizo라고 불리며 [3][4]2015년에 출시되었습니다.Carrizo APU는 HSA 1.0에 [5]준거하도록 설계되어 있습니다.서버 및 엔터프라이즈 시장을 위한 토론토라는 이름의 Excluverator 기반 APU 및 CPU 변종도 [6]생산되었습니다.
엑셀레이터는 "불도저" 패밀리의 최종 개정판이었고, 1년 [7][8]후 두 개의 새로운 마이크로아키텍처가 엑셀레이터를 대체했다.굴착기는 2017년 [9][10]초 x86-64 Zen 아키텍처에 의해 계승되었습니다.
아키텍처
굴착기는 AVX2, BMI2, [11]RDRAND와 같은 새로운 명령에 대한 하드웨어 지원을 추가했습니다.굴착기는 GPU에 일반적으로 사용되는 고밀도('씬'이라고도 함) 라이브러리를 사용하여 전력 소비량과 다이 크기를 줄여 에너지 [12]효율을 30% 향상시킵니다.커브레이터는 AMD의 이전 코어 [13]Steamroller에 비해 클럭당 명령을 최대 15% 더 처리할 수 있습니다.
기능과 ASIC
다음 표에 AMD의 APU 기능을 나타냅니다(참조 항목:AMD 액셀러레이션 처리 장치 목록).
플랫폼 | 고출력, 표준전력 및 저전력 | 저전력 및 초저전력 | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
코드명 | 서버 | 기본의 | 토론토 | |||||||||||||||||
마이크로 | 교토 | |||||||||||||||||||
데스크톱 | 성능 | 르누아르 | 세잔 | |||||||||||||||||
메인스트림 | 라노 | 삼위일체 | 리치랜드 | 카베리 | Kaveri 리프레시(고다바리프레시 | 카리조 | 브리스톨 능선 | 레이븐 리지 | 피카소 | |||||||||||
엔트리 | ||||||||||||||||||||
기본의 | 카비니 | |||||||||||||||||||
모바일. | 성능 | 르누아르 | 세잔 | 렘브란트 | ||||||||||||||||
메인스트림 | 라노 | 삼위일체 | 리치랜드 | 카베리 | 카리조 | 브리스톨 능선 | 레이븐 리지 | 피카소 | ||||||||||||
엔트리 | 달리 | |||||||||||||||||||
기본의 | 데스나, 온타리오, 자케이트 | 카비니 주, 테마시 | 비마, 멀린스 | 카리조 L | 스토니리지 | |||||||||||||||
내장 | 삼위일체 | 흰머리 독수리 | 멀린 팔콘, 갈색 매 | 큰뿔올빼미 | 그레이 호크 | 온타리오, 자카테 | 카비니 | 스텝 이글, 크라운 이글 LX 패밀리 | 프레리 팔콘 | 밴딩 케스트렐 | ||||||||||
방출된 | 2011년 8월 | 2012년 10월 | 2013년 6월 | 2014년 1월 | 2015 | 2015년 6월 | 2016년 6월 | 2017년 10월 | 2019년 1월 | 2020년 3월 | 2021년 1월 | 2022년 1월 | 2011년 1월 | 2013년 5월 | 2014년 4월 | 2015년 5월 | 2016년 2월 | 2019년 4월 | ||
CPU 마이크로아키텍처 | K10 | 스택드라이버 | 증기 롤러 | 굴착기 | "엑스커베이터+"[14] | 선 | 젠플러스 | 젠 2 | 젠3 | Zen 3 이상 | 붉은 스라소니 | 재규어 | 푸마 | 푸마+[15] | "엑스커베이터+" | 선 | ||||
ISA | x86-64 | x86-64 | ||||||||||||||||||
소켓 | 데스크톱 | 하이엔드 | — | — | ||||||||||||||||
메인스트림 | — | AM4 | — | |||||||||||||||||
엔트리 | FM1 | FM2 | FM2+[a] | — | ||||||||||||||||
기본의 | — | — | AM1 | — | ||||||||||||||||
다른. | FS1 | FS1+, FP2 | FP3 | FP4 | FP5 | FP6 | FP7 | FT1 | FT3 | FT3b | FP4 | FP5 | ||||||||
PCI Express 버전 | 2.0 | 3.0 | 4.0 | 2.0 | 3.0 | |||||||||||||||
Fab. (nm) | GF32 SHP (HKMGSOI) | GF 28SHP (HKMG 벌크) | GF 14LPP (FinFET 벌크) | GF 12LP (FinFET 벌크) | TSMCN7 (FinFET 벌크) | TSMC N6 (FinFET 벌크) | TSMC N40 (표준) | TSMC N28 (HKMG 벌크) | GF 28SHP (HKMG 벌크) | GF 14LPP (FinFET 벌크) | ||||||||||
다이 면적(mm2) | 228 | 246 | 245 | 245 | 250 | 210[16] | 156 | 180 | 210 | 75 (+28 FCH) | 107 | ? | 125 | 149 | ||||||
최소 TDP(W) | 35 | 17 | 12 | 10 | 15 | 4.5 | 4 | 3.95 | 10 | 6 | ||||||||||
최대 APU TDP(W) | 100 | 95 | 65 | 45 | 18 | 25 | ||||||||||||||
최대 재고 APU 기준 클럭(GHz) | 3 | 3.8 | 4.1 | 4.1 | 3.7 | 3.8 | 3.6 | 3.7 | 3.8 | 4.0 | 3.3 | 1.75 | 2.2 | 2 | 2.2 | 3.2 | 2.6 | |||
노드당[b] 최대 APU 수 | 1 | 1 | ||||||||||||||||||
APU당 최대 CPU[c] 코어 수 | 4 | 8 | 2 | 4 | 2 | |||||||||||||||
CPU 코어당 최대 스레드 수 | 1 | 2 | 1 | 2 | ||||||||||||||||
i386, i486, i586, CMOV, NOL, i686, PAE, NX 비트, CMPXCHG16B, AMD-V, RVI, ABM 및 64 비트 LAHF/SAHF | ![]() | ![]() | ||||||||||||||||||
IOMMU[d] | — | ![]() | ||||||||||||||||||
BMI1, AES-NI, CLMUL 및 F16C | — | ![]() | ||||||||||||||||||
움직임 | — | ![]() | ||||||||||||||||||
AVIC, BMI2, RDRAND | — | ![]() | ||||||||||||||||||
ADX, SHA, RDSEED, SMAP, SMEP, XSAVEC, XSAVES, XRSTors, CLFLUSHOPT 및 CLZERO | — | ![]() | — | ![]() | ||||||||||||||||
WBNOINVD, CLWB, RDPID, RDPRU 및 MCOMMIT | — | ![]() | — | |||||||||||||||||
코어당 FPU 수 | 1 | 0.5 | 1 | 1 | 0.5 | 1 | ||||||||||||||
FPU당 파이프 수 | 2 | 2 | ||||||||||||||||||
FPU 파이프 폭 | 128비트 | 256비트 | 80비트 | 128비트 | ||||||||||||||||
CPU 명령 집합 SIMD 수준 | SSE4a[e] | AVX | AVX2 | SSE3 | AVX | AVX2 | ||||||||||||||
3DNow! | ![]() | — | — | |||||||||||||||||
FMA4, LWP, TBM 및 XOP | — | ![]() | — | — | ![]() | — | ||||||||||||||
FMA3 | ![]() | ![]() | ||||||||||||||||||
코어당 L1 데이터 캐시(KiB) | 64 | 16 | 32 | 32 | ||||||||||||||||
L1 데이터 캐시 관련성(방법) | 2 | 4 | 8 | 8 | ||||||||||||||||
코어당 L1 명령 캐시 수 | 1 | 0.5 | 1 | 1 | 0.5 | 1 | ||||||||||||||
최대 APU 총 L1 명령 캐시(KiB) | 256 | 128 | 192 | 256 | 64 | 128 | 96 | 128 | ||||||||||||
L1 명령 캐시의 어소시에이티비티 | 2 | 3 | 4 | 8 | 2 | 3 | 4 | |||||||||||||
코어당 L2 캐시 수 | 1 | 0.5 | 1 | 1 | 0.5 | 1 | ||||||||||||||
최대 APU 합계 L2 캐시(MiB) | 4 | 2 | 4 | 1 | 2 | 1 | ||||||||||||||
L2 캐시 어소시에이티비티(웨이) | 16 | 8 | 16 | 8 | ||||||||||||||||
APU 총 L3 캐시(MiB) | — | 4 | 8 | 16 | — | 4 | ||||||||||||||
APU L3 캐시 관련성(방법) | 16 | 16 | ||||||||||||||||||
L3 캐시 스킴 | 피해자. | 피해자. | ||||||||||||||||||
최대 재고 DRAM 지원 | DDR3-1866 | DDR3-2133 | DDR3-2133, DDR4-2400 | DDR4-2400 | DDR4-2933 | DDR4-3200, LPDDR4-4266 | DDR5-4800, LPDDR5-6400 | DDR3L-1333 | DDR3L-1600 | DDR3L-1866 | DDR3-1866, DDR4-2400 | DDR4-2400 | ||||||||
APU당 최대 DRAM 채널 수 | 2 | 1 | 2 | |||||||||||||||||
APU당 최대 재고 DRAM 대역폭(GB/s) | 29.866 | 34.132 | 38.400 | 46.932 | 68.256 | 102.400 | 10.666 | 12.800 | 14.933 | 19.200 | 38.400 | |||||||||
GPU 마이크로아키텍처 | 테라스케일 2(VLIW5) | 테라스케일3(VLIW4) | GCN 제2세대 | GCN 제3세대 | GCN 제5세대[17] | RDNA 제2세대 | 테라스케일 2(VLIW5) | GCN 제2세대 | GCN 제3세대[17] | GCN 제5세대 | ||||||||||
GPU 명령 세트 | TeraScale 명령 집합 | GCN 명령 세트 | RDNA 명령 세트 | TeraScale 명령 집합 | GCN 명령 세트 | |||||||||||||||
최대 재고 GPU 기본 클럭(MHz) | 600 | 800 | 844 | 866 | 1108 | 1250 | 1400 | 2100 | 2400 | 538 | 600 | ? | 847 | 900 | 1200 | |||||
GPU 기반[f] GPU 최대 재고 수 | 480 | 614.4 | 648.1 | 886.7 | 1134.5 | 1760 | 1971.2 | 2150.4 | 3686.4 | 86 | ? | ? | ? | 345.6 | 460.8 | |||||
3차원[g] 엔진 | 최대 400:20:8 | 최대 384:24:6 | 최대 512:32:8 | 최대 704:44:16[18] | 최대 512:32:8 | 768:48:8 | 80:8:4 | 128:8:4 | 최대 192:?: | 최대 192:?: | ||||||||||
IOMMUv1 | IOMMUv2 | IOMMUv1 | ? | IOMMUv2 | ||||||||||||||||
비디오 디코더 | UVD 3.0 | UVD 4.2 | UVD 6.0 | VCN 1.0[19] | VCN 2.1[20] | VCN 2.2[20] | VCN 3.1 | UVD 3.0 | UVD 4.0 | UVD 4.2 | UVD 6.0 | UVD 6.3 | VCN 1.0 | |||||||
비디오 인코더 | — | VCE 1.0 | VCE 2.0 | VCE 3.1 | — | VCE 2.0 | VCE 3.1 | |||||||||||||
AMD Fluid Motion | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ||||||||||||||
GPU 전력 절약 | PowerPlay | PowerTune | PowerPlay | PowerTune[21] | ||||||||||||||||
True Audio | — | ![]() | ? | — | ![]() | |||||||||||||||
프리싱크 | 1 2 | 1 2 | ||||||||||||||||||
HDCP[h] | ? | 1.4 | 1.4 2.2 | ? | 1.4 | 1.4 2.2 | ||||||||||||||
플레이레디[h] | — | 3.0 미정 | — | 3.0 미정 | ||||||||||||||||
지원되는 디스플레이[i] | 2–3 | 2–4 | 3 | 3(표준) 4 (모바일, 내장) | 4 | 2 | 3 | 4 | ||||||||||||
/drm/radeon [j][24][25] | ![]() | — | ![]() | — | ||||||||||||||||
/drm/amdgpu [j][26] | — | ![]() | — | ![]() |
- ^ FM2+ 굴착기 모델: A8-7680, A6-7480 및 Athlon X4 845.
- ^ PC는 하나의 노드입니다.
- ^ APU는 CPU와 GPU를 결합합니다.둘 다 코어가 있어요
- ^ 펌웨어 지원이 필요합니다.
- ^ SSE4는 없습니다.SSE3는 없습니다.
- ^ 단정도 성능은 FMA 연산에 기초하여 베이스(또는 부스트) 코어 클럭 속도에서 계산됩니다.
- ^ 유니파이드 셰이더: 텍스처 매핑 단위: 렌더 출력 단위
- ^ a b 보호된 비디오 콘텐츠를 재생하려면 카드, 운영 체제, 드라이버 및 응용 프로그램 지원도 필요합니다.이를 위해서는 호환되는 HDCP 디스플레이도 필요합니다.HDCP는 특정 오디오 형식의 출력에 필수적이며 멀티미디어 설정에 추가적인 제약을 가합니다.
- ^ 3개 이상의 디스플레이를 공급하려면 추가 패널이 기본 DisplayPort를 [23]지원해야 합니다.또는 액티브한 DisplayPort-to-DVI/HDMI/VGA 어댑터를 사용할 수 있습니다.
- ^ a b DRM(Direct Rendering Manager)은 Linux 커널의 컴포넌트입니다.이 표의 지원은 최신 버전을 나타냅니다.
프로세서
APU 회선
발표 또는 공개된 APU 회선은 다음 3개입니다.
- 예산 및 미드레인지 시장(데스크탑 및 모바일):카리조 APU
- Carrizo 모바일 APU는 Excluator x86 코어를 기반으로 2015년에 출시되었으며 CPU와 GPU 간의 통합 작업 공유를 위한 이기종 시스템 아키텍처를 갖추고 있습니다.이를 통해 GPU는 컴퓨팅 기능을 수행할 수 있으며 기능 크기만 [5]축소하는 것보다 더 큰 성능을 제공할 수 있습니다.
- Carrizo 데스크톱 APU는 2018년에 출시되었습니다.미드레인지 제품(A8-7680)은 4개의 엑셀레이터 코어와 GCN1.2 아키텍처를 기반으로 한 GPU를 갖추고 있습니다.또한 2개의 Excluverator 코어를 갖춘 엔트리 레벨 APU(A6-7480)도 출시됩니다.
- 예산 및 미드레인지 시장(데스크탑 및 모바일):Bristol Ridge 및 Stoney Ridge(엔트리 레벨 노트북용), APU[28]
- 엔터프라이즈 및 서버 시장: 토론토 APU
- 서버 및 엔터프라이즈 시장용 토론토 APU에는 4개의 x86 Excluverator CPU 코어 모듈과 Volcanic Islands 통합 GPU 코어가 탑재되어 있습니다.
- IPC는 스팀롤러보다 굴착기 코어가 더 유리합니다.개선은 4~15%입니다.
- HSA/hUMA, DDR3/DDR4, PCIe 3.0, GCN 1.2 지원[5][6][10]
- 토론토 APU는 BGA 및 SoC 변종으로 제공되었습니다.SoC 모델에서는 공간과 전력을 절약하고 워크로드를 최적화하기 위해 APU와 동일한 다이브릿지를 사용했습니다.
- Toronto APU를 탑재한 전체 시스템의 최대 전력 소비량은 70 [6]W입니다.
CPU 데스크톱 라인
하이엔드 데스크톱 플랫폼에는 CPU Steamroller(3세대 불도저) 또는 Exclubator(4세대 불도저) 아키텍처가 없습니다.
데스크톱용 굴착기 CPU(Athlon X4 845)[29]는 2016년 2월 2일에 발표되었습니다.2017년에는 3개의 데스크톱 CPU(Athlon X4 9x0)가 추가로 출시되었습니다.TDP는 65W의 소켓 AM4로 제공됩니다.실제로는 그래픽 코어가 비활성화되어 있는 APU입니다.
브랜드. 이름. | 모델 번호 | 코드 이름. | 주파수(GHz) | 코어 | TDP (W) | 소켓 | 캐시 | PCI Express 3.0 | 상대 IPC | 잠김 | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|
기초 | 터보 | L1D | L2 | |||||||||
애슬론 X4 | 845 | 카리조 | 3.5 | 3.8 | 4 | 65 | FM2+ | 4배 32KB | 2배 1 MB | x8 | 1.0 | 네. |
940 | 브리스톨 능선 | 3.2 | 3.6 | AM4 | x16 | 1.1 | 아니요. | |||||
950 | 3.5 | 3.8 | ||||||||||
970 | 3.8 | 4.0 |
서버 회선
2015년도의 AMD Opteron 로드맵에는 1개의 프로세서(1P)[6] 클러스터 애플리케이션을 대상으로 한 Excluverator 기반의 토론토 APU 및 토론토 CPU가 나와 있습니다.
- 1P 웹 및 엔터프라이즈 서비스 클러스터의 경우:
- 토론토 CPU – 쿼드코어 x86 굴착기 아키텍처
- Cambridge CPU 계획– 64비트 AArch64 코어
- 1P 컴퓨팅 및 미디어 클러스터의 경우:
- 토론토 APU – 쿼드코어 x86 굴착기 아키텍처
- 2P/4P 서버의 경우:
- 바르샤바 CPU – 12/16 코어 x86 스택드라이버 (2세대 불도저) (Operteron 6338P 및 6370P)
- 하이엔드 멀티프로세서 플랫폼에서의 Steamroller(3세대 불도저) 또는 Excluverator(4세대 불도저) 아키텍처 계획 없음
레퍼런스
- ^ "Computex 2015: AMD launches Carrizo A-Series processors ZDNet". www.zdnet.com.
- ^ "AMD leak confirms that Excavator APU will be 28nm, and that some production is moving back to GlobalFoundries - ExtremeTech". www.extremetech.com.
- ^ Reynolds, Sam (October 31, 2013). "New confirmed details on AMD's 2014 APU lineup, Kaveri delayed". Vr-zone.com. Archived from the original on January 25, 2014. Retrieved November 24, 2013.
- ^ "AMD updates product roadmap for 2014 and 2015". Digitimes.com. August 26, 2013. Retrieved November 24, 2013.
- ^ a b c Hachman, Mark (November 21, 2014). "AMD reveals high-end 'Carrizo' APU, the first chip to fully embrace audacious HSA tech". PCWorld. Retrieved January 15, 2015.
- ^ a b c d Mujtaba, Hassan (December 26, 2013). "AMD Opteron Roadmap Reveals Next Generation Toronto and Carrizo APU Details". WCCF Tech. Retrieved January 15, 2015.
- ^ "AMD hints at high-performance Zen x86 architecture bit-tech.net". bit-tech.net.
- ^ "Archived copy". Archived from the original on 2014-05-13. Retrieved 2014-05-22.
{{cite web}}
: CS1 maint: 제목으로 아카이브된 복사(링크) - ^ Moammer, Khalid (September 9, 2014). "AMD's Next Gen x86 High Performance Core is Zen". WCCF Tech. Retrieved January 15, 2015.
- ^ a b Mujtaba, Hassan (May 5, 2014). "AMD Announces 2014-2016 Roadmap – 20nm Project SkyBridge and K12 64-bit ARM Cores For 2016". WCCF Tech. Retrieved January 15, 2015.
- ^ "AMDs Carrizo architecture detailed and explored". Extremetech.com. June 2, 2015. Retrieved March 3, 2019.
- ^ Crowthers, Doug (August 28, 2012). "AMD Explains Advantages of High Density (Thin) Libraries". Tom's Hardware.
- ^ Mujtaba, Hassan (August 26, 2015). "AMD Details Carrizo APUs Energy Efficient Design at Hot Chips 2015 - 28nm Bulk High Density Design With 3.1 Billion Transistors, 250mm2 Die".
- ^ "AMD Announces the 7th Generation APU: Excavator mk2 in Bristol Ridge and Stoney Ridge for Notebooks". 31 May 2016. Retrieved 3 January 2020.
- ^ "AMD Mobile "Carrizo" Family of APUs Designed to Deliver Significant Leap in Performance, Energy Efficiency in 2015" (Press release). 20 November 2014. Retrieved 16 February 2015.
- ^ "The Mobile CPU Comparison Guide Rev. 13.0 Page 5 : AMD Mobile CPU Full List". TechARP.com. Retrieved 13 December 2017.
- ^ a b "AMD VEGA10 and VEGA11 GPUs spotted in OpenCL driver". VideoCardz.com. Retrieved 6 June 2017.
- ^ Cutress, Ian (1 February 2018). "Zen Cores and Vega: Ryzen APUs for AM4 – AMD Tech Day at CES: 2018 Roadmap Revealed, with Ryzen APUs, Zen+ on 12nm, Vega on 7nm". Anandtech. Retrieved 7 February 2018.
- ^ Larabel, Michael (17 November 2017). "Radeon VCN Encode Support Lands in Mesa 17.4 Git". Phoronix. Retrieved 20 November 2017.
- ^ a b "AMD Ryzen 5000G 'Cezanne' APU Gets First High-Res Die Shots, 10.7 Billion Transistors In A 180mm2 Package". wccftech. Aug 12, 2021. Retrieved August 25, 2021.
{{cite web}}
: CS1 maint :url-status (링크) - ^ Tony Chen; Jason Greaves, "AMD's Graphics Core Next (GCN) Architecture" (PDF), AMD, retrieved 13 August 2016
- ^ "A technical look at AMD's Kaveri architecture". Semi Accurate. Retrieved 6 July 2014.
- ^ "How do I connect three or More Monitors to an AMD Radeon™ HD 5000, HD 6000, and HD 7000 Series Graphics Card?". AMD. Retrieved 8 December 2014.
- ^ Airlie, David (26 November 2009). "DisplayPort supported by KMS driver mainlined into Linux kernel 2.6.33". Retrieved 16 January 2016.
- ^ "Radeon feature matrix". freedesktop.org. Retrieved 10 January 2016.
- ^ Deucher, Alexander (16 September 2015). "XDC2015: AMDGPU" (PDF). Retrieved 16 January 2016.
- ^ a b Michel Dänzer (17 November 2016). "[ANNOUNCE] xf86-video-amdgpu 1.2.0". lists.x.org.
- ^ Cutress, Ian (1 June 2016). "AMD Announces 7th Generation APU". Anandtech.com. Retrieved 1 June 2016.
- ^ Jeff Kampman (2 February 2016). "AMD puts Excavator on the desktop with the Athlon X4 845".