HPC 챌린지 벤치마크

HPC Challenge Benchmark
HPC 챌린지 벤치마크
원본 작성자테네시 대학교의 혁신 컴퓨팅 연구소
초기 릴리즈2003 (2003)
안정적 해제
1.5.0 / 2016년 3월 18일; 5년(2016-03-18)[1]
플랫폼크로스 플랫폼
면허증.BSD
웹사이트icl.cs.utk.edu/hpcc/

HPC Challenge Benchmark는 여러 벤치마크를 결합하여 고성능 컴퓨터(HPC) 시스템의 성능에 대한 다수의 독립적인 속성을 테스트한다.이 프로젝트는 DARPA High Productivity Computing Systems 프로그램, 미국 에너지부, 국립과학재단이 공동 후원해왔다.[2]null

컨텍스트

HPC 시스템에서 복잡한 애플리케이션의 성능은 하드웨어의 다양한 독립적인 성능 속성에 의존할 수 있다.HPC Challenge Benchmark는 이러한 속성들 중 몇 가지를 단일 프로그램으로 측정함으로써 이 다차원 공간에 대한 가시성을 향상시키기 위한 노력이다.null

관심 있는 성능 속성은 특정 컴퓨터 아키텍처에 특정하지는 않지만, CMPI에서 HPC Challenge Benchmark의 참조 구현은 시험 대상 시스템이 네트워크에 연결된 공유 메모리 멀티프로세서 시스템의 클러스터라고 가정한다.계층적 시스템 구조에 대한 이러한 가정 때문에 대부분의 시험은 몇 가지 다른 작동 모드에서 실행된다.벤치마크 보고서에 사용된 표기법에 따라, "단일"이라는 라벨이 붙은 결과는 테스트가 시스템에서 무작위로 선택된 하나의 프로세서에서 실행되었음을 의미하며, "별표"라는 라벨이 붙은 결과는 테스트의 독립된 복사본이 시스템의 각 프로세서에서 동시에 실행되었음을 의미하며, "글로벌"이라는 라벨이 붙은 결과는 모든 프로세서가 c에서 작동하고 있음을 의미한다.(시스템 노드에 분산된 데이터로) 단일 문제를 해결하기 위한 주문.null

구성 요소들

벤치마크는 현재 7가지 시험으로 구성된다(각 시험마다 작동 모드가 표시됨).null

  1. 고성능[3] LINPACK(High Performance LINPACK) – 고밀도 선형 방정식(글로벌) 시스템에 대한 솔버의 성능 측정
  2. DMEM – 매트릭스 매트릭스 곱셈(단일, 별)에 대한 성능 측정
  3. STREAM[4] – 메모리(단일, 별)로/메모리 간 지속 메모리 대역폭 측정
  4. PTRANS – 시스템이 대규모 어레이(글로벌)를 전치할 수 있는 속도를 측정한다.
  5. RandomAccess – 큰 테이블의 임의로 선택한 요소(단일, 별, 전역)에 대한 64비트 업데이트 속도를 측정한다.
  6. FFT – 일반화된 쿨리(Cooley)를 사용하여 큰 1차원 벡터에서 고속 푸리에 변환 수행Tukey 알고리즘(단일, 별, 전역).
  7. 통신 대역폭 및 대기 시간 – b_eff[5] 대역폭/대기 시간 벤치마크에 기반한 MPI 중심의 성능 측정

성능 속성

높은 수준에서 이 시험은 성능의 네 가지 중요한 속성인 이중 정밀 부동 소수점 산술(DGEMM 및 HPL), 로컬 메모리 대역폭(STREAM), "대형" 메시지에 대한 네트워크 대역폭(PTRANS, RandomAccess, FFT, b_eff), "소형" 메시지에 대한 네트워크 대역폭(Random Access, b_eff)의 범위를 제공하기 위한 것이다.일부 코드는 다른 코드보다 복잡하고 추가적인 성능 민감도를 가질 수 있다.예를 들어, 일부 시스템에서는 HPL 성능이 네트워크 대역폭 및/또는 네트워크 지연 시간에 의해 제한될 수 있다.null

경쟁

Supercomputing Conference에서 매년 열리는 HPC Challenge Award Conference는 제품군에서 가장 도전적인 4가지 벤치마크에 초점을 맞추고 있다.

상에는 두 가지 등급이 있다.

  • 클래스 1: HPC Challenge 웹사이트에 제출된 베이스 또는 최적화된 실행에서 최고의 성능.[6]
  • 클래스 2: 3개 이상의 HPC Challenge 벤치마크를 포함하여 4개 또는 5개의 계산 커널을 "독보적인" 구현.[7]

참고 항목

참조

  1. ^ "Releases · icl-utk-edu/hpcc". github.com. Retrieved 2021-04-12.
  2. ^ "Cray X1 Supercomputer Has Highest Reported Scores on Government-Sponsored HPC Challenge Benchmark Tests". 2004-06-14. Archived from the original on 2012-05-04. Retrieved 2010-01-22.
  3. ^ "HPL – A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers". Innovative Computing Laboratory, University of Tennessee at Knoxville. Retrieved 2015-06-10.
  4. ^ "STREAM: Sustainable Memory Bandwidth in High Performance Computers". Retrieved 2015-06-10.
  5. ^ "Effective Bandwidth (b_eff) Benchmark". High Performance Computing Center Stuttgart. Retrieved 2015-06-10.
  6. ^ 벤치마크는 제한된 기능 집합을 보다 최적화된 버전으로 교체하는 동시에 "베이스" 실행을 유지하도록 설계되었다."최적화" 실행 범주에서는 추가(그러나 여전히 제한적) 수정이 허용된다.
  7. ^ "HPC Challenge Award Competition". DARPA HPCS Program. Retrieved 2010-01-23.

외부 링크