NAS 병렬 벤치마크

NAS Parallel Benchmarks
NAS 병렬 벤치마크
원본 작성자NASA 수치 공기역학 시뮬레이션 프로그램
개발자NASA 슈퍼컴퓨팅 부문
초기 릴리즈1991 (1991)
안정적 해제
3.4
웹사이트nas.nasa.gov/Software/NPB/

NAS 병렬 벤치마크(NPB)는 병렬 슈퍼컴퓨터의 성능 평가를 목표로 하는 벤치마크 세트다.NASA Ames 연구 센터에 본부를 둔 NASA Advanced Supercomputing(NASA Advanced Supercomputing, 이전 NASA 수치 공기역학 시뮬레이션 프로그램) 부서에서 개발 및 유지 관리한다.NAS는 모든 소스에서 NPB에 대한 성능 결과를 요청한다.[1]null

역사

동기

리버모어 루프, LINPACK 벤치마크, NAS 커널 벤치마크 프로그램과 같이 NPB 이전에 존재했던 전통적인 벤치마크는 대개 벡터 컴퓨터에 특화되었다.이들은 일반적으로 병렬 처리로 인한 조정 제한과 불충분한 문제 크기를 비롯한 불충분한 문제로 인해 고도로 병렬화된 시스템에 적합하지 않게 되었다.높은 포팅 비용과 자동 소프트웨어 병렬화 도구의 사용 불가능으로 인해 전면적인 애플리케이션 벤치마크도 적합하지 않았다.[2]그 결과, NPB는 1991년에[3] 개발되어 1992년에[4] 출시되었으며, 그에 따른 고도로 평행한 기계에 적용할 수 있는 벤치마크의 부족을 해결하였다.null

NPB 1

NPB의 첫 번째 사양은 벤치마크가 특징이어야 한다는 것을 인식했다.

  • 새로운 병렬 인식 알고리즘 및 소프트웨어 방법
  • 일반성과 건축 중립성,
  • 결과 및 성능 수치 정확성을 쉽게 검증할 수 있는 능력
  • 전력 증대로 새로운 시스템을 수용할 수 있는 능력
  • 그리고 즉시 분배가능성.

이러한 지침에 비추어 볼 때, 일련의 문제를 알고리즘적으로만 명시하고 대부분의 시행 세부사항을 필요한 제한에 따라 시행자의 재량에 맡기는 "종이 및 펜슬" 벤치마크 모음을 사용하는 유일한 실행 가능한 접근법으로 간주되었다.null

NPB 1은 8개의 벤치마크를 정의했는데, 각 벤치마크는 클래스 A클래스 B로 명명된 두 가지 문제 크기였다.포트란 77로 작성된 샘플 코드가 공급됐다.그들은 S등급의 작은 문제 크기를 사용했으며 벤치마킹 목적을 위한 것은 아니었다.[2]null

NPB 2

출시 이후 NPB 1은 크게 두 가지 약점을 보였다.첫째로, 그것의 "종이 및 연필" 사양 때문에, 컴퓨터 판매업자들은 보통 그들의 성능을 과학 프로그래머들이 얻기 어렵게 만들기 위해 그들의 구현을 고도로 조정했다.둘째로, 이러한 구현의 많은 부분이 독점적이고 공개적으로 이용할 수 없어 최적화 기술을 효과적으로 숨겼다.둘째로, NPB 1의 문제 크기는 슈퍼컴퓨터의 개발에 뒤쳐졌다.[3]null

1996년에 출시된 NPB 2는 NPB 1을 보완하기 위해 NPB 1에 정의된 8개의 벤치마크 중 5개의 소스 코드를 구현했다.[5][6]그것은 최신 문제 C등급으로 벤치마크를 확장했다.벤치마킹 결과 제출 규칙도 개정했다.새로운 규칙은 결과의 수정과 재현성의 공공성을 보장하기 위해 수정된 소스 파일과 빌드 스크립트에 대한 명시적인 요청과 함께 출력 파일에 대한 요청을 포함했다.[3]null

NPB 2.2에는 두 개의 벤치마크가 추가로 구현되어 있었다.[5]1997년의 NPB 2.3은 MPI에서 최초의 완전한 구현이었다.[4]그것은 병렬 버전과 일치하는 벤치마크의 직렬 버전과 함께 제공되었고 소형 메모리 시스템의 문제 크기 클래스 W를 정의했다.[7]2002년의 NPB 2.4는 새로운 MPI 구현을 제안했고, 여전히 더 큰 문제 크기인 클래스 D를 도입했다.[6]또한 I/O 집약적인 하위 유형으로 하나의 벤치마크를 증강시켰다.[4]null

NPB 3

NPB 3은 NPB 2의 MPI 구현을 유지했으며 OpenMP,[8] Java[9]High Performance Fortran과 같은 더 많은 맛이 났다.[10]이러한 새로운 병렬 구현은 추가 최적화와 함께 NPB 2.3의 시리얼 코드에서 도출되었다.[7]NPB 3.1과 NPB 3.2는 3개의 벤치마크를 추가했지만,[11][12] 모든 구현에서 사용할 수 없었다. NPB 3.3은 E등급 문제 크기를 도입했다.[7]단일 영역 NPB 3을 기반으로, MPI/OpenMP 하이브리드 프로그래밍 모델을 활용한 멀티 영역 벤치마크 세트가 NPB-멀티존(NPB-MZ)[1][13]이라는 이름으로 출시되었다.null

벤치마크

NPB 3.3을 기준으로 다음 표에 요약된 11개의 벤치마크를 정의한다.null

벤치마크 에서[2] 파생된 이름 이후 사용 가능 설명[2] 언급
MG 멀티그리드 NPB 1[2] V-cycle multigrid 방법을 사용하여 3차원 이산형 포아송 방정식에 대한 해법 근사치
CG 결합 그라데이션 선형 방정식의 시스템 해결을 위한 서브루틴으로 공차 그라데이션 방법을 사용한 역반복법을 사용하여 큰 희소 대칭 양-적정 행렬의 최소 고유값을 추정한다.
FT 빠른 푸리에 변환 고속 FFT(Fast Fourier Transform)를 사용하여 3차원 부분 미분 방정식(PDE) 해결
IS 정수 정렬 버킷 정렬[5] 사용하여 작은 정수 정렬
EP 민망할 정도로 평행한 Marsaglia 극지방법을 사용하여 독립 가우스 랜덤 변수 생성
BT 블록삼각형 블록 3지각, 스칼라 펜타디각대칭 연속 과완화(SSOR) 해결 커널을 포함하는 3가지 알고리즘을 사용하여 비선형 PDE의 합성 시스템을 해결하십시오.
  • BT 벤치마크에 I/O 집약적인 하위 유형이[4] 있음
  • 세 벤치마크 모두 멀티존 버전을 갖추고[13] 있음
SP 스칼라 펜타디각형[6]
LU 하부-상부 대칭[6] 가우스-상부 대칭
UA 비정형 적응형[11] NPB 3.1[7] 방정식을 움직이는 공에서 대류 및 확산으로 해결한다.메쉬는 적응성이 뛰어나며 매 5단계마다 다시 계산된다.
DC 데이터 큐브 연산자[12]
DT 데이터 트래픽[7] NPB 3.2[7]

참조

  1. ^ a b "NAS Parallel Benchmarks Changes". NASA Advanced Supercomputing Division. Retrieved 2009-02-23.
  2. ^ a b c d e Baily, D.; Barszcz, E.; Barton, J.; Browning, D.; Carter, R.; Dagum, L.; Fatoohi, R.; Fineberg, S.; Frederickson, P.; Weeratunga, S. (March 1994), "The NAS Parallel Benchmarks" (PDF), NAS Technical Report RNR-94-007, NASA Ames Research Center, Moffett Field, CA
  3. ^ a b c Bailey, D.; Harris, T.; Saphir, W.; van der Wijngaart, R.; Woo, A.; Yarrow, M. (December 1995), "The NAS Parallel Benchmarks 2.0" (PDF), NAS Technical Report NAS-95-020, NASA Ames Research Center, Moffett Field, CA
  4. ^ a b c d Wong, P.; van der Wijngaart, R. (January 2003), "NAS Parallel Benchmarks I/O Version 2.4" (PDF), NAS Technical Report NAS-03-002, NASA Ames Research Center, Moffett Field, CA
  5. ^ a b c Saphir, W.; van der Wijngaart, R.; Woo, A.; Yarrow, M., New Implementations and Results for the NAS Parallel Benchmarks 2 (PDF), NASA Ames Research Center, Moffett Field, CA
  6. ^ a b c d van der Wijngaart, R. (October 2002), "NAS Parallel Benchmarks Version 2.4" (PDF), NAS Technical Report NAS-02-007, NASA Ames Research Center, Moffett Field, CA
  7. ^ a b c d e f "NAS Parallel Benchmarks Changes". NASA Advanced Supercomputing Division. Retrieved 2009-03-17.
  8. ^ Jin, H.; Frumkin, M.; Yan, J. (October 1999), "The OpenMP Implementation of NAS Parallel Benchmarks and Its Performance" (PDF), NAS Technical Report NAS-99-011, NASA Ames Research Center, Moffett Field, CA
  9. ^ Frumkin, M.; Schultz, M.; Jin, H.; Yan, J., "Implementation of the NAS Parallel Benchmarks in Java" (PDF), NAS Technical Report NAS-02-009, NASA Ames Research Center, Moffett Field, CA
  10. ^ Frumkin, M.; Jin, H.; Yan, J. (September 1998), "Implementation of NAS Parallel Benchmarks in High Performance Fortran" (PDF), NAS Technical Report NAS-98-009, NASA Ames Research Center, Moffett Field, CA
  11. ^ a b Feng, H.; van der Wijngaart, F.; Biswas, R.; Mavriplis, C. (July 2004), "Unstructured Adaptive (UA) NAS Parallel Benchmark, Version 1.0" (PDF), NAS Technical Report NAS-04-006, NASA Ames Research Center, Moffett Field, CA
  12. ^ a b Frumkin, M.; Shabanov, L. (September 2004), "Benchmarking Memory Performance with the Data Cube Operator" (PDF), NAS Technical Report NAS-04-013, NASA Ames Research Center, Moffett Field, CA
  13. ^ a b van der Wijngaart, R.; Jin, H. (July 2003), "NAS Parallel Benchmarks, Multi-Zone Versions" (PDF), NAS Technical Report NAS-03-010, NASA Ames Research Center, Moffett Field, CA

외부 링크