GPU 클러스터

GPU cluster

GPU 클러스터는 각 노드가 GPU(그래픽 처리 장치)를 갖춘 컴퓨터 클러스터입니다.GPGPU(General-Purpose Computing on Graphics Processing Units)를 통해 최신 GPU의 처리 능력을 활용하여 GPU 클러스터를 사용하여 매우 빠르게 계산할 수 있습니다.

Titan, GPU를 사용한 최초의 슈퍼컴퓨터

하드웨어(GPU)

GPU 클러스터의 하드웨어 분류는 다음 두 가지 범주로 나뉩니다.이종 혼재 및 동종 혼재

이종

양쪽 메이저 IHV 하드웨어(AMD 및 nVidia)를 사용할 수 있습니다.같은 GPU의 다른 모델이 사용되고 있는 경우(예를 들어 8800GT와 8800GTX가 혼재하고 있는 경우)도 GPU 클러스터는 이종 클러스터로 간주됩니다.

균질한

모든 GPU는 동일한 하드웨어 클래스, 제조사 및 모델입니다.(즉, 모두 같은 양의 메모리를 가진 100개의 8,800GT로 구성된 동종 클러스터)

GPU 클러스터를 위의 의미에 따라 분류하면 GPU마다 사용할 수 있는 기능이 다르기 때문에 클러스터 상의 소프트웨어 개발이 주로 이루어집니다.

하드웨어(기타)

상호 접속

컴퓨터 노드와 각각의 GPU에 더해 노드 간에 데이터를 셔틀하기 위해서는 충분한 속도의 상호접속이 필요합니다.인터커넥트의 유형은 존재하는 노드의 수에 따라 크게 달라집니다.인터커넥트의 예로는 기가비트이더넷이나 InfiniBand 등이 있습니다.

벤더

NVIDIA는 Tesla 20 시리즈 GPGPU를 사용하여 완전히 구성된 GPU 클러스터를 구축하고 제공하는 기능을 갖춘 전용 Tesla Preferred Partners(TPP) 목록을 제공합니다.AMAX Information Technologies, Dell, Hewlett-Packard Silicon Graphics는 GPU 클러스터 및 시스템을 [1]모두 제공하는 몇 안 되는 기업입니다.

소프트웨어

GPU를 탑재한 많은 머신을 동작시키기 위해 필요한 소프트웨어 컴포넌트는 다음과 같습니다.

  1. 운영 체제
  2. 각 클러스터 노드에 있는 각 GPU 유형의 GPU 드라이버입니다.
  3. 클러스터링 API(Message Passing Interface, MPI 등).
  4. VirtualCL(VCL) 클러스터 플랫폼 [1]은 OpenCL™을 위한 래퍼입니다.이러한 래퍼에서는 수정되지 않은 대부분의 애플리케이션이 클러스터 내의 여러 OpenCL 디바이스를 마치 모든 디바이스가 로컬 컴퓨터에 있는 것처럼 투과적으로 사용할 수 있습니다.

알고리즘 매핑

GPU 클러스터를 실행하기 위한 알고리즘 매핑은 기존 컴퓨터 클러스터에서 실행할 알고리즘을 매핑하는 것과 다소 유사합니다.예: RAM에서 어레이 조각을 배포하는 것이 아니라 GPU 클러스터의 노드 간에 텍스처가 분할됩니다.

참고 자료 및 외부 링크

  • Are Magnus Bruaset, Aslak Tveito (2006). Numerical Solution of Partial Differential Equations on Parallel Computers. Birkhäuser. ISBN 3-540-29076-1.
  • NCSA 액셀러레이터 클러스터
  • 고성능 컴퓨팅을 위한 GPU 클러스터
  • STFC Daresbury Laboratory GPU 클러스터
  • GPU 코어 온도 감시