버스트 버퍼

고성능 컴퓨팅 환경에서 버스트 버퍼는 프런트 엔드 컴퓨팅 프로세스와 백엔드 스토리지 시스템 사이에 위치한 빠른 중간 스토리지 계층이다. 컴퓨팅 노드의 처리 속도와 스토리지 시스템의 입출력(I/O) 대역폭 사이의 성능 차이를 메운다. 버스트 버퍼는 NVRAM과 SSD와 같은 고성능 스토리지 디바이스 어레이에서 구축되는 경우가 많다. 일반적으로 백엔드 스토리지 시스템보다 1 ~ 2배 더 높은 I/O 대역폭을 제공한다.

사용 사례

버스트 버퍼는 슈퍼컴퓨터의 과학적 데이터 이동을 가속화한다. 예를 들어, 과학 애플리케이션의 수명 주기는 일반적으로 계산 단계와 I/O 단계를 번갈아 사용한다.^[1] 즉, 각 컴퓨팅 라운드(즉, 컴퓨팅 단계) 후에 모든 컴퓨팅 프로세스가 백엔드 스토리지 시스템(즉, I/O 단계)에 중간 데이터를 동시에 쓰고, 그 다음에 또 다른 컴퓨팅 및 데이터 이동 작업이 이어진다. 버스트 버퍼의 파병으로, 프로세스 빠르게 계산 대신 느린 하드 디스크 기반 저장 시스템 쓰는 것의 한 라운드를 마친 후에 버퍼에 하고, 즉시 계산의 다음 라운드에 데이터를 백엔드 저장 시스템으로 이전하게 되기를 기다리지 않고 진행하고 데이터는 그때 asynchro[2][3]그들의 데이터를 쓸 수 있다.nously는 다음 컴퓨팅 라운드에서 동시에 버스트 버퍼에서 스토리지 시스템으로 플러시됨. 이러한 방식으로 데이터를 스토리지 시스템으로 이동하는 데 소요되는 긴 I/O 시간은 계산 시간 뒤에 숨겨진다. 또한 버스트 버퍼에서 데이터를 버퍼링하면 애플리케이션은 스토리지 시스템의 효율적인 대역폭 활용을 위해 백엔드 스토리지 시스템으로 데이터 트래픽을 재구성할 수 있는 충분한 기회를 제공한다.^[4]^[5] 또 다른 일반적인 사용 사례에서 과학 애플리케이션은 느린 스토리지 시스템과 상호 작용하지 않고 중간 데이터를 버스트 버퍼 내부 및 외부로 스테이징할 수 있다. 스토리지 시스템을 우회하면 애플리케이션은 버스트 버퍼의 성능 이점을 대부분 실현할 수 있다.^[6]

대표적인 버스트 버퍼 아키텍처

고성능 컴퓨팅 환경에는 노드 로컬 버스트 버퍼와 원격 공유 버스트 버퍼의 두 가지 대표적인 버스트 버퍼 아키텍처가 있다. 노드-로컬 버스트 버퍼 아키텍처에서 버스트 버퍼 스토리지는 개별 컴퓨팅 노드에 위치하기 때문에 애그리게이트 버스트 버퍼 대역폭은 컴퓨팅 노드 수에 따라 선형적으로 증가한다. 이러한 확장성 편익은 최근 문헌에 잘 설명되어 있다.^[7]^[8]^[9]^[10] 또한 모든 버스트 버퍼에 분산된 데이터에 대한 글로벌 네임스페이스를 유지하기 위한 확장 가능한 메타데이터 관리 전략에 대한 수요도 수반된다.^[11]^[12] 원격 공유 버스트 버퍼 아키텍처에서 버스트 버퍼 스토리지는 컴퓨팅 노드와 백엔드 스토리지 시스템 사이에 위치한 더 적은 수의 I/O 노드에 상주한다. 컴퓨팅 노드와 버스트 버퍼 사이의 데이터 이동은 네트워크를 통해 이루어져야 한다. 버스트 버퍼를 I/O 노드에 배치하면 버스트 버퍼 서비스의 독립적 개발, 배포 및 유지보수가 용이하다. 따라서 DataWarp, Infinite Memory Engine과 같이 이러한 유형의 버스트 버퍼를 관리하기 위해 잘 알려진 몇몇 상용 소프트웨어 제품이 개발되었다. 슈퍼컴퓨터는 컴퓨팅 노드의 NVRAM, 전용 I/O 노드의 SSD 등 여러 이기종 버스트 버퍼 레이어가 구축됨에 따라 여러 스토리지 레이어에 걸쳐 데이터를 투명하게 이동할 필요가 있다.^[13]^[14]^[15]