IBM 병렬 Sysplex

IBM Parallel Sysplex

컴퓨팅에서 Parallel Sysplexz/OS와 함께 단일 시스템 이미지로 작동하는 IBM 메인프레임클러스터다.재해 복구에 사용되는 Parallel Sysplex는 데이터 공유와 병렬 컴퓨팅을 결합하여 최대 32개의 시스템으로 구성된 클러스터가 고성능고가용성을 위해 워크로드를 공유할 수 있도록 한다.

시스플렉스

1990년에 IBM 메인프레임 컴퓨터MVS/ESA SPV4.1과 함께 일반적으로 Sysplex라고 불리는 시스템 콤플렉스의 개념을 도입하였다.이를 통해 최대 8개의 논리 파티션(LPAR)의 인증된 구성요소가 XCF 프로토콜을 사용하여 서로 통신하고 협력할 수 있다.

Sysplex의 구성 요소:

  • 모든 구성원 시스템의 시계를 동기화하는 공통 시간 소스.여기에는 Sysplex 타이머(모델 9037) 또는 STP(Server Time Protocol)가 포함될 수 있다.
  • 여러 시스템이 동일한 리소스에 동시에 액세스할 수 있도록 하는 GRS(Global Resource Serialization) - 필요한 경우 직렬화하여 단독 액세스 보장
  • XCF(Cross System Coupling Facility) - 시스템에서 피어 투 피어(Peer-to-Peer) 통신 가능
  • 커플링 데이터 세트(CDS)

(base) Sysplex의 사용자는 다음과 같다.

  • 콘솔 서비스 – 여러 Sysplex 구성원의 여러 MCS 콘솔을 병합하여 운영을 위한 단일 시스템 이미지를 제공
  • ARM(Automatic Restart Manager) – 동일한 시스템에서 사용 가능한 경우 또는 Sysplex의 다른 LPAR에서 실패한 작업을 자동으로 재시작하도록 지시하는 정책
  • Sysplex Failure Manager(SFM) – Sysplex 구성원의 손실과 같은 특정 장애가 발생할 때 또는 시스템을 재구성할 때 수행할 자동화된 작업을 지정하는 정책
  • WLM(Workload Manager) – 하나 이상의 z/OS 이미지 또는 AIX에서 이기종 워크로드에 대한 정책 기반 성능 관리
  • GRS(Global Resource Serialization) - 통신 – GRS 및 Dynamic RNL 전용 채널 대신 XCF 링크를 사용할 수 있음
  • Tivoli OPC – 컨트롤러에 대한 핫 스탠바이 지원
  • RACF(IBM의 메인프레임 보안 소프트웨어 제품) – Sysplex 전체 RVARY 및 SETROPTS 명령
  • PDSE 파일 공유
  • 멀티시스템 VLFNOE, SDUMP, SLIP, DAE
  • RMF(Resource Measurement Facility) – Sysplex 전체 보고
  • CICS – XCF를 사용하여 트랜잭션 라우팅 및 기능 배송에 VTAM을 사용하는 것보다 더 나은 성능과 응답 시간을 제공한다.
  • zFS – XCF 통신을 사용하여 여러 LPAR의 데이터에 액세스

병렬 시스플렉스

병렬 Sysplex의 도식적 표현

IBM은 1994년 4월에 9674[2] CF(Coupling Facility), 새로운 S/390 모델,[3][4][5] 기존 모델로의 업그레이드, 고속 통신을 위한 커플링 링크, MVS/ESA SP V5.1[6] 운영 체제 지원 등을 추가하면서 Parallel Sysplex를 도입했다[1].[7]

CF(Coupling Facility)는 CFCC(Coupling Facility Control Code)를 실행할 수 있는 프로세서로 구성된 전용 독립형 서버에 ICF(Internal Coupling Facilities)로 구성된 메인프레임 자체에서 통합 프로세서로 구성되거나 일반 LPAR보다 덜 일반적인 서버에 상주할 수 있다.CF에는 여러 LPAR 간의 직렬화, 메시지 전달 및 버퍼 정합성에 도움이 되는 Lock, List 및 Cache 구조가 포함되어 있다.[8]

Parallel Sysplex의 주요 목표는 데이터 공유 기능을 제공하여 공유 데이터에 대한 직접 읽기 및 쓰기를 위한 여러 데이터베이스를 허용하는 것이다.이것은 다음 이점을 제공할 수 있다.

  • 서버, LPAR 또는 하위 시스템 내에서 단일 장애 지점 제거 지원
  • 애플리케이션 가용성
  • 단일 시스템 이미지
  • 동적 세션 밸런싱
  • 동적 트랜잭션 라우팅
  • 확장 가능한 용량

이를 활용할 수 있는 System z 서버에서 실행되는 데이터베이스:

다른 구성요소는 시스템 관리, 성능 또는 하드웨어 요구사항의 감소에 도움을 주기 위해 Coupling Facility를 사용할 수 있다."리소스 공유"라고 하는 용도에는 다음이 포함된다.

  • 카탈로그 – 디스크의 카탈로그 데이터 세트에 대한 I/O를 줄여 성능을 향상시키는 공유 카탈로그
  • CICS – CF를 사용하여 명명된 카운터, 데이터 테이블 또는 임시 데이터에 대한 공유 및 복구 기능 제공
  • DFSMShsm – 데이터 마이그레이션 워크로드를 위한 워크로드 밸런싱
  • GRS Star – 데이터 세트 할당을 위한 CPU 및 응답 시간 성능 감소

테이프 전환은 GRS 구조를 사용하여 z/OS 이미지 간에 테이프 유닛 공유를 제공한다.

  • DCM(Dynamic CHPID Management) 및 I/O 우선 순위 관리
  • JES2 체크포인트 – 다중 시스템 체크포인트에 대한 향상된 액세스 제공
  • Operlog / Logrec – 시스템 관리를 위한 병합된 다중 시스템 로그
  • RACF – Parallel Sysplex 전반에서 보안 관리를 단순화하는 공유 데이터 세트
  • WebSphere MQ – 가용성 및 유연성을 위한 공유 메시지 대기열
  • WLM - IRD(Intelligent Resource Director)가 z/OS Workload Manager를 확장하여 Parallel Sysplex 내의 여러 LPAR에서 CPU 및 I/O 리소스를 관리할 수 있도록 지원기능으로는 LPAR CPU 관리, IRD 등이 있다.

성능 향상을 위한 멀티 시스템 엔클로저 관리

  • XCF Star – 하드웨어 요구 사항 감소 및 XCF 통신 경로 관리 간소화

Parallel Sysplex의 주요 구성 요소:

  • 여러 프로세서가 데이터 액세스를 공유, 캐시, 업데이트 및 밸런싱할 수 있는 CF(Coupling Facility) 하드웨어
  • 모든 구성원 시스템의 클럭을 동기화하기 위한 Sysplex Timers(더 최근에는 서버 시간 프로토콜)
  • 고속, 고품질, 중복 케이블 연결;
  • 소프트웨어(운영 체제 서비스 및 일반적으로 IBM Db2와 같은 미들웨어).

Coupling Facility는 전용 외부 시스템(System z9 BC와 같은 소형 메인프레임, 특히 연결 설비 프로세서만으로 구성됨) 또는 ICF(Internal Coupling Facilities)로 구성된 메인프레임 자체의 일체형 프로세서일 수 있다.[9]병렬형 sysplex에서 적어도 하나의 외부 CF를 사용하는 것이 좋다.[10]Parallel Sysplex는 특히 프로덕션 데이터 공유 환경에서 중복성을 위해 최소 2개의 CF 및/또는 ICF를 보유할 것을 권장한다.STP(Server Time Protocol)는 System z 메인프레임 모델 z990 이상에 대해 2005년부터 Sysplex Timers를 대체했다.[11]Sysplex Timer는 메인프레임에서 물리적으로 분리된 하드웨어인 반면,[12] STP는 메인프레임의 마이크로코드 내에서 필수적인 설비다.[13]STP와 ICF를 사용하면 두 개의 메인프레임이 연결된 완전한 병렬 시스템 설치를 할 수 있다.또한 단일 메인프레임은 애플리케이션 테스트 및 개발 목적에 유용한 완전한 물리적 병렬 Sysplex와 내부 동등한 기능을 포함할 수 있다.[14]

IBM Systems Journal은 모든 기술 구성요소에 대해 전체 이슈를 발행했다.[15]

서버 시간 프로토콜

컴퓨터 시스템에서는 정확한 시간을 유지하는 것이 중요하다.예를 들어, 트랜잭션 처리 시스템에서 복구 프로세스는 로그 파일에서 트랜잭션 데이터를 재구성한다.트랜잭션 데이터 로깅에 타임 스탬프를 사용하고, 두 개의 관련 트랜잭션의 타임 스탬프를 실제 시퀀스에서 변환하는 경우, 트랜잭션 데이터베이스의 재구성이 복구 프로세스 이전의 상태와 일치하지 않을 수 있다.STP(Server Time Protocol)를 사용하여 여러 서버 간에 단일 시간 소스를 제공할 수 있다.Network Time Protocol 개념에 기초하여, System z 서버 중 하나는 HMC에 의해 1차 시간 소스(Stratum 1)로 지정된다.이어 커플링 링크 사용을 통해 스트라텀 2 서버에 타이밍 신호를 보낸다.Stratum 2 서버는 차례로 Stratum 3 서버로 타이밍 신호를 보낸다.가용성을 제공하기 위해 서버 중 하나를 백업 시간 소스로 지정할 수 있으며, 세 번째 서버를 Arbiter로 지정하여 백업 시간 서버가 예외 조건 동안 기본 역할을 수행할지 여부를 결정할 수 있도록 지원할 수 있다.

STP는 2005년부터 System z 서버에서 이용 가능하다.

STP에 대한 자세한 내용은 "Server Time Protocol Planning Guide"[16]를 참조하십시오.

지리적으로 분산된 병렬 시스템

지리적으로 분산된 병렬 시스템스플렉스(GDPS)는 다른 도시에 위치한 메인프레임의 병렬 시스템스플렉스의 확장이다.GDPS는 단일 사이트 또는 다중 사이트 구성을 위한 구성을 포함한다.[17]

  • GDPS HyperSwap Manager:이는 단일 데이터 센터 내에서 사용하기 위한 동기식 PPRC(Peer to Peer Remote Copy) 기술을 기반으로 한다.데이터는 1차 저장 장치에서 2차 저장 장치로 복사된다.주 저장 장치에 장애가 발생할 경우 시스템은 실행 중인 애플리케이션을 중단하지 않고 보조 저장 장치를 주 저장 장치로 자동 설정한다.
  • GDPS 메트로:이는 메인프레임에서 200km(120mi) 떨어져 사용할 수 있는 동기식 데이터 미러링 기술(PPRC)을 기반으로 한 것이다.2-시스템 모델에서는 두 사이트 모두 하나의 시스템인 것처럼 관리할 수 있다.시스템이나 저장장치에 장애가 발생할 경우 데이터 손실이 제한되거나 전혀 발생하지 않고 자동으로 복구가 발생할 수 있다.
  • GDPS 글로벌 - XRC:거리 제한이 없는 비동기식 XRC(Extended Remote Copy) 기술을 기반으로 한 것이다.XRC는 장애가 발생할 경우 단 몇 초의 데이터만 손실될 수 있도록 두 사이트 간에 스토리지 장치의 데이터를 복사한다.장애가 발생하면 사용자는 복구 프로세스를 시작해야 한다.프로세스가 시작되면 보조 스토리지 장치에서 복구하고 시스템을 재구성할 때 자동으로 수행된다.
  • GDPS Global - GM: 거리에 제한이 없는 비동기 IBM Global Mirror 기술을 기반으로 한다.한 사이트에서 발생한 전체 장애로부터 복구하도록 설계되어 있다.2차 저장장치와 백업 시스템을 활성화한다.
  • GDPS Metro Global - GM: 재해 복구 목적으로 시스템/사이트가 세 개 이상인 시스템을 위한 구성이다.GDPS Global - GM과 함께 GDPS Metro를 기반으로 한다.
  • GDPS Metro Global - XRC:이는 재해 복구를 목적으로 시스템/사이트가 3개 이상인 시스템에 대한 구성이다.GDPS Metro와 GDPS Global - XRC를 기반으로 한다.
  • GDPS 무중단 가용성:이것은 두 개 이상의 사이트를 기반으로 한 재해 복구/연속 가용성 솔루션으로, 거리 제한 없이 분리되어 동일한 애플리케이션을 실행하고 동일한 데이터를 사용하여 사이트 간 워크로드 밸런싱을 제공한다.IBM Multi-site Workload Lifeline은 모니터링 및 워크로드 라우팅을 통해 GDPS Continuous Availability 솔루션에서 중요한 역할을 한다.

참고 항목

참조

  1. ^ "S/390 Parallel Sysplex Overview". Announcement Letters. IBM. April 6, 1994. 194-080.
  2. ^ "IBM S/390 Coupling Facility 9674 Model C01". Announcement Letters. IBM. April 6, 1994. 194-082.
  3. ^ "S/390 Parallel Sysplex Offering". Announcement Letters. IBM. April 6, 1994. 194-081.
  4. ^ "IBM ES/9000 Water-Cooled Processor Enhancements: New Ten-Way Processor, Parallel Sysplex Capability, and Additional Functions". Announcement Letters. IBM. April 6, 1994. 194-084.
  5. ^ "IBM Enterprise System/9000 Air-Cooled Processors Enhanced with Additional Functions and Parallel Sysplex Capability". Announcement Letters. IBM. April 6, 1994. 194-084.
  6. ^ "IBM MVS/ESA SP Version 5 Release 1 and OpenEdition Enhancements". Announcement Letters. IBM. April 6, 1994. 294-152.
  7. ^ System/390 Parallel Sysplex Performance (PDF) (Fourth ed.). International Business Machines Corporation. December 1998. SG24-4356-03. Archived from the original (PDF) on 2011-05-18. Retrieved 2007-09-17.
  8. ^ David Raften (November 2019). "Coupling Facility Configuration Options". Positioning paper. IBM. ZSW01971USEN.
  9. ^ "Coupling Facility Definition". PC Magazine.com. Retrieved April 13, 2009.
  10. ^ "Coupling Facility" (PDF). Retrieved April 13, 2009.
  11. ^ "Migrate from a Sysplex Timer to STP". IBM. Retrieved April 15, 2009.
  12. ^ "Sysplex Timer". Symmetricom. Retrieved April 15, 2009.
  13. ^ "IBM Server Time Protocol (STP)". IBM. Retrieved April 15, 2009.
  14. ^ Johnson, John E. "MVS Boot Camp: IBM Health Checker". z/Journal. Retrieved April 15, 2009.[영구적 데드링크]
  15. ^ "IBM's System Journal on S/390 Parallel Sysplex Clusters". Retrieved 24 April 2017.
  16. ^ Server Time Protocol Planning Guide (PDF). Redbooks (Fourth ed.). International Business Machines Corporation. June 2013. SG24-7280-03.
  17. ^ Ahmad, Riaz (March 5, 2009). GDPS 3.6 Update & Implementation. Austin, TX: SHARE. Retrieved April 17, 2009.[영구적 데드링크]

외부 링크