다차원 계층형 툴킷
Multidimensional hierarchical toolkit다차원 계층형 툴킷 또는 MDH(Multi-Dimensional and Hierarchical) Database Toolkit은 Linux 기반의 오픈 소스형 휴대용 소프트웨어 툴킷으로 최대 256테라바이트의 데이터베이스 내 정보 검색 및 조작을 매우 빠르고 유연하게 다차원적으로 지원합니다.패키지는 C 및 C++로 작성되어 있으며 소스 코드 형식으로 GNU GPL/LGPL/Free Documentation 라이선스로 제공됩니다.배포 키트에는 네트워크 대응 인터랙티브 텍스트 및 시퀀스 검색 툴의 데모 구현이 포함되어 있습니다.이 툴킷은 매우 큰 게놈 데이터베이스와 기능하며 방대한 게놈 정보 데이터 세트를 조작할 수 있는 툴킷의 기능을 나타냅니다.
분배
툴킷은 MUMP 컴파일러의 일부로 배포됩니다.Linux, Cygwin 및 Windows XP용 버전이 있습니다.
오리진스
툴킷은 매우 크고, 문자열 색인화된 다차원, 희박한 행렬을 조작하는 문제에 대한 해결책입니다.이는 60년대 중반 매사추세츠 종합병원에서 시작된 범용 프로그래밍 언어인 MUMP(Mushets General Hospital)를 기반으로 합니다.
주요 기능
이 프로젝트의 주요 데이터베이스 기능은 글로벌 어레이입니다.이것에 의해, 실질적으로 무제한의 사이즈의 다차원 어레이를 직접, 효율적으로 조작할 수 있습니다.글로벌 어레이는 영속적이고 스파스하며 선언되지 않은 다차원 문자열 인덱스 데이터 디스크 기반 구조입니다.글로벌 어레이는 통상의 어레이 레퍼런스가 허가된 장소에 표시되며 데이터는 데이터베이스 어레이 내의 리프 노드 및 중간 노드에 저장될 수 있습니다.어레이 참조의 서브스크립트 수는 어레이 참조의 총 길이에 의해서만 제한됩니다.모든 서브스크립트가 문자열 값으로 확장됩니다.이 툴킷에는 데이터베이스를 통과하여 어레이를 조작하는 몇 가지 기능이 포함되어 있습니다.
이 툴킷은 데이터베이스와 함수 세트를 C++ 클래스로 사용할 수 있도록 하며 레거시 MUMP 스크립트를 해석적으로 실행할 수도 있습니다.이 툴킷을 사용하려면 MDH 및 MUMP 배포 키트 및 관련 코드를 설치합니다.
구현된 기능
툴킷은 레거시 MUMP 함수인 $ascii(), $extract(), $find(), $horog(), $length(), $name(), $justify(), $order(), $pice() 및 $test, Boyer-Moore-Gosper 문자열 검색 알고리즘, Smith-Waterman 알고리즘, Perl에 대한 관계형 연산 및 액세스 기능을 구현합니다.정규 표현 라이브러리(PCRE).