아파치 cTAKES
Apache cTAKES| 개발자 | 아파치 소프트웨어 재단 |
|---|---|
| 안정적 해제 | 4.0.0 / 2017년 4월 25일; 전 |
| 리포지토리 | cTakes 저장소 |
| 기록 위치 | 자바, 스칼라 |
| 운영 체제 | 크로스 플랫폼 |
| 유형 | 자연 언어 처리, 생물 정보학, 텍스트 마이닝, 정보 추출 |
| 면허증 | 아파치 라이선스 2.0 |
| 웹사이트 | ctakes |
Apache cTAKES: 임상 텍스트 분석 및 지식 추출 시스템은 전자 건강 기록 비정형 텍스트에서 임상 정보를 추출하는 오픈 소스 NLP(Natural Language Processing) 시스템이다.그것은 임상 기록들을 처리하고, 약물, 질병/장애, 징후/증상, 해부학적 부위 및 절차 등 임상적으로 명명된 실체의 유형을 식별한다.각 명명된 엔티티는 텍스트 범위, 온톨로지 매핑 코드, 컨텍스트(현재, 환자와 무관한 가족력)에 대한 속성을 가지며 부정/부정되지 않는다.[1]
cTAKES는 UIMA 비정형 정보 관리 아키텍처 프레임워크와 OpenNLP 자연 언어 처리 툴킷을 사용하여 구축되었다.[2][3]
구성 요소들
cTAKES의 구성요소는 임상영역을 위해 특별히 훈련되어 있으며, 임상결정 지원 시스템과 임상연구에 의해 활용될 수 있는 풍부한 언어 및 의미주석을 생성한다.[4]
이러한 구성 요소에는 다음이 포함된다.
- 명명된 횡단 식별자
- 문장 경계 검출기
- 규칙 기반 토큰라이저
- 서식 있는 목록 식별자
- 노멀라이저
- 컨텍스트 종속 토큰라이저
- 부분 음성 태그거
- 프라살 청커
- 사전 조회 주석기
- 컨텍스트 주석기
- 부정 검출기
- 불확도 검출기
- 피실험자 검출기
- 종속성 분석기
- 환자 흡연 상태 식별자
- 약물 언급 주석기
역사
cTAKES의 개발은 2006년 메이요 클리닉에서 시작되었다.게르가나 사보바 박사, 닥터 등이 이끄는 개발팀.Christopher Chute는 의사, 컴퓨터 과학자, 소프트웨어 엔지니어를 포함했다.구축 후 cTAKES는 Mayo의 임상 데이터 관리 인프라에 필수적인 부분이 되어 8천만 건 이상의 임상 노트를 처리했다.[5]
사보바 박사가 2010년 초 보스턴 아동병원으로 옮기면서 핵심 개발팀은 그 곳에 멤버를 포함하도록 성장했다.추가적인 외부 협력에는 다음이 포함된다.[5]
이러한 협력은 cTAKES의 기능을 임상 영역에 대한 시간 추론, 임상 질문 답변, 코레오론 해결과 같은 다른 영역으로 확장시켰다.[5]
2010년 i2b2 프로그램에 의해 cTAKES가 채택되었으며, 샤프 영역 4의 중심 부품이다.[5]
2013년, cTAKES는 아파치 인큐베이터 프로젝트인 cTAKES 3.0으로 첫 출시되었다.
2013년 3월, cTAKES는 아파치 최상위 프로젝트(TPP)가 되었다.[5]
참고 항목
참조
- ^ Denecke, Kerstin (2015-08-31). "Tools and Resources for Information Extraction". Health Web Science: Social Media Data for Healthcare. Springer. p. 67. ISBN 978-3-319-20582-3 – via Google Books.
- ^ Khalifa, Abdulrahman; Meystre, Stéphane (2015-12-01). "Adapting existing natural language processing resources for cardiovascular risk factors identification in clinical notes". Journal of Biomedical Informatics. Proceedings of the 2014 i2b2/UTHealth Shared-Tasks and Workshop on Challenges in Natural Language Processing for Clinical Data. 58 (Supplement): S128–S132. doi:10.1016/j.jbi.2015.08.002. PMC 4983192. PMID 26318122.
- ^ Khudairi, Sally (2017-04-25). "The Apache Software Foundation Announces Apache® cTAKES™ v4.0" (Press release). Forest Hill, MD: The Apache Software Foundation. Globe Newswire. Retrieved 2017-09-20.
- ^ Savova, Guergana K; Masanz, James J; Ogren, Philip V; Zheng, Jiaping; Sohn, Sunghwan; Kipper-Schuler, Karin C; Chute, Christopher G (2010). "Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES): architecture, component evaluation and applications". Journal of the American Medical Informatics Association. 17 (5): 507–513. doi:10.1136/jamia.2009.001560. ISSN 1067-5027. PMC 2995668. PMID 20819853.
- ^ a b c d e "History". Apache cTAKES™ - clinical Text Analysis Knowledge Extraction System. 2015-06-22. Retrieved 2018-01-11.
외부 링크
- cTAKES 공식 웹사이트
- ASF의 Apache cTAKES 프로젝트 정보 페이지
- 추상(JAMIA)
- OHNLP(Open Health Natural Language Processing) 컨소시엄
- Strategic Health IT Advanced Research Projects(SHARP) 프로그램
- 샤프 영역 4 - EHR 데이터의 2차 사용
- 자동 검색 콘솔(ARC)
- 건강 정보 텍스트 추출(HITEx)은 i2b2 프로젝트의 일환으로 개발되었다.생물학 통합 정보학(Informatics for Integration Biology)과 침상(Beader)이 개발한 GATE 프레임워크에 기반한 규칙 기반 NLP 파이프라인이다.
- Computing Language and Education Research 툴킷(cleartk)(더 이상 유지되지 않음)은 콜로라도 대학교 볼더에서 개발되었으며, 자바에서 통계 NLP 구성요소를 개발하기 위한 프레임워크를 제공한다.아파치 UIMA 위에 지어졌다.
- NegEx - 임상 텍스트에서 부정 용어를 검출하기 위해 피츠버그 대학에서 개발한 도구다.시스템은 문장 내에서 발생할 수 있는 부정 시나리오를 결정하기 위한 방법으로 트리거 용어를 사용한다.
- ConText: NegEx로의 확장이며, 피츠버그 대학에서 개발하기도 한다.ConText는 NegEx를 확장하여 부정된 개념을 탐지할 뿐만 아니라 일시적(최근, 역사적 또는 가상적 시나리오)과 대상(경험적)이 누구(환자 또는 기타)인지를 찾아낸다.
- MetaMap(미국 국립 의학 라이브러리 by United National Library of Medicine): 통합의학 언어 시스템 위에 구축된 종합 개념 태그 지정 시스템이다.UMLS 메타테사우루스 라이센스 계약(및 계정)을 사용해야 한다.
- MedEx - 임상 텍스트에서 의약품 정보를 추출하는 도구.MedEx는 자유 텍스트 임상 기록을 처리하여 약물 투여량, 빈도, 경로 및 기간과 같은 의약품 이름과 서명 정보를 인식한다.UMLS 사용권은 무료다.리눅스 및 윈도우즈용 독립형 애플리케이션이다.
- SecTag(섹션 태그 계층): NLP, 베이지안, 철자 수정 및 채점 기법을 사용하여 노트 섹션 헤더를 인식한다.UMLS 또는 LOINC 라이센스에 무료로 사용 가능.
- (Stanford Named Entity Incognizer (NER): 스탠포드의 NER는 조건부 무작위 필드 시퀀스 모델이며, 영어와 독일어로 Named Entity Incognition에 대해 잘 설계된 기능이다.
- (Stanford CoreNLP)는 토큰화, part-of-speech tagging, 명명된 엔티티 인식, 구문 분석, 코레오레이션을 포함한 자바 영어용 자연어 처리 툴의 통합 모음입니다.