아파치 cTAKES

Apache cTAKES
아파치 cTAKES
Apache cTAKES Logo
개발자아파치 소프트웨어 재단
안정적 해제
4.0.0 / 2017년 4월 25일; 4년(2017-04-25)
리포지토리cTakes 저장소
기록 위치자바, 스칼라
운영 체제크로스 플랫폼
유형자연 언어 처리, 생물 정보학, 텍스트 마이닝, 정보 추출
면허증아파치 라이선스 2.0
웹사이트ctakes.apache.org

Apache cTAKES: 임상 텍스트 분석지식 추출 시스템은 전자 건강 기록 비정형 텍스트에서 임상 정보를 추출하는 오픈 소스 NLP(Natural Language Processing) 시스템이다.그것은 임상 기록들을 처리하고, 약물, 질병/장애, 징후/증상, 해부학적 부위 및 절차 등 임상적으로 명명된 실체의 유형을 식별한다.각 명명된 엔티티는 텍스트 범위, 온톨로지 매핑 코드, 컨텍스트(현재, 환자와 무관한 가족력)에 대한 속성을 가지며 부정/부정되지 않는다.[1]

cTAKES는 UIMA 비정형 정보 관리 아키텍처 프레임워크OpenNLP 자연 언어 처리 툴킷을 사용하여 구축되었다.[2][3]

구성 요소들

cTAKES의 구성요소는 임상영역을 위해 특별히 훈련되어 있으며, 임상결정 지원 시스템과 임상연구에 의해 활용될 수 있는 풍부한 언어 및 의미주석을 생성한다.[4]

이러한 구성 요소에는 다음이 포함된다.

  • 명명된 횡단 식별자
  • 문장 경계 검출기
  • 규칙 기반 토큰라이저
  • 서식 있는 목록 식별자
  • 노멀라이저
  • 컨텍스트 종속 토큰라이저
  • 부분 음성 태그거
  • 프라살 청커
  • 사전 조회 주석기
  • 컨텍스트 주석기
  • 부정 검출기
  • 불확도 검출기
  • 피실험자 검출기
  • 종속성 분석기
  • 환자 흡연 상태 식별자
  • 약물 언급 주석기

역사

cTAKES의 개발은 2006년 메이요 클리닉에서 시작되었다.게르가나 사보바 박사, 닥터 등이 이끄는 개발팀.Christopher Chute는 의사, 컴퓨터 과학자, 소프트웨어 엔지니어를 포함했다.구축 후 cTAKES는 Mayo의 임상 데이터 관리 인프라에 필수적인 부분이 되어 8천만 건 이상의 임상 노트를 처리했다.[5]

사보바 박사가 2010년 초 보스턴 아동병원으로 옮기면서 핵심 개발팀은 그 곳에 멤버를 포함하도록 성장했다.추가적인 외부 협력에는 다음이 포함된다.[5]

이러한 협력은 cTAKES의 기능을 임상 영역에 대한 시간 추론, 임상 질문 답변, 코레오론 해결과 같은 다른 영역으로 확장시켰다.[5]

2010년 i2b2 프로그램에 의해 cTAKES가 채택되었으며, 샤프 영역 4의 중심 부품이다.[5]

2013년, cTAKES는 아파치 인큐베이터 프로젝트인 cTAKES 3.0으로 첫 출시되었다.

2013년 3월, cTAKES는 아파치 최상위 프로젝트(TPP)가 되었다.[5]

참고 항목

참조

  1. ^ Denecke, Kerstin (2015-08-31). "Tools and Resources for Information Extraction". Health Web Science: Social Media Data for Healthcare. Springer. p. 67. ISBN 978-3-319-20582-3 – via Google Books.
  2. ^ Khalifa, Abdulrahman; Meystre, Stéphane (2015-12-01). "Adapting existing natural language processing resources for cardiovascular risk factors identification in clinical notes". Journal of Biomedical Informatics. Proceedings of the 2014 i2b2/UTHealth Shared-Tasks and Workshop on Challenges in Natural Language Processing for Clinical Data. 58 (Supplement): S128–S132. doi:10.1016/j.jbi.2015.08.002. PMC 4983192. PMID 26318122.
  3. ^ Khudairi, Sally (2017-04-25). "The Apache Software Foundation Announces Apache® cTAKES™ v4.0" (Press release). Forest Hill, MD: The Apache Software Foundation. Globe Newswire. Retrieved 2017-09-20.
  4. ^ Savova, Guergana K; Masanz, James J; Ogren, Philip V; Zheng, Jiaping; Sohn, Sunghwan; Kipper-Schuler, Karin C; Chute, Christopher G (2010). "Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES): architecture, component evaluation and applications". Journal of the American Medical Informatics Association. 17 (5): 507–513. doi:10.1136/jamia.2009.001560. ISSN 1067-5027. PMC 2995668. PMID 20819853.
  5. ^ a b c d e "History". Apache cTAKES™ - clinical Text Analysis Knowledge Extraction System. 2015-06-22. Retrieved 2018-01-11.

외부 링크