아파치 cTAKES

아파치 cTAKES
개발자	아파치 소프트웨어 재단
안정적 해제	4.0.0 / 2017년 4월 25일; 4년 전
리포지토리	cTakes 저장소
기록 위치	자바, 스칼라
운영 체제	크로스 플랫폼
유형	자연 언어 처리, 생물 정보학, 텍스트 마이닝, 정보 추출
면허증	아파치 라이선스 2.0
웹사이트	ctakes.apache.org

Apache cTAKES: 임상 텍스트 분석 및 지식 추출 시스템은 전자 건강 기록 비정형 텍스트에서 임상 정보를 추출하는 오픈 소스 NLP(Natural Language Processing) 시스템이다.그것은 임상 기록들을 처리하고, 약물, 질병/장애, 징후/증상, 해부학적 부위 및 절차 등 임상적으로 명명된 실체의 유형을 식별한다.각 명명된 엔티티는 텍스트 범위, 온톨로지 매핑 코드, 컨텍스트(현재, 환자와 무관한 가족력)에 대한 속성을 가지며 부정/부정되지 않는다.^[1]

cTAKES는 UIMA 비정형 정보 관리 아키텍처 프레임워크와 OpenNLP 자연 언어 처리 툴킷을 사용하여 구축되었다.^[2]^[3]

구성 요소들

cTAKES의 구성요소는 임상영역을 위해 특별히 훈련되어 있으며, 임상결정 지원 시스템과 임상연구에 의해 활용될 수 있는 풍부한 언어 및 의미주석을 생성한다.^[4]

이러한 구성 요소에는 다음이 포함된다.

명명된 횡단 식별자
문장 경계 검출기
규칙 기반 토큰라이저
서식 있는 목록 식별자
노멀라이저
컨텍스트 종속 토큰라이저
부분 음성 태그거
프라살 청커
사전 조회 주석기
컨텍스트 주석기
부정 검출기
불확도 검출기
피실험자 검출기
종속성 분석기
환자 흡연 상태 식별자
약물 언급 주석기

역사

cTAKES의 개발은 2006년 메이요 클리닉에서 시작되었다.게르가나 사보바 박사, 닥터 등이 이끄는 개발팀.Christopher Chute는 의사, 컴퓨터 과학자, 소프트웨어 엔지니어를 포함했다.구축 후 cTAKES는 Mayo의 임상 데이터 관리 인프라에 필수적인 부분이 되어 8천만 건 이상의 임상 노트를 처리했다.^[5]

사보바 박사가 2010년 초 보스턴 아동병원으로 옮기면서 핵심 개발팀은 그 곳에 멤버를 포함하도록 성장했다.추가적인 외부 협력에는 다음이 포함된다.^[5]

이러한 협력은 cTAKES의 기능을 임상 영역에 대한 시간 추론, 임상 질문 답변, 코레오론 해결과 같은 다른 영역으로 확장시켰다.^[5]

2010년 i2b2 프로그램에 의해 cTAKES가 채택되었으며, 샤프 영역 4의 중심 부품이다.^[5]

2013년, cTAKES는 아파치 인큐베이터 프로젝트인 cTAKES 3.0으로 첫 출시되었다.

2013년 3월, cTAKES는 아파치 최상위 프로젝트(TPP)가 되었다.^[5]

참고 항목

참조

^ Denecke, Kerstin (2015-08-31). "Tools and Resources for Information Extraction". Health Web Science: Social Media Data for Healthcare. Springer. p. 67. ISBN 978-3-319-20582-3 – via Google Books.
^ Khalifa, Abdulrahman; Meystre, Stéphane (2015-12-01). "Adapting existing natural language processing resources for cardiovascular risk factors identification in clinical notes". Journal of Biomedical Informatics. Proceedings of the 2014 i2b2/UTHealth Shared-Tasks and Workshop on Challenges in Natural Language Processing for Clinical Data. 58 (Supplement): S128–S132. doi:10.1016/j.jbi.2015.08.002. PMC 4983192. PMID 26318122.
^ Khudairi, Sally (2017-04-25). "The Apache Software Foundation Announces Apache® cTAKES™ v4.0" (Press release). Forest Hill, MD: The Apache Software Foundation. Globe Newswire. Retrieved 2017-09-20.
^ Savova, Guergana K; Masanz, James J; Ogren, Philip V; Zheng, Jiaping; Sohn, Sunghwan; Kipper-Schuler, Karin C; Chute, Christopher G (2010). "Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES): architecture, component evaluation and applications". Journal of the American Medical Informatics Association. 17 (5): 507–513. doi:10.1136/jamia.2009.001560. ISSN 1067-5027. PMC 2995668. PMID 20819853.
^ ^a ^b ^c ^d ^e "History". Apache cTAKES™ - clinical Text Analysis Knowledge Extraction System. 2015-06-22. Retrieved 2018-01-11.

외부 링크

cTAKES 공식 웹사이트
ASF의 Apache cTAKES 프로젝트 정보 페이지
추상(JAMIA)
OHNLP(Open Health Natural Language Processing) 컨소시엄
Strategic Health IT Advanced Research Projects(SHARP) 프로그램
샤프 영역 4 - EHR 데이터의 2차 사용
자동 검색 콘솔(ARC)
건강 정보 텍스트 추출(HITEx)은 i2b2 프로젝트의 일환으로 개발되었다.생물학 통합 정보학(Informatics for Integration Biology)과 침상(Beader)이 개발한 GATE 프레임워크에 기반한 규칙 기반 NLP 파이프라인이다.
Computing Language and Education Research 툴킷(cleartk)(더 이상 유지되지 않음)은 콜로라도 대학교 볼더에서 개발되었으며, 자바에서 통계 NLP 구성요소를 개발하기 위한 프레임워크를 제공한다.아파치 UIMA 위에 지어졌다.
NegEx - 임상 텍스트에서 부정 용어를 검출하기 위해 피츠버그 대학에서 개발한 도구다.시스템은 문장 내에서 발생할 수 있는 부정 시나리오를 결정하기 위한 방법으로 트리거 용어를 사용한다.
ConText: NegEx로의 확장이며, 피츠버그 대학에서 개발하기도 한다.ConText는 NegEx를 확장하여 부정된 개념을 탐지할 뿐만 아니라 일시적(최근, 역사적 또는 가상적 시나리오)과 대상(경험적)이 누구(환자 또는 기타)인지를 찾아낸다.
MetaMap(미국 국립 의학 라이브러리 by United National Library of Medicine): 통합의학 언어 시스템 위에 구축된 종합 개념 태그 지정 시스템이다.UMLS 메타테사우루스 라이센스 계약(및 계정)을 사용해야 한다.
MedEx - 임상 텍스트에서 의약품 정보를 추출하는 도구.MedEx는 자유 텍스트 임상 기록을 처리하여 약물 투여량, 빈도, 경로 및 기간과 같은 의약품 이름과 서명 정보를 인식한다.UMLS 사용권은 무료다.리눅스 및 윈도우즈용 독립형 애플리케이션이다.
SecTag(섹션 태그 계층): NLP, 베이지안, 철자 수정 및 채점 기법을 사용하여 노트 섹션 헤더를 인식한다.UMLS 또는 LOINC 라이센스에 무료로 사용 가능.
(Stanford Named Entity Incognizer (NER): 스탠포드의 NER는 조건부 무작위 필드 시퀀스 모델이며, 영어와 독일어로 Named Entity Incognition에 대해 잘 설계된 기능이다.
(Stanford CoreNLP)는 토큰화, part-of-speech tagging, 명명된 엔티티 인식, 구문 분석, 코레오레이션을 포함한 자바 영어용 자연어 처리 툴의 통합 모음입니다.

[1] Denecke, Kerstin (2015-08-31). "Tools and Resources for Information Extraction". Health Web Science: Social Media Data for Healthcare. Springer. p. 67. ISBN 978-3-319-20582-3 – via Google Books.

[2] Khalifa, Abdulrahman; Meystre, Stéphane (2015-12-01). "Adapting existing natural language processing resources for cardiovascular risk factors identification in clinical notes". Journal of Biomedical Informatics. Proceedings of the 2014 i2b2/UTHealth Shared-Tasks and Workshop on Challenges in Natural Language Processing for Clinical Data. 58 (Supplement): S128–S132. doi:10.1016/j.jbi.2015.08.002. PMC 4983192. PMID 26318122.

[3] Khudairi, Sally (2017-04-25). "The Apache Software Foundation Announces Apache® cTAKES™ v4.0" (Press release). Forest Hill, MD: The Apache Software Foundation. Globe Newswire. Retrieved 2017-09-20.

[4] Savova, Guergana K; Masanz, James J; Ogren, Philip V; Zheng, Jiaping; Sohn, Sunghwan; Kipper-Schuler, Karin C; Chute, Christopher G (2010). "Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES): architecture, component evaluation and applications". Journal of the American Medical Informatics Association. 17 (5): 507–513. doi:10.1136/jamia.2009.001560. ISSN 1067-5027. PMC 2995668. PMID 20819853.

[cTAKES_history-5] "History". Apache cTAKES™ - clinical Text Analysis Knowledge Extraction System. 2015-06-22. Retrieved 2018-01-11.

[1]

[2]

[3]

[4]

[5]

v t 아파치 소프트웨어 재단
최상위 수준 프로젝트	아큐룰로 액티브MQ 기류 암바리 개미 양자리 화살표 Apache HTTP 서버 APR 아브로 축 축2 빔 블러드하운드 브루클린 빌더 석회석 낙타 카본데이터 카산드라 카옌 화학 클라우드스택 고치 코도바 카우치DB cTAKES CXF 더비 디렉토리 드릴 드루이드 엠파이어-db 펠릭스 플렉스 플링크 플룸 제로니모 지라프 금프 하둡 HBase 헬릭스 벌집 임팔라 잭래빗 제임스 예나 지니 JMeter 카프카 쿠두 킬린 루세네 마하트 메이븐 미나 mod_perl 마이페이스 넷빈즈 너치 OFBIZ 오오지에 오픈EJB 오픈JPA 오픈NLP 오랄렌 오피스 ORC PDFBox 파르케 피닉스 POI 돼지 피노 피벗 큐피드 롤러 로켓MQ 삼자 서비스믹스 시스루 싱가 슬링 솔러 스파크 스톰 스팸어세신 스트럿츠 1 스트럿츠 2 전복 슈퍼셋 시스템DS 태피스트리 절약 티카 톰캣 트라포디온 트래픽 서버 우이마 속도 위켓 샬란 크세르체스 XMLBeans 예투스 동물원 관리인
커먼스	BCEL BSF 데몬 젤리 로깅
인큐베이터	MXNet 너트엑스 타베나
기타 프로젝트	바틱 체인소 FOP 담쟁이덩굴 로그4j
다락방	압데라 에이펙스 액스킷 벌집 푸른하늘 iBATIS C++ 표준 라이브러리 선인장 클릭 연속체 델타클라우드 에치 엑살리버 포레스트 하마 하모니 하이브마인드 자카르타 레냐 마못타 ODE 셰일 신디그 미끄럼틀 스쿱 스탠볼 투스카니 웨이브 윙크
면허증	아파치 라이선스
카테고리

Search

아파치 cTAKES

네임스페이스

더

목차

구성 요소들

역사

참고 항목

참조

외부 링크