겐심
Gensim![]() | |
원본 작성자 | 라딤 řřek |
---|---|
개발자 | REARE Technologies Ltd. |
최초 공개. | 2009 |
안정적 해제 | 4.1.2[1] / 2021년 9월 18일; |
리포지토리 | github |
기록 위치 | 파이톤 |
운영 체제 | Linux, Windows, MacOS |
유형 | 정보 검색 |
면허증 | LGPL |
웹사이트 | radimrehurek |
겐심은 현대 통계 머신러닝을 활용한 무감독 주제 모델링과 자연어 처리를 위한 오픈소스 도서관이다.
젠심은 파이톤과 사이튼에서 구현해 성능을 발휘한다.겐심은 데이터 스트리밍과 증분 온라인 알고리즘을 이용해 대형 텍스트 컬렉션을 처리하도록 설계돼 인메모리 처리만을 목표로 하는 대부분의 다른 머신러닝 소프트웨어 패키지와 차별화된다.
주요 기능
겐심은 fastText,[2] word2vec, doc2vec 알고리즘의 스트리밍 병렬 구현뿐만 아니라 잠재 의미 [3]분석(LSA, LSI, SVD), 비-음극 매트릭스 인자화(NMF), 잠재 디리클레 할당(LDA), tf-idf, 무작위 투영을 포함한다.[4]
겐심의 소설 온라인 알고리즘 중 일부는 겐심의 창시자인 라딤 řřůek의 2011년 자연어 처리에서 의미론적 분석의 확장성 박사학위 논문에도 게재됐다.[5]
겐심의 사용
겐심은 2018년 현재 1400여 건의 상업 및 학술 출원에서 의약품부터 보험금 청구 분석, 특허 검색에 이르기까지 다양한 분야에서 사용 및 인용되고 있다.[6][7]그 소프트웨어는 몇 개의 새로운 기사, 팟캐스트, 인터뷰로 다루어졌다.[8][9][10]
무료 및 상업 지원
오픈 소스 코드는 GitHub에서[11] 개발, 주최하고, 공개 지원[12] 포럼은 Google 그룹과 Gitter에서 유지된다.[13]
겐심은 인큐베이터 프로그램을 통해 겐심을 위한 학생 멘토링과 학술 논문 프로젝트도 제공하는 rare-technologies.com사의 지원을 받고 있다.[14]
참조
- ^ "Release 4.1.2". 18 September 2021. Retrieved 27 September 2021.
- ^ 확장 가능한 *2vec 교육
- ^ 워드2벡과 겐심과의 딥러닝
- ^ 라딤 řůek and Petr Sojka(2010년).대기업과 함께 주제를 모델링하기 위한 소프트웨어 프레임워크.Proc. NLP 프레임워크의 새로운 과제에 대한 LREC 워크샵
- ^ Řehůřek, Radim (2011). "Scalability of Semantic Analysis in Natural Language Processing" (PDF). Retrieved 27 January 2015.
my open-source gensim software package that accompanies this thesis
- ^ 겐심 학술 인용구
- ^ 겐심의 상업적 입양인
- ^ 팟캐스트__init__ 에피소드 71번 겐심
- ^ 겐심의 창시자 라딤 řůek와의 인터뷰
- ^ "DecisionStats Interview Radim Řehůřek Gensim #python". 8 December 2015.
- ^ Github의 겐심 소스 코드
- ^ Google 그룹의 겐심 메일링 목록
- ^ 지터의 겐심 채팅방
- ^ 겐심 오픈소스 인큐베이터
외부 링크