WordStat
WordStat![]() | |
개발자 | 프로발리스 리서치 |
---|---|
초기 릴리즈 | 1998 |
안정된 릴리스 | 9 |
운영 체제 | Microsoft Windows |
이용가능기간: | 다국어 |
유형 | 텍스트 마이닝, 콘텐츠 분석, 텍스트 분석, 감성 분석 |
면허증. | 독자적인 소프트웨어 |
웹 사이트 | www |
WordStat는 콘텐츠 분석 [1]및 텍스트 마이닝 소프트웨어입니다.프로발리스 리서치의 노만드 펠라도가 개발한 후 1998년에 처음 출시되었습니다.최신 버전 9는 2021년에 출시되었습니다.
이 소프트웨어는 주로 비즈니스 인텔리전스 및 웹사이트 경쟁 분석, 감성 분석, 개방형 질문 콘텐츠 분석, 소셜 미디어 데이터 주제 추출 등에 사용됩니다.
WordStat[2] 9의 일부 기능
- 사용자 정의 사전을 사용하여 내용을 분류합니다.
- 단어 또는 개념에 적용되는 Nave-Bayes 또는 k-근접 인접 알고리즘을 사용한 문서 분류.
- 1차(단어 동시 발생) 또는 2차(공동 발생 프로파일) 계층 클러스터링 및 다차원 축척을 사용한 자동 토픽 추출.
- NNMF 및 인자 분석을 사용하여 주요 테마를 추출하는 주제 모델링.
- 문서와 관련된 범주형 메타 데이터와 연관된 단어 또는 개념(또는 내용 범주)을 식별하기 위한 대응 분석입니다.
- R 및 python 스크립트를 사용한 사전 및 사후 처리
- 중국어, 일본어, 한국어, 태국어를 포함한 70개 이상의 언어를 분석합니다.
- 인터랙티브 워드 클라우드 및 워드 빈도 테이블을 키워드 검색 및 KWIC(Keyword-in-Context) 결과에서 직접 얻을 수 있으므로 특정 콘텐츠 카테고리와 관련된 단어 또는 특정 대상 항목 앞에 나타나는 단어를 빠르게 식별할 수 있습니다.
- 비정형 텍스트를 날짜, 숫자 또는 범주형 데이터와 같은 정형 데이터와 관련지어 하위 그룹 간의 시간적 추세 또는 차이를 식별하거나 등급 또는 기타 종류의 범주형 또는 숫자 데이터와의 관계를 평가합니다.
- 텍스트 분석 결과를 시각화하고 해석하는 시각화 도구:
- 막대 차트(선택 사항)가 있는 덴드로그램
- 2D 및 3D 다차원 스케일링
- 근접도
- 히트맵(듀얼 클러스터링 포함)
- 버블 차트
- 막대 차트, 원형 차트, 꺽은선형 차트, 단어 구름
- 대응 그림(2D 및 3D)