WordStat

WordStat
WordStat
Logo of WordStat from Provalis Research.png
개발자프로발리스 리서치
초기 릴리즈1998
안정된 릴리스
9
운영 체제Microsoft Windows
이용가능기간:다국어
유형텍스트 마이닝, 콘텐츠 분석, 텍스트 분석, 감성 분석
면허증.독자적인 소프트웨어
웹 사이트www.provalisresearch.com

WordStat콘텐츠 분석 [1]텍스트 마이닝 소프트웨어입니다.프로발리스 리서치의 노만드 펠라도가 개발한 후 1998년에 처음 출시되었습니다.최신 버전 9는 2021년에 출시되었습니다.

이 소프트웨어는 주로 비즈니스 인텔리전스 및 웹사이트 경쟁 분석, 감성 분석, 개방형 질문 콘텐츠 분석, 소셜 미디어 데이터 주제 추출 등에 사용됩니다.

WordStat[2] 9의 일부 기능

  • 사용자 정의 사전을 사용하여 내용을 분류합니다.
  • 단어 또는 개념에 적용되는 Nave-Bayes 또는 k-근접 인접 알고리즘을 사용한 문서 분류.
  • 1차(단어 동시 발생) 또는 2차(공동 발생 프로파일) 계층 클러스터링 및 다차원 축척을 사용한 자동 토픽 추출.
  • NNMF 및 인자 분석을 사용하여 주요 테마를 추출하는 주제 모델링.
  • 문서와 관련된 범주형 메타 데이터와 연관된 단어 또는 개념(또는 내용 범주)을 식별하기 위한 대응 분석입니다.
  • R 및 python 스크립트를 사용한 사전 및 사후 처리
  • 중국어, 일본어, 한국어, 태국어를 포함한 70개 이상의 언어를 분석합니다.
  • 인터랙티브 워드 클라우드 및 워드 빈도 테이블을 키워드 검색 및 KWIC(Keyword-in-Context) 결과에서 직접 얻을 수 있으므로 특정 콘텐츠 카테고리와 관련된 단어 또는 특정 대상 항목 앞에 나타나는 단어를 빠르게 식별할 수 있습니다.
  • 비정형 텍스트를 날짜, 숫자 또는 범주형 데이터와 같은 정형 데이터와 관련지어 하위 그룹 간의 시간적 추세 또는 차이를 식별하거나 등급 또는 기타 종류의 범주형 또는 숫자 데이터와의 관계를 평가합니다.
  • 텍스트 분석 결과를 시각화하고 해석하는 시각화 도구:
    • 막대 차트(선택 사항)가 있는 덴드로그램
    • 2D 및 3D 다차원 스케일링
    • 근접도
    • 히트맵(듀얼 클러스터링 포함)
    • 버블 차트
    • 막대 차트, 원형 차트, 꺽은선형 차트, 단어 구름
    • 대응 그림(2D 및 3D)

레퍼런스

  1. ^ "LINGUIST List 15.1171: Software: Wordstat, v. 4". 10 April 2004.
  2. ^ http://flightsafety.org/files/Provalis_text_mining_report.pdf[베어 URL PDF]