감정 분석

Sentiment analysis

감정 분석(오피니언 마이닝 또는 감정 AI라고도 함)은 자연 언어 처리, 텍스트 분석, 컴퓨터 언어학생체 인식학을 사용하여 감정 상태와 주관적인 정보를 체계적으로 식별, 추출, 정량화 및 연구하는 것입니다.감성 분석은 리뷰 및 설문 응답, 온라인 및 소셜 미디어, 마케팅에서 고객 서비스, 임상 의학에 이르기까지 다양한 응용 분야의 의료 자료에 광범위하게 적용됩니다.RoBERTA와 같은 심층 언어 모델이 부상함에 따라 더 어려운 데이터 영역도 분석할 수 있다. 예를 들어, 저자가 일반적으로 의견/감정을 [1]덜 명확하게 표현하는 뉴스 텍스트가 그것이다.

감정 분석의 목적과 과제는 몇 가지 간단한 예를 통해 보여줄 수 있다.

단순한 케이스

  • 코로넷은 하루 중 최고의 순양함을 보유하고 있다.
  • Bertram은 깊은 V 선체를 가지고 있고 바다를 쉽게 통과합니다.
  • 플로리다에서 온 파스텔 색상의 1980년대 순양함은 못생겼다.
  • 는 오래된 객실 순찰차가 싫다.

보다 어려운 예

  • 나는 객실 순양함을 싫어하지 않는다. (부정 취급)
  • 나는 물놀이를 싫어하지 않는다. (부정, 역순)
  • 가끔 RIB가 너무 싫을 때가 있어요. (부사적 수정)
  • 이런 날씨에 정말 나가고 싶어요!
  • Chris Craft는 석회암보다 더 잘생겼다.(브랜드명 두 개, 자세의 대상을 특정하기 어렵다.)
  • Chris Craft는 석회암보다 외모가 뛰어나지만, 석회암은 항해의 용이성과 신뢰성을 자랑합니다. (두 가지 자세, 두 가지 브랜드 이름)
  • 그 영화는 많은 불안한 줄거리 반전으로 놀랍다.(특정 도메인에서 긍정적인 의미로 사용되는 부정적인 용어).
  • 퇴폐 디저트 메뉴가 표시됩니다. (최근 특정 도메인에서 태도 용어가 극성을 옮겼습니다.)
  • 저는 제 모바일을 좋아하지만 동료들에게는 추천하지 않습니다.(적격된 긍정적 감정, 분류하기 어렵다)
  • 다음 주 공연은 프랑스어로 "What's new?"를 뜻하는 "Quoi de neuf?"입니다.새로 주조된 용어는 매우 자세적이지만 극성이 불안정할 수 있으며 종종 알려진 어휘에서 제외됩니다.)

종류들

감정 분석의 기본 작업은 문서, 문장 또는 특징/기대 수준에서 주어진 텍스트의 극성을 분류하는 것이다. 문서, 문장 또는 실체 특징/기대 중 어느 것이 긍정인지, 부정인지, 중립인지 여부이다.예를 들어, "극성을 넘어선" 감정 분류는 즐거움, 분노, 혐오, 슬픔, 두려움, [2]놀라움과 같은 감정 상태를 봅니다.

감성적 분석의 전조로는 텍스트의 패턴을 수량화하는 힌트를 제공하는 General Inquirer와 [3]언어적 [4]행동의 분석을 바탕으로 사람의 심리 상태를 검사하는 심리 연구가 있다.

그 후 Volcani와 Fogel의 [5]특허에 기술된 방법은 구체적으로 감정을 살펴보고 다른 감정 척도에 대해 텍스트에서 개별 단어와 구를 식별했다.이펙트체크라고 불리는 그들의 작업에 기반을 둔 현재의 시스템은 각 척도에서 유발된 감정의 수준을 증가시키거나 감소시키는 데 사용될 수 있는 동의어를 제시한다.

터니[6]작품과 영화[7] 리뷰의 극성을 감지하는 방법이 각각 다른 터니와 팡의 작품처럼 긍정적인 것부터 부정적인 것까지 단지 감정의 극적 시각만을 사용하는 다른 많은 노력들은 덜 정교했다.이 작업은 문서 수준입니다.또는 Pang[8]과 Snyder[9]에 시도했습니다는 다중에:Snyder[9]식당 revie에 대한 심층 분석을 수행했다 팽, Lee[8], 또는 부정적인 중 3또는4-star 규모에 별 등급을 예측하기 위해 긍정적으로 영화를 분류하는 것의 기본적인 과제를 문서의 극성을 분류할 수 있다.그도 예측하고 있음식 및 분위기 등 특정 레스토랑의 다양한 측면에 대한 등급 설정(5성급).

학습, 어휘, 지식 기반 등 다양한 접근 방식을 통합하기 위한 첫 번째 단계2004년 AAAI 봄 심포지엄에서 언어학자, 컴퓨터 과학자 및 기타 관심 있는 연구자들이 먼저 관심을 조정하고 텍스트의 [10]영향, 호소력, 주관성 및 감정에 대한 체계적인 컴퓨터 연구를 위한 공유 태스크와 벤치마크 데이터 세트를 제안했습니다.

대부분의 통계 분류 방법에서 중립 텍스트가 이진 분류기의 경계 근처에 있다는 가정 하에 중립 클래스는 무시되지만, 몇몇 연구자들은 모든 극성 문제에서와 같이 세 가지 범주를 식별해야 한다고 제안한다.또한 Max[11] Entropy 및 SVM[12] 같은 특정 분류기가 중립 클래스의 도입으로 혜택을 받고 분류의 전반적인 정확도를 향상시킬 수 있다는 것을 증명할 수 있다.중립 클래스로 조작하는 방법에는 원칙적으로 두 가지가 있습니다.이 알고리즘은 우선 중립적인 언어를 식별하고 이를 걸러낸 다음 긍정과 부정의 관점에서 나머지를 평가하는 방식으로 진행되거나 [13]한 단계로 삼원 분류를 구축한다.이 두 번째 접근법은 종종 모든 범주(예: NLTK에 의해 구현된 순진한 베이즈 분류기)에 대한 확률 분포를 추정하는 것을 포함한다.중립 클래스를 사용할지 여부와 방법은 데이터의 특성에 따라 달라집니다. 데이터가 중립, 부정 및 긍정 언어로 명확하게 정리되어 있다면 중립 언어를 걸러내고 긍정과 부정 사이의 극성에 초점을 맞추는 것이 이치에 맞습니다.반대로, 데이터가 대부분 중립적이고 긍정적인 영향과 부정적인 영향을 향한 편차가 작다면, 이 전략은 두 극을 명확하게 구별하기 어렵게 만들 것이다.

감정을 결정하는 다른 방법은 음, 중성 또는 양의 감정을 갖는 것과 공통적으로 관련된 단어에 -10에서 +10 척도(가장 음에서 가장 양까지) 또는 단순히 0에서 +4와 같은 양의 상한으로 관련 번호를 부여하는 스케일링 시스템을 사용하는 것이다.이를 통해 주어진 용어의 환경(일반적으로 문장의 수준)에 대한 상대적인 감정을 조정할 수 있습니다.자연어 처리를 사용하여 구조화되지 않은 텍스트를 분석하면 특정 환경의 각 개념은 감성 단어가 개념 및 관련 [14][15][16]점수에 관련된 방법에 따라 점수가 부여됩니다.이를 통해 감정에 대한 보다 정교한 이해로 이동할 수 있습니다. 왜냐하면 이제 감정에 대한 개념을 둘러싼 수정에 대한 상대적인 감정 값을 조정할 수 있기 때문입니다.예를 들어, 개념에 의해 표현된 감정을 강화, 완화 또는 부정하는 단어는 그 점수에 영향을 미칠 수 있다.또는 텍스트의 [17]전체 극성과 강도가 아닌 텍스트의 감성을 결정하는 것이 목표인 경우 텍스트에 긍정 및 부정 감정 강도 점수를 부여할 수 있습니다.

정서분석에는 Aspect Based 정서분석, Grading 정서분석(긍정, 부정, 중립), 다국어 정서분석 및 감정검출 등 다양한 유형이 있습니다.

주관성/객관성 식별

이 작업은 일반적으로 주어진 텍스트(일반적으로 문장)를 객관적 또는 주관적 [18]두 가지 클래스 중 하나로 분류하는 것으로 정의됩니다.이 문제는 극성 [19]분류보다 어려울 수 있습니다.단어와 구문의 주관성은 문맥에 따라 달라질 수 있으며, 객관적인 문서에는 주관적인 문장이 포함될 수 있다(예: 사람들의 의견을 인용하는 뉴스 기사).또한 [20]Su가 언급한 바와 같이, 결과는 텍스트에 주석을 달 때 사용되는 주관성의 정의에 따라 크게 좌우된다.그러나[21] Pang은 극성을 분류하기 전에 문서에서 객관적인 문장을 삭제하면 성능 향상에 도움이 된다는 것을 보여주었다.

주관적이고 객관적인 식별, 구문적, 의미적 특징, 문장이나 문서를 식별하기 위한 기계 학습 지식을 사용하기 위한 감정 분석의 새로운 하위 태스크는 사실 또는 의견이다.사실과 의견을 인식하는 것에 대한 인식은 최근이 아니며, 1979년 예일 대학의 Carbonell에 의해 처음 제시되었을 가능성이 있다.[아쉬움]

목적이라는 용어는 사실 정보를 [22]포함하는 사건을 말합니다.

  • 객관적인 문장의 예: '미국의 대통령으로 선출되려면 후보자는 적어도 35세 이상이어야 한다.'

주관적이라는 용어는 개인적인 의견, 판단, 예측 등 다양한 형태로 사실이 아닌 정보를 포함합니다.Quirk [23]등이 언급한 '개인 국가'로도 알려져 있다.아래 예에서는 'We American'이라는 민간 주를 반영하고 있습니다.또, 의견의 대상이 되는 주체는, 유형 제품으로부터 Liu(2010)[24]에 기재된 무형 토픽에 이르기까지, 몇개의 형태를 취할 수 있다.또한 Liu(2010), 긍정적 의견, 중립적 의견, 부정적 의견 [24]등 3가지 유형의 태도가 관찰되었다.

  • 주관적인 문장의 예: '우리 미국인들은 성숙하고 현명한 결정을 내릴 수 있는 대통령을 선출할 필요가 있다.'

이 분석은 분류상의 문제입니다.[25]

주석 없는 텍스트에서 원하는 패턴을 찾기 위해 각 클래스의 단어 또는 구 표시기 모음이 정의됩니다.주관식의 경우 다른 단어 목록이 생성되었습니다.단어 또는 구문의 주관적 지표 목록은 Riloff et al.(2003)[26]의 언어학자 및 자연어 처리 분야 상태에 있는 여러 연구자에 의해 개발되었다.주어진 식을 측정하기 위해 추출 규칙 사전을 만들어야 합니다.수년간 주관적 검출에서 특징 추출은 수작업으로 특징 큐레이팅에서 자동화된 특징 학습으로 진행됩니다.현재 자동 학습 방법은 감독된 기계 학습과 감독되지 않은 기계 학습으로 더욱 분리될 수 있습니다.기계 학습 프로세스에 주석을 달고 주석을 달지 않은 텍스트를 사용한 패턴 추출은 학술 연구자들에 의해 광범위하게 탐구되어 왔다.

그러나 연구자들은 표현식에 대한 고정 규칙 집합을 개발하는 데 있어 몇 가지 어려움을 인식했다.규칙 개발의 많은 과제는 텍스트 정보의 특성에서 비롯됩니다.여러 연구자들은 1) 은유적 표현, 2) 글의 불일치, 3) 문맥 의존적 표현, 4) 사용 빈도가 적은 표현, 5) 시간에 민감한 표현, 6) 계속 증가하는 볼륨 등 6가지 과제를 인식하고 있습니다.

  1. 은유적인 표현.텍스트에는 [27]추출 성능에 영향을 줄 수 있는 은유적 표현이 포함되어 있습니다.게다가, 은유는 다양한 형태를 취하는데, 이것은 검출의 증가에 기여했을지도 모른다.
  2. 글의 불일치.인터넷에서 얻은 텍스트의 경우, 대상 텍스트 데이터의 쓰기 스타일의 불일치는 다른 장르와 스타일을 포함한다.
  3. 문맥 의존형분류는 이전 문장과 다음 [25]문장의 주관성 또는 객관성에 따라 달라질 수 있습니다.
  4. 시간에 민감한 속성.일부 텍스트 데이터의 시간에 민감한 특성에 의해 작업이 수행됩니다.연구자 그룹이 뉴스에서 사실을 확인하고 싶다면 교차 검증에 더 오랜 시간이 필요합니다. 뉴스가 시대에 뒤떨어지기 때문입니다.
  5. 사용 빈도가 낮은 단어를 입력합니다.
  6. 계속 증가하는 볼륨이 작업은 텍스트 데이터의 양으로도 인해 어려움을 겪고 있습니다.텍스트 데이터의 계속 증가하는 특성으로 인해 연구자들이 제시간에 작업을 완료하기가 압도적으로 어렵습니다.

이전에는 주로 문서 수준 분류에 초점을 맞췄습니다.그러나 문서 수준 분류에는 다양한 유형의 표현이 포함될 수 있으므로 정확도가 떨어집니다.조사 증거는 객관적 표현에 의해 지배될 것으로 예상되는 일련의 뉴스 기사를 시사하는 반면, 결과는 그것이 주관적 [22]표현의 40% 이상으로 구성되었음을 보여준다.

이러한 과제를 극복하기 위해, 연구자들은 분류기 효과가 패턴 학습자의 정밀도에 따라 달라진다고 결론지었다.또한 학습자는 주석이 달린 대량의 교육 데이터를 사용하여 보다 포괄적이지 않은 주관적 기능에 대해 교육받은 데이터보다 성능이 우수합니다.그러나 이러한 유형의 작업을 실행하는 데 있어 주요 장애물 중 하나는 주석이 달린 문장의 큰 데이터 세트를 수동으로 생성하는 것이다.수동 주석 방법은 세 가지 이유로 자동 학습보다 선호도가 낮습니다.

  1. 이해의 변화.수동 주석 태스크에서는 언어의 모호성으로 인해 주석자 간에 하나의 인스턴스가 주관적인지 객관적인지에 대한 불일치가 발생할 수 있습니다.
  2. 인적 오류입니다.수동 주석 작업은 꼼꼼한 작업이며, 끝내려면 집중력이 필요합니다.
  3. 시간이 많이 걸린다.수동 주석 작업은 부지런한 작업입니다.Riloff(1996)는 160개의 텍스트가 주석 한 명이 [28]끝내는 데 8시간이 걸린다는 것을 보여준다.

이러한 모든 이유는 주관적이고 객관적인 분류의 효율성과 효과에 영향을 미칠 수 있습니다.따라서 주석 없는 텍스트 데이터에서 언어 패턴을 학습하기 위한 두 가지 부트스트랩 방법이 설계되었다.두 방법 모두 소수의 시드 워드와 주석이 없는 텍스트 데이터로 시작합니다.

  1. 1999년 [29]Riloff와 Jones의 메타 부트스트랩.레벨 1: 미리 정의된 규칙과 추출된 패턴을 바탕으로 각 패턴이 보유한 시드 워드의 수만큼 추출 패턴을 생성합니다.레벨 2:상위 5개의 단어가 표시되고 사전에 추가됩니다.따라하다.
  2. Thelen과 Riloff의 [30]Basilisk(시맨틱 지식을 이용한 시맨틱 사전 유도 부트스트랩 접근법).1단계: 추출 패턴 생성 2단계: 최적의 패턴을 패턴 풀에서 후보 워드 풀로 이동합니다.순서 3:상위 10개의 단어가 표시되고 사전에 추가됩니다.따라하다.

전반적으로, 이러한 알고리즘은 주관적이고 객관적인 작업에서 자동 패턴 인식 및 추출의 필요성을 강조한다.

주관적 및 객체 분류자는 자연어 처리의 서벌 애플리케이션을 향상시킬 수 있습니다.분류자의 주요 이점 중 하나는 다양한 산업에서 데이터 중심 의사결정 프로세스의 관행을 대중화했다는 것입니다.Liu에 따르면, 주관적이고 객관적인 식별의 적용은 비즈니스, 광고, 스포츠 [31]및 사회과학에서 구현되어 왔다.

  • 온라인 리뷰 분류:비즈니스 산업에서는 분류기를 통해 기업이 제품에 대한 피드백과 리뷰의 이면에 있는 이유를 더 잘 이해할 수 있습니다.
  • 주가 예측:금융업계에서 클래시어는 소셜 미디어로부터의 보조 정보 및 인터넷으로부터의 기타 텍스트 정보를 처리함으로써 예측 모델을 지원한다.동 등이 실시한 이전의 일본 주가에 관한 연구에 따르면 주관적이고 객관적인 모듈을 갖춘 모델이 [32]이 부품이 없는 모델보다 더 나은 성능을 발휘할 수 있다.
  • 소셜 미디어 분석
  • 학생의 피드백 분류.[33]
  • 개요:분류자는 특정 엔티티에 의해 이루어진 대상별 코멘트와 의견수렴을 추출할 수 있습니다.
  • 복잡한 질문 답변입니다.분류자는 언어 주어나 객관적이고 집중적인 대상을 분류함으로써 복잡한 문제를 분석할 수 있습니다.연구 Yu 등(2003)에서, 연구원은 정체성 의견 조각을 [34]묶은 문장과 문서 수준을 개발했다.
  • 도메인 고유의 애플리케이션.
  • 이메일 분석:주관적 및 객관적 분류자는 대상 단어를 사용하여 언어 패턴을 추적하여 스팸을 탐지합니다.

기능/스펙 기반

휴대폰, 디지털 카메라 또는 [35]은행과 같은 실체의 다른 특징이나 측면에 대해 표현된 의견이나 감정을 결정하는 것을 말한다.특징 또는 측면은 휴대전화 화면, 레스토랑 서비스, 카메라의 화질 등 엔티티의 속성 또는 구성요소입니다.특징 기반 감정 분석의 장점은 관심 객체에 대한 미묘한 차이를 포착할 수 있다는 것입니다.다양한 특징에 따라 다양한 감성 반응이 나타날 수 있습니다. 예를 들어, 호텔은 편리한 위치를 가질 수 있지만 음식은 [36]평범할 수 있습니다.이 문제에는 관련 실체의 식별, 특징/기대 추출, 각 특징/기대에 대한 의견의 긍정, 부정 [37]또는 중립 여부 결정과 같은 몇 가지 하위 문제가 포함된다.기능의 자동 식별은 구문 분석 방법, 주제 [38][39]모델링 또는 [40][41]러닝을 사용하여 수행할 수 있습니다.이 정도 수준의 감정분석에 대한 자세한 논의는 류 씨의 작품에서 [24]찾을 수 있다.

강도 순위

감정과 감정은 본질적으로 주관적이다.문서, 문장 또는 특징/기대 수준에서 주어진 텍스트로 표현되는 감정/감정의 정도 - 문서, 문장 또는 엔티티의 의견에서 표현되는 강도의 정도는 경우에 [42]따라 다르다.그러나 감정과 감정만을 예측하는 것이 항상 완전한 정보를 전달하는 것은 아니다.감정과 감정의 정도 또는 수준은 종종 단일 클래스 내에서 정확한 감정을 이해하는 데 결정적인 역할을 합니다(예: '좋은' 대 '대박').일부 방법은 얻은 출력을 결합하고 컨볼루션 신경 네트워크,[44] 장기 단기 기억 네트워크게이트 반복 [45]단위를 기반으로 하는 러닝 모델을 사용하여 감정과 감정에 대한 강도를 예측하기 위한 누적 앙상블[43] 방법을 활용한다.

방법 및 기능

감정 분석에 대한 기존 접근법은 지식 기반 기법, 통계 방법 및 하이브리드 [46]접근법의 세 가지 주요 범주로 분류할 수 있다.지식 기반 기법은 행복, 슬픔, 두려움, [47]지루함과 같은 명확한 영향 단어의 존재에 따라 영향 범주에 따라 텍스트를 분류합니다.일부 지식 기반은 명백한 영향을 미치는 단어들을 나열할 뿐만 아니라 임의의 단어들을 특정 [48]감정에 대한 가능성 있는 "선호도"로 할당합니다.통계 방법은 잠재 의미 분석, 지원 벡터 기계, 의미 [6]지향성을 위한 "단어 가방", 의미 공간 모델 또는 단어 포함 모델,[49] 러닝 등의 기계 학습 요소를 활용한다.보다 정교한 방법은 감정의 소유자(즉, 그러한 감정 상태를 유지하는 사람)와 대상(즉, 영향을 [50]느끼는 주체)을 감지하려고 한다.문맥에서 의견을 캐내고 화자가 말한 특징을 얻기 위해 단어의 문법적 관계가 사용됩니다.문법의존관계는텍스트의심층파싱에의해얻습니다.[51]하이브리드 접근법은 기계 학습과 온톨로지 시멘틱 네트워크와 같은 지식 표현의 요소 모두를 활용한다. 예를 들어, 관련 정보를 명시적으로 전달하지는 않지만, 다음을 수행하는 다른 개념과 암묵적으로 연계된 개념의 분석을 통해 미묘한 방식으로 표현되는 의미를 감지한다.그래서.[52]

오픈 소스 소프트웨어 툴과 무료 및 유료 감정 분석 툴은 웹 페이지, 온라인 뉴스, 인터넷 토론 그룹, 온라인 리뷰, 웹 블로그 및 소셜 미디어 [53]등의 대규모 텍스트 모음에 대한 감정 분석을 자동화하는 기계 학습, 통계 및 자연 언어 처리 기술을 배포합니다.한편, 지식 기반 시스템은 자연어 개념과 관련된 의미적, 정서적 정보를 추출하기 위해 공개적으로 이용 가능한 자원을 이용한다.그 시스템은 감정적인 상식적[54]추론을 수행하는데 도움을 줄 수 있다.감성 분석은 영상과 비디오와 같은 시각적 콘텐츠에도 수행할 수 있습니다(멀티모달 감성 분석 참조).이 방향의 첫 번째 접근법 중 하나는 시각 콘텐츠의 형용사 명사 쌍 표현을 사용하는 SentiBank이다[55].또한, 감정 분류 접근법의 대부분은 문맥, 문법, 심지어 어순을 무시하는 단어봉투 모델에 의존한다.단어가 긴 구문의 의미를 구성하는 방법에 따라 감정을 분석하는 접근법은 [56]더 나은 결과를 보여주지만, 추가적인 주석 오버헤드가 발생합니다.

자동화된 시스템은 개별 논평자 또는 플랫폼의 과거 경향을 분석할 수 없고 종종 표현된 감정으로 잘못 분류되기 때문에 감정 분석에 인간 분석 구성요소가 필요하다.자동화는 [57]인간이 올바르게 분류한 코멘트의 약 23%에 영향을 미칩니다.그러나 인간은 종종 동의하지 않으며, 인간 간 합의가 자동화된 감정 분류기가 결국 [58]도달할 수 있는 상한을 제공한다는 주장이 있다.

평가하기

감정분석 시스템의 정확성은 원칙적으로 인간의 판단과 얼마나 잘 일치하느냐에 달려 있다.이것은 보통 부정 텍스트와 긍정 텍스트의 두 가지 대상 카테고리에 대한 정밀도와 리콜에 기초한 변종 측정에 의해 측정된다.그러나 연구에 따르면 인간 평가자는 일반적으로 약 [59]80%의 시간에만 동의합니다(라이터 간 신뢰성 참조).따라서 감정 분류에서 70%의 정확도를 달성한 프로그램은 인상적으로 들리지 않더라도 인간과 거의 비슷한 수준의 성과를 내고 있다.만약 어떤 프로그램이 100% "올바른" 시간이라면,[60] 인간은 어떤 대답에 대해서도 그렇게 많이 동의하지 않기 때문에, 여전히 20% 정도 그것에 동의하지 않을 것이다.

반면 컴퓨터 시스템은 인간 평가자와는 매우 다른 오류를 범하기 때문에 수치가 완전히 비교될 수는 없다.예를 들어, 컴퓨터 시스템은 부정, 과장, 농담 또는 빈정거림에 어려움을 겪을 것입니다. 이것은 일반적으로 인간 독자들에게 다루기가 쉽습니다. 컴퓨터 시스템이 저지르는 몇 가지 오류는 인간에게는 지나치게 순진하게 보일 것입니다.일반적으로 학술 연구에서 정의된 감정 분석의 실용적인 상업적 작업에 대한 효용성에 의문이 제기되어 왔다. 대부분 부정적인 감정에서 긍정적인 감정으로 이어지는 단순한 1차원 모델이 브랜드에 대한 공공 담론의 영향을 우려하는 고객에게는 실행 가능한 정보가 거의 없기 때문이다.r 기업의 [61][62][63]평판

시장 요구에 더 잘 맞추기 위해, 감정 분석의 평가는 홍보 기관의 대표자 및 시장 조사 전문가들과 함께 공식화된 보다 태스크 기반적인 척도로 옮겨갔다.예를 들어, RepLab 평가 데이터 세트의 초점은 고려 대상 텍스트의 내용이 아니라 해당 텍스트가 브랜드 [64][65][66]평판에 미치는 영향에 더 집중됩니다.

감정분석의 평가는 점점 더 태스크에 기반하고 있기 때문에 각 구현에서는 특정 데이터 세트에 대한 감정을 보다 정확하게 표현하기 위한 별도의 훈련 모델이 필요합니다.

Web 2.0

블로그나 소셜네트워크 소셜미디어의 등장으로 감성분석에 대한 관심이 높아지고 있다.리뷰, 평가, 추천 및 기타 온라인 표현의 확산으로 온라인 의견은 제품의 마케팅, 새로운 기회의 특정 및 평판 관리를 원하는 기업에 일종의 가상화폐가 되었습니다.기업이 노이즈 필터링, 대화 이해, 관련 콘텐츠 식별 및 적절한 조치 프로세스를 자동화하려고 함에 따라 현재 많은 기업이 감성 [67]분석 분야에 관심을 보이고 있습니다.문제를 더욱 복잡하게 만드는 것은 4chanReddit[68]같은 익명의 소셜 미디어 플랫폼의 부상이다.Web 2.0이 퍼블리싱의 민주화에 관한 것이라면,[69] Web의 다음 단계는 퍼블리싱되는 모든 컨텐츠의 데이터 마이닝의 민주화에 근거하고 있는 것이 확실합니다.

이 목표를 향한 한 걸음은 연구에서 달성된다.현재 전 세계 대학의 여러 연구팀은 감정 [70]분석을 통해 전자 커뮤니티의 감정 역학을 이해하는 데 주력하고 있다.예를 들어 CyberEmotions 프로젝트는 최근 소셜 네트워크 [71]논의를 주도하는 데 있어 부정적인 감정의 역할을 확인했다.

문제는 대부분의 감정 분석 알고리즘이 제품이나 서비스에 대한 감정을 표현하기 위해 단순한 용어를 사용한다는 것입니다.그러나 문화적 요인, 언어적 뉘앙스, 그리고 다른 맥락으로 인해 일련의 쓰여진 텍스트를 단순한 찬성 [67]또는 반대 감정으로 바꾸는 것은 매우 어렵습니다.텍스트의 감정에 대해 사람들이 종종 동의하지 않는다는 사실은 컴퓨터가 이것을 바로잡는 것이 얼마나 큰 과제인지를 보여준다.텍스트 문자열이 짧을수록 더 어려워집니다.

비록 짧은 텍스트 문자열이 문제가 될 수 있지만, 마이크로 블로그 내의 감정 분석은 트위터가 정치적 감정을 보여주는 유효한 온라인 지표로 보여질 수 있다는 것을 보여주었다.트위터의 정치적 정서가 정당과 정치인의 정치적 입장과 밀접하게 맞아떨어져 있어 트위터 메시지 내용이 오프라인 정치지형을 [72]반영하고 있음을 알 수 있다.게다가 트위터의 감정 분석은 약물 [74]부작용과 같은 공중 보건 관련 문제뿐만 아니라 세계적으로 인간의 생식 [73]주기 뒤에 있는 대중의 기분을 포착하는 것으로 나타났다.

소셜미디어나 상품평론 등 작가가 다소 노골적으로 의견을 표현하는 영역(영화 대박)에서 감성분석이 인기를 끌었지만 최근에서야 정서가 암묵적이거나 간접적인 다른 영역에서도 강력한 방법이 고안됐다.예를 들어, 뉴스 기사에서, 주로 예상되는 언론적 객관성 때문에 저널리스트들은 종종 정보의 극성을 직접적으로 말하기 보다는 행동이나 사건을 묘사한다.사전이나 얕은 기계 학습 기능을 사용한 이전의 접근법은 "행간의 의미"를 파악할 수 없었지만, 최근 연구자들은 뉴스 [1]기사에서 감정을 분석할 수 있는 딥 러닝 기반 접근법과 데이터 세트를 제안했다.

추천 시스템의 응용 프로그램

추천자 시스템의 경우, 감정 분석은 가치 있는 기술임이 입증되었습니다.추천 시스템은 대상 사용자의 항목에 대한 선호도를 예측하는 것을 목적으로 한다.주류 추천 시스템은 명시적 데이터 세트에서 작동합니다.예를 들어, 협업 필터링은 등급 매트릭스에서 작동하고 컨텐츠 기반 필터링은 항목의 메타 데이터에서 작동합니다.

많은 소셜 네트워크 서비스나 전자 상거래 웹사이트에서 사용자는 항목에 대한 텍스트 리뷰, 코멘트 또는 피드백을 제공할 수 있습니다.이러한 사용자 생성 텍스트는 수많은 제품 및 항목에 대한 사용자 의견의 풍부한 원천을 제공합니다.잠재적으로 항목의 경우, 이러한 텍스트는 항목의 관련 특징/대상과 각 [75]특징에 대한 사용자의 감정을 모두 나타낼 수 있습니다.텍스트에 설명된 항목의 기능/외관은 컨텐츠 기반 필터링에서 메타 데이터와 같은 역할을 하지만, 추천자 시스템에서는 전자가 더 중요합니다.이러한 기능은 리뷰에서 사용자에 의해 광범위하게 언급되기 때문에 아이템에 대한 사용자의 경험에 큰 영향을 미칠 수 있는 가장 중요한 기능으로 간주될 수 있으며, 아이템의 메타 데이터(일반적으로 소비자 대신 생산자가 제공하는 것)는 사용자가 우려하는 기능을 무시할 수 있다.공통적인 특징을 가진 다른 항목에 대해, 사용자는 다른 감정을 나타낼 수 있습니다.또, 같은 아이템의 피쳐는, 유저 마다 다른 감정을 수신할 수 있습니다.기능에 대한 사용자의 감정은 항목에 대한 선호도를 반영하여 다차원 평가 점수로 볼 수 있습니다.

사용자가 생성한 텍스트에서 추출한 특징/기대 및 감정에 기초하여 하이브리드 추천 시스템을 [76]구축할 수 있다.사용자에게 후보 아이템을 추천하는 동기에는 두 가지 유형이 있습니다.첫 번째 동기는 후보 아이템이 사용자의 선호 [77]아이템과 많은 공통적인 특징을 가지고 있다는 것이고, 두 번째 동기는 후보 아이템이 그 특징에 대해 높은 평가를 받는다는 것이다.선호 품목은 동일한 기능을 가진 품목이 유사한 기능 또는 효용을 가질 것이라고 믿는 것이 타당하다.따라서 이러한 항목도 사용자가 선호할 수 있습니다.한편, 2개의 후보 아이템의 공유 기능에 대해서는, 다른 유저는 한쪽에는 긍정적인 감정을, 다른 한쪽에는 부정적인 감정을 줄 수 있다.높은 평가를 받은 항목을 사용자에게 권장해야 합니다.이 2가지 동기에 근거해, 각 후보 [76]항목에 대해서, 유사도와 감정 평가의 조합 순위 점수를 구성할 수 있다.

감정분석 자체가 어려운 점을 제외하면 리뷰나 피드백에 감정분석을 적용하는 것도 스팸과 편파 리뷰의 난관에 봉착한다.작업 방향 중 하나는 각 [78]검토의 유용성을 평가하는 데 초점이 맞춰져 있습니다.서투른 리뷰나 피드백은 추천자 시스템에 거의 도움이 되지 않습니다.또, 대상 제품의 판매를 방해하도록 리뷰를 설계할 수 있기 때문에, 잘 쓰여져 있어도 추천자 시스템에 해가 된다.

연구자들은 또한 사용자가 생성한 텍스트의 긴 형태와 짧은 형태는 다르게 다루어져야 한다는 것을 발견했다.흥미로운 결과는 짧은 형식의 검토가 긴 [79]형식의 검토보다 더 유용하다는 것을 보여준다. 왜냐하면 짧은 형식의 텍스트에서 노이즈를 걸러내는 것이 더 쉽기 때문이다.긴 형식 텍스트의 경우 텍스트 길이가 길어진다고 해서 텍스트의 특징 또는 정서 수가 비례적으로 증가하는 것은 아닙니다.

Lamba & Madhusudhan은[80] Twitter와 같은 소셜 미디어 플랫폼의 감정 분석 결과를 재패키지화하여 다양한 형식의 통합된 시간 기반 서비스로 제공함으로써 오늘날 도서관 사용자의 정보 요구를 충족시키는 새로운 방법을 도입하고 있습니다.또한, 그들은 소셜 미디어 마이닝과 감성 분석을 이용하여 도서관에서 마케팅을 수행하는 새로운 방법을 제안합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b 함보리, 펠릭스, 도나이, 카스텐(2021년)."NewsMTSC: (멀티)를 위한 데이터 세트"정치 뉴스 기사의 대상 의존적 감정 분류"컴퓨터 언어학 협회 유럽 지부 제16차 총회 속행: 본권
  2. ^ Vong Anh Ho, Duong Huynh-Cong Nguyen, Danh Hoang Nguyen, Linh Ti-Van Pham, Duc-Vu Nguyen, Kiet Van Nguyen, Nguyen.'베트남 소셜 미디어 정서 인식 텍스트'2019년 베트남 하노이(PACLING 2019) 태평양 컴퓨터 언어학 협회 국제 회의의 속행.
  3. ^ 스톤, 필립 J, 덱스터 C던피와 마샬 S.스미스. "일반 질문자:컨텐츠 분석에의 컴퓨터 어프로치」.MIT Press, Cambridge, MA(1966).
  4. ^ 고트샬크, 루이 어거스트, 골딘 C.글레저.언어행동의 내용분석을 통한 심리상태 측정.캘리포니아 대학 출판사, 1969년.
  5. ^ USA가 발행한 7,136,877, Volcani, Yanon; & Fogel, David B., "텍스트의 영향을 판단하고 제어하는 시스템 및 방법", 2001년 6월 28일 발행
  6. ^ a b Turney, Peter (2002). "Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews". Proceedings of the Association for Computational Linguistics. pp. 417–424. arXiv:cs.LG/0212032.
  7. ^ Pang, Bo; Lee, Lillian; Vaithyanathan, Shivakumar (2002). "Thumbs up? Sentiment Classification using Machine Learning Techniques". Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP). pp. 79–86.
  8. ^ a b Pang, Bo; Lee, Lillian (2005). "Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales". Proceedings of the Association for Computational Linguistics (ACL). pp. 115–124.
  9. ^ a b Snyder, Benjamin; Barzilay, Regina (2007). "Multiple Aspect Ranking using the Good Grief Algorithm". Proceedings of the Joint Human Language Technology/North American Chapter of the ACL Conference (HLT-NAACL). pp. 300–307.
  10. ^ Qu, Yan, James Shanahan, Janyce Wiebe. "텍스트에서 태도와 영향을 탐구합니다.이론과 응용 프로그램"AAAI 봄 심포지엄에서는 기술 보고서 SS-04-07.AAAI Press, Menlo Park, CA. 2004.
  11. ^ Vryniotis, Vasilis (2013). The importance of Neutral Class in Sentiment Analysis.
  12. ^ Koppel, Moshe; Schler, Jonathan (2006). "The Importance of Neutral Examples for Learning Sentiment". Computational Intelligence 22. pp. 100–109. CiteSeerX 10.1.1.84.9735.
  13. ^ Ribeiro, Filipe Nunes; Araujo, Matheus (2010). "A Benchmark Comparison of State-of-the-Practice Sentiment Analysis Methods". Transactions on Embedded Computing Systems. 9 (4).
  14. ^ Taboada, Maite; Brooke, Julian (2011). "Lexicon-based methods for sentiment analysis". Computational Linguistics. 37 (2): 272–274. CiteSeerX 10.1.1.188.5517. doi:10.1162/coli_a_00049. S2CID 3181362.
  15. ^ Augustyniak, Łukasz; Szymański, Piotr; Kajdanowicz, Tomasz; Tuligłowicz, Włodzimierz (2015-12-25). "Comprehensive Study on Lexicon-based Ensemble Classification Sentiment Analysis". Entropy. 18 (1): 4. Bibcode:2015Entrp..18....4A. doi:10.3390/e18010004.
  16. ^ Mehmood, Yasir; Balakrishnan, Vimala (2020-01-01). "An enhanced lexicon-based approach for sentiment analysis: a case study on illegal immigration". Online Information Review. 44 (5): 1097–1117. doi:10.1108/OIR-10-2018-0295. ISSN 1468-4527. S2CID 221766042.
  17. ^ Thelwall, Mike; Buckley, Kevan; Paltoglou, Georgios; Cai, Di; Kappas, Arvid (2010). "Sentiment strength detection in short informal text". Journal of the American Society for Information Science and Technology. 61 (12): 2544–2558. CiteSeerX 10.1.1.278.3863. doi:10.1002/asi.21416.
  18. ^ Pang, Bo; Lee, Lillian (2008). "4.1.2 Subjectivity Detection and Opinion Identification". Opinion Mining and Sentiment Analysis. Now Publishers Inc.
  19. ^ Mihalcea, Rada; Banea, Carmen; Wiebe, Janyce (2007). "Learning Multilingual Subjective Language via Cross-Lingual Projections" (PDF). Proceedings of the Association for Computational Linguistics (ACL). pp. 976–983. Archived from the original (PDF) on 2010-07-08.
  20. ^ Su, Fangzhong; Markert, Katja (2008). "From Words to Senses: a Case Study in Subjectivity Recognition" (PDF). Proceedings of Coling 2008, Manchester, UK.
  21. ^ Pang, Bo; Lee, Lillian (2004). "A Sentimental Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts". Proceedings of the Association for Computational Linguistics (ACL). pp. 271–278.
  22. ^ a b Wiebe, Janyce; Riloff, Ellen (2005). Gelbukh, Alexander (ed.). "Creating Subjective and Objective Sentence Classifiers from Unannotated Texts". Computational Linguistics and Intelligent Text Processing. Lecture Notes in Computer Science. Berlin, Heidelberg: Springer. 3406: 486–497. doi:10.1007/978-3-540-30586-6_53. ISBN 978-3-540-30586-6.
  23. ^ Quirk, Randolph; Greenbaum, Sidney; Geoffrey, Leech; Jan, Svartvik (1985). A Comprehensive Grammar of the English Language (General Grammar). Longman. pp. 175–239. ISBN 1933108312.
  24. ^ a b c Liu, Bing (2010). "Sentiment Analysis and Subjectivity" (PDF). In Indurkhya, N.; Damerau, F. J. (eds.). Handbook of Natural Language Processing (Second ed.).
  25. ^ a b Pang, Bo; Lee, Lillian (2008-07-06). "Opinion Mining and Sentiment Analysis". Foundations and Trends in Information Retrieval. 2 (1–2): 1–135. doi:10.1561/1500000011. ISSN 1554-0669.
  26. ^ Riloff, Ellen; Wiebe, Janyce (2003-07-11). "Learning extraction patterns for subjective expressions". Proceedings of the 2003 Conference on Empirical Methods in Natural Language Processing. EMNLP '03. USA: Association for Computational Linguistics. 10: 105–112. doi:10.3115/1119355.1119369. S2CID 6541910.
  27. ^ Wiebe, Janyce; Riloff, Ellen (July 2011). "Finding Mutual Benefit between Subjectivity Analysis and Information Extraction". IEEE Transactions on Affective Computing. 2 (4): 175–191. doi:10.1109/T-AFFC.2011.19. ISSN 1949-3045. S2CID 16820846.
  28. ^ Riloff, Ellen (1996-08-01). "An empirical study of automated dictionary construction for information extraction in three domains". Artificial Intelligence. 85 (1): 101–134. doi:10.1016/0004-3702(95)00123-9. ISSN 0004-3702.
  29. ^ Riloff, Ellen; Jones, Rosie (July 1999). "Learning dictionaries for information extraction by multi-level bootstrapping" (PDF). AAAI '99/IAAI '99: Proceedings of the Sixteenth National Conference on Artificial Intelligence and the Eleventh Innovative Applications of Artificial Intelligence Conference Innovative Applications of Artificial Intelligence: 474–479.
  30. ^ Thelen, Michael; Riloff, Ellen (2002-07-06). "A bootstrapping method for learning semantic lexicons using extraction pattern contexts". Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing - Volume 10. EMNLP '02. USA: Association for Computational Linguistics. 10: 214–221. doi:10.3115/1118693.1118721. S2CID 137155.
  31. ^ Liu, Bing (2012-05-23). "Sentiment Analysis and Opinion Mining". Synthesis Lectures on Human Language Technologies. 5 (1): 1–167. doi:10.2200/S00416ED1V01Y201204HLT016. ISSN 1947-4040.
  32. ^ Deng, Shangkun; Mitsubuchi, Takashi; Shioda, Kei; Shimada, Tatsuro; Sakurai, Akito (December 2011). "Combining Technical Analysis with Sentiment Analysis for Stock Price Prediction". 2011 IEEE Ninth International Conference on Dependable, Autonomic and Secure Computing. IEEE: 800–807. doi:10.1109/dasc.2011.138. ISBN 978-1-4673-0006-3. S2CID 15262023.
  33. ^ Nguyen, Kiet Van; Nguyen, Vu Duc; Nguyen, Phu X.V.; Truong, Tham T.H.; Nguyen, Ngan L-T. (2018-10-01). "UIT-VSFC: Vietnamese Students' Feedback Corpus for Sentiment Analysis". 2018 10th International Conference on Knowledge and Systems Engineering (KSE). Vietnam: IEEE: 19–24. doi:10.1109/KSE.2018.8573337. ISBN 978-1-5386-6113-0. S2CID 56172224.
  34. ^ Yu, Hong; Hatzivassiloglou, Vasileios (2003-07-11). "Towards answering opinion questions: separating facts from opinions and identifying the polarity of opinion sentences". Proceedings of the 2003 Conference on Empirical Methods in Natural Language Processing. EMNLP '03. USA: Association for Computational Linguistics: 129–136. doi:10.3115/1119355.1119372.
  35. ^ Hu, Minqing; Liu, Bing (2004). "Mining and Summarizing Customer Reviews". Proceedings of KDD 2004.
  36. ^ Cataldi, Mario; Ballatore, Andrea; Tiddi, Ilaria; Aufaure, Marie-Aude (2013-06-22). "Good location, terrible food: detecting feature sentiment in user-generated reviews". Social Network Analysis and Mining. 3 (4): 1149–1163. CiteSeerX 10.1.1.396.9313. doi:10.1007/s13278-013-0119-7. ISSN 1869-5450. S2CID 5025282.
  37. ^ Liu, Bing; Hu, Minqing; Cheng, Junsheng (2005). "Opinion Observer: Analyzing and Comparing Opinions on the Web". Proceedings of WWW 2005.
  38. ^ Zhai, Zhongwu; Liu, Bing; Xu, Hua; Jia, Peifa (2011-01-01). Huang, Joshua Zhexue; Cao, Longbing; Srivastava, Jaideep (eds.). Constrained LDA for Grouping Product Features in Opinion Mining. Lecture Notes in Computer Science. Springer Berlin Heidelberg. pp. 448–459. CiteSeerX 10.1.1.221.5178. doi:10.1007/978-3-642-20841-6_37. ISBN 978-3-642-20840-9.
  39. ^ Titov, Ivan; McDonald, Ryan (2008-01-01). Modeling Online Reviews with Multi-grain Topic Models. Proceedings of the 17th International Conference on World Wide Web. WWW '08. New York, NY, USA: ACM. pp. 111–120. arXiv:0801.1063. doi:10.1145/1367497.1367513. ISBN 978-1-60558-085-2. S2CID 13609860.
  40. ^ Liang, Bin; et al. (2022). "Aspect-based sentiment analysis via affective knowledge enhanced graph convolutional networks". Knowledge-Based Systems. 235: 107643. doi:10.1016/j.knosys.2021.107643.
  41. ^ Ma, Yukun; et al. (2018). "Targeted aspect-based sentiment analysis via embedding commonsense knowledge into an attentive LSTM". Proceedings of AAAI. pp. 5876–5883.
  42. ^ Sharma, Raksha; Somani; Kumar; Bhattacharyya (2017). "Sentiment Intensity Ranking among Adjectives Using Sentiment Bearing Word Embeddings" (PDF). Association for Computational Linguistics: 547–552.
  43. ^ M. S. 아크타르, A.에크발과 E.캠브리아, "얼마나 열정적절한가요?IEEE Computational Intelligence Magazine, vol. 15, No. 1, 페이지 64-75, 2020년 2월 doi: 10.1109/MCI.2019.2954667.
  44. ^ X. Oouyang, P. Zhou, C. H. Liu 및 L. Liu, 2015 IEEE International Conference on Computing and Information Technology; Ubiquitous Computing and Secure Computing; 신뢰할 수 있고 자율적이며 안전한 컴퓨팅; Pubsitive Intelligence and Computing, 2015. 페이지 23.IT/IUCC/DASC/PICOM.2015.349
  45. ^ Y. Santur, "게이트 반복 단위를 기반으로 한 감성 분석", 2019 국제 인공지능 및 데이터 처리 심포지엄(IDAP), 2019, 페이지 1~5, doi: 10.1109/IDAP.2019.8875.
  46. ^ Cambria, E; Schuller, B; Xia, Y; Havasi, C (2013). "New avenues in opinion mining and sentiment analysis". IEEE Intelligent Systems. 28 (2): 15–21. CiteSeerX 10.1.1.688.1384. doi:10.1109/MIS.2013.30. S2CID 12104996.
  47. ^ Ortony, Andrew; Clore, G; Collins, A (1988). The Cognitive Structure of Emotions (PDF). Cambridge Univ. Press. Archived from the original (PDF) on 2015-11-23.
  48. ^ Stevenson, Ryan; Mikels, Joseph; James, Thomas (2007). "Characterization of the Affective Norms for English Words by Discrete Emotional Categories" (PDF). Behavior Research Methods. 39 (4): 1020–1024. doi:10.3758/bf03192999. PMID 18183921. S2CID 6673690.
  49. ^ Sahlgren, Magnus; Karlgren, Jussi; Eriksson, Gunnar (2007). "Valence annotation based on seeds in word space". Proceedings of the Fourth International Workshop on Semantic Evaluations (SemEval-2007).
  50. ^ Kim, S. M.; Hovy, E. H. (2006). "Identifying and Analyzing Judgment Opinions." (PDF). Proceedings of the Human Language Technology / North American Association of Computational Linguistics conference (HLT-NAACL 2006). New York, NY. Archived from the original (PDF) on 2011-06-29.
  51. ^ Dey, Lipika; Haque, S. K. Mirajul (2008). "Opinion Mining from Noisy Text Data". Proceedings of the second workshop on Analytics for noisy unstructured text data, p.83-90.
  52. ^ Cambria, E; Hussain, A (2015). Sentic Computing: A Common-Sense-Based Framework for Concept-Level Sentiment Analysis. Springer. ISBN 9783319236544.
  53. ^ Akcora, Cuneyt Gurcan; Bayir, Murat Ali; Demirbas, Murat; Ferhatosmanoglu, Hakan (2010). "Identifying breakpoints in public opinion". SigKDD, Proceedings of the First Workshop on Social Media Analytics.
  54. ^ Cambria, Erik; Liu, Qian; Decherchi, Sergio; Xing, Frank; Kwok, Kenneth (2022). "SenticNet 7: A Commonsense-based Neurosymbolic AI Framework for Explainable Sentiment Analysis" (PDF). Proceedings of LREC. pp. 3829–3839.
  55. ^ Borth, Damian; Ji, Rongrong; Chen, Tao; Breuel, Thomas; Chang, Shih-Fu (2013). "Large-scale Visual Sentiment Ontology and Detectors Using Adjective Noun Pairs". Proceedings of ACM Int. Conference on Multimedia. pp. 223–232.
  56. ^ Socher, Richard; Perelygin, Alex; Wu, Jean Y.; Chuang, Jason; Manning, Christopher D.; Ng, Andrew Y.; Potts, Christopher (2013). "Recursive deep models for semantic compositionality over a sentiment treebank". In Proceedings of EMNLP: 1631–1642. CiteSeerX 10.1.1.593.7427.
  57. ^ "Case Study: Advanced Sentiment Analysis". Retrieved 18 October 2013.
  58. ^ Mozetič, Igor; Grčar, Miha; Smailović, Jasmina (2016-05-05). "Multilingual Twitter Sentiment Classification: The Role of Human Annotators". PLOS ONE. 11 (5): e0155036. arXiv:1602.07563. Bibcode:2016PLoSO..1155036M. doi:10.1371/journal.pone.0155036. ISSN 1932-6203. PMC 4858191. PMID 27149621.
  59. ^ Ogneva, M. "How Companies Can Use Sentiment Analysis to Improve Their Business". Mashable. Retrieved 2012-12-13.
  60. ^ Roebuck, K. (2012-10-24). Sentiment Analysis: High-impact Strategies - What You Need to Know: Definitions, Adoptions, Impact, Benefits, Maturity, Vendors. ISBN 9781743049457.
  61. ^ 칼그렌, 유시, 마그누스 살그렌, 프레드릭 올슨, 프레드릭 에스피노자, 올라 햄포스."감정 분석의 유용성"유럽 정보 검색 회의, 페이지 426-435.스프링거 베를린 하이델베르크, 2012.
  62. ^ 칼그렌, 쥬시"텍스트와 텍스트 장르에서 작가 기분과 감성의 관계"정보 검색에서 의미 주석 활용에 관한 제4차 워크숍의 계속에서, 페이지 9-10.ACM, 2011.
  63. ^ 칼그렌, 쥬시"멀티미디어 정보와의 상호작용에 영향을 미치는 요소로서 영향, 호소력감정에 영향을 줍니다."시각 정보 검색 평가에 관한 테세우스/ImageCLEF 워크숍 진행, 2009년 8-11페이지.
  64. ^ 아미고, 엔리케, 아돌포 코루호, 훌리오 곤살로, 에드거 메이, 그리고 마르텐리케."RepLab 2012 개요: 온라인 평판 관리 시스템 평가"CLEF(온라인 작업 노트/랩/워크샵) 내.2012.
  65. ^ 아미고, 엔리케, 호르헤 카리요 데 알보르노즈, 이리나 추구르, 아돌포 코루호, 훌리오 곤살로, 타마라 마르틴, 에드가르 메이, 마르텐리케, 다미아노 스피나."리탭 2013 개요: 온라인 평판 모니터링 시스템 평가"유럽 언어 교차 언어 평가 포럼의 국제 회의에서, 페이지 333-352.스프링거 베를린 하이델베르크, 2013년
  66. ^ 아미고, 엔리케, 호르헤 카리요 데 알보르노즈, 이리나 추구르, 아돌포 코루호, 훌리오 곤살로, 에드가르 메이, 마르텐 데 리케, 다미아노 스피나."repab 2014 개요: 온라인 평판 관리를 위한 저자 프로파일링 및 평판 차원"유럽 언어 교차 언어 평가 포럼의 국제 회의에서, 페이지 307-322.Springer International Publishing, 2014.
  67. ^ a b 라이트, 알렉스. "사실이 아닌 감정을 위한채굴", 뉴욕타임스, 2009-08-23.2009-10-01에 취득.
  68. ^ "Sentiment Analysis on Reddit". 2014-09-30. Retrieved 10 October 2014.
  69. ^ Kirkpatrick, Marshall, ReadWriteWeb, 2009-04-15.2009-10-01에 취득.
  70. ^ CORDIS. "사이버 공간의 집단 감정(CYBEREMOTIONS)", 유럽위원회, 2009-02-03.2010년 12월 13일에 취득.
  71. ^ 인정해, 제이미"Flaming driving drives on-line social networks", New Scientist, 2010-12-07.2010년 12월 13일에 취득.
  72. ^ 투마잔, 안드라니크, O.스펜저, 팀; G.샌더, 필리핀; M.Welpe, Isabell(2010)."Twitter를 통한 선거 예측: 140자의 정서가 드러나는 것"이라고 썼다.제4회 웹로그·소셜미디어 국제 AAAI 회의 진행
  73. ^ Wood, Ian B.; Varela, Pedro L.; Bollen, Johan; Rocha, Luis M.; Gonçalves-Sá, Joana (2017). "Human Sexual Cycles are Driven by Culture and Match Collective Moods". Scientific Reports. 7 (1): 17973. arXiv:1707.03959. Bibcode:2017NatSR...717973W. doi:10.1038/s41598-017-18262-5. PMC 5740080. PMID 29269945.
  74. ^ Korkontzelos, Ioannis; Nikfarjam, Azadeh; Shardlow, Matthew; Sarker, Abeed; Ananiadou, Sophia; Gonzalez, Graciela H. (2016). "Analysis of the effect of sentiment analysis on extracting adverse drug reactions from tweets and forum posts". Journal of Biomedical Informatics. 62: 148–158. doi:10.1016/j.jbi.2016.06.007. PMC 4981644. PMID 27363901.
  75. ^ Tang, Huifeng; Tan, Songbo; Cheng, Xueqi (2009). "A survey on sentiment detection of reviews" (PDF). Expert Systems with Applications. 36 (7): 10760–10773. doi:10.1016/j.eswa.2009.02.063. S2CID 2178380. Archived from the original (PDF) on 2018-05-24.
  76. ^ a b 제이콥, 니클라스 등"스타를 넘어서: 무료 텍스트 사용자 리뷰를 활용하여 영화 추천의 정확성을 향상시킵니다."제1회 국제 CIKM 주제-감정분석 워크숍 진행.ACM, 2009.
  77. ^ Minqing, Hu; Liu, Bing (2004). "Mining opinion features in customer reviews" (PDF). AAAI. 4 (4). S2CID 5724860. Archived from the original (PDF) on 2018-05-24.
  78. ^ Liu, Yang; Huang, Xiangji; An, Aijun; Yu, Xiaohui (2008). "Modeling and predicting the helpfulness of online reviews" (PDF). ICDM'08. Eighth IEEE international conference on Data mining. IEEE. pp. 443–452. doi:10.1109/ICDM.2008.94. ISBN 978-0-7695-3502-9. S2CID 18235238.
  79. ^ Bermingham, Adam; Smeaton, Alan F. (2010). Classifying sentiment in microblogs: is brevity an advantage? (PDF). Proceedings of the 19th ACM International Conference on Information and Knowledge Management. p. 1833. doi:10.1145/1871437.1871741. ISBN 9781450300995. S2CID 2084603.
  80. ^ Lamba, Manika; Madhusudhan, Margam (2018). "Application of sentiment analysis in libraries to provide temporal information service: a case study on various facets of productivity". Social Network Analysis and Mining. 8 (1): 1–12. doi:10.1007/s13278-018-0541-y. S2CID 53047128.