이모티콘에 대한 감정 데이터


12

실험을 위해 우리는 사용하고 싶은 이모티콘 많은 지상 사실로 트윗 / 단순 양적 senitment 분석을 위해 데이터를 교육에 포함합니다. 트윗은 일반적으로 NLP가 제대로 작동하기에는 너무 구조화되어 있지 않습니다.

어쨌든 유니 코드 6.0에는 722 개의 이모지가 있으며, 유니 코드 7.0에는 또 다른 250 개가 추가 될 것입니다.

감정 주석이 포함 된 데이터베이스 (예 : SentiWordNet)가 있습니까?

(SentiWordNet은 또한 모호한 의미를 허용합니다 . 예를 들어 재미 있음을 고려하십시오. 예를 들어 "이것은 재미 있음"은 아마도 긍정적이지 않습니다 ;-). 일반적인 단어보다 이모티콘을 위해 ...)

또한, 당신이 감정 분석을 위해 그것들을 사용한 경험이 있다면, 듣고 싶습니다.


이와 같은 것이 현재 존재한다고 믿지 말고, 이것을 위해 무언가를 모으면 그것을 좋아할 것입니다!
indico

Erich Schubert, 나는 똑같은 것을 찾고 있습니다! 유용한 자료를 찾을 기회가 있었습니까?
saeed mehrabi

답변:


4

총 972 개의 이모지가 실제로 수동으로 라벨을 붙일 수 없을 정도로 크지는 않지만 좋은 기본 진리로 작동할지는 의문입니다. Twitter와 같은 출처는 감정적 기호 (예 : 이모티콘 또는 이모티콘)가 일반적인 해석과 다른 의미를 갖는 아이러니, 풍자 및 기타 까다로운 설정으로 가득합니다. 예를 들어, 누군가 "xxx는 고객을 속이고 지금은 자신을 속이고! ha ha ha! : D"라고 쓸 수 있습니다. 이것은 확실히 부정적인 의견이지만 저자는 xxx 회사가 어려움에 처해있어 긍정적 인 이모티콘을 추가하게되어 기쁩니다. 이러한 경우는 그다지 빈번하지 않지만 사실에 적합하지 않습니다.

훨씬 더 일반적인 방법은 이모티콘을 실제 데이터 세트를 수집하기위한 시드 로 사용하는 것 입니다 . 예를 들어, 이 논문에서 저자는 이모티콘과 감정적 해시 태그를 사용하여 추가 분류에 유용한 단어 사전을 잡습니다.


1
사실은 동의하지 않습니다. 저자는 그들이 곤경에 처한 것을 좋아하기 때문에 긍정적 인 감정입니다. 그것은 회사에 대한 부정적인 의견이지만 그럼에도 불구하고 저자의 긍정적 인 감정입니다. 이 간단한 시나리오 (이것이 완전한 목표라고 말하지는 않습니다)에서 사용자가 자신의 게시물에 추가 할 이모티콘을 합리적인 작업처럼 들립니다. 사실은 ... 이모티콘이 필수적이다 많은 경우를 구성 고려할 수 있습니다 "당함 f_cked :-)"에 반대 "당함 f_cked :-(."
에리히 슈베르트

주제에 대한 사람의 태도와 반대로 사람의 감정을 평가하려고하면이 예가 효과가 없습니다. 그러나 다른 많은 것들이 있습니다. Sarcasm은 일반적인 경우입니다. "오 그래, 당신은 진짜 '마스터';)"라는 문장을 고려하십시오. 인간은 부정적인 맥락을 포착 할 수 있지만 긍정적 인 이모티콘은 긍정적 인 감정을 가리킬 것입니다. 그러나 나는 그것을 실제로 얻지 못했습니다 : 당신은 트윗에서 주관적인 정보를 추출하거나 가능한 이모티콘을 예측하고 싶습니까? 비슷하게 들리지만 두 번째 과제는 실제로 감정 분석에 관한 것이 아닙니다. 적어도 직접적으로는 아닙니다.
ffriend

"윙크"스마일은 일반적으로 "긍정적 인"것으로 간주되지 않지만 "ironic"으로 간주됩니다. 이것이 SentiWordNet과 같은 좋은 사전이 의미가있는 이유입니다. SentiWordNet에서 웃기면 하나 이상의 의미가 있습니다! sentiwordnet.isti.cnr.it/search.php?q=funny ( 양수 / 음수만큼 단순하지 않기 때문에 수동으로 주석을 추가하는 것은 쉬운 아닙니다. 그러나 일반적인 interrater-agreement 유효성 검사 등을 수행해야합니다)
Erich Schubert

이제 나는 당신의 생각을 봅니다. 그러나 나는 (대부분의) 그림 이모티콘이 나에게 좋은 예측 변수처럼 들리지 않고 다른 기능을 사용하고 싶지 않기 때문에 실제로 작동하지 않는다고 생각합니다. 어쨌든 이것은 내 경험에 근거한 의견 일뿐이며 데이터만이 진정한 대답을 줄 수 있습니다. 행운을 빕니다!
ffriend

다른 기능을 사용하고 싶지 않다고 누가 말했습니까? 그러나 이것들을 위해 데이터베이스를 보았습니다.
Erich Schubert

0

나는이 Github 저장소가 유용하다는 것을 알았습니다 ( https://github.com/wooorm/emoji-emotion 마이너스 5 (음수)와 플러스 5 (양수) 사이의 정수로 원자가 등급이 지정된 이모티콘 목록.

지원되는 유니 코드 이모티콘 목록 참조 : https://github.com/wooorm/emoji-emotion/blob/master/Support.md

긍정적 인 감정과 부정적인 감정 모두에 사용되기 때문에 stuck_out_tongue_closed_eyes (0)와 같은 일부 이모티콘은 논란의 여지가있는 극성을받습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.