久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

方法專題|情感分析:如何分析社交媒體文本包含的用戶情緒,?

 njemma 2021-05-24

文| 萌萌 zizi

編| zizi

責(zé)編| 伊妍

各位島友大家好,!這里是計(jì)傳島的“方法專題分享”欄目。在前幾期分享中,,我們?yōu)榇蠹医榻B了自然語(yǔ)言分析中的語(yǔ)料庫(kù)方法語(yǔ)義網(wǎng)絡(luò)分析方法,。本期“方法專題分享”將繼續(xù)為大家介紹分析文本時(shí)的另一大重要任務(wù)——情感分析

當(dāng)前,,社交媒體上匯聚著海量的包含用戶情感的文本,。對(duì)這些文本進(jìn)行情感分析,其結(jié)果可應(yīng)用于輿情分析,、內(nèi)容推薦,、信息預(yù)測(cè)等諸多方面,。下面我們將介紹一些能夠處理社交媒體文本并進(jìn)行情感分析,且無需編程基礎(chǔ)中英文工具,,不會(huì)或不精通編程的小伙伴們快來一起看看吧,!

01

什么是情感分析

情感分析(sentiment analysis):文本情感分析旨在分析出文本中針對(duì)某個(gè)對(duì)象評(píng)價(jià)的態(tài)度,如下圖,。

Image

圖1: 分析句子情感傾向性(圖源自李明磊的《一文看懂 NLP 中的文本情感分析任務(wù)》)

情感分析主要有五個(gè)要素: entity/實(shí)體,,aspect/屬性,opinion/觀點(diǎn),,holder/觀點(diǎn)持有者,,time/時(shí)間(有時(shí)可能不考慮觀點(diǎn)持有者與時(shí)間這兩個(gè)要素),其中實(shí)體和屬性合并稱為評(píng)價(jià)對(duì)象(target),。情感分析的目標(biāo)就是從非結(jié)構(gòu)化的文本評(píng)論中抽取出這五個(gè)要素,并且對(duì)它們的關(guān)系進(jìn)行分析,,最終得出整個(gè)句子或文章表達(dá)的情感傾向性,。

其中,極性分類(Polarity classification)是情感傾向分析中的主要的任務(wù)之一,。在各種情感分析中,,對(duì)情感的正負(fù)面——也就是褒義、貶義進(jìn)行分析判定,。

02

情感分析方法

根據(jù)使用方法的不同,,情感分析方法多被劃分為以下三種:

1. 基于情感詞典的情感分析方法

基于情感詞典的分析方法的普遍做法是,首先使用現(xiàn)成的情感詞典對(duì)需要分析的文本進(jìn)行情感詞匹配,,然后匯總情感詞計(jì)算出整體評(píng)分,,最后得到文本的整體情感傾向。目前使用較多的中文情感詞典主要有兩種:一種是BosonNLP情感詞典,,另一種是知網(wǎng)推出的情感詞典,。

2. 基于傳統(tǒng)機(jī)器學(xué)習(xí)的情感分析方法

機(jī)器學(xué)習(xí)是指用某些算法指導(dǎo)計(jì)算機(jī)利用已知數(shù)據(jù)得出適當(dāng)?shù)哪P停⒗么四P蛯?duì)新的情境給出判斷的過程,?;诖说那楦蟹治龇椒ㄖ饕遣捎糜斜O(jiān)督的學(xué)習(xí)方式,在有標(biāo)注的訓(xùn)練語(yǔ)料上訓(xùn)練一個(gè)情感分類器,,然后用于未標(biāo)注數(shù)據(jù)的情感極性及具體情感屬性預(yù)測(cè),。

3. 基于深度學(xué)習(xí)的情感分析方法

深度學(xué)習(xí)是學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,讓機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力,,能夠識(shí)別文字,、圖像和聲音等數(shù)據(jù)。以此為基礎(chǔ)的情感分析方法會(huì)自動(dòng)提取文本特征,,并通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)文本中所蘊(yùn)含的語(yǔ)義信息,,達(dá)到情感分析的目的,。

03

無需編程的情感分析工具

對(duì)于沒有編程基礎(chǔ)的同學(xué)們來說,直接采用上述方法要求自己編寫程序分析文本,,還是非常有挑戰(zhàn)性的,。接下來,我們將為大家介紹以下5種不需要編程的中英文情感分析工具,,讓編程小白可以輕松自如地根據(jù)自己的需求進(jìn)行情感分析,。

1

NCSU Tweet Sentiment Visualization (英文)

2

Social Searcher (英文)

3

RapidMiner + Aylien (英文)

4

中國(guó)傳媒大學(xué)國(guó)重自然語(yǔ)言處理綜合服務(wù)平臺(tái)(中文)

5

NLPIR-Parser大數(shù)據(jù)語(yǔ)義智能分析平臺(tái)(中文)

英文平臺(tái)

NCSU Tweet Sentiment Visualization ●

NCSU Tweet Sentiment Viz是由北卡羅來納州立大學(xué)高級(jí)分析研究所教授 Christopher Healey 博士開發(fā)的,專門應(yīng)用于 Twitter 的免費(fèi)情感分析工具,。該程序可根據(jù)使用者輸入的關(guān)鍵字,,通過推文搜索接口(Tweet's Search API)自動(dòng)提取過去一周內(nèi)的相關(guān)推文。

不同于常見的“正面-中立-負(fù)面”三值情感分析,,該應(yīng)用采用了James Russell的環(huán)狀情感模型(circumplex model of affect),,使其能夠進(jìn)行更為細(xì)致的情感分類。這一模型提供基于高興(pleasure)和興奮(arousal)兩個(gè)情感維度的情感分析,,其可定位包括激動(dòng)-沮喪(excited-depressed)和痛苦-放松(distressed-relaxed)等中間情感在內(nèi)的28種情感,。

Image

圖2: Tweet Sentiment Viz 的情感維度

該應(yīng)用采用基于情感詞典的情感分析方法。開發(fā)者使用自主建立的情感詞典,,該情感詞典可對(duì)大約10,680個(gè)英文單詞的進(jìn)行分析,,并逐一給出在[1,9]區(qū)間內(nèi)的情感評(píng)分。

NCSU Tweet Sentiment Viz 的強(qiáng)項(xiàng)在于可視化功能,。該應(yīng)用可自動(dòng)生成反映推文整體情感傾向的散點(diǎn)圖(scatterplot),。使用者將鼠標(biāo)懸停在某一氣泡上,可以獲取單個(gè)推文,,并查看其中與情感詞典相匹配的具體單詞和詳細(xì)的情感評(píng)分,。除此之外,該應(yīng)用還可結(jié)合主題,、時(shí)間,、地點(diǎn)、等信息,,提供標(biāo)簽云(tag cloud),、時(shí)間線(timeline)、地圖等8種情感傾向可視化選擇,。

作為一個(gè)免費(fèi)的情感分析工具,,NCSU Tweet Sentiment Viz簡(jiǎn)單易用,可以滿足基本的監(jiān)測(cè)和分析需求,。然而,,該程序目前只適用于Twitter上的推文分析,適用范圍小,也沒有用于高級(jí)實(shí)現(xiàn)的API (應(yīng)用程序接口,,即一個(gè)軟件組件或是一個(gè) Web 服務(wù)與外界進(jìn)行的交互的接口,,其作用是把某些功能封裝好,方便其他人調(diào)用),。并且,,其只能提取過去一周內(nèi)的推文,涉及時(shí)間范圍小,,也無法滿足更長(zhǎng)期的分析需求,。

網(wǎng)址:

https://www.csc2./faculty/healey/tweet_viz/tweet_app/

Social Searcher ●

Social Searcher是一款由Dmitry Oreshko開發(fā)的社交媒體搜索引擎,支持對(duì)多家主流社交網(wǎng)絡(luò)進(jìn)行實(shí)時(shí)搜索和監(jiān)測(cè),,并可通過指定社交媒體的API自動(dòng)導(dǎo)入包含輸入關(guān)鍵詞的內(nèi)容,,并進(jìn)行情感分析。目前,,其支持42種語(yǔ)言的關(guān)鍵詞檢索,,并可對(duì)英語(yǔ)、德語(yǔ),、法語(yǔ)等共8種語(yǔ)言進(jìn)行情感分析,,但尚不支持中文。其支持對(duì)包括Facebook,,Twitter,YouTube,,Instagram在內(nèi)的11個(gè)主要的社交網(wǎng)絡(luò)進(jìn)行檢索和分析,。

該工具的免費(fèi)版套餐包含每天100條實(shí)時(shí)搜索,以及2條郵件提醒,。如果想要進(jìn)行更多搜索,,設(shè)置更多提醒,以及使用對(duì)特定話題進(jìn)行實(shí)時(shí)監(jiān)測(cè),、全網(wǎng)關(guān)鍵詞搜索等功能,,用戶則需付費(fèi)升級(jí)套餐。

Social Searcher使用基于情感詞典的情感分析方法,,并對(duì)相關(guān)帖子進(jìn)行三值(正面,、負(fù)面或中立)情感評(píng)分。在其分析結(jié)果界面中,,使用者不僅可以查看三種情感類別中熱度最高的帖子,,還可以查看單個(gè)社交網(wǎng)絡(luò)的分析結(jié)果,或進(jìn)行多平臺(tái)對(duì)比,。除此之外,,其還支持以CSV格式導(dǎo)出檢索結(jié)果。

Image

圖3: Social Searcher 網(wǎng)站操作界面

由于使用社交網(wǎng)絡(luò)的開放式API導(dǎo)入數(shù)據(jù),Social Searcher可搜集的數(shù)據(jù)時(shí)間范圍受到限制,。其中,,其只可從Facebook導(dǎo)入過去兩周的或者最新的100個(gè)相關(guān)帖子,Twitter的數(shù)據(jù)來源也限定在過去兩周,。

網(wǎng)址:https://www./

 RapidMiner + AYLIEN ●

RapidMiner,,原名為YALE(Yet Another Learning Environment)由多特蒙德技術(shù)大學(xué)的人工智能部門的Ralf Klinkenberg,Ingo Mierswa和Simon Fischer于2001年開始開發(fā),。

RapidMiner是一個(gè)免編程的數(shù)據(jù)挖掘分析平臺(tái),,可以通過不同組件模塊之間的自由組合實(shí)現(xiàn)任何情感分析方法,以情感詞典,,或機(jī)器學(xué)習(xí)為基礎(chǔ)的情感分析方式均可實(shí)現(xiàn),。其中情緒分析組件Aylien正確率很高,其界面為全英文界面,,與情感分析相關(guān)聯(lián)的功能也均以英文作為語(yǔ)言,。目前RapidMiner只能處理英文。

該軟件當(dāng)中的文件導(dǎo)入功能可以通過更換組件從本地上傳不同類型的文本分析文件(如圖畫圈部分),,也可以通過API導(dǎo)入,,或是從網(wǎng)上的數(shù)據(jù)庫(kù)直接導(dǎo)入。

RapidMiner + AYLIEN 可以自動(dòng)分析導(dǎo)入文本,,并用三值情緒量表(正面,、負(fù)面或中立)對(duì)其進(jìn)行范圍從-1到1的評(píng)分除了從在線數(shù)據(jù)源讀取外,,RapidMiner 還可以直接讀取本地文件(如 CSV 和 Excel 文件或數(shù)據(jù)庫(kù)),。

RapidMiner的初級(jí)版本免費(fèi),情感分析的Aylien文本情緒分析組件提供每天1500個(gè)條目的免費(fèi)分析,。

其優(yōu)勢(shì)是,,通過添加不同組件,RapidMiner即可以實(shí)現(xiàn)數(shù)據(jù)輸出的可視化,,也可以輕松把數(shù)據(jù)分析結(jié)果導(dǎo)出為Excel 或CSV任何版本的數(shù)據(jù),。但軟件的缺點(diǎn)是,其涉及的功能繁多,,且網(wǎng)上的中文教程很少,,相關(guān)軟件的高級(jí)功能方面教程均為英文。

Image

圖4: RapidMiner軟件操作界面

Image

圖5: Aylien 擴(kuò)展包添加界面

軟件下載界面:https:///get-started/

擴(kuò)展包下載添加頁(yè)面:https://marketplace./UpdateServer/faces/product_details.xhtml?productId=rmx_com.aylien.textapi.rapidminer

中文平臺(tái)

中國(guó)傳媒大學(xué)國(guó)重自然語(yǔ)言處理綜合服務(wù)平臺(tái) ●

中國(guó)傳媒大學(xué)國(guó)重自然語(yǔ)言處理綜合服務(wù)平臺(tái)由中國(guó)傳媒大學(xué)開發(fā),。界面為中文,。平臺(tái)服務(wù)包含漢語(yǔ)分詞、自動(dòng)關(guān)鍵詞語(yǔ),、自動(dòng)摘要,、情感計(jì)算,、信息抽取和標(biāo)題黨識(shí)別等

用戶在注冊(cè)頁(yè)面輸入用戶名,,密碼,,手機(jī)號(hào)和手機(jī)驗(yàn)證碼,即可注冊(cè)成功,,每個(gè)手機(jī)號(hào)只能注冊(cè)一個(gè)賬號(hào),。系統(tǒng)的所有服務(wù)必須先進(jìn)行注冊(cè)以及token值(即登錄令牌. 用戶登錄成功之后,在服務(wù)器端會(huì)根據(jù)用戶信息生成一個(gè)唯一的值)的申請(qǐng),之后再請(qǐng)求服務(wù)的時(shí)候附帶該token參數(shù),。


該平臺(tái)因訓(xùn)練語(yǔ)料大多為中文,,故目前在中文領(lǐng)域內(nèi)效果較好,英文或其他外文暫不支持,。

目前該平臺(tái)的情感傾向分析可以分析的情感類型有積極,、消極、中性,。對(duì)輸入的文本進(jìn)行極性計(jì)算,,可以輸入句子,短文本和篇章(長(zhǎng)文本),,計(jì)算機(jī)會(huì)自自動(dòng)判斷,,輸出結(jié)果包括正面、中立,、負(fù)面三種類型,,并給出傾向強(qiáng)度,范圍從-1到1,,判斷的依據(jù)是等于0分為中立,,大于0為正面,小于0為負(fù)面,。用戶可以根據(jù)自已語(yǔ)料的特點(diǎn)對(duì)中立進(jìn)行重新劃分,,比如-0.25到0.25為中立,。

Image

圖6: 中國(guó)傳媒大學(xué)國(guó)重自然語(yǔ)言處理綜合服務(wù)平臺(tái)界面

登錄地址:http://1.119.44.200:6482

NLPIR-Parser大數(shù)據(jù)語(yǔ)義智能分析平臺(tái) ●

NLPIR-Parser大數(shù)據(jù)語(yǔ)義智能分析平臺(tái)是北京理工大學(xué)開發(fā)的的大數(shù)據(jù)內(nèi)容批處理平臺(tái),。此平臺(tái)針對(duì)大數(shù)據(jù)內(nèi)容處理的需要,融合了網(wǎng)絡(luò)精準(zhǔn)采集,、自然語(yǔ)言理解,、文本挖掘和網(wǎng)絡(luò)搜索技術(shù)的十三項(xiàng)功能,提供客戶端工具,、云服務(wù),、二次開發(fā)接口。其界面是中文的,,目前僅能處理中文,。目前平臺(tái)的應(yīng)用均免費(fèi)給研究人員從事研究工作。

平臺(tái)的數(shù)據(jù)收集和預(yù)處理中包括了通過主題采集和站點(diǎn)采集從互聯(lián)網(wǎng)上爬取信息和處理本地上傳或錄入的信息,同時(shí)還提供了不同文檔格式轉(zhuǎn)換和編碼轉(zhuǎn)換的工具,;平臺(tái)的情感分析功能是針對(duì)事先指定的分析對(duì)象,,自動(dòng)分析海量文檔的情感傾向:情感極性,并在原文中給出正負(fù)面的得分和句子樣例,。

NLPIR情感分析的優(yōu)勢(shì)在于情感分類豐富,,不僅包括正、負(fù)兩面,,還包括好,、樂、驚,、怒,、惡、哀和 懼的具體情感屬性,。NLPIR還提供關(guān)于特定人物的情感分析,,并能計(jì)算正負(fù)面的具體得分??梢?strong>單個(gè)對(duì)象分析和批量對(duì)象分析來進(jìn)行情感分析,。情感分析統(tǒng)計(jì)結(jié)果包括:文檔總數(shù)、正面數(shù)量及占比,,每一篇文檔的正負(fù)面 得分與排序,。情感分析詳情結(jié)果會(huì)在原文本中顯示情感分析的詳情:對(duì)象、得分,、 原文等,。

Image

圖7: NLPIR大數(shù)據(jù)語(yǔ)義智能分析客戶端

Image

圖8: 單個(gè)對(duì)象的情感分析結(jié)果

NLPIR客戶端下載:https://github.com/NLPIR-team/NLPIR/tree/master/NLPIR-Parser

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多