99爱免费观看_日韩在线免费_97成人在线视频_中文字幕三区_美女福利视频网站_色伊人

一種基于語料庫的網(wǎng)絡(luò)群體事件情感傾向分析模型

來源:期刊VIP網(wǎng)所屬分類:計(jì)算機(jī)網(wǎng)絡(luò)時(shí)間:瀏覽:

  摘要:介紹了一種基于語料庫的群體情感傾向度分析模型,該模型基于傾向性語料庫中的極性詞匯對集合中每一份素材文本進(jìn)行分詞,統(tǒng)計(jì)并計(jì)算素材文本中出現(xiàn)的極性詞匯的強(qiáng)度值,得到整篇素材文本的傾向度,對集合中所有素材文本的傾向度進(jìn)行統(tǒng)計(jì)并歸一化,帶入分段條件函數(shù)中進(jìn)行傾向度判斷,得到網(wǎng)絡(luò)群體對該事件的情感傾向。通過對巴以沖突和中國空間站2個(gè)近期熱點(diǎn)事件的對照測試,驗(yàn)證了模型的正確性。

  關(guān)鍵詞:極性詞匯;語料庫;情感傾向度;向量分析

  引言

  國家管理者在決策活動(dòng)中必然會(huì)涉及關(guān)乎民眾利益的社會(huì)客觀情況,以及民眾在認(rèn)知、情感和意識的基礎(chǔ)上對社會(huì)客觀事件的態(tài)度(民意)[1]。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,民眾越來越多地通過微博、論壇、微信等手段對公共事件或熱點(diǎn)事件發(fā)表意見、觀點(diǎn)、言論和態(tài)度,如何及時(shí)識別網(wǎng)民這一群體對某一事件的情感傾向,成為網(wǎng)絡(luò)輿情管理的重要研究課題[2-3],而不同群體情感傾向的偏差研究,是解決輿情群體情感傾向差異分析的重點(diǎn)[4]。本文提出了一種基于語料庫的網(wǎng)絡(luò)群體對事件的情感傾向分析模型,用于分析網(wǎng)絡(luò)上的群體對某個(gè)事件的情感傾向。該模型以網(wǎng)絡(luò)上某事件相關(guān)的微博、帖子等文本為素材集合,基于傾向性語料庫中的極性詞匯對集合中每一份素材文本進(jìn)行分詞,統(tǒng)計(jì)并計(jì)算素材文本中出現(xiàn)的極性詞匯的強(qiáng)度值,得到整篇素材文本的傾向度,再對集合中所有素材文本的傾向度進(jìn)行統(tǒng)計(jì)并歸一化,帶入分段條件函數(shù)中進(jìn)行傾向度判斷,得到當(dāng)前網(wǎng)絡(luò)群體對該事件的情感傾向是正面的、中立的還是負(fù)面的,從而及時(shí)采取相應(yīng)的輿情管控手段加以引導(dǎo)。

  1定義

  1.1群體認(rèn)知

  群體是指按某種特征結(jié)合在一起的多個(gè)個(gè)體,群體與個(gè)體相對,是個(gè)體的集合。群體對事件的認(rèn)知是指某個(gè)特定群體對事件的看法或態(tài)度。對一個(gè)事件的群體認(rèn)知數(shù)據(jù)主要來源于個(gè)人微博、Twitter、QQ空間、朋友圈、論壇和貼吧等個(gè)人社交軟件產(chǎn)生的信息。

  1.2情感傾向度

  群體對事件的情感傾向即廣大個(gè)體對于特定事件的公眾認(rèn)知。事件可以來自線上傳播,也可以來自媒體報(bào)道,事件傳播途徑多是通過互聯(lián)網(wǎng)上的各類社交媒體軟件、論壇和貼吧等。互聯(lián)網(wǎng)是一個(gè)任何人均可以發(fā)聲的大平臺,信息傳播是一種松散的網(wǎng)狀結(jié)構(gòu),存在于社會(huì)各個(gè)階層的網(wǎng)民是構(gòu)成這個(gè)網(wǎng)的節(jié)點(diǎn),他們掌握的或多或少的碎片化信息在節(jié)點(diǎn)間流動(dòng),雖然虛擬環(huán)境中仍然存在意見領(lǐng)袖和沉默螺旋效應(yīng),但缺少了社會(huì)群體中的監(jiān)督機(jī)制和自我約束,導(dǎo)致群體情感傾向帶有更多的情緒和不理智因素。同時(shí),群體對事件的情感傾向也不都以文字的形式體現(xiàn),很多人并不直接發(fā)聲,而是對贊同的觀點(diǎn)點(diǎn)贊。同時(shí),群體在使用社交媒體軟件時(shí),經(jīng)常會(huì)使用表情符號表達(dá)自己的情感,而有時(shí)表情符號會(huì)傳達(dá)出比文字更強(qiáng)烈的傾向性。

  2模型應(yīng)用

  2.1模型原理

  群體對某個(gè)事件的情感傾向性可歸類為正面、中立和負(fù)面。以一定平臺上的素材為基礎(chǔ),事先構(gòu)建傾向性語料庫,采集目標(biāo)群體對特定事件的相關(guān)文本,利用自然語言處理技術(shù)提取文本中的詞匯和表情符號,基于語料庫進(jìn)行分析計(jì)算得到對事件的傾向度,從而判斷目標(biāo)群體對該事件的傾向性。群體傾向性分析流程如圖1所示。

  (1)構(gòu)建傾向性語料庫

  使用網(wǎng)絡(luò)爬蟲從互聯(lián)網(wǎng)上采集近期常見的傾向性詞匯和表情符號,經(jīng)過人工對詞匯和表情進(jìn)行分類并設(shè)置權(quán)重后,再為詞匯和表情建立倒排索引,形成語料庫。

  (2)提取事件相關(guān)文本的傾向性屬性

  收集目標(biāo)群體針對某事件的相關(guān)文本素材形成原始素材集合,為每一份文本素材構(gòu)建情感傾向性屬性向量。

  (3)計(jì)算事件的傾向度

  對于包含傾向性屬性向量的文本素材,根據(jù)其傾向性屬性向量,結(jié)合語料庫中詞匯和表情符號的權(quán)重值計(jì)算每篇文本素材的傾向度。

  (4)分析群體對事件的傾向性

  遍歷原始素材集合中的所有素材,對集合內(nèi)所有素材的傾向度進(jìn)行帶符號累加求和后做歸一化處理,求出被分析群體對該事件的傾向度。

  2.2模型設(shè)計(jì)

  2.2.1構(gòu)建傾向性語料庫

  傾向性詞匯即包含情感傾向的詞匯,可以是形容詞或者副詞,比如幸福、漂亮、卑鄙、愚蠢等;也可以是動(dòng)詞,比如支持、點(diǎn)贊、反對、作弊等;也可以是介詞短語,比如干的漂亮、有意境等。這些具有傾向性的詞匯出現(xiàn)在語句中,通常會(huì)表達(dá)出個(gè)體對事件的情感傾向是正面積極的,還是負(fù)面消極的。向傾向性語料庫中插入詞匯時(shí),除了要包含正統(tǒng)詞匯外,還應(yīng)盡可能多地包含網(wǎng)絡(luò)流行用語。每一個(gè)進(jìn)入語料庫的詞匯除了要進(jìn)行正面、負(fù)面分類外,還要對其情感強(qiáng)度進(jìn)行評估,并預(yù)置一個(gè)強(qiáng)度值。

  在社交媒體軟件中,比如新浪微博、微信、QQ等,表情符號也被用戶廣泛使用。用戶在表達(dá)具有情感傾向的觀點(diǎn)時(shí),經(jīng)常會(huì)在文本中附加表情符號,它近似刻畫了用戶的表情,能夠簡單、直觀地展現(xiàn)出用戶的情感傾向。根據(jù)表情符號的不同可以歸類到不同的傾向中,比如:笑臉符號可以歸類到正面傾向中;憤怒或哭泣的符號可以歸類到負(fù)面傾向中。而不同的符號傳達(dá)的情感強(qiáng)度也不相同,應(yīng)當(dāng)為其預(yù)置不同的強(qiáng)度值,比如:大笑符號的情感強(qiáng)度應(yīng)當(dāng)大于微笑符號。

主站蜘蛛池模板: 亚洲精品无遮挡 | 国产精品一品二区三区的使用体验 | 国产视频福利一区 | 亚洲最大av网站 | 人人做人人爽 | 国产精品久久久久久久久久妞妞 | 亚洲精品一区二区网址 | 国产精品一区二区精品 | 国产成人精品免费视频大全 | 男人久久天堂 | 羞羞视频网| 日韩艹逼视频 | 在线免费av观看 | 中文字幕国产一区 | 欧美一级欧美三级在线观看 | 亚洲精品亚洲 | 成人精品久久久 | 亚洲三级视频 | 在线欧美 | 久久成人亚洲 | 欧美天堂在线观看 | 黄色网页免费观看 | 欧美一区 | 免费观看毛片 | 狠狠干狠狠操 | 精品一区二区免费视频 | www.久久精品 | 成人在线免费观看 | 日本亚洲精品成人欧美一区 | 亚洲精品乱码久久观看网 | 亚洲福利片 | 草逼逼 | 91精品国产一区二区 | 亚洲欧洲一区二区 | 午夜a毛片 | 欧美成人免费在线观看 | 99reav| 日韩一区二区三区在线 | 国产综合99 | 久久精品成人免费视频 | 欧美一区成人 |