43 近年出現了網路輿情的民意探詢機制(例如:正負情緒分析),這是用什麼方式來了解民意?
(A)網路問卷調查
(B)網路文字的探勘
(C)透過網路直播進行官民互動
(D)網路公民連署
統計: A(1999), B(3200), C(350), D(158), E(0) #2592792
詳解 (共 10 筆)
看到「民意探詢機制」原本想到問卷調查,
但是題目前面提到「網路輿情」感覺就是指社會輿論,
輿論比較容易出現在社群的文章或留言中
完全沒有看過什麼網路文字的探勘,查了一下,這根本是屬於電腦程式方面的東西,到底和行政學有什麼關係.....出題委員是不是有病
https://www.nchc.org.tw/Page?itemid=17&mid=29
情緒分析(Sentiment Analysis)是繼文字探勘(Text Mining)之後,近年被熱烈討論的議題。過去學者普遍探討的是如何把一句話非結構化轉結構化的方法,像是各式演算方法,包含監督式學習(Supervised learning)、半監督式學習(Semi-supervised learning)、非監督式學習(Unsupervised learning)方法都有大量討論,各種文字探勘工具也應運而生,現在透過R、Python也都能很快做到這些事情。
我們隨著學者的腳步,可以發現隨著時代演進,解析文字的科技發展,在20年間有很快速的變動。從最早的網頁資料探勘(Web Data Mining)、文字探勘(Text Mining),慢慢的演進到近10年討論的情緒探勘(Sentiment Analysis)與意見探勘(Opinion Mining),再到這2年的情緒分析系統(Sentiment Analysis System)這樣的議題,都是為了要解決我們大量文字的閱讀需求,因為人類每一天不斷產生文字與內容已經超乎我們想像。
#資料探勘(Data Mining),意指利用一個龐大數據庫建立模型(Model),並從中找出隱藏的特殊關聯性及特徵。通常為結構式
#文本探勘
如部落格文章 新聞 或是臉書動態貼文
#將各種資料整理成文本 再利用各種分析手法了解人的思想
一、另類的網路民調:利用文字探勘(網路文字的探勘)分析大眾觀感
(一)實際案例說明
1 走進一家餐廳,面對菜單上琳琅滿目的菜色時,你會感到困擾,不曉得該選
哪幾道菜才不虛此行嗎?
2 走進手機通訊行,你會猶疑在多種選擇當中而不知所措嗎?
3 你會不會希望,能有一個先前不久才發佈的網路民調,剛好是根據你所希望的
消費需求,調查出大家所公認的最佳選擇呢?
4 現代人每天都在做消費決策,網路上的確也有很多消費心得分享,但你會不會
總是發現:自己的需求是獨一無二的,往往得耗費心思瀏覽許多消費心得才能
得到符合自己需求的消費指引?
5 電腦網路資訊已發展出有更好的方式幫助消費者,利用網路上的消費心得分享
幫助閱讀搜尋然後做出選擇,而這就是 文字探勘 ( Text Mining ) 技術。
(二)利用文字探勘技術,協助讀者解讀大量文字資訊。
1 文字探勘技術,結合了文字分析技術與資料探勘技術,
目的是希望能夠透過電腦的的運算能力,過濾及轉化大量的文字內容,
讓人能夠更有效率的運用各種訊息。
2 最基本的文字探勘技術,像是在藉由一段文字找到合適的標籤。
網站上常見的標籤 ( Tagging )功能,透過這功能我們可以文字、圖片或影像
定義一些我們認為是相關聯的關鍵字。
例如:以這段文字為例:
直接從搜尋網址,去搜尋一些文字內容看,就會發現網路呈現出一系列相關聯
的標籤訊息,而這些相關訊息或文字都是透過關鍵字分析找出來。
但如果更想找出其他衍伸的相關文字的深入標籤,就需要透過更複雜的文字探
勘技術才能做到。
3 當一段文字內容能用一組字眼作為象徵,我們就能透過這些字眼串連相關文字
內容,或按照消費者需求對眾多文字內容進行篩選。
(三)Text Mining + Web = ?
Text Mining(文字探勘)在Web(網路)上的可能應用
Web上的豐富文字,正好為文字探勘技術建立了一個取之不盡的實驗場域。
在兩者適當的結合之下,其實能夠提供許多創造新型態資訊服務的可能性,
如以下兩個範例。
1 範例一:Reveable 飯店評論口碑分析服務
Reveable是一家透過文字探勘技術提供飯店口碑評論資訊的網站。
抓準了網路使用者外出旅遊經常有找尋符合個人期待及高品質飯店的需要,
Reveable匯整了來自各大知名旅遊飯店評論分享網站 ( 例如Yahoo! Travel、
TripAdvisor.com等等 ) 的網友口碑評論,再以文字探勘技術分析評論內容的
正負面口碑意見,再將結果以口碑星星級數及評論數等方式排序。
除此之外,針對每一飯店,他們也提供了網友正負面評論句的整理,甚至以
不同評估面向加以編排 ( 例如:房間設施、地點、服務及飯店氣氛等等 ),
讓使用者可以透過網友分享的口碑資訊,快速找到最滿意的飯店。
2 範例二:嚴選百店
資策會創研所於2008年9月 和 中華電信Xuite部落格合作舉辦了第二屆部落
客百傑活動。當中一個重頭戲,是展示透過部落格網路口碑分析技術所整理出
來的「部落客嚴選百店」。
百大名店的篩選過程,即是透過文字探勘技術,將網友分享的大量口碑評論文
章,經過美食文章分類、文章主題餐廳辨識、餐廳菜名辨識及正反意見分析等
層層關卡,最後產出一個按照不同美食類別 ( 例如日式、泰式、美式料理等 )
加以分門別類的嚴選百大美食餐廳清單。
透過這樣一個餐廳口碑資訊清單,可幫助想要嘗試新口味卻又怕受傷害的網路
使用者,直接參考網民口碑經驗所分享的餐廳來做選擇,大大節省了搜尋過濾
資訊的時間和風險。
二、文字探勘(網路文字的探勘)分析:另類的網路民調之發展
(一)隨著時代演進,解析文字的科技發展,在20年間有很快速的變動。
1 從最早的 網頁資料探勘 ( Web Data Mining )、文字探勘 ( Text Mining ),
慢慢的演進到近10年討論的 情緒探勘 ( Sentiment Analysis ) 與 意見探勘
( Opinion Mining ),再到這2年的情緒分析系統 ( Sentiment Analysis System )
因為人類每一天不斷產生文字與內容已經超乎我們想像,對於許多議題的分
析,可透過網路文字探勘技術去解析文字的科技發展,就是為了要解決我們
快速閱讀、歸納、整理大量文字,並找出每個人的獨立答案的需求。
(二)文字探勘
1 網頁資料探勘(Web Data Mining),
利用一個龐大數據庫建立模型(Model),從中找出隱藏的特殊關聯性及特徵。
2 文字探勘 ( Text Mining )
將各種資料整理成重點摘要,再利用各種分析手法,去了解當事人的思想。
例如:分析電腦網路上的部落格文章、新聞、或是臉書動態貼文。
3 情緒分析 ( Sentiment Analysis )
文字探勘 ( Text Mining ) 之後,情緒分析技術是近年被熱烈討論的議題。
遍探討的是:如何把一句話非結構化轉結構化的方法,透過運用電腦大數據、
統計學、心理分析等等各式演算方法,包含監督式學習 ( Supervised learning )、
半監督式學習 (Semi-supervised learning)、非監督式學習 (Unsupervised
learning ) 方法,創立出最新的網路輿情的民意探詢機制(正負情緒分析)。
(三)功效:
最新的網路輿情的民意探詢機制(例如:正負情緒分析)
1 在文字探勘技術領域中,藉由分析文字中帶有的正負面情緒及觀感的方式,
被稱作 意見探勘 ( Opinion Minin ) 或情感分析 ( Sentiment Analysis ) 技術。
2 案例分析:
在撰寫部落格文章、臉書留言或照片呈現的時候,往往會透過文字表現個人的
情緒,這種自我對每個事物的感受,文章中夾雜了對不同對象、事件的不同強
度正負面觀感。
例如:就像一篇分享某家泰式餐廳的食記中,作者可能對於不同的菜餚有不同
的正負面觀感;他可能會覺得「這家店的甜點很好吃,但是泰式酸辣湯卻不是
很夠味,我本來最喜歡吃的椒麻雞炸的好硬,讓我超級失望」
集合這些意見,他最後的結論是:不推薦這家店(即使這家店的甜點非常好吃)。
3 要如何準確的了解作者主要傳達的觀感是偏向正面或負面,是一件相當不容易
的事。
針對2 案例分析這樣的問題,意見探勘 或 情感分析技術 可透過對於否定詞
、程度性的文詞、以及考量正負面意見詞的出現頻率等等的方式來處理。
用前面的例子來說,可判斷出「超級失望」比「很好吃」的觀感強度更強,
最後統整出來的評論意見,就可以正確判斷為負面。
再針對「不是很夠味」 這種情況,也可透過否定詞的考量,得出最正確的
觀感。
4 透過這些機制來處理蒐集的相關評論文章,排除意見過於模擬兩可或是長度
過短的句子,若是最終整理出了大約5000句的意見句,其中正面句佔了75%
左右,而負向句佔了25%。(當然越大量資料,分析的預測能力,越精確。)
5 從意見探勘 ( Opinion Minin ) 或情感分析 ( Sentiment Analysis ) 技術測量分析
的結果,發現這些透過文字探勘技術所萃取出的觀感意見,可提供民意調查公
司對於企圖想調查的事件或人物,非常具參考價值的精確資訊。
6 一般的功用
(1)透過文字探勘技術的幫助,可將商品評論文章透過各種維度,
如:產品、正負面、甚至是各種產品特徵進行分類。
(2)再根據消費者不同的需求,過濾出特定範圍的商品評論文章提供消費者
參考,進而統計出熱門程度、正負面傾向等網路民調指標,讓消費者能
夠更有效率的做出購買決策。
7 最夯的趨勢
透過最新的文字探勘技術:意見探勘 ( Opinion Minin ) 或情感分析 ( Sentiment
Analysis ) 技術測量,可精準的分析政治選舉的結果。
參考:2019年出版的一書:Targeted: The Cambridge Analytica Whistleblower’s
Inside Story of How Big Data, Trump, and Facebook Broke Democracy and How It
Can Happen Again
2020年中文繁體字版,書名:
操弄【劍橋分析事件大揭祕】:
幫川普當選、讓英國脫歐,看大數據、Facebook 如何洩露你的個資來操弄你
的選擇?