百擎大數據
在計算社會科學的發展進程中,多種形態的大數據類型不斷涌現,比如書籍文本大數據Google Books、網絡百科大數據Wikipedia等。在眾多的大數據類型當中,以Twitter、Facebook以及在線新聞輿情信息匯聚成的輿情大數據,構成計算社會科學的重要觀測對象。
1.輿情大數據第一個重要特征是其話語屬性
文本的內容表達了各種各樣的觀點、態度和立場,這些歸結到一點,實際上就是話語,即各種各樣的社會主體,基于其立場,表達各種各樣的意見和看法。因此,話語分析應該是輿情大數據分析的第一層重要含義,借助于輿情大數據的高維屬性,對文本進行話語分析,呈現話語背后的立場與觀點、不同話語主體之間的交鋒與博弈、不同話語的聲量大小與社會影響等等。
2.輿情大數據的第二個重要特征是其情感屬性
輿情者,情緒也。輿情信息中,總是會充斥著豐富的情感表達,這是由輿情信息的屬性所決定的。一方面,就新聞輿情而言,輿情需要與受眾 “同呼吸、共命運”。輿情數據的一個重要特征就是共情,只有這樣,輿情信息所表達的喜怒哀樂,才能與大眾的喜怒哀樂保持共振,輿情才能夠影響社會,才能夠吸引觀眾。因此,在線新聞輿情信息的一個重要特征就是其情感屬性。另一方面,就社交媒體信息而言,社交媒體的主體部分是大眾直接在社交媒體上表達所思所想、生存狀態與生存方式,在這些自我表達中,也往往是有感而發,分享的是或喜悅、或憂傷、或震驚、或憤怒的情感。
3.輿情大數據第三個重要特征是其傳播屬性
輿情大數據的受眾和生產主體都是大眾,信息、話語或者情緒的傳播,構成輿情的一個重要景觀,而某種話語或者觀點在網絡空間或者社交媒體空間能否傳播開來,很大程度上取決于其傳播屬性。
4.輿情大數據第四個重要特征是其社會屬性
輿情大數據包含社會生活中各種各樣的利益主體,涵蓋社會系統中各個階層,新聞輿情大數據描述和記錄了社會生活中各個階層和群體的生活方式與生存狀態,而社交媒體大數據的參與主體也是各種各樣。正是因為輿情大數據涵蓋社會各階層,包含多種事件,空間范圍涵蓋五湖四海?;诖?,我們可以分析不同社會階層與群體的生活方式與生存狀態。