水晶宫建筑

 首頁 >> 社會學
羅家德 高馨:創新大數據時代的社會計算
2019年10月09日 10:57 來源:中國社會科學網-中國社會科學報 作者:羅家德 高馨 字號

內容摘要:

關鍵詞:

作者簡介:

  大數據的出現和計算機技術的發展為社會計算帶來了新的研究方法的革命,使得研究設計、分析方法到理論建立都有了新的改變。為探索大數據研究的跨學科方法論,促進學科整合與創新,由清華大學社會科學學院主辦,清華大學社會網絡研究中心(CSNR)、清華大學數據科學研究院(IDS)承辦的“2019社會計算國際會議”(2019 International Conference of Social Computing)在清華大學召開,邀請全球學者在大數據分析方法與社會科學的交叉領域進行交流和溝通。

  大數據和調查數據結合,產生了一種理論視角下新的研究范式。芝加哥大學社會學系James A. Evans首先闡釋計算社會科學使用計算機來生成數據、發現其中的模式和規律,或生成和檢驗解釋(explanations)。他勾勒出了社會計算的愿景,結合其研究內容及計算社會科學領域最新研究闡述了如何利用數據計算來理解社會,分析復雜、動態、自適應的社會系統以及人機交互的過程中何以形成更為強大的智能。

  大數據時代大量基于網絡、社交媒體、人工智能、傳感器等產生的實時電子印記數據,從網絡上的集體活動、社交媒體、即時通信到在線交易、政府情報和數字化圖書館,越來越多的社會生活留在電子文本中。研究者可以從中發現現象、尋求解釋因素、進行社會計算,以前所未有的廣度、深度和規模利用、收集和分析數據。參會者針對各自研究領域,所使用的大數據涵蓋了社交網絡、維基百科、Github網站數據分析、組織中員工社交數據、微博數據、社會經濟相關的電子印記數據等。當這些大數據結合社會科學傳統的定性、定量調查,新的研究范式應運而生。采用傳統調查方法收集局部、及時的扎根真相,將社會科學的問題意識、扎根真相與現有的大數據相結合形成預測模型,從而在更易獲得的相同的大數據維度下進行推論。扎根真相和大數據的結合為數據挖掘、理論建模以及預測算法構建的三角間往復對話提供了可能,一方面使理論不斷改善,另一方面使預測算法更加精確,進而可以推論并解釋更多現象。這種研究范式的推理過程采用的是Charles Sanders Pierce提出的溯因推理(abduction),而不僅僅是歸納(induction)和演繹(deduction),是一種開始于事實、想象的集合,并推導出其最佳解釋的推理過程。與計算社會科學研究中首先基于數據和理論雙驅動,在大數據挖掘出有趣的現象,然后結合理論來預測或模擬推導其解釋的過程不謀而合。抽樣方式也從原來的全樣本的隨機抽樣(random sampling)轉變為最適化抽樣(optimized sampling),即局部抽樣建立預測模型,不斷使得預測模型與理論對話,使得預測模型逼近最優,最終采用相同的大數據預測因子輸入預測模型中進行推論。

  目前社會計算領域同時致力于開發和改進一些算法來解決社會計算的問題,其中包括機器學習、數據挖掘、網絡分析、自然語言處理、深度學習等內容分析、數據挖掘和預測模型建立。

  北京師范大學系統科學學院的張江、樊瑛分別分析了復雜系統當中運用簡單規則建模和運用深度學習建模各自的利弊,并展示了其團隊關于用于網絡重構和動態學習的深度學習框架的研究。清華大學計算機系的劉知遠改進自然語言分析技術和圖神經網絡算法,可以應用于推薦、預測等多個領域。復旦大學計算機學院陳陽副教授使用深度學習檢測在線開發者社區中的惡意賬戶,其他學者也多使用大數據集成的機器學習算法等進行預測,同時不乏結合回歸模型來進行理論的驗證和探究。模型和方法的改進可更好地挖掘數據中的價值,也使得社會預測的準確率更高,為一些社會現象提供了更加微觀或中層的模式(pattern)和規律的解釋路徑,從而可以建構并逐步完善社會科學理論。

  在大數據和社會科學結合中,社會科學調查發揮了確立問題意識以及提供扎根真相的作用,理論為大數據開啟了很多新議題,為構建的預測模型賦予更具推論性的價值,因為只有形成理論才可以在不同領域、時間、空間的條件下進行推論。

  依照以上方法論和技術的創新,學者們在不同領域進行了研究,范圍廣泛,內容多樣。其中清華大學社會學系羅家德試圖探討中國人的人脈圈層到底可以劃分為幾層。在開展調查收集到用戶之間的關系強度的扎根真相后,找到這些用戶在社交軟件中留下的互動的印記數據并整理出指標,結合扎根真相訓練建立分類模型,不斷尋找準確率最高的劃分方式,從而得到合適的圈層劃分方式,讓這種研究對象在一定的情境(context)變得可被測量,這就體現了大數據和調查數據的相互對話的價值。電子科技大學周濤利用學生生活和學習活動的實時記錄,開展數據驅動的關于智能教育的研究。清華大學孟天廣利用大數據,關注中國共產黨黨員的入黨問題。清華大學蘇毓淞主要關注中國審查制度的縱向戰略,即利用微博數據來觀察政府對于輿論的審查等。

  豐富的研究問題為社會計算的發展注入了活力。目前,不管是在研究問題、算法模型還是理論與數據挖掘、預測模型的結合中,還均處于不斷探索當中。理論、數據挖掘與預測模型的不斷對話將會推動更多理論的驗證、修正,或是新的理論的發現,同時使得研究動態的個體、個體間的關系和互動、從小團體的結構變化到宏觀的網絡的變化,從而如何涌現出集體行動(如重大創新、社會運動、革命爆發等)和復雜社會系統的非常態演化(如金融風暴、景氣突轉、社會變遷)成為可能。來自芝加哥大學、麻省理工學院、斯坦福大學、哥廷根大學、法蘭克福大學、牛津大學、香港中文大學、清華大學、復旦大學、北京師范大學等10余所高校不同學科背景的20多位專家學者就會議主題進行了學術演講與交流討論。

 ?。ㄗ髡叩ノ唬呵寤笱緇嵫擔?/p>

作者簡介

姓名:羅家德 高馨 工作單位:清華大學社會學系

轉載請注明來源:中國社會科學網 (責編:孫志香)
W020180116412817190956.jpg
用戶昵稱:  (您填寫的昵稱將出現在評論列表中)  匿名
 驗證碼 
所有評論僅代表網友意見
最新發表的評論0條,總共0 查看全部評論

QQ圖片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
內文頁廣告3(手機版).jpg
中國社會科學院概況|中國社會科學雜志社簡介|關于我們|法律顧問|廣告服務|網站聲明|水晶宫建筑