通過(guò)詞頻統(tǒng)計(jì)快速抓取《紅樓夢(mèng)》中的730多個(gè)人名,;利用三維建模和3D打印技術(shù)“重塑”云岡石窟第十二窟,;抓取分析人氣值、集資榜數(shù)據(jù),,研究《創(chuàng)造營(yíng)2020》等熱門綜藝節(jié)目的粉絲行為……如今,,大數(shù)據(jù),、云計(jì)算、人工智能等數(shù)字技術(shù)與人文研究的結(jié)合正催生出“數(shù)字人文”的全新研究范式,,在驅(qū)動(dòng)學(xué)術(shù)生產(chǎn)方式變革的同時(shí),,其創(chuàng)新研究成果也逐步惠及大眾。
數(shù)字人文是研究者采用數(shù)字技術(shù)來(lái)解決人文領(lǐng)域研究問(wèn)題的跨學(xué)科實(shí)踐,。其歷史最早可以追溯到1949年的“阿奎那項(xiàng)目”,,即用計(jì)算機(jī)對(duì)中世紀(jì)經(jīng)院哲學(xué)家托馬斯·阿奎那的全部著作及相關(guān)文獻(xiàn)制作語(yǔ)詞索引。數(shù)字人文最核心的特征是用數(shù)字技術(shù)解決傳統(tǒng)人文學(xué)研究中遇到的,、傳統(tǒng)手段無(wú)法解決的問(wèn)題,。這樣說(shuō)來(lái),恐怕還略顯抽象,,我們不妨舉幾個(gè)數(shù)字人文在不同學(xué)科的應(yīng)用案例,。
文學(xué)研究方面,令研究者發(fā)愁的一個(gè)問(wèn)題就是海量文學(xué)作品并沒有進(jìn)入研究視野,,進(jìn)而對(duì)文學(xué)創(chuàng)作的總體情況缺乏高屋建瓴式的準(zhǔn)確把握,。2019年,中國(guó)新版當(dāng)代小說(shuō)就有5542種之多,,更別提汗牛充棟的網(wǎng)絡(luò)文學(xué)了,。當(dāng)年網(wǎng)絡(luò)文學(xué)注冊(cè)作者已達(dá)1755萬(wàn)人,其作品量可想而知。因此,,想要把握當(dāng)下創(chuàng)作的潮流和趨勢(shì),,數(shù)字人文給出的辦法是“遠(yuǎn)讀”(distant reading),與貼近作品,、以準(zhǔn)確把握某一文本為目標(biāo)的“細(xì)讀”(close reading)相對(duì),,遠(yuǎn)讀將鏡頭拉得更遠(yuǎn)、視角更廣,,考察作品的范圍更大,,通過(guò)忽略無(wú)關(guān)的細(xì)節(jié)信息,利用數(shù)字技術(shù)從宏觀上更加客觀準(zhǔn)確地描摹出文學(xué)創(chuàng)作的概貌,。
2018年,,谷臻故事工場(chǎng)CEO走走通過(guò)抓取1979年至2018年40年間,680位作者發(fā)表在《收獲》雜志上的1618篇長(zhǎng)中短篇小說(shuō),,從每十年的地理位置變化,、明快—沉郁作品比例、影視改編類型曲線,、主題變遷等6個(gè)維度著手,,解讀《收獲》40年作品風(fēng)格的變化趨勢(shì),是遠(yuǎn)讀研究方法的一次嘗試,。通過(guò)對(duì)小說(shuō)文本的詞頻數(shù)據(jù)分析,,他們發(fā)現(xiàn)《收獲》第一個(gè)十年(1979年—1989年)刊載作品的高頻詞是“我要”,反映了作家主體意識(shí)的覺醒和自我表達(dá)欲望的提升,;第二個(gè)十年(1990年-1999年)的表達(dá)主體從“我”擴(kuò)展到“我們”,,“家庭”倫理關(guān)系成為最受關(guān)注的話題;第三,、第四個(gè)十年中,,文學(xué)創(chuàng)作也呈現(xiàn)出各自不同的特點(diǎn)。如果通過(guò)人工閱讀得出相似結(jié)論,,恐怕要大費(fèi)一番周折,。
此外,,數(shù)字人文還可為人文學(xué)研究中的疑難問(wèn)題提供全新的解決思路,,實(shí)現(xiàn)了科技和人文的跨界破壁。明初重要詩(shī)人楊基的出生年月一直存在爭(zhēng)議,。有研究者根據(jù)他《梁園飲酒歌》一詩(shī)中“我生之辰木入斗,,烏啼東井命壁守。壁為文府斗為歲,,許我文章播人口,。”將楊基出生地蘇州天平山的GPS坐標(biāo)、時(shí)區(qū)導(dǎo)入軟件,,加載黃道坐標(biāo)后計(jì)算出他的生日在1331年12月4日至次年1月25日之間,,為文學(xué)史研究提供了更為可靠的證據(jù)支撐。河北大學(xué)研究人員借助聲門儀,、呼吸帶,、眼動(dòng)儀等設(shè)備記錄保存?zhèn)鹘y(tǒng)戲曲保定老調(diào),可以精確記錄表演者的聲帶振動(dòng)頻率,、幅度,、節(jié)奏和呼吸信號(hào)以及眼神表達(dá)和視線焦點(diǎn)。通過(guò)對(duì)這些數(shù)據(jù)的分析,,有可能找到戲曲表演“韻味”形成的密碼,。
在文化遺產(chǎn)保護(hù)利用方面,數(shù)字人文更是發(fā)揮著不可替代的作用,。通過(guò)平面和立體掃描,、智能文本識(shí)別,可以完成古籍文獻(xiàn),、藝術(shù)品甚至建筑的數(shù)字化數(shù)據(jù)采集,,形成穩(wěn)定安全可靠、可重復(fù)利用,、獲取便利的數(shù)字資源,,這不僅是獲取學(xué)術(shù)研究資料的必要環(huán)節(jié),其成果通過(guò)轉(zhuǎn)化利用,,更可面向大眾發(fā)揮文化普及的教育功能,。經(jīng)過(guò)30多年數(shù)字化技術(shù)的發(fā)展,目前敦煌研究院已完成230多個(gè)洞窟的數(shù)據(jù)采集,、145個(gè)洞窟的圖像拼接,、160多個(gè)洞窟的虛擬漫游和三維空間結(jié)構(gòu)以及42身的彩塑三維重建。利用相關(guān)數(shù)字化成果,,敦煌研究院面向大眾推出了“云游敦煌”微信小程序等一系列線上“云展覽”,,讓數(shù)字人文的成果為全社會(huì)共享。
以上只是數(shù)字人文應(yīng)用前景的冰山一角,,更多的跨學(xué)科交叉研究正在展開,。有研究顯示,數(shù)字人文研究論文分布在102個(gè)學(xué)科領(lǐng)域中,,計(jì)算語(yǔ)言學(xué),、計(jì)量史學(xué)等新興學(xué)科不斷涌現(xiàn)。未來(lái)的人文學(xué)研究將搭上數(shù)字化時(shí)代的快車,,相關(guān)成果也將更好地為社會(huì)大眾服務(wù),。