城大學(xué)者推動(dòng)數(shù)碼人文 結(jié)合數(shù)碼工具研究中國(guó)歷史
社交媒體讓我們可以輕易得知朋友最近過(guò)得怎麼樣,甚至找到蛛絲馬跡,發(fā)現(xiàn)誰(shuí)和誰(shuí)原來(lái)早已是老相識(shí)。但若要找出歷代人物之間的關(guān)係,便要埋首無(wú)數(shù)古籍,花上海量的時(shí)間和精力。香港城市大學(xué)(城大)一名積極推廣數(shù)碼人文(digital humanities,又譯「數(shù)字人文」)的歷史學(xué)者,便利用數(shù)碼工具研究宋代歷史,包括由宋人的書(shū)信中嘗試交織出他們的「朋友圈」。近年他四出分享將電腦與資訊科技應(yīng)用在人文學(xué)科的經(jīng)驗(yàn),革新研究模式之餘,更希望凝聚不同領(lǐng)域的學(xué)者共同研究,集各家之大成。

所謂數(shù)碼人文,可理解為使用電腦技術(shù)進(jìn)行人文學(xué)科的研究。城大人文社會(huì)科學(xué)院中文及歷史學(xué)系助理教授徐力恆博士,正是香港少數(shù)的數(shù)碼人文專(zhuān)家之一。
分析海量資料的前提是先要獲得資料,但是要將中國(guó)典籍?dāng)?shù)碼化,可謂挑戰(zhàn)重重。徐博士解釋說(shuō):「首先,漢字?jǐn)?shù)量不少,且有很多種寫(xiě)法,用電腦辨識(shí)古籍中的文字已不容易;而且古籍的文本一般沒(méi)有標(biāo)點(diǎn),故需要人文學(xué)者用專(zhuān)業(yè)知識(shí),有效地訓(xùn)練電腦執(zhí)行數(shù)據(jù)輸入及數(shù)碼化的工作?!?strong>他形容數(shù)碼人文的精粹在於人文學(xué)者的人腦與電腦的力量相輔相成,形成互補(bǔ)。他預(yù)期研究人員以後甚至可用人工智能和機(jī)器學(xué)習(xí)等數(shù)碼技術(shù),進(jìn)行更深入的分析和整理。
因《三國(guó)演義》衍生對(duì)中史的興趣

於香港土生土長(zhǎng)的徐博士在學(xué)生時(shí)代會(huì)打關(guān)於《三國(guó)演義》人物的電玩,更衍生出對(duì)中史的興趣,大學(xué)本科毅然選讀北京大學(xué)歷史學(xué)系,後來(lái)主攻宋代歷史研究。他認(rèn)為既然想學(xué)習(xí)中國(guó)歷史,便值得到歷史發(fā)源地中國(guó)內(nèi)地鑽研學(xué)習(xí),北大自然是不二之選。大學(xué)的其中一年他回香港度假,並到城大中國(guó)文化中心聽(tīng)講座。他笑說(shuō):「當(dāng)時(shí)的講者談及歷史研究和電腦技術(shù)的結(jié)合,我聽(tīng)完只當(dāng)作是研究的嶄新方法,沒(méi)想到那就是我首次接觸數(shù)碼人文研究的相關(guān)概念。」
大學(xué)本科畢業(yè)後,他獲得羅德獎(jiǎng)學(xué)金到牛津大學(xué)攻讀博士學(xué)位,其間協(xié)助他的指導(dǎo)老師用數(shù)碼工具整理及研究宋代政界信息的流通,自此學(xué)術(shù)生涯與數(shù)碼人文結(jié)下不解緣。他亦將數(shù)碼工具用於自己對(duì)宋人書(shū)信的研究,尤其關(guān)注北宋書(shū)畫(huà)家米芾、名臣李綱和文官孫覿等人物的書(shū)信,分析他們的社交圈子。
大學(xué)本科畢業(yè)後,他獲得羅德獎(jiǎng)學(xué)金到牛津大學(xué)攻讀博士學(xué)位,其間協(xié)助他的指導(dǎo)老師用數(shù)碼工具整理及研究宋代政界信息的流通,自此學(xué)術(shù)生涯與數(shù)碼人文結(jié)下不解緣。他亦將數(shù)碼工具用於自己對(duì)宋人書(shū)信的研究,尤其關(guān)注北宋書(shū)畫(huà)家米芾、名臣李綱和文官孫覿等人物的書(shū)信,分析他們的社交圈子。
參與中國(guó)歷代人物傳記資料庫(kù)的工作
博士畢業(yè)之後,他到哈佛大學(xué)當(dāng)博士後研究員,參與「中國(guó)歷代人物傳記資料庫(kù)」(China Biographical Database Project, CBDB)的工作。中國(guó)歷代人物傳記資料庫(kù)的開(kāi)發(fā)工作由哈佛大學(xué)費(fèi)正清中國(guó)研究中心、中央研究院歷史語(yǔ)言研究所及北京大學(xué)中國(guó)古代史研究中心合作進(jìn)行,現(xiàn)時(shí)儲(chǔ)存了大約49萬(wàn)個(gè)生於七至十九世紀(jì)間中國(guó)人物的資訊,包括籍貫、社會(huì)交往關(guān)係、親屬關(guān)係等,讓外界作數(shù)碼分析之用。

徐博士認(rèn)為,該資料庫(kù)可以成為幫助學(xué)者研究歷史人物各方面的重要工具。舉例來(lái)說(shuō),他研究宋代歷史,傳統(tǒng)研究方法是埋首圖書(shū)館的典籍,細(xì)選史料再分析解讀。他說(shuō):「但窮一生之力,我們也不可能看完或精準(zhǔn)地把握所有的中國(guó)典籍。如果有電腦的協(xié)助,我們?cè)谘凶x之餘,在比較、篩選、分析海量的資料上,都會(huì)更具效率和規(guī)模?!?/p>
徐博士後來(lái)和當(dāng)時(shí)的同事把資料庫(kù)如何將資料數(shù)碼化、學(xué)者可以怎樣善用資料庫(kù)等議題,總結(jié)成題為《Harvesting Big Biographical Data for Chinese History : The China Biographical Database (CBDB)》的論文,並於《中國(guó)歷史學(xué)刊》(Journal of Chinese History)上發(fā)表,希望藉此推廣資料庫(kù),讓更多人善用這批數(shù)據(jù)了解中國(guó)歷史。
向各界推廣數(shù)碼人文研究的概念
徐博士於2019年加入城大,現(xiàn)時(shí)身兼人文社會(huì)科學(xué)院「數(shù)碼社會(huì)」研究群召集人。他認(rèn)為,數(shù)碼人文會(huì)為人文學(xué)科的研究帶來(lái)衝擊和新機(jī)遇,而與電腦科學(xué)等不同領(lǐng)域的學(xué)者合作,亦會(huì)帶來(lái)新的研究模式和意念,故積極推動(dòng)數(shù)碼人文相關(guān)發(fā)展,鼓勵(lì)校內(nèi)外的研究人員使用數(shù)碼工具。

2021年6月,徐博士便代表城大中文及歷史學(xué)系主辦了「再思中國(guó)人文的數(shù)據(jù)化:數(shù)碼人文網(wǎng)上工作坊」,邀請(qǐng)國(guó)際學(xué)者分享交流,約有280人在各地透過(guò)互聯(lián)網(wǎng)參與其中。
另外,徐博士與朋友於微信上開(kāi)設(shè)了一個(gè)名為《零壹Lab》的公眾號(hào),輪流發(fā)表他們本人以及指導(dǎo)年輕學(xué)生寫(xiě)下對(duì)科技與人文精神的反思,以起學(xué)術(shù)知識(shí)轉(zhuǎn)移之效。公眾號(hào)更獲得了2019年度數(shù)碼人文大獎(jiǎng)中「最佳數(shù)碼人文博客文章和系列文章」的第二名。徐博士解釋說(shuō):「這公眾號(hào)以『零』和『壹』取名,是源於電腦0和1的二進(jìn)制代碼,也代表我們公眾號(hào)團(tuán)隊(duì)在數(shù)碼人文、數(shù)碼文化範(fàn)疇中的新探索,就如由0跳到1,是令人振奮的開(kāi)端?!箶?shù)碼人文大獎(jiǎng)由來(lái)自世界各地的相關(guān)學(xué)者創(chuàng)立,旨在表?yè)P(yáng)對(duì)數(shù)碼人文有貢獻(xiàn)的單位和計(jì)劃,並由公眾提名及票選出得獎(jiǎng)?wù)摺?/p>
徐博士也在2021年5月於城大人文社會(huì)科學(xué)院為中學(xué)教師舉辦的活動(dòng)中,分享了歷史學(xué)者如何運(yùn)用資訊科技工具進(jìn)行研究,例如用地圖呈現(xiàn)唐代進(jìn)士和北宋進(jìn)士籍貫的對(duì)比,以及這些圖像化的呈現(xiàn)對(duì)教學(xué)有何幫助。

徐博士相信,數(shù)碼人文為學(xué)術(shù)界帶來(lái)的影響廣泛,不但促成跨學(xué)科的研究協(xié)作,亦協(xié)助研究人員突破長(zhǎng)篇大論的論文、專(zhuān)著的框框,例如以電子地圖及網(wǎng)上資料庫(kù)等較為新穎的方式呈現(xiàn)並發(fā)佈研究結(jié)果,既直觀又有根有據(jù)。更重要的是,數(shù)碼人文幫助研究人員處理零散及大規(guī)模數(shù)據(jù)的整理工作,令研究效率得以提高,也孕育出新的角度。
Newsletter Subscription: Research
Areas of Interest