在近日舉行的“中俄數(shù)字經(jīng)濟(jì)示范項(xiàng)目——數(shù)字人文技術(shù)直播”活動(dòng)上,,中華農(nóng)業(yè)文明研究院數(shù)字人文研究中心包平,發(fā)表了自己對(duì)數(shù)字時(shí)代歷史研究發(fā)展的看法。
為什么要做這項(xiàng)工作,?包平解釋:中國(guó)有一個(gè)特殊歷史文獻(xiàn)方志,之前叫地記,、圖經(jīng),,是一種中華獨(dú)有的歷史文獻(xiàn),據(jù)中華書局《中國(guó)地方志聯(lián)合目錄》 (1985)記載,,我國(guó)歷代(南朝宋至1949)方志8200余種,;收錄范圍:通志、府,、州,、廳、縣志,、鄉(xiāng)土志,、里鎮(zhèn)志、衛(wèi)志,、所志,、關(guān)志、島嶼志,,以及一些具有志書體例和內(nèi)容的方志初稿,、采訪冊(cè)、調(diào)查記等,,山,、水、寺廟,、名勝等志除外,;據(jù)《中國(guó)數(shù)字方志庫(kù)》,收錄11000種,,這里還有旅游志和一部分國(guó)外的,,我們現(xiàn)在正在普查,對(duì)地方志里記載有物產(chǎn)的都收集起來(lái),,盡可能把國(guó)內(nèi)外收集全,。地方志古籍文獻(xiàn)約占中華古籍十分之一,。
很長(zhǎng)一段時(shí)間,數(shù)字化和網(wǎng)絡(luò)化技術(shù)還沒(méi)有發(fā)展,,我們用手工方式把手抄本資料進(jìn)行專題提煉,,曾經(jīng)出過(guò)八個(gè)專題。后來(lái)在這個(gè)基礎(chǔ)上開(kāi)展一些專題研究,,出版了一些專著,。王利華教授曾飽含深情的回憶:“一度雄心勃勃地想要從人的生物屬性和自然環(huán)境因素出發(fā)重新解說(shuō)中國(guó)史,于是利用中國(guó)農(nóng)業(yè)遺產(chǎn)研究室所珍藏的大量動(dòng)植物文獻(xiàn),,開(kāi)始寫些不倫不類的文章”,;恰恰是這些交叉性的思維,構(gòu)建了他中國(guó)環(huán)境史的理論體系,。
包平表示,,當(dāng)前正在構(gòu)建"數(shù)字人文+科技史研究"的模式,開(kāi)展數(shù)字人文研究基礎(chǔ)設(shè)施,。自2008年開(kāi)始,,基于內(nèi)容的智能知識(shí)組織與知識(shí)挖掘,已解決或正在解決的技術(shù)問(wèn)題:
1,、古籍資源收集,、整序、??迸c知識(shí)庫(kù)構(gòu)建技術(shù),。這個(gè)永遠(yuǎn)在路上,因?yàn)橘Y料本身有殘缺,,也有一些誤傳,,這里工作一直要做,我們有基礎(chǔ)團(tuán)隊(duì)在做這項(xiàng)工作,。
2,、標(biāo)注標(biāo)準(zhǔn)的建立與本體構(gòu)建?;谶@些素材庫(kù)怎么樣建立一些標(biāo)準(zhǔn),建立一些規(guī)范,,建立計(jì)算機(jī)識(shí)別進(jìn)一步加工中間的素材庫(kù),。
3、實(shí)體的智能識(shí)別優(yōu)化方案目前我們做了多套方案,,從當(dāng)初的規(guī)則和統(tǒng)計(jì),,到最后調(diào)節(jié),到現(xiàn)在深度學(xué)習(xí)等等,。
4,、知識(shí)重組,、再造與活化,將來(lái)這套資料碎片化,,經(jīng)過(guò)精準(zhǔn)標(biāo)注,,根據(jù)需求重組再造,應(yīng)用活化,。
5,、基于GIS和社會(huì)網(wǎng)絡(luò)德克士華時(shí)空關(guān)聯(lián)展示與分析。
6,、數(shù)據(jù)源不同展示,。
數(shù)字時(shí)代歷史研究的現(xiàn)實(shí)需求,數(shù)據(jù)時(shí)代可在當(dāng)下和未來(lái)使史學(xué)家成為數(shù)據(jù)文獻(xiàn)專家,;計(jì)量史學(xué)讓習(xí)慣于歸納和演繹的傳統(tǒng)學(xué)者打開(kāi)了新的觀察和分析問(wèn)題的視角,,"數(shù)據(jù)"與"問(wèn)題"驅(qū)動(dòng)相互驗(yàn)證、啟發(fā),;結(jié)合微觀史精于處理文獻(xiàn)的優(yōu)勢(shì),,學(xué)會(huì)采用大圖景、大歷史的研究維度,,讓史學(xué)與其他學(xué)科融會(huì)貫通,、更好地服務(wù)于現(xiàn)實(shí)需求與社會(huì)發(fā)展。