9月18日,由鳳凰傳媒牽頭、江蘇人民出版社聯(lián)合同方知網(wǎng)數(shù)字科技有限公司共同打造的“抗戰(zhàn)史人工智能數(shù)據(jù)庫(kù)”在南京正式上線。
![]()
![]()
“抗戰(zhàn)史人工智能數(shù)據(jù)庫(kù)”依托大模型、知識(shí)圖譜、OCR 識(shí)別、語(yǔ)義理解等核心技術(shù),將中國(guó)抗戰(zhàn)有關(guān)的圖書資源及期刊文獻(xiàn)進(jìn)行一系列數(shù)字化加工、結(jié)構(gòu)化標(biāo)引、知識(shí)細(xì)粒度處理、內(nèi)部資源管理、多元化應(yīng)用服務(wù)、智能問(wèn)答與可視化展示等處理,構(gòu)建成集資源管理、學(xué)術(shù)研究、教育普及、展示傳播、智能服務(wù)于一體的“抗戰(zhàn)知識(shí)服務(wù)平臺(tái)”。
鳳凰出版?zhèn)髅郊瘓F(tuán)黨委書記、董事長(zhǎng)章朝陽(yáng)在致辭中表示,運(yùn)用現(xiàn)代科技手段,對(duì)浩如煙海的抗戰(zhàn)史料進(jìn)行系統(tǒng)的、搶救性的數(shù)字化整合與開(kāi)發(fā),打造一個(gè)權(quán)威、全面的資源平臺(tái)非常重要,“抗戰(zhàn)史人工智能數(shù)據(jù)庫(kù)”在搭建中一方面力求內(nèi)容的權(quán)威性與系統(tǒng)性,另一方面注重技術(shù)的先進(jìn)性與便捷性,此外,該數(shù)據(jù)庫(kù)還凸顯了教育的功能與時(shí)代性,引導(dǎo)讀者進(jìn)一步深入學(xué)習(xí)和了解抗戰(zhàn)史。
同方知網(wǎng)數(shù)字科技有限公司總經(jīng)理張宏偉表示,“抗戰(zhàn)史人工智能數(shù)據(jù)庫(kù)”是人工智能與出版深度融合的一次重要突破。它絕非簡(jiǎn)單的史料數(shù)字化,而是以人工智能技術(shù)為核心,對(duì)海量歷史資源進(jìn)行深度挖掘、智能關(guān)聯(lián)和知識(shí)重構(gòu)的成果。它提升了歷史研究的效率與深度,拓展了歷史知識(shí)的傳播邊界。數(shù)據(jù)庫(kù)的上線發(fā)布,標(biāo)志著抗戰(zhàn)史研究從傳統(tǒng)文獻(xiàn)檢索模式邁向問(wèn)答式知識(shí)服務(wù)新范式。
江南大學(xué)原黨委書記、南京大學(xué)中華民國(guó)史研究中心主任朱慶葆從學(xué)術(shù)的角度談?wù)撛摂?shù)據(jù)庫(kù)的價(jià)值所在,“我作為一名長(zhǎng)期從事中華民國(guó)史,尤其是抗戰(zhàn)史研究和教學(xué)的工作者,深知史料是歷史理論的基石,是連接過(guò)去與未來(lái)的橋梁,抗戰(zhàn)史人工智能數(shù)據(jù)庫(kù)的建設(shè)回應(yīng)了在新的時(shí)代條件下,歷史資源如何保存、如何發(fā)揮資政育人、啟迪未來(lái)作用的時(shí)代課題,這不僅是一個(gè)技術(shù)工程,更是一條承載深遠(yuǎn)歷史意義和文化使命的工程?!?/p>
南京大學(xué)圖書館黨總支書記羅鈞同樣肯定了抗戰(zhàn)史人工智能數(shù)據(jù)庫(kù)的建設(shè)回應(yīng)了時(shí)代的需求,“對(duì)珍貴史料利用數(shù)字化手段使其煥發(fā)新的生命力,服務(wù)于學(xué)術(shù)研究、社會(huì)教育和文化傳播是我們面臨的重要課題和時(shí)代機(jī)遇,抗戰(zhàn)史人工智能數(shù)據(jù)庫(kù)匯聚大量珍貴史料,不僅有效延長(zhǎng)了文獻(xiàn)的生命周期,更是為學(xué)界和社會(huì)公眾構(gòu)建了一個(gè)內(nèi)容全面、結(jié)構(gòu)清晰的抗戰(zhàn)史資料體系”。
南京市社科聯(lián)主席、黨組書記曹勁松從社科工作者的角度,認(rèn)為抗戰(zhàn)史人工智能數(shù)據(jù)庫(kù)有助于促進(jìn)人文經(jīng)濟(jì)中知識(shí)庫(kù)價(jià)值鏈的拓展,“根據(jù)不同主題構(gòu)建數(shù)字知識(shí)庫(kù),既是人文經(jīng)濟(jì)在滿足人們自身知識(shí)構(gòu)建和精神成長(zhǎng)的現(xiàn)實(shí)需求,又是文明發(fā)展在促進(jìn)人類知識(shí)積累和探索創(chuàng)新的智慧驅(qū)動(dòng),成為數(shù)字時(shí)代人們從技術(shù)生存走向智慧生存的基礎(chǔ)性建設(shè)”。
![]()
![]()
抗戰(zhàn)史人工智能數(shù)據(jù)庫(kù)內(nèi)容非常豐富,總文字體量超億字,其中不乏名著名作,包括《南京大屠殺史料集》《抗日戰(zhàn)爭(zhēng)專題研究叢書》《抗戰(zhàn)為什么贏》《抗戰(zhàn)旗幟毛澤東》等。其功能分成四個(gè)板塊,智能檢索板塊對(duì)史料進(jìn)行數(shù)字化處理,利用數(shù)字化加工工具和AI工具對(duì)這些文本進(jìn)行了語(yǔ)義分析、分類和索引,提取關(guān)鍵詞、主題,用向量空間模型,語(yǔ)義相似度計(jì)算等技術(shù)以自然語(yǔ)言形式生成回答。知識(shí)圖譜板塊利用先進(jìn)的自然語(yǔ)言處理技術(shù),從文獻(xiàn)等相關(guān)知識(shí)中獲得的大量抽取有價(jià)值的知識(shí)信息,識(shí)別出具有特定意義的實(shí)體,提供面向知識(shí)圖譜構(gòu)建的智能化輔助。時(shí)間軸板塊將人物、事件、機(jī)構(gòu)、地理的三元關(guān)系中的時(shí)間屬性進(jìn)行梳理和標(biāo)引,按照時(shí)間的演進(jìn),把重大歷史事件、歷史人物生平中涉及的各類實(shí)體和實(shí)體關(guān)系展示出來(lái)。抗戰(zhàn)搜問(wèn)板塊為用戶提供智能問(wèn)答服務(wù),并從全文數(shù)據(jù)庫(kù)中提取知識(shí)片段,為用戶提供簡(jiǎn)潔明了的答案,回答真實(shí)可信,并提供知識(shí)溯源、圖書溯源、相關(guān)文獻(xiàn)、推薦圖片、推薦問(wèn)題、專題問(wèn)答等服務(wù),這是全國(guó)首個(gè)具有智能化功能的抗戰(zhàn)史數(shù)據(jù)庫(kù)。
未來(lái),抗戰(zhàn)史人工智能數(shù)據(jù)庫(kù)將走進(jìn)博物館、圖書館和各類學(xué)校中,為廣大用戶提供服務(wù)。
揚(yáng)子晚報(bào)|紫牛新聞?dòng)浾?沈昭
視頻|沈昭