12月10日消息,2016年,中國(guó)文字博物館曾向公眾發(fā)出懸賞令,承諾每破譯一個(gè)甲骨文字便獎(jiǎng)勵(lì)10萬(wàn)元人民幣。然而直到2023年前,僅有一位學(xué)者憑借對(duì)“蠢”字的研究獲得了這份獎(jiǎng)金。
截至目前,已發(fā)現(xiàn)的甲骨數(shù)量接近16萬(wàn)片,其中包含約4500個(gè)不同的甲骨文字符。但遺憾的是,這些字符中只有大約1500個(gè)被成功解讀出來(lái)。
造成這一現(xiàn)象的主要原因包括:許多甲骨上的文字模糊不清、相似字形難以區(qū)分以及人工查找效率低下等挑戰(zhàn)。
為了加快甲骨文的解碼速度,騰訊公司構(gòu)建了一個(gè)包含超過(guò)143萬(wàn)個(gè)單字記錄的世界大甲骨文數(shù)據(jù)庫(kù),并利用數(shù)字技術(shù)實(shí)現(xiàn)了相似形狀和相關(guān)甲骨之間的匹配與關(guān)聯(lián)功能。該數(shù)據(jù)庫(kù)已于近期開源。
通過(guò)這個(gè)平臺(tái),用戶可以快速檢索到相關(guān)信息。例如,在搜索欄輸入“牛”,系統(tǒng)將返回3504種與之形態(tài)相近或相關(guān)的甲骨文樣本及其對(duì)應(yīng)的原始材料。
除此之外,騰訊還發(fā)布了首個(gè)多模態(tài)甲骨文數(shù)據(jù)集(涵蓋一萬(wàn)份甲骨拓片及摹本),詳細(xì)標(biāo)注了每個(gè)單字的具體位置及其所屬類別等信息,這一系列舉措有助于加速甲骨文被考釋的進(jìn)程。
本文鏈接:http://www.zh1234.com/news42897.html騰訊建全球大甲骨文單字?jǐn)?shù)據(jù)庫(kù):一個(gè)“?!庇?500種寫法