让沉睡的智慧重新绽放光彩

我想给大家聊聊,最近我们搞了一个很有意思的项目,“我用AI校古籍”。这个项目是从2024年开始的,在2025年的总结会上我们取得了不少成绩。就在北京举办的“数智时代古籍数字化前沿论坛”上,卢伟教授还有首都师范大学敦煌学方向的博士生方晓辰等专家,还有好多志愿者都参加了这个活动。 这个项目一开始吸引了全国1450多所高校的2万名大学生还有1.7万名社会志愿者来帮忙。这么多人一起干,结果非常好,他们完成了大概15亿字的古籍粗校,总共覆盖了2万部古籍。这就像是给那些沉睡的智慧打了一针兴奋剂,让它们重新焕发生机。 说起这个项目的技术突破,其实最关键的就是AI。以前我们整理古籍需要花费大量时间和精力,“穷经皓首”的情况经常发生。现在有了AI,特别是OCR和NLP技术,真的是极大提升了效率。杨海峥教授说,高精度的OCR技术帮我们快速提取文字信息,还有AI在自动标点、分段这些方面表现得特别出色。 卢伟教授认为,AI技术不仅提高了效率,还弥补了人力处理海量文献的局限性。他强调,“人机协同”的新模式让学者们把更多精力放在关键问题上,而不是被繁琐的劳动拖累。张晓波就是一个很好的例子,他虽然是在机场工作的志愿者,但对历史古籍有着浓厚兴趣。他参与了《永乐大典》的精校工作,在和高校师生合作的过程中学习到了很多知识。 方晓辰也分享了她的感受。她处理《康熙字典》复杂字形的时候,平台的图像识别功能帮了大忙,再加上在线字典数据库,短短几秒钟就能搞定一个生僻字。这种便捷性让原本枯燥烦琐的工作变得轻松有趣。当她看到自己整理的古籍被上线引用讨论时,“让沉睡的文字活起来”的感觉真的很强烈。 这个项目不仅让古籍整理变得更高效,更重要的是激发了大家对传统文化的热情。北京大学中文系的杨海峥教授就说过,“大幅度节约校勘时间”可以让学者们有更多时间去做深度研究。公众参与进来以后,“文化符号”变成了可触摸、可参与、可分享的公共资源。 所以说这个项目意义重大。首先它为学术界提供了大规模、结构化的高质量数字文本基础;其次它激发了社会公众对传统文化的认知兴趣;最后它探索出了一条技术赋能文化遗产保护与传承的新路径。 未来随着技术不断迭代和协同模式优化,沉睡在故纸堆中的智慧一定会被更深入地唤醒和传播。这次“我用AI校古籍”项目就是一个很好的开端,证明了技术和平台能汇聚专业与大众力量,打破时空与知识壁垒。 大家不妨去试试这个平台吧!让我们一起让沉睡的智慧重新绽放光彩吧!