古籍智能整理志愿者大会成功举办

2024年3月4日

/images/blog/blog-32/1.png

2024年1月21日晚19时,北京大学数字人文研究中心于线上成功举办了 “2023年度北京大学数字人文研究中心古籍智能整理志愿者大会”。 北京大学数字人文研究中心致力于利用智能技术保存和整理中国古典文献,开发和建设大众阅读、大众加工、大众使用的智能古籍文献平台。为此目标,我们面向社会组建了一支高水平“古籍智能整理志愿者团队”。这个团队继承了中国千余年来依靠民间力量刻印、传承、保存文化典籍的传统,通过开放共享的模式、利用社会资源、动员大众参与、运用智能技术,开创了智能时代传承和传播中国古典文献的新模式。 目前,北大数字人文研究中心的志愿者团队有近160人,他们以在校大学生为主,也有高校、图书馆和出版社等文化单位的从业人员。志愿者大多为文史哲相关专业出身,也有部分具备信息管理和计算机科学与技术等理工科背景,这充分体现了数字人文的跨学科属性。志愿者们拥有对古籍传承事业的高度热情和对数字人文领域的热爱,因为共同的理想而汇聚为一股力量。 本次会议旨在回顾2023年度志愿者团队在数字人文研究方面取得的进展与成果,表彰工作中涌现的优秀志愿者个人,分享志愿者代表在工作中的收获和对未来的展望,并提出对未来一年工作的目标和规划。会议由数字人文中心伞红雷老师主持。

# Part 01 开幕式

会议伊始,北京大学数字人文研究中心王军主任发表致辞,感谢志愿者一年来的辛勤付出,并充分肯定了民间力量在中国典籍传承中的关键作用。他提及了古籍整理的复杂性,肯定了中心与志愿者共同推动古籍数字化,特别是在整理、标注和古籍传承方面的卓越努力。王军老师将北大数字人文研究中心的工作宗旨总结为智能时代的 “整理国故,再造文明”(上世纪初由胡适先生提出),即在整理传统文献典籍的基础上,将中国古典文献与现代技术和世界文化相结合,开创出新的文化形态。此外,他还简要介绍了2024年数字人文中心的愿景,包括推出古籍智能系列课程和新技术的探索,旨在建立一个数字人文社区,致力于培养能够综合利用各种手段、连接古今东西的人才,激发志愿者团队的创造力,为古籍数字化事业贡献更大的力量。

随后,北京大学数字人文研究中心副主任杨浩老师作年度工作总结报告。杨浩副主任对志愿者团队工作进行了总结,回顾了团队的成立背景与发展过程。他提及志愿者根据不同项目分组合作,参与古籍整理与数据标注等工作,并期许志愿者能够在工作中学习到前沿技术和理念,成为数字人文研究的生力军和后备力量。同时,他对组织工作中存在的问题进行了反思,并展望了未来改进的方向和目标。

#

志愿者代表陈宇航分享了他参与志愿者工作和线下实习的经历,强调了跨学科合作中的收获。志愿者代表韩静雯分享了加入数字人文中心的历程,同时表达了对档案数据库建设及人工智能技术未来发展的期许。

# Part 02 古籍整理项目总结报告

志愿者团队古籍整理项目负责人伞红雷回顾了2023年数字人文中心的古籍整理志愿者项目,并介绍了古籍整理平台的新进展。

志愿者刘钰昕汇报了“《四部丛刊》古籍整理”进展,并分享整理经验,强调了兴趣、知识、熟练、耐心、尊重原著及团队协作的重要性。

#

志愿者陈家璇分享了参与“百衲本《二十四史》文字精校”的经历,强调该项目的学术价值及整理中获得的宝贵经验。

#

志愿者樊海东在其发言中回顾了“增强阅读”在古代注疏学中的应用,指出了传统古籍注解方式存在的局限性,并展示了“识典古籍”平台如何提升阅读体验,如何通过数字技术解决了传统注疏读法的不便之处。

#

志愿者梁晨阳介绍了古籍元数据的著录工作,并强调查阅资料后精准著录和提要撰写的重要性。

#

志愿者熊昊就“《道藏》古籍结构整理”项目发言,阐述了《道藏》的历史背景、整理流程及电子化对学术研究的推动。

#

展开讨论: 报告结束后,与会人员就 “古籍智能整理的未来畅想” 这一题目展开了热烈的讨论。志愿者朱美林认为数字时代人人可参与古籍整理,应普及数字古籍整理的理念,他强调了共享的重要性,期待创建更好的古籍整理平台以促进学术工作。志愿者林桔莹讨论了数字人文在文献学方面应用的潜力,特别是校勘工作的自动化和大数据规则设定的重要性。志愿者张伟在讨论中提出将智能技术应用于古籍修复中的潜能,以增强读者的阅读体验。

# Part 03 数据标注项目总结报告

志愿者团队数据标注项目负责人邓泽琨介绍了参与数据标注工作的经历,并强调学科交叉与技术发展对该领域的影响,期待志愿者进一步的贡献和创新。

志愿者韩静雯分享了参与“二十四史命名实体识别”项目的经历,强调个人在阅读中对古代制度和数字人文理解方面的收获。

#

志愿者朱慧介绍了“指代消解和互文性标注”的定义与重要性,她设想了若干未来研究的方向,如《资治通鉴》专书研究、同名地名指代消解分析、苏轼互文性个案研究等。

#

志愿者朱韶华总结了“人文对话AI”的工作,他希望人文AI能够对更复杂的问题做出更加精准的回答,并期待引入更多历史人物形象的AI对话系统,以及实现多媒体融合的AI体验。

#

志愿者田梦怡就“诗词鉴赏抽取”项目发言,介绍了构建古诗鉴赏框架的过程以及知识抽取面临的挑战。

#

志愿者尹鹏宇分享了AI和人类在文学创作上的差异以及诗词实验的体验及感悟。

#

展开讨论: 报告结束后,与会人员讨论了 “数字人文的创新与未来”主持人邓泽琨指出了AI技术的发展给志愿者带来的变革,强调必须提升个人技能以适应时代。志愿者谭惠予分享了数字人文教育的发展趋势,阐明数字人文领域的交叉性和应对人工智能挑战的思考。志愿者王颖慧分享了图书馆学在数字时代的创新以及古籍数字人文的研究热点。他指出技术难点包括OCR识别和文本处理,并提及AIGC带来的影响和挑战。志愿者刘钰昕认为数字人文的协作应以人文意识为核心,技术为辅助,以推动人文学科发展。

# Part 04 王军主任总结发言

会议中,北大数字人文研究中心主任王军教授对志愿者工作进行了全面规划。

#

他强调识典古籍平台具有独特吸引力,吸纳了一批具备古籍知识的同道。在当今信息爆炸的环境下,这种凝聚具有难得的价值,同时也蕴含着丰富的发展机遇。他还着眼于人才培养,呼吁建立古籍整理社区,结合数字技术创新,推动传统典籍的传播,甚至开创新的文化产品形式。通过课程与社群的建设,提升志愿者的综合素养、跨学科合作能力、交流能力和科研探索能力。王军教授还提出了古籍整理工作的未来计划,强调推进儒释道核心典籍高质量文本的加工与向公众开放的重要性,以促进中国典籍在互联网上的存量增长,进而推动其传播和研究利用。此外,王军教授还就人工智能对人文学科的影响进行了深入探讨,指出古籍整理工作是应对人工智能挑战的一种策略尝试。他认为即使机器的能力全面超越了人类,最终也应该服务于人类本身,人文是技术的落脚点。

# Part 05 闭幕式

在2023年北大数字人文研究中心志愿者大会闭幕式上,数字人文中心副主任杨浩老师对志愿者的辛勤工作以及所取得的成就表示了高度肯定。他介绍了中心将于2024年开展的整体发展规划,包括扩大团队规模,特别是吸引和培养具有技术背景的志愿者与教师,以推动建设一个更富有活力的学术社区。杨浩老师阐述了未来的工作重点,包括优化古籍智能处理的全流程、提升数据标注的工作效率、构建拥有技术专长的团队、培养产品设计和创意思维能力,以及开办多种线上课程来提高志愿者的能力和专业知识。他对志愿者团队的未来充满信心,期待他们通过参与中心的项目丰富个人经验,进而为学术界做出贡献。

logo

© 2020-2024 北京大学数字人文研究中心

地址:北京市海淀区北京大学资源东楼 1406 室

邮箱:gdhc@pku.edu.cn

微信公众号:数字人文开放实验室