《论语》文本复用可视化平台

/images/portfolio/lyfy.png 访问系统

对历时性古籍语料进行文本处理和分析,以可视化方式呈现《论语》在中国儒家文献的互文联结关系。

# 平台简介

记录孔子及其弟子思想言行的语录文集《论语》被尊为“五经之輨辖,六艺之喉衿”,所承载的先秦儒家思想对后世儒学著作影响深远。历朝历代援引论语语录的文学作品不计其数,平台旨在针对《论语》的复用互文现象提供交互式可视化功能。

# 数据来源

本项目自《中国学术名著提要-哲学卷》中选取了136部儒藏经典作为文本复用检索的参考语料集合,所选数据集的成书时间跨越先秦到近代,字符数总计2449万。

# 数据加工

为了高效分析和展示《论语》文本的复用情况,平台采用了语料结构化处理、属性标注以及复用抽取技术。通过这些技术,平台能够识别和展示《论语》在不同历史时期及不同儒家经典中的复用情况,为用户提供丰富的历史和思想演变视角。

# 研究内容

  • 文本复用识别:采用近似最长公共子串算法自动识别《论语》在136部自先秦至晚清的儒家典籍中的文本复用片段。

  • 多粒度统计分析:从篇目、章节、短语三个粒度定量分析复用情况,揭示儒家思想的广泛传播与影响。

  • 历时演变分析:考察不同历史时期《论语》文本复用频次及主题变迁,以映射社会历史背景与儒学地位的演化。

logo

© 2020-2025 北京大学数字人文研究中心

地址:北京市海淀区北京大学资源东楼 1406 室

邮箱:gdhc@pku.edu.cn

微信公众号:数字人文开放实验室