严承希同学完成在哈佛的交换学习返回学校

2020年10月10日

/images/blog/blog-11.jpg

严承希同学是北京大学数字人文实验室 16 级的情报学博士生,主要研究方向为自然语言处理、信息检索和数字人文。严博士得到学校与项目组的博士生资助计划,于 2019 年 9 月 15 日至 2020 年 9 月 14 日期间赴美国哈佛大学量化社会研究中心(IQSS)中国历代人物传记资料数据库项目组(CBDB)进行访学学习,师从知名汉学家、哈佛大学东亚语言与文明系教授 Peter K. Bol(包弼德)教授从事中华古籍文本的挖掘与分析工作。

在此期间,严博士与包教授合作完成了基于混合门技术的古籍命名实体抽取模型的开发,与其他 SOTA 模型相比至少可以提高 1.5%的 F1 值,相关研究发表在 IEEE ACCESS 期刊上;在 CBDB 前项目经理、IQSS 研究员王宏甦的指导下完成了 CBDB 全文本查询系统,并开发了一种融合查询扩展技术与可视化交互技术的智能查询扩展组件。为了更好地提升在做人文学者使用计算机编程技术在 CBDB 数据库的课题探索和量化分析,严博士在 2019 年 11 月 22 日了分享了“基于 python 的 CBDB 数据库数据分析与挖掘”的报告,通过多个案例与重要的 python 开发包展现了数据清洗、数据查询、可视化以及社会网络分析等处理技术与方法的具体步骤与相关结果,

详细请见: 数据分析和中国历代人物传记资料库(Python and CBDB) (opens new window)

总的而言,在这次哈佛大学 IQSS 的访问学习过程中,严博士先后参加了哈佛大学多个跨专业课程的学习以及不同学科的学者与团队主持的工作坊和讨论会,在技术、方法和理论层面得到了显著提高,同时进一步拓展了研究国际研究视野。

logo

© 2020-2024 北京大学数字人文研究中心

地址:北京市海淀区颐和园路 5 号北京大学方李邦琴楼

邮箱:gdhc@pku.edu.cn

微信公众号:数字人文开放实验室