1. Vision 简介
2. Vision 研究动机
3. 什么是 DL-KOS
4. VISION 原型系统
5. VISION 深入研究

1.Vision 简介
   集成分类法、主题词表和语义元数据构造DL-KOS。

2.Vision 研究动机
   数字图书馆,Web时代知识经济环境下信息资源管理的智能机构, 其使命是提供对网络信息资源的知识管理。 这是解决当前Web信息环境的信息爆炸(信息的急剧增长超过了人们的处理能力) 和信息污染(垃圾信息和无关信息对人们获取有用信息的障碍)的有效手段。 实现网络信息资源的知识管理的关键是知识组织。VISION继承了传统图书馆 知识组织的悠久传统,结合Web社区信息资源组织和服务技术,提出了一条实 现数字图书馆知识组织的现实可行的、有效的方法——集成分类法、主题词表 和语义元数据构造数字图书馆的知识组织系统。

3.什么是 DL-KOS?
分类法和主题词表是传统图书馆最重要的知识组织工具,元数据是数字图书馆最宝贵的信息资源。VISION将这三者结合起来,构造数字图书馆的知识组织系统——DL-KOS。如下图所示:

 首先改造分类法和主题词表,形成一个由类目或同义词集合作为概念节点、以学科等级关系或概念语义关系作为边的概念网络;然后将各元数据记录按照它们的主题标引信息分配到对应的概念节点下,作为对应概念节点的文献实例,相当于元数据的“上架”。这样,结合了具体元数据记录的概念节点不仅包含抽象的概念,而且包含具体的文献实例,成为一个知识节点。上述概念网络就成为一个知识的网络——DL-KOS。

DL-KOS具有五大功能:
  1. 为DL资源的组织和管理提供了一个知识框架

  2. 为DL业已累积的元数据资源提供有效的利用手段

  3. 为用户提供了一个检索、服务、教育一体化的知识空间

  4. 一个自丰富、自增强、自适应的知识系统

  5. 实现DL知识管理的技术基础。

4.VISION 原型系统
VISION原型系统是以《中国分类主题词表》为基础构造的,所有的类目、 词汇即其间关系全部被导入系统。VISION系统目前集成了北京大学图书馆 提供的5000余条计算机领域的OPAC数据。DL-KOS用Oracle9i实现;前端 概念检索系统采用Java来实现。Oracle9i中丰富的面向对象技术,如嵌套表 和可变长数组,为DL-KOS中复杂对象的实现提供了支持。

DL-KOS的规模如下表所示:

词汇 概念 组配概念 类目 文献
120,951 102,624 58,011 27,099 5,069

VISION概念检索系统用户界面如下图所示:

 左侧窗口显示了概念网络,可以从学科分类、字顺、概念族三种方式查看概念网络;右侧中部窗口显示用户选取或查询的概念的信息,包括属于这一概念的词汇,上下位概念,所属类目等;右侧左上窗口用图形化的方式显示了给定概念和其它概念间的关系;右侧下部窗口是属于这个概念的所有书目数据。用户在VISION以知识点为基本单元(包括属于一个概念的所有词汇以及以此概念为主题的所有元数据)进行知识导航,定位了一个概念,也就定位了该概念在知识体系中的位置;用户可以从任何一个同义词出发,检索对应的概念和以之为主题的文献。查询不再需要在数据集合中进行关键词匹配,而是在概念网络进行概念检索。

  • VISION概念检索系统下载


  • 新词抽取与定位部分,应用基于bigram的统计方法解决新词提取问题;利用元数据记录中主题标引信息和标题间的语义对应关系,计算新词在DL-KOS中的位置。以下是新词频率阈值分别为3和5时,从5000余条书目记录中提取和定位的结果:

    新词提取

    阈值 抽取总数 正确提取 准确度
    3 1,139 1,051 92.3%
    5 638 610 95.6%

    专指词定位

    阈值 抽取总数 正确提取 准确度
    3 564 505 89.5%
    5 294 283 96.3%

     

  • 新词概念定位演示程序下载


  •  

    5.VISION 深入研究。
    基于DL-KOS的结构和已经取得的成果,KVision课题组正在深入研究的方向包括:
    1. 应用Semantic Web技术于DL-KOS的构造、表示、互操作;

    2. 新词提取和定位的深入研究:探索从元数据资源的文摘字段提取新词的技术。进一步,从全文文献提取新词并建立和已有词汇间的关系;

    3. 基于DL-KOS的应用研究:概念检索,自动标引:基于DL-KOS的个性化服务;

    4. 元数据资源扩展:寻求其它领域和其它类型的元数据资源,集成到DL-KOS中。以进一步验证DL-KOS的可应用性。


      本课题的研究得到了国家自然科学基金的资助。
    
      主页 | 科研项目 | 科研成果 | 小组成员 | 相关资源 | 学术论坛 | 教学课程 | TOP♂  
    Copyright 2003 OPAQUE. All Rights Reserved.