《科图法》SKOS描述方案设计
张士男, 宋文
中国科学院国家科学图书馆 北京 100190
摘要

调研SKOS及其应用案例,论述《科图法》SKOS化描述的技术方法,探索《科图法》中复分表SKOS化的实现思路,为其他中文知识组织体系实现SKOS描述提供借鉴。

关键词: 知识组织; 《科图法》; SKOS; 描述方案
中图分类号:G25
Description Scheme of LASC in SKOS
Zhang Shinan, Song Wen
National Science Library,Chinese Academy of Sciences, Beijing 100190,China
Abstract

Based on the research of SKOS and its applications, a technique for converting LASC to SKOS is described, the method of dealing with auxiliary tables in LASC is also explored. This paper can provide references for the other Chinese knowledge organization systems in implanting SKOS.

Keyword: Knowledge organization; LASC; SKOS; Description scheme
1 《科图法》SKOS描述方案设计的背景
1.1 知识组织体系网络化服务的必要性

数字环境下,越来越多的科研信息以数字化形式出现,重要的信息组织工具和知识组织体系的应用场景也发生了巨大变化,科研综合数字信息环境已经形成,传统知识组织体系的电子化、网络化是其在网络环境下应用的主要形式之一[ 1]。知识组织体系建设是一项系统工程,是推动科技文献信息服务向知识服务转变的基础与核心,有效实现数字科研信息的组织势在必行。与外文科技知识组织体系相比,中文知识组织体系的网络化服务还存在很大发展空间。本文以《科图法》为例,对中文知识组织体系通过简单知识组织系统(Simple Knowledge Organization System,SKOS)编码实现网络化服务的可行性与必要性进行了探索。

1.2 中文知识组织体系SKOS化描述的可行性

SKOS是由W3C提出的一种编码语言,它试图将传统的知识组织规范以RDF方式编码,以实现提供“机器可读”的能力。事实上,SKOS就是一套表现Resource Types(Classes)和Link Types(Properties)的系统编码。SKOS词表主要是由skos:Concept实例构成,成为以URI标识的“思想单元”,其概念都有词汇标签、说明文本以及指向其他概念的丰富语义链接。2005年至今,W3C相继发布了SKOS Core Guide、SKOS Core Vocabulary Specification、SKOS Simple Knowledge Organization System Primer、SKOS Simple Knowledge Organization System Reference和SKOS Use Cases and Requirements[ 2]。这些规范文档详细说明了SKOS的核心词汇及应用指南,使应用SKOS更好地实现知识组织体系的知识管理和语义处理成为可能。

2009年初,DDC(http://dewey.info)[ 3]与LCSH(http://id.loc.gov)[ 4]相继以SKOS发布。WebDewey采用W3C标准SKOS语言进行描述,开始变身关联数据(但OCLC目前只开放了三级类号),实现了与美国国会主题词表(LCSH)的映射和医学主题词表(MeSH)的选择性映射。美国国会图书馆主题词表LCSH以SKOS 编码,使整个LCSH成为“关联数据”(Linked Data),在其网站上公布了全部SKOS源码,并可被下载。同时采用可视化的方式表达主题概念相互之间的关系,使LCSH在网络时代成为更加共享、广泛的知识内容,通过采用SKOS把全部LCSH变身为语义网应用。这些权威、经典的外文知识组织体系的SKOS编码实现及应用为探索中文知识组织体系SKOS描述方案的设计带来了很大启发。

中文知识组织体系的SKOS化描述也有相应研究,Zeng[ 5]等对《中国分类主题词表》SKOS转换进行了深入讨论和试验,并在DC-2008会上发布了试验成果,分析了SKOS应用于汉语主题分类词表编码方面的可行性、存在的问题及发展方向,探讨了对复分表、skos:notation等的处理方法。刘丽斌[ 6]等以程序设计语言、数据库查询语言为基础,提出了将《中国分类主题词表》电子版自动转换为SKOS描述形式的构想,并进行了具体实践,但是对于《中国分类主题词表》的附表部分在语义网环境下如何实现SKOS描述尚没有明确研究。分析发现对中文知识组织体系SKOS化转换的研究集中在《中国分类主题词表》,目前处于讨论和试验阶段,存在很多问题尚未解决,如仿分复分的处理。

2 《科图法》SKOS描述方案设计

SKOS包括SKOS Core、SKOS Mapping和SKOS Extensions,其中SKOS Core发展比较成熟,已经形成了相应的语法标准和应用标准,对《科图法》SKOS描述方案的设计主要应用SKOS Core词汇,SKOS Core词表是本体语言RDF(S)的应用,由网络联盟(W3C)语义网(Semantic Web)最佳实践和部署工作小组(Best Practice and Deployment Working Group)发布并维护[ 7],按照其应用场景,将在方案设计中应用到的SKOS Core词汇划分为概念框架标签、概念标签、词汇标签、语义标签和说明性标签。

2.1 概念框架描述方案设计

SKOS中与概念框架相关的词汇包括:概念框架(skos:ConceptScheme)、属于(skos:inScheme)、顶级概念(skos:hasTopConcept)。概念框架用来声明某个资源是一个概念框架。属于属性用来声明一个概念包含于一个概念框架。顶级概念属性用来声明在某个概念框架中,一个概念链的顶级概念是什么,一个概念框架可以有多个顶级概念[ 8]。实际上,每部知识组织体系可以看作是一个概念表,即KOS内所有概念及概念之间的语义关系的集合,将整部《科图法》看作一个概念框架,一级类目作为顶级概念,每个类目均属于整个概念框架。因此通过skos:ConceptScheme和skos:hasTopConcept对整部知识组织体系进行概括说明,在每个类目中通过skos:inScheme说明其属于关系,并在对整部知识组织体系进行概括描述之前,事先定义其命名空间等内容。《科图法》概念框架的SKOS描述方案设计如下:

<? xml version="1.0" encode="UTF-8"?>

<!DOCTYPE rdf:RDF[]>

<rdf:RDF

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"

xmlns:skos="http://www.w3.org/2004/02/skos/core#"

xmlns:base="http://www.las.ac.cn/lasc">

<skos:conceptScheme rdf:about="#LASC">

<dc:title>中国科学院图书馆图书分类法</dc:title>

<dc:creator>中国科学院图书馆</dc:creator>

<skos:hasTopConcept rdf:resource="#51"/>

<skos:hasTopConcept rdf:resource="#52"/>

…………

</skos:ConceptScheme>

2.2 概念描述方案设计

概念(Concept)是SKOS词汇中的基本组成单元,用来标注独立的抽象实体[ 9]。SKOS引入了skos:Concept来声明概念,可通过两步建立概念:创建或重用URI为概念建立唯一标识;应用RDF的属性描述对URI加以声明。将《科图法》的每个类目看作是一个概念,用skos:Concept加以声明,将其设为必备字段,同时采用rdf:about声明URI。URI要求满足唯一性,鉴于分类法中类号唯一的特点,采用分类号作为URI内容。

《科图法》概念SKOS描述语句格式为:

<skos:Concept rdf:about=“#分类号”></skos:Concept>

应用场景描述如下,如果原稿内容为“51 数学”,则其SKOS描述语句为:

<skos:Concept rdf:about=“#51”></skos:Concept>

2.3 类名描述方案设计

概念的首要特征就是用于表达其自然语言:标签。SKOS提供了三个属性标签来表达概念资源,即skos:prefLabel,skos:altLabel和skos:hiddenLabel。这些属性被明确地定义为两两不相交,即如果同一概念、同一语种的首选标签和交替标签同名,则出错。skos:prefLabel是用于说明概念资源的首选词汇标签,一个概念中可以包含多个语种的首选词汇标签,但每个语种只能有一个首选标签;skos:altLabel是用于说明概念资源的交替词汇标签,当可用多个词汇标签表示同一概念时,可采用此词汇标签[ 10];skos:hiddenLabel是用于说明概念资源的交替隐藏标签,如错误但有入口作用的其他词汇标签。《科图法》每个类目是一个概念,每个类目至少对应一个类名,用首选词汇标签来表达类名,则每个概念中有且只有一个skos:prefLabel,用交替词汇标签来表达类名的同义词,则每个概念中可能有0个、1个或多个skos:altLabel,类目没有同义词时,交替标签为0个,有同义词时,则有1个或多个(类目的同义词在《科图法》中用小括号表示),通过xml:lang="cn"标识其语种为中文,设计方案如表1所示:

表1 类名描述方案设计

《科图法》类名SKOS描述语句格式为:

<skos:prefLabel xml:lang="cn">首选标签</skos:prefLabel>

<skos:altLabel xml:lang="cn">交替标签</skos:altLabel>

应用场景描述如下,如果原稿内容为“51.51 几何基础(几何原理)”,则其SKOS描述语句为:

<skos:prefLabel xml:lang="cn">几何基础</skos:prefLabel>

<skos:altLabel xml:lang="cn">几何原理</skos:altLabel>

2.4 语义关系描述方案设计

(1)层级语义关系描述方案设计

SKOS包含了丰富的表示语义关系的标签,有表示层级关系的skos:broader,skos:narrower,skos:broaderTransitive,skos:narrowerTransitive和表示相关关系的skos:related。其中,skos:broader和skos:narrower是一组互逆标签,skos:broaderTransitive和skos:narrowerTransitive是一组互逆标签,尽管两组标签都表示层级关系,用于和其上下级位类建立关联,但也存在一定差别,最明显的是skos:broaderTransitive和skos:narrowerTransitive明确了类目间语义上的传递性,而skos:broader和skos:narrower则没有明确[ 11]。举例说明,如果A skos:broader B,B skos:broader C,则无法确定A一定skos:broader C;如果A skos:broaderTransitive B,B skos:broaderTransitive C,则一定有A skos:broaderTransitive C。

《科图法》是层累制的分类法,每一个类目的语义主要通过分类等级表达,下级类目间存在明确的语义传递性,即在同一个概念中,一级类目是二级类目的上位类,二级类目是三级类目的上位类,则一定有一级类目是三级类目的上位类,因此在《科图法》SKOS描述方案设计中选用了具有语义传递性的skos:broaderTransitive和skos:narrowerTransitive这一组互逆标签来表示上下位类目的层级关系,并将其设为必备字段,设计方案如表2所示:

表2 层级语义关系描述方案设计

对《科图法》进行语义描述时,涉及到对资源的引用,在RDF中要引用已经说明的资源,需要用rdf:resource特性,且引用和被引用资源属性值都需要用“#”加以标识[ 12]。因此,《科图法》中层级语义关系的SKOS描述语句格式为:

<skos:broaderTransitive rdf:resource="#相邻上位类号"/>

<skos:narrowerTransitive rdf:resource="#相邻下位类号"/>

应用场景描述如下,如果原稿中“51.52 解析几何学”的相邻上位类是“51.5几何、拓扑”,相邻下位类有“51.521初等解析几何学”和“51.523高等解析几何学”,则“51.52解析几何学”这一概念的相关SKOS描述语句为:

<skos:broaderTransitive rdf:resource="#51.52"/>

<skos:narrowerTransitive rdf:resource="#51.521"/>

(2)相关语义关系描述方案设计

SKOS通过skos:related语义标签来实现具有关联但又不是层级关系的类目的描述[ 13],一个类目可以与多个类目通过该标签实现关联。在《科图法》中存在大量这种关系的类目,主要以“参见…”、“宜入…”等形式出现,应用skos:related描述类目的相关关系,有以下几种形式:与一个相关类目关联,用一个skos:related建立关联;与多个不连续类目关联,用多个skos:related建立关联;与多个连续类目关联,用一个skos:related与其相邻上级类目建立关联。并不是每个类目都有相关类目,因此将skos:related设为可选字段,用于与相关类目(上下级类目除外)建立关联。

《科图法》中相关语义关系的SKOS描述语句格式为:

<skos:related rdf:related="#相关类号"/>

应用场景描述如下,如果原稿中类目“51.58 代数几何学”中注明该类目可参见51.487,则其SKOS描述语句为:

<skos:related rdf:resource="#51.487"/>

2.5 类号描述方案设计

2008年6月,更新的SKOS工作草案新增“skos:notation”属性专门用来处理分类号,正式采纳了SKOS-Issue79的处理方法[ 14]。该属性用来唯一标识一个概念,具有唯一性,区别于标签的用法是其值域不能是任何自然语言[ 15],这对分类法的表示来说是可行的,《科图法》中每个类目都有唯一的分类号,采用skos:notation属性来处理分类号,并将其设为必备字段,《科图法》类号的SKOS描述语句格式为:

<skos:notation>分类号</skos:notation>

应用场景描述如下,如果原稿内容为“51数学”,则其SKOS描述语句为:

<skos:notation>51</skos:notation>

2.6 类目注释描述方案设计

许多KOS指南十分强调语义关系对定义概念的重要性,实际上与这些结构化语言相比,概念有时需要进一步使用非正式语言来表达,如范围注释或定义。SKOS提供了一种通用的文献属性说明标签skos:note,还定义了其若干子属性,即skos:scopeNote、skos:definition、skos:example、skos: historyNote。此外,SKOS还为KOS管理者和编辑者提供了两个特别的说明性标签,即skos:editorialNote和skos:changeNote[ 16]。各种说明性标签的适用范围如表3所示:

表3 skos:note属性说明表

鉴于skos:note较其他子属性的概括性和《科图法》中注释内容的复杂性,采用skos:note作为类目注释的描述语句。由于不是每个类目都有注释,因此将skos:note设为可选字段,用于描述类目注释。

通过xml:lang="cn"标识其语种为中文,《科图法》类目注释的SKOS描述语句格式为:

<skos:note xml:lang="cn">说明性文字</skos:note>

应用场景描述如下,如果原稿中类目“51.62函数论”有说明文字“不分实变数、复变数者入此”,则其SKOS描述语句为:

<skos:note xml:lang="cn">不分实变数、复变数者入此</skos:note>

2.7 复分/仿分描述方案设计

对知识组织体系中复分仿分的SKOS化处理一直没有得到很好的解决,原因有两点:

(1)SKOS本身主要用来处理简单的语义关系,并没有提供合适的词汇来解决复分、仿分等复杂关系;

(2)复分、仿分的特殊性超出了SKOS所能描述的范围,现有的SKOS无法满足传统词表的所有需要。

解决这类问题需要采取开放的思路,对SKOS Core适当扩展,建立一些本地词汇(Local Vocabulary),在复表的处理方式上做降级处理,做出一个与hasTopConcept不同的hasTopTableConcept来定义复分表[ 17]。但如何将定义好的复分表与相关类目联系起来,在公开发表的文献中并未找到明确解答,沿着扩展SKOS Core的思路,笔者认为处理复表问题时需要考虑两个方面:

(1)通过自定义属性skos:hasTopTableConcept封装复表;

(2)通过自定义属性skos:inTableConcept调用复表。

具体步骤如下:将每个复表看作是一个概念(Concept),并为其定义一个虚拟URI,如LASCTableConcept65,表示该复表处在词族“65 农业科学”下;在逻辑上将每个复表放在一个虚拟空间中,并认为这些复表与相应类目的关系是语义关系;在处理利用复表进行仿分的概念时,利用自定义的SKOS属性skos:inTableConcept调用复表,如在概念描述框架中加入调用语句 <skos:inTableConcept rdf:resource="#复表URI标识"/>实现复表的调用,这里调用的不是简单的一条资源,而是一个包含了内容的复表分类结构。

3 结 语

为将《科图法》用于综合科技信息资源的组织,有必要对《科图法》进行数字化转换,使其在网络环境下提供更加广泛的服务。以《科图法》中“51 数学”大类为试验对象,对其进行SKOS描述方案的设计,解决了《科图法》中类目、类号、关系(BT、NT、RT)、类目注释等的SKOS转换,探索了通过自定义相关属性来解决复分仿分问题的思路,但复分仿分及附表的SKOS化转换实际上并没有得到明确解决,此外,与其他知识组织体系的映射描述方案也需要进一步研究。

参考文献
[1] 李育嫦. 网络数字环境下知识组织体系的发展现状及未来趋势[J]. 情报资料工作, 2009(2): 45-48. [本文引用:1]
[2] All Documents-W3C[EB/OL]. [ 2010-05-18]. All Documents-W3C[EB/OL]. [2010-05-18]. http://www.w3.org/TR/tr-title-all#tr_S. [本文引用:1]
[3] Dewey Decimal Classification/Summaries[EB/OL]. [ 2010-05-18]. Dewey Decimal Classification/Summaries[EB/OL]. [2010-05-18]. http://dewey.info/. [本文引用:1]
[4] Library of Congress Subject Headings (LCSH)[EB/OL]. [2010-05-18]. http://id.loc.gov/authorities/. [本文引用:1]
[5] Zeng M L, Fan W. SKOS and Its Application in Transferring Traditional Thesauri into Networked Knowledge Srganization Systems[EB/OL]. [2010-06-09]. http://www.oclc.org/us/en/news/events/presentations/2008/ISKO/200808-SKOS-zeng.pdf. [本文引用:1]
[6] 刘丽斌, 张寿华, 濮德敏, . 《中国分类主题词表》的SKOS描述自动转换研究[J]. 中国图书馆学报, 2009, 34(6): 56-60. [本文引用:1]
[7] Miles A, Matthews B, Wilson M, et al. SKOS Core: Simple Knowledge Organization for the Web[EB/OL]. [2010-04-15]. http://isegserv.itd.rl.ac.uk/public/skos/press/dc2005/dc2005skospaper.pdf. [本文引用:1]
[8] 王一丁, 王军. 网络知识组织系统表示语言: SKOS[J]. 大学图书馆学报, 2007, 25(4): 30-35. [本文引用:1]
[9] SKOS Simple Knowledge Organization System Primer[EB/OL]. [2010-05-05]. http://www.w3.org/TR/2009/NOTE-skos-primer-20090818/. [本文引用:1]
[10] Labels-SKOS Simple Knowledge Organization System Primer[EB/OL]. [2010-05-05]. http://www.w3.org/TR/2009/NOTE-skos-primer-20090818/#seclabel. [本文引用:1]
[11] Semantic Relationships-SKOS Simple Knowledge Organization System Primer[EB/OL]. [2010-05-11]. http://www.w3.org/TR/2009/NOTE-skos-primer-20090818/#secrel. [本文引用:1]
[12] 用RDF描述Web资源[EB/OL]. [2010-05-18]. http://hi.baidu.com/sunnybill/blog/item/248d134fefe53d31aec3ab63.html. [本文引用:1]
[13] Associative Relationships -SKOS Simple Knowledge Organization System Primer[EB/OL]. [2010-05-11]. http://www.w3.org/TR/2009/NOTE-skos-primer-20090818/#secassociative. [本文引用:1]
[14] SKOS[EB/OL]. [2010-05-18]. http://www.metadataetc.org/wiki/index.php5?title=SKOS. [本文引用:1]
[15] SKOS Simple Knowledge Organization System Reference[EB/OL]. [2010-05-18]. http://www.w3.org/TR/skos-reference/#notations. [本文引用:1]
[16] Documentary Notes -SKOS Simple Knowledge Organization System Primer[EB/OL]. [2010-05-11]. http://www.w3.org/TR/2009/NOTE-skos-primer-20090818/#secdocumentation. [本文引用:1]
[17] Auxiliary Tables[EB/OL]. [ 2010-06-09]. Auxiliary Tables[EB/OL]. [2010-06-09]. http://www.metadataetc.org/wikispace/index.php?title=Tables&oldid=27. [本文引用:1]