布拉德福定律在专利分析系统中的应用
张鹏1, 刘平1, 唐田田1, 高祥林2, 邓亮2, 孙大龙3
1.国家知识产权局电学发明审查部 北京 100088
2.国家知识产权局自动化部 北京 100088
3.国家知识产权局审查业务管理部 北京 100088
摘要

介绍专利分析系统中分析核心技术、核心申请人或发明人的现状,分析布拉德福定律用于确定核心技术、核心申请人或发明人的可行性,最后使用两个具体的实例进行验证。

关键词: 专利分析; 布拉德福定律; 核心分类号; 核心申请人
中图分类号:G306
The Application of Bradford’s Law in Patent Analysis System
Zhang Peng1, Liu Ping1, Tang Tiantian1, Gao Xianglin2, Deng Liang2, Sun Dalong3
1.The Electricity Examination Department, State Intellectual Property Office of the P.R.C, Beijing 100088, China
2.The Automation Department, State Intellectual Property Office of the P.R.C, Beijing 100088, China
3.Patent Affairs Administration Department, State Intellectual Property Office of the P.R.C,Beijing 100088, China
Abstract

This paper first introduces the current status of analyzing core technology, core applicant or inventor in patent analysis system. Then it analyzes the feasibility of applying the Bradford’s Law to determine the core technology, core applicant or inventor. Lastly, it uses two specific examples for verification.

Keyword: Patent analysis; Bradford’s Law; Core IPC; Core applicant
1 引 言

随着科学技术的迅速发展以及企业间竞争的日趋激烈,分析、研究和利用专利信息已成为企业在竞争中获益,处于有利竞争地位的重要手段之一。专利信息分析是利用专利文献中的信息进行分析。专利文献中的信息,不仅包括该专利的技术信息,还包括申请人、发明人等信息,进行专利信息分析的系统称为专利分析系统。专利分析系统是以信息分析的理论为模型,基于数理统计原理和软件技术设计,对数据库中以“字段”或“索引”方式归类的文献“记录”进行分析,以得到用户所需的专利分析项目。

2 研究背景

目前的专利分析系统(如德温特公司的Thomson Data Analyzer专利分析系统[ 1],汉之光华专利情报分析系统[ 2]等)只能完成基本的分析项目,如仅能分析出技术领域分布、申请人和发明人分布,无法定量分析出核心技术、核心申请人或者核心发明人,而这些分析结果是公众进行专利信息分析的有实用价值的结果之一。除此之外,大多数专利分析系统对核心技术、核心申请人或发明人的判断没有统一的标准,给分析结果带来很大的误差。因此在专利信息分析领域提出了新的课题:是否可以采用科学的计量方法来对专利数据,特别是核心技术、核心申请人或发明人的数据进行定量分析。

3 布拉德福定律用于确定核心申请人/核心分类号的可行性研究
3.1 布拉德福定律特点

布拉德福定律[ 3]是文献计量学重要的基本定律之一,其通过对科技文献进行统计调查,得出科学文献具有分散性的特点,并采用数据模型描述文献分散的现象。

(1)布拉德福定律的理论基础

布拉德福分散定律的重要理论基础是:科学具有统一性的原则,科学技术的每一个学科都或多或少、或远或近地与其他学科相关联。因此才会有一个学科的文献出现在另一个学科的文献之中的现象[ 4]

(2)科学文献的集中与分散规律

众多研究均表明[ 5],科学文献的分布呈现出明显的集中与离散规律[ 6]

文献集中规律即某一学科的大部分文献高度集中在少数期刊中。比如《物理文摘》共收录期刊420种,而90%以上的文献却摘自120种期刊;美国《化学文摘》收录期刊14 000种,而基本期刊却只有1 000种[ 7],仅占全部期刊的0.07%。

文献离散规律是指对于一个特定的学科来说,该学科的论文一方面在专业性较强的期刊中高度集中,另一方面有一部分论文分散在为数众多的相关学科的期刊中。

文献的集中与分散实际上是一个事物的两个方面,二者是对立统一的。文献的集中与离散分布的经典表述是著名的布拉德福定律。换言之,一篇论文不仅会出现在这篇论文所涉及学科的专业期刊上,也可能出现在“其他学科”的期刊上。这些有可能登载这篇论文的“其他学科”的期刊数量,是随着“其他学科”所属的学科领域与这篇论文所属学科领域的关联度的降低、以及这篇论文在每种期刊中的登载率的减少而升高[ 8]

3.2 专利文献的分布特点

专利文献与科学技术论文文献有许多方面是相似的。专利文献中,每个专利文献都或多或少、或远或近地与一个或者多个技术领域相关联。

对专利文献所涉及的技术领域以IPC分类号[ 9]进行标记。一般而言,相同或相近技术领域的专利文献大部分都集中分布在少数几个IPC分类号下,只有较少数量的专利文献分散在其他多个分类号下,也就是说,专利文献中的技术领域分布存在与科技文献同样的集中性。例如,涉及“便携终端上音像文件”领域的专利文献约有473篇,其中145篇专利文献的IPC分类号主要集中在H04Q7/32、H04M11/00、H04M1/02、H04N5/225、H04N7/14、H04N5/232、G06K9/00等7个分类号。

一篇专利文献记载的专利技术可能涉及多个领域,因此一篇专利文献可能涵盖多个IPC分类号,同时这些IPC分类号也可能出现在其他专利文献中。因而专利文献中的技术领域分布存在与科技文献同样的分散性。例如,涉及“便携终端上音像文件”领域的473篇专利文献中,328篇专利文献分布在H04N7/18、H04M1/21、G06F17/30、G02B7/02、H04M1/00、G06F13/00等185个分类号。

从上述例子可以得出,涉及“便携终端上音像文件”领域的专利申请对应的专利文献(仅限于发明),其中最相关的H04Q7/32、H04N5/225等7个分类号对应的专利文献有145篇,而较为相关的33个分类号则对应142篇专利文献,有关联的152个分类号对应186篇文献。按照专利申请中对应IPC分类号的专利申请数量来等分区域,每个区域中IPC分类号的数量随着该区域IPC分类号对应文献量的减小而增多,也存在高度集中与分散的现象,这与前面叙述的反比关系相吻合。也就是说,分类体系在专利文献技术领域的不均匀分布,与科技文献的分布情况相似。

因此,将布拉德福定律应用到专利信息分析系统中,可以较科学、准确地确定专利文献中的核心技术(核心分类号)。基于同样的理由,布拉德福文献分散定律也适用于分析确定某一领域的核心申请人或者核心发明人。

4 应用举例

在专利信息分析系统中应用布拉德福定律,主要是应用这个定律的等级排列方法和分析的思路。在应用布拉德福文献定律进行专利信息分析时,具体可以分为以下三个过程:

(1)选用统计资料,根据需要选择期望分析的数据集合;

(2)等级排列统计资料,对专利申请,按照分析字段(分类号或者申请人、发明人等)对应的专利申请量的大小进行排列;

(3)分析统计资料,得出统计分析的结果。

下面列举涉及“计算机”和“锁相环电路”两个专利技术领域中利用布拉德福定律进行专利分析的实例,具体验证专利分析系统利用布拉德福定律来分析核心技术、核心申请人的可行性。

4.1 涉及“计算机”领域的核心技术分布

(1) 区域分析

图1 便携式终端的核心分类号分布图

①选取计算机领域中涉及“便携终端上音像文件”领域的专利文献的专利分类号进行统计,其核心分类号分布如图1所示。在专利数据库检索“移动终端”,再扩展到“手机,移动电话,便携装置”,以及“影像、音像”方面的发明专利,共得到182篇专利文献。之后对检索得到的专利文献按照各个IPC分类号对应的专利文献数量进行排序。

②将检索得到的182篇专利文献分为三个区域,每个区域中的文献数目大致相同。也就是说,将采集到的专利数据大致分为三个区域,每个区域中专利文献的数量大致为总数量的三分之一。

③区域分配的大致结果如表1所示:

表1 便携式终端的布拉德福分布表

第一区域为所分析技术领域的核心技术(分类号),该领域的专利文献相对集中在少量的核心分类位置上;第二区域为所分析技术领域的一般性技术,该区域的分类号较多,但每一分类号下集中的专利文献并不多;第三区域为所分析技术领域相关技术,该区域的分类号是那些主题与本领域技术内容有关联的类别。

(2)数据验证

①布拉德福定律验证

表1的数据可知,分类号的总数为N=192,其对应的专利文献数量为A=473篇,取分区数P=3来计算布拉德福常数n。

1)埃格的布拉德福系数计算法[ 10]

该系数计算法是1986年由埃格提出来的。计算公式如下:n=(eE×Y)1/P,式中n为布拉德福系数;P为分区数目(本分析方案中P=3);E为欧拉系数,E=0.5772;Y为最高IPC分类号对应的文献数量。H04Q7/32分类号对应的专利文献量最大,为54篇,因此Y取值54。代入公式得:

n=(e0.5772×54)1/3=4.58

2)核心区的IPC数量R

计算公式为R=N(n-1)/(nP-1),其中R为第一区域中的分类号数目,N为分类号总数,n为布拉德福系数,P为分区数目。

第一区域IPC数目:R=192×(4.58-1)/(4.583-1)=7.22≈7;

第二区域IPC数目:R×n=7.22×4.58=33.11≈33;

第三区域IPC数目:R×n2=7.22×4.582=151.44≈151。

三个区域的IPC数目的计算值为7:33:151,而实际值为7:33:152,如表2所示:

表2 布拉德福定律验证对比表

由此可见,该领域的核心IPC分布基本上符合布拉德福文献分散定律,比值大约为1∶5∶52

②核心技术(分类号)分布

表3所示,第一区域IPC分类号数量占所有IPC总数的3.65%,但其对应的专利数量占所有专利数量的30.6%;第二区域IPC分类号数量占所有IPC总数的17.18%,其对应的专利数量占所有专利数量的30.0%;第三区域IPC分类号数量占所有IPC总数的79.17%,其对应的专利数量占所有专利数量的39.4%。其中三个区域的平均IPC密度分别为20.7、4.3和1.2,由此可见,IPC分布的核心效应是非常显著的。

表3 便携式终端文献的离散分布表
4.2 涉及“锁相环电路”领域的核心申请人分布

为了全面验证布拉德福定律在专利分析系统中分析核心申请人的可行性,本文还使用涉及锁相环电路的相关文献进行验证。

图2 锁相环和调制器的核心申请人分布

例如,对于电子电路领域中涉及“锁相环和调制器”的核心申请人的分布情况,如图2所示。具体统计数据如表4所示:

表4 锁相环和调制器的布氏分布表

从上述数据可以明显得出三个区域中的申请人数目之比为9:22:46,大约为1:2.2:2.22,基本符合布拉德福文献分散定律。

表5 锁相环和调制器的离散分布表

表5所示,第一区域申请人数量占所有申请人总数的11.7%,但其对应的专利数量占所有专利数量的32%;第二区域申请人数量占所有申请人总数的28.6%,其对应的专利数量占所有专利数量的30%;第三区域申请人数量占所有申请人总数的59.7%,其对应的专利数量占所有专利数量的38%。其中三个区域的平均密度分别为4.0,1.5和0.9,由此可见,申请人分布的核心效应是非常显著的。

5 结 语

在当今经济全球化的背景下,竞争愈演愈烈,企业需了解其所在行业和市场的技术分布以及参与竞争的对手,以便制定有效的企业战略和专利战略。本文提出将文献计量学中重要的布拉德福定律应用到专利信息分析系统中,可以科学、准确地定量分析出核心技术、核心申请人或发明人,以便企业准确判断行业内的核心技术、核心技术的分布情况,以及核心竞争对手的相关情况,从而帮助企业对未来的市场开拓做出相应的对策。通过充分利用专利信息,掌握最新、最准确的技术情报,真正实现了专利信息为企业发展创新导航,为我国加快经济发展方式转变提供有力支撑。

参考文献
[1] Thomson Data Analyzer[EB/OL]. [2009-11-19]. http://thomsonreuters.com/.products_services/legal/legal_products/intellectual_property/Thomson_Data_Analyzer. [本文引用:1]
[2] 专利分析系统[EB/OL]. [2009-11-19]. http://www.iprtop.com/pages/view/fn/hg_fxxt/. [本文引用:1]
[3] Viekery B C. Bradford’s Law of Scattering[J]. Journal of Documentation, 1948, 4(3): 198-203. [本文引用:1]
[4] 赵玉珍. 运用布拉德福定律研究中国沙棘文献的核心期刊[J]. 情报科学, 2000, 18(5): 462-464. [本文引用:1]
[5] Braun T, Gianzel W, Grup P H. The Scientometric Weight of 50 Nations in 27 Science Area, 1989-1993. 2, Life Sciences[J]. Scientometrics, 1995, 34(2): 207-237. [本文引用:1] [JCR: 2.133]
[6] 王津生. 浅谈布拉德福分散定律及其应用[J]. 情报科学, 1980(2): 79-86. [本文引用:1]
[7] 邱均平. 信息计量学(四)文献信息离散分布规律——布拉德福定律[J]. 情报理论与实践, 2000, 23(4): 315-320. [本文引用:1]
[8] 郭强, 赵瑾, 张芳, . 历时的布拉德福定律研究[J]. 情报科学, 2009, 27(2): 239-243. [本文引用:1]
[9] WIPO Reformed IPC: Internet Publication[EB/OL]. [2009-10-23]. http://www.wipo.int/classifications/ipc/ipc8/?lang=en. [本文引用:1]
[10] 王崇德. 文献计量学教程[M]. 天津: 南开大学出版社, 1990. [本文引用:1]