基于专利文本数据的技术实力评价方法
韩红旗1, 桂婕1, 徐硕1, 刘玉琴2
通讯作者 韩红旗 E-mail:bithhq@163.com

作者贡献:

韩红旗:提出研究思路,设计研究方案,负责论文起草和最终版本修订;

桂婕:燃料电池中国专利数据的采集、清洗和格式加工;

刘玉琴:触摸屏技术的美国授权专利数据的采集、清洗和格式加工;

徐硕,桂婕,刘玉琴:进行实验。

摘要

【目的】提出不依靠专利引文数据、利用专利文本数据评价企业技术实力的方法。【方法】该方法综合采用专利授权数量指标、专利增长率指标、技术中心性指标和专利最小价值指标来评估技术实力。这4类指标分别从技术规模、技术增长性、技术重要性和技术价值性等不同侧面反映一个企业的技术能力。【结果】通过CII和TII指标对比实验, 验证引文分析给公开早的专利较高评价的问题;通过TS指标和TSQGIV对比实验, 验证提出的技术实力评价方法的有效性。【局限】数据处理中没有对机构名称进行规范化处理, 实验结果可能存在误差。【结论】相比于其他评价技术实力的方法, 本研究可以在没有引文数据的情况下对企业的技术实力进行评价。

关键词: 技术实力评价; 专利分析; 专利评价; 评价指标
文章编号: 2014-66-71
Technical Strength Evaluation Method Based on Patent Text Data
Han Hongqi1, Gui Jie1, Xu Shuo1, Liu Yuqin2
1Institute of Scientific and Technical Information of China, Beijing 100038, China
2Beijing Academy of Printing & Packaging Industrial Technology, Beijing Institute of Graphic Communication, Beijing 102600, China
Abstract

[Objective] The paper aims to propose a method to evaluate enterprise technical strength based on patent text data without citation data. [Methods] Four indexes are used to evaluate technical strength comprehensively, including valid granted patent quantity index, patent growth ratio index, technical centrality index and patent minimum value index. The four indexes reflect technical strength respectively from technical scale, growth, importance and value.

[Results] The experimental results on indexes comparison between CII and TII show that citation analysis give higher value to earlier publicated patents. Another experimental results on indexes comparison between TS and TSQGIV show the effectiveness of the proposed method. [Limitations] The enterprise names are not normalized in data pre-process, which might cause errors to experimental results. [Conclusions] Compared with previous methods, the proposed novel method can evaluate technical strength of companies without citation data.

Keyword: Technical strength evaluation; Patent analysis; Patent evaluation; Evaluation index
1 引 言

技术实力评价是竞争分析的一项重要内容, 对企业并购、市场预测和产业政策制定等有非常重要的价值。专利是一种具有丰富信息的、重要的技术研发数据源[1, 2], 被认为是科技发明活动的指标、产业和国家层面上技术进步和变革的指标[3], 长期以来, 它被认为是最有用、最客观的衡量技术产出、技术变革和创新的指示器[4, 5, 6]。专利往往是一项发明的第一次透漏, 专利透漏的技术信息有80%-94%是其他地方无法得到的信息, 含有90%-95%具有经济价值的研发成果, 专利文献中公布的重要发明比其他形式的报道要早5-10年[7, 8]。一般来说, 研发机构只有在看好一个国家产业市场发展潜力时, 才会提前进行专利布局, 使专利成为保护其自身经济利益、打击竞争对手的一种重要筹码, 这也是跨国公司目前普遍采用的一种方法[9]。因此通过专利来评价技术实力是一种可靠的方法。

在评价一个企业(国家)技术实力的时候, 常把以专利数量为依据的专利活动指标(Patenting Activity)作为测度技术能力的主要指标[10, 11], 然而专利的数量并不等于质量, 完全以专利数量来测度可能会低估或高估企业的技术实力。为此, 一些学者提出以专利的被引用次数来测量企业专利组合的质量和实力, 评估企业并购对象的技术实力和市场价值[12]。其中, 美国CHI公司提出的当前影响力指标是一种较为有效的方法[13]。虽然此类技术实力评价指标具有合理性, 但也存在一些明显的问题。首先它依赖引文数据, 如果没有引文数据, 这种方法就不能使用, 从而限制了其应用范围;其次, 被引用次数多的专利往往公开的时间很长, 也就是说此方法对于公开时间长的专利给予了较高的评价, 而对最新公开的专利数据则无法合理评价。为此, 本研究提出一种没有专利引文数据情况下、利用专利文本内容评估技术实力的方法, 从专利数量、增长率、技术重要性和技术价值性4个方面综合评判一个企业的技术实力。

2 现有专利技术实力评价指标概述

通过对已有研究文献的梳理, 专利技术实力的评价指标可以分为数量类、比率类、质量类指标以及三类指标的组合[14, 15, 16]

(1)数量类指标是一类绝对性指标, 主要有专利申请量、授权量、实施量、存活量等。专利数量指标表示一个技术研发机构的技术投入规模。

(2)比率类指标是一类相对性指标, 主要有专利增长率、专利授权率、专利实施率、存活率等。其中专利增长率指标是一种重要的测量公司创新活动的指标(见公式(1)[13]), 可显现技术创新随时间的变化是增加还是迟缓, 能够反映一个组织的技术成长能力。专利数量一般选择授权专利量。计算专利增长率指标时的时间跨度可长可短, 时间长短的选择依赖于分析的目的和技术领域的特点[13]

专利增长率=(近期专利数量-前期专利数量)×100% / 前期专利数量 (1)

(3)质量类指标是从专利的技术价值、市场价值或权利价值出发来判断专利技术的质量[17], 从而判断企业的技术能力。

当前影响力指标(Current Impact Index, CII)是一种重要的质量类指标, 该指标通过专利的引用来测量专利的技术价值。其提出的依据是:如果一个企业的专利平均被引用次数高于产业的平均被引用数, 那么此企业被认为处于产业技术的强势地位, 其定义如下所示[13]

(2)

其中, Ai为产业技术专利池中的专利总数, Bi为某企业拥有的专利总数, Ci为该企业的专利被引用的次数, Di为产业技术专利被引用的次数。CII值是一个和时间保持同步的指标, 它不仅反映过去企业专利的影响力、企业专利组合的质量, 同时对企业现行技术相当敏感, 当一个企业CII值开始降低时, 说明该企业在放弃某种技术创新活动。然而, CII指标是相对指标, 它在一定程度上能够反映企业专利的质量, 而不能反映专利综合水平[10], 另外它基于引文分析, 会给早期出版专利较高的权重, 在没有引文数据的情况下不能使用[18]

其他评价专利价值的方法, 如重置成本法、收益现值法、现行市场法和实物期权法等, 它们通过专利给主体带来的未来收益的折现来衡量, 具有一定客观性, 但该类指标的客观性必须建立在主观确定专利评估场景的基础上, 并通过对比才能确定专利的理论价值[19]。虽然这些方法有其固然的优点, 但由于制度的不完善或真实数据难以获取, 实际上均难以操作[16], 即便是获取了真实数据, 也极有可能高估或低估专利的价值[20]。实际上, 专利价值的大小与主体及主体的兴趣和目的有关[19], 即存在主观性, 所以作为技术的拥有者和专利的持有人, 其是否愿意维持专利权成为一项技术价值的相对有效和客观的评价。

正是因为各种指标都有其可取之处, 所以有专家建议专利综合实力的评价既要考虑量, 也要考虑率, 进行组合评价[15]。已提出的组合技术实力评价指标有技术优势指标、Score指标等[13]。技术优势指标(Technology Strength, TS)是由CII指标引申出来的, 用企业专利数量和CII的乘积来测量专利组合强度, 但并未考虑到企业技术的增长能力。Score指标通过几个技术积分给公司的技术实力排序, 投资者据此发现技术上被低估或高估的公司, 从而指导相应的投资决策, 但这种技术选择存在主观性, 往往需要专业人士的参与。

3 技术实力的评价方法

在进行专利指标综合评价时, 指标的选取宜遵循实用、简约、有代表性、客观和可获得的基本原则[15]。为了在没有专利引文数据的情况下评价技术实力, 提出基于如下4个指标的综合评价方法:授权数量指标、专利增长率指标、技术重要性指标(Technology Importance Index, TII)、专利最小价值指标。选取授权数量指标和专利增长率指标, 原因在于这两类指标在数量类和比率类指标中具有代表性, 并且符合指标选取的基本原则。授权数量代表着现有的技术积累, 比申请量更能代表企业的技术能力, 而专利增长率指标则代表了企业的技术成长能力或发展趋势。提出的TII指标拟代替CII指标从技术重要性方面来测量专利的价值, 专利最小价值指标则希望从经济角度客观地测量专利技术的价值。

3.1 专利重要性的测量指标

鉴于引文分析和CII指标的缺陷,Yoon等[18]提出了一种代替CII指标的网络分析方法,采用技术中心性指标(Technology Centrality Index,TCI),可以在没有或不采用专利引文数据情况下评价技术价值,取得了良好的效果。该方法采用关键词向量和欧几里德距离计算专利文档之间的连接值(见公式(3)[18]),并以此连接值来定义TCI。

(3)

其中,k为关键词的数量,两个专利ni和nj分别表示为向量ni=(ni1,ni2,…,nik)和nj=(nj1,nj2,…,njk)。然而,连接值的计算基于欧几里德距离,得出的结果不在0-1之间,在选定阈值时存在人为因素。因此本文按照传统文档余弦相似度公式[13]来定义两个专利的连接值Iij,公式如下所示:

(4)

计算专利两两之间的连接值Iij并建立关联矩阵I, 从而可以计算一个专利的TCI指标, 公式如下[18]所示:

(5)

其中, m是整个专利的数量, 即TCI指标反映了一个专利与其他m-1个专利连接的比例。TCI指标类似于CII指标, 但比CII提供了更多的信息, 也更可信赖, 因为网络分析中, 两个专利之间的联系不仅反映了频率值, 也反映了关联值, 高TCI值的专利自然地展示了知识在跨专利间的流入和流出[18]。由TCI指标本文定义了一个企业的技术重要性指标:

定义1:技术重要性指标(TII)是一个企业专利的平均TCI指标与产业专利的平均TCI指标的比值。假设共有M件产业专利, 某企业有m件专利, 则该企业的技术重要性指标如下所示:

(6)

3.2 专利最小价值的测量指标

授权专利的拥有者必须向专利局缴纳年费才可以维持其专利权。一个合理的推理是, 如果一项专利没有价值或其价值不足以弥补年费, 专利权人会主动放弃专利权而造成专利权失效。因此, 授权专利的年费是衡量有效授权专利最小经济价值的客观指标[19]。基于授权专利的年费, 本文定义了专利的最小价值、企业专利的最小价值和企业技术价值指标。

定义2:专利的最小价值(Minimum Patent Value, MPV)是一个专利权有效的授权专利在当前年份的年费。

定义3:企业专利的最小价值是其当前拥有的有效授权专利的最小价值之和。

(7)

其中, m是企业的授权专利数量。

定义4:企业的技术价值指标(Technology Value Index, TVI)是其专利最小价值和有效授权专利数量的比值, 即用专利的平均最小价值来测量企业技术的实力。公式如下所示:

(8)

3.3 技术实力指标计算方法

授权数量指标从专利活动规模上衡量了企业的技术研发能力, 专利增长率指标从增长性角度衡量了企业的技术成长能力, 技术重要指标(TII)从内容分析角度衡量了企业的专利技术重要性, 专利价值指标从经济角度衡量了企业技术的价值。这4类指标分别从技术规模、技术增长性、技术重要性和技术价值性等不同侧面反映了一个对象的技术能力, 如图1所示:

图1 技术实力评价及对应指标

为了综合评价企业的技术实力, 将专利增长率指标、技术重要性指标和技术价值指标首先进行归一化处理, 即转化为0-1之间的数字, 记有效授权专利数量为Q, 归一化后的专利增长率指标为G, 归一化后的技术重要性指标为I, 归一化后的技术价值指标为V, 则本文定义了如下公式来计算企业的综合技术实力指标TSQGIV

TSQGIV=Q×(α×G+β×I+γ×V) (9)

其中, α、β和γ分别是专利增长性、技术重要性和技术价值性三项指标的权重, α+β+γ=1, 权重的选择可根据技术发展阶段和技术特征综合决定, 例如在一个新兴产业发展的早期, 技术增长性相对重要, 可以赋予较高的权重。

4 技术竞争对象的实力分析方法的实证
4.1 指标对比实验

为了验证提出的指标的效果, 采集了触摸屏技术的美国授权专利数据, 共得到2 638条数据。计算了CII指标及以此指标为基础的技术优势指标TS、TII指标及本研究提出的技术实力评价指标TSQGIV

首先对比了各指标排名下的专利平均年龄, 如表1所示:

表1 评价指标的专利平均年龄对比

可以看到CII指标的专利平均年龄显著大于TII指标, 而TS指标的专利平均年龄则比TSQGIV指标约大1.5年。TS指标评价前50名企业的专利平均年龄基本上在10-11之间, 而TSQGIV的企业专利平均年龄在9-9.5之间。这验证了引文分析倾向给公开早的专利较高评价的说法。

然后对比了TS指标和TSQGIV指标下的前10名企业, 如表2所示。可以看到TSQGIV指标没有采用引文数据, 但两者的前10名企业中存在5个相同企业, 其中前三名企业完全一样, 只是IBM和微软的顺序调换了一下, 主要原因就是IBM的专利平均年龄为12.29, 而微软的则为 6.24, 远远低于IBM, 这验证了本方法的有效性。

表2 TS和TSQGIV前10名公司对比
4.2 中文专利评价实验

为了进一步验证该方法的应用, 采集了燃料电池中国专利数据, 并利用提出的方法计算了企业技术实力指标。数据来源于中国国家知识产权局网站, 没有引文数据, 数据截止到2009年10月。技术实力排名前20的企业如图2所示:

图2 燃料电池公司技术实力前20名排名

可以看到, 日本公司占据9席(松下、丰田、日产、东芝、本田、三洋、三菱、索尼和日立), 美国占据3席(通用汽车、UTC和摩托罗拉), 韩国占据2席(三星、乐金), 加拿大占据1席(百拉得), 中国公司仅占据5席(上海神力、胜光科技、比亚迪、新源动力和亚太), 而且除上海神力外, 其他企业的指标明显偏低, 这说明我国企业在该领域的研发实力还比较弱, 需要进一步加强。

5 结 语

本文提出了一种基于专利文本数据评估技术实力的方法, 从技术规模、专利增长性、技术重要性和技术价值性4个方面综合评判一个企业的技术实力, 和其他方法相比, 此方法具有不依赖专利引文数据的特点。在技术实力分析中, 引入了技术中心性指标(TCI)从内容分析角度来测量专利的技术价值, 解决了没有专利引文数据情况下对专利重要性判断的问题, 进一步由TCI指标定义技术重要性指标(TII)来代替当前影响力指标(CII)。在触摸屏专利数据上的实验不仅验证了本方法的有效性, 而且证明了TII指标排名靠前的企业专利平均年龄显著低于CII指标, 该方法的排名靠前的企业专利平均年龄也明显低于TS方法。在燃料电池中国专利数据上的进一步实验证明了该方法的应用具有语言无关性。需要注意的是, 虽然Yoon等[18]通过实验说明了技术中心性指标在测量专利重要性方面具有良好的效果, 能够代替引用指标, 但该指标在测量技术实力方面的能力仍需要更多的检验, 这是未来需要进一步研究的方向。

参考文献
[1] Pilkington A. Technology Portfolio Alignment as an Indicator of Commercialisation: An Investigation of Fuel Cell Patenting[J]. Technovation, 2004, 24(10): 761-771. [本文引用: 1] [JCR: 3.177]
[2] Lee C K, Ong R. An Analysis of the Liquid Crystal Cell Patents of LG and Samsung Filed at the USPTO [C]. In: Proceedings of 2006 IEEE International Conference on Management of Innovation and Technology. 2006: 345-349. [本文引用: 1]
[3] 冯君, 周静珍, 杜芸. 单件专利质量评价指标体系研究[J]. 科技管理研究, 2012, 32(23): 166-170.
(Feng Jun, Zhou Jingzhen, Du Yun. Study on the Quality Evaluation Method for Single Patent[J]. Science and Technology Management Research, 2012, 32(23): 166-170. ) [本文引用: 1] [CJCR: 0.55]
[4] Kayal A A, Waters R C. An Empirical Evaluation of the Technology Cycle Time Indicator as a Measure of the Pace of Technological Progress in Superconductor Technology[J]. IEEE Transactions on Engineering Management, 1999, 46(2): 127-131. [本文引用: 1] [JCR: 0.893]
[5] Connelly M C, Sekhar J A. A Case Study in Metals for Inventions and Innovations [C]. In: Proceedings of Portland International Conference on Management of Engineering & Technology (PICMET’08). IEEE, 2008: 639-655. [本文引用: 1] [JCR: 1.616]
[6] 于潇, 孙英隽. 专利情报分析对企业创新的影响研究[J]. 情报科学, 2007, 25(11): 1668-1671, 1678.
(Yu Xiao, Sun Yingjun. Study on Patent Information Analysis Used by Technical Innovation of Companies[J]. Information Science, 2007, 25(11): 1668-1671, 1678. ) [本文引用: 1] [CJCR: 1.112]
[7] 张冬梅. 专利分析在医药行业的技术预见能力检验——以检测和诊断艾滋病病毒(HIV)感染的技术[J]. 图书情报工作, 2008, 52(2): 135-137, 76(Zhang Dongmei. A Study of Patent Analysis for Technology Foresight Potential in Pharmaceutical Industry——Taking HIV as an Example [J]. Library and Information Service, 2008, 52(2): 135-137, 76. ) [本文引用: 1] [CJCR: 1.193]
[8] 吴琳, 魏星, 霍翠婷. 基于Web的专利双语语料自动获取研究及实现——以esp@cenet数据库为例[J]. 现代图书情报技术, 2009 (9): 57-63.
(Wu Lin, Wei Xing, Huo Cuiting. Research and Implement of Automatic Patent Bilingual Corpus Extraction from Web——Taking esp@cenet as an Example[J]. New Technology of Library and Information Service, 2009 (9): 57-63. ) [本文引用: 1] [CJCR: 1.073]
[9] Han H, Wang X, Liu J. Study on the Model Construction of Early Warning System of Patent Risk [C]. In: Proceedings of Interna- tional Conference on Risk and Reliability Management (RRM 2008). 2008: 408-411. [本文引用: 1]
[10] 杨中楷, 孙玉涛. 基于专利引用的国家技术力量指标比较[J]. 科学学与科学技术管理, 2005, 26(10): 11-14.
(Yang Zhongkai, Sun Yutao. Comparison Between National Technology Strength Indexes Based on Patent Citation[J]. Science of Science and Management of S&T, 2005, 26(10): 11-14. ) [本文引用: 2] [CJCR: 0.871]
[11] 李瑞璇, 王学思. 基于因子聚类分析的专利综合评价研究[J]. 现代情报, 2012, 32(9): 172-177.
(Li Ruixuan, Wang Xuesi. The Research of Patent Evaluation by Factor Analysis and Cluster Analysis[J]. Modern Information, 2012, 32(9): 172-177. ) [本文引用: 1] [CJCR: 0.801]
[12] Breitzman A, Thomas P, Cheney M. Technology Powerhouse or Diluted Competence: Techniques for Assessing Mergers via Patent Analysis[J]. R&D Management, 2002, 32(1): 1-10. [本文引用: 1]
[13] 陈燕, 黄迎燕, 方建国. 专利信息采集与分析[M]. 北京: 清华大学出版社, 2006.
(Chen Yan, Huang Yingyan, Fang Jianguo. Collection and Analysis of Patent Information[M]. Beijing: Tsinghua University Press, 2006. ) [本文引用: 5]
[14] 黄庆, 曹津燕, 瞿卫军, . 专利评价指标体系(一)——专利评价指标体系的设计和构建[J]. 知识产权, 2004, 14(5): 25-28.
(Huang Qing, Cao Jinyan, Qu Weijun, et al. The Indicators System for Patent Evaluation (PartⅠ)——Design and Cons- truction[J]. Intellectual Property, 2004, 14(5): 25-28. ) [本文引用: 1] [CJCR: 1.0489]
[15] 刘洋, 瞿卫军, 黄庆, . 专利评价指标体系(三)——运用专利评价指标体系进行的地区评价[J]. 知识产权, 2004, 14(5): 35-38.
(Liu Yang, Qu Weijun, Huang Qing, et al. The Indicators System for Patent Evaluation (Part Ⅲ)——Regional Evaluation[J]. Intellectual Property, 2004, 14(5): 35-38. ) [本文引用: 3] [CJCR: 1.0489]
[16] 汪雪锋, 刘晓轩, 朱东华. 专利价值评价指标研究[J]. 科学管理研究, 2008, 26(6): 115-117.
(Wang Xuefeng, Liu Xiaoxuan, Zhu Donghua. Research on Patent Value Indicators[J]. Scientific Management Research, 2008, 26(6): 115-117. ) [本文引用: 2] [CJCR: 0.938]
[17] 万小丽, 朱雪忠. 专利价值的评估指标体系及模糊综合评价[J]. 科研管理, 2008, 29(2): 185-191.
(Wan Xiaoli, Zhu Xuezhong. The Indicator System and Fuzzy Comprehensive Evaluation of Patent Value[J]. Science Research Management, 2008, 29(2): 185-191. ) [本文引用: 1] [CJCR: 1.457]
[18] Yoon B, Park Y. A Text-mining-based Patent Network: Analytical Tool for High-technology Trend[J]. The Journal of High Technology Management Research, 2004, 15(1): 37-50. [本文引用: 6]
[19] 宋爽, 陈向东. 基于存续期的专利价值研究述评[J]. 科技管理 研究, 2013, 33(12): 150-154.
(Song Shuang, Chen Xiangdong. Review on Studies of Renewal Payment Based on Patent Value Evaluation[J]. Science and Technology Management Research, 2013, 33(12): 150-154. ) [本文引用: 3] [CJCR: 0.55]
[20] 程夷, 周焯华. 技术进步对专利价值影响的实物期权分析[J]. 工业工程, 2011, 14(5): 58-61.
(Cheng Yi, Zhou Zhuohua. Real Option Valuation of the Patent under Competition[J]. Industrial Engineering Journal, 2011, 14(5): 58-61. ) [本文引用: 1] [CJCR: 0.589]