Please wait a minute...
Advanced Search
数据分析与知识发现  2022, Vol. 6 Issue (11): 61-71     https://doi.org/10.11925/infotech.2096-3467.2022.0161
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
专业技术领域核心专利组合识别方法构建及其应用比较*
曾闻1,王曰芬2,3()
1南京理工大学知识产权学院 南京 210094
2天津师范大学管理学院 天津 300380
3天津师范大学大数据科学研究院 天津 300380
Core Patent Portfolio Identification and Application in Professional Technical Field
Zeng Wen1,Wang Yuefen2,3()
1School of Intellectual Property, Nanjing University of Science and Technology, Nanjing 210094, China
2School of Management, Tianjin Normal University, Tianjin 300380, China
3Institute for Big Data Science, Tianjin Normal University, Tianjin 300380, China
全文: PDF (813 KB)   HTML ( 14
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 从识别指标信息的多元与不同赋权及排序算法组配的综合视角,结合大规模数据集的特点,研究核心专利组合识别方法的构建及其应用对比。【方法】 通过交叉组配构建5种组合识别方法,选取6项专利特征信息,以人工智能领域为例,从整体与局部层次对比各方法的特征和应用情境。【结果】 不同组合识别方法在不同的数据集与时间段有较高的一致性。同时,不同方法识别的结果随着被识别的核心专利数量增加而两两间重合率逐渐减少,例如方法①与方法④的核心专利重合率由80%降至47%。【局限】 仅考虑现实研究中较普遍的核心识别需求,可进一步研究针对特定的、个性化的核心识别需求的专利组合识别方法。【结论】 所构建的5种组合识别方法,基于专利数据集的规模、分散程度、时间跨度和特征值表现及技术领域发展的差异,可分别应用到核心专利识别不同应用需求场景中。针对快速发展的人工智能领域,熵权法赋权结合灰色关联分析和熵权法赋权结合TOPSIS这两种方法识别效果更优。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
曾闻
王曰芬
关键词 核心专利识别组合识别方法单一赋权组合赋权    
Abstract

[Objective] This paper constructs identification methods for core patent portfolio and then examines their application with the help of large-scale datasets. [Methods] Through cross-combination, we constructed five identification models for the patents, which included six features of the patents. We then compared our methods’ performance with datasets of artificial intelligence. [Results] Different combined methods yielded highly consistent results when applied to various datasets. Meanwhile, as the number of core patents increased, the duplicated rates between the two methods gradually decreased. For example, the core patent duplication rates of method ① and method ④ dropped from 80% to 47%. [Limitations] We only investigated the common identification requirements. More research is needed to study those for specific and individualized areas. [Conclusions] The five constructed methods can be applied to different scenarios. For the rapidly developing field of artificial intelligence, the entropy weight method combining grey relational analysis and the entropy weight method with TOPSIS may yield better results.

Key wordsCore Patent Identification    Combination Identification Methods    Single Weighting    Combination Weighting
收稿日期: 2022-02-28      出版日期: 2023-01-13
ZTFLH:  G306  
基金资助:* 国家社会科学基金重大项目(16ZDA224)
通讯作者: 王曰芬     E-mail: yuefen163@163.com
引用本文:   
曾闻,王曰芬. 专业技术领域核心专利组合识别方法构建及其应用比较*[J]. 数据分析与知识发现, 2022, 6(11): 61-71.
Zeng Wen,Wang Yuefen. Core Patent Portfolio Identification and Application in Professional Technical Field. Data Analysis and Knowledge Discovery, 2022, 6(11): 61-71.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2022.0161      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2022/V6/I11/61
Fig.1  权重赋权及其计算交叉组配的核心专利识别组合方法构成设计
指标 指标特征信息 特征信息的含义 反映的特点
技术价值 专利被引频次 专利被其他专利引用的次数 原创性及其影响力
引用专利数 专利文本引用他人专利的数量 创新程度与新颖性
引用科学文献数 专利文本引用科学文献的数量 科学关联程度
IPC小类数 专利包含IPC小类的数量 技术属性与覆盖范围
经济价值 同族专利数 同一发明思想向不同国家提出专利申请的数量 技术市场范围
权利要求数 专利文件中包含权利要求的数量 法定保护范围与经济性
Table 1  核心专利识别的指标及其特征信息的选取
指标特征信息 被引频次 引用专利数 引用科学文献数 IPC小类数 同族专利数 权利要求数
最大值 757 1 057 1 776 15 149 1 442
最小值 0 0 0 0 0 0
算术平均数 0.675 6 0.700 1 3.487 8 2.023 9 1.698 3 11.226 7
标准差 5.737 1 8.546 3 23.227 3 1.276 8 2.576 6 13.076 3
Table 2  专利特征信息的数据描述性统计
赋权方法 被引频次 引用专利数 引用科学文献数 IPC小类数 同族专利数 权利要求数
熵权法 0.300 2 0.222 8 0.380 7 0.020 6 0.044 2 0.031 5
TOPSIS 0.039 9 0.065 4 0.088 6 0.002 0 0.008 0 0.207 3
离差最大化法 0.146 6 0.200 8 0.147 3 0.109 6 0.111 8 0.283 9
AHP法 0.268 6 0.041 1 0.066 2 0.105 6 0.307 2 0.211 3
G1法 0.142 1 0.262 8 0.177 9 0.112 4 0.138 1 0.166 7
G2法 0.153 4 0.209 8 0.154 2 0.149 3 0.174 1 0.159 2
AHP与TOPSIS组合权重 0.167 6 0.265 3 0.123 9 0.023 4 0.080 5 0.339 3
多算法赋权组合方法权重 0.191 9 0.224 8 0.224 6 0.092 8 0.112 1 0.153 8
Table 3  不同赋权方法的指标特征信息权重计算结果
方法① 方法② 方法③ 方法④ 方法⑤
方法① - 90% 20% 80% 80%
方法② 90% - 20% 80% 80%
方法③ 20% 20% - 30% 30%
方法④ 80% 80% 30% - 100%
方法⑤ 80% 80% 30% 100% -
Table 4  基于Top10的不同方法间的重合率
方法① 方法② 方法③ 方法④ 方法⑤
方法① - 85% 42% 75% 80%
方法② 85% - 31% 85% 80%
方法③ 42% 31% - 41% 34%
方法④ 75% 85% 41% - 92%
方法⑤ 80% 80% 34% 92% -
Table 5  基于Top100的不同方法间的重合率
方法① 方法② 方法③ 方法④ 方法⑤
方法① - 68% 23% 47% 59%
方法② 68% - 20% 55% 73%
方法③ 23% 20% - 35% 24%
方法④ 47% 55% 35% - 72%
方法⑤ 59% 73% 24% 72% -
Table 6  基于Top500的不同方法间的重合率
方法 2011-2012 2013-2014 2015-2016 2017-2018 2019-2020
方法① 85 67 95 152 101
方法② 62 49 82 179 128
方法③ 81 53 62 128 176
方法④ 63 39 70 159 169
方法⑤ 70 44 78 171 137
整体重
复比
70% 58% 76% 71% 63%
Table 7  基于各识别方法的Top500集合时间阶段分布及 重合率
核心专利组合识别方法 赋权原理/算法 组合/排序方式 特点及应用
熵权法赋权结合灰色关联分析 熵权法计算权重凸显数据分散度大的指标信息 借助灰色关联分析寻找接近最优方案的评价对象 面向规模较大、数据较分散的专利数据集,识别出某一项或几项特征值表现突出的专利,尤其适合处于迅猛发展期的技术领域
熵权法赋权结合TOPSIS 熵权法计算权重凸显数据分散度大的指标信息 借助TOPSIS寻找接近最优方案、远离最劣方案的评价对象 面向规模较大、数据较分散的专利数据集,识别出某一项或者几项指标值表现突出且其他指标值均不趋近最低值的专利,尤其适合处于迅猛发展期的技术领域
AHP赋权结合TOPSIS 基于AHP法获取专家评价的具有关联程度的指标信息赋权 借助TOPSIS寻找接近最优方案、远离最劣方案的评价对象 面向数据时间跨度长,主观判断发挥作用,且专利价值被不断认可的评价应用情境,尤其适合处于发展成熟期的技术领域
AHP与TOPSIS组合赋权 AHP权重体现专家核心评价侧重,TOPSIS权重反映客观赋权情况 基于最小熵原理计算组合权重,并计算排序专利核心程度 面向需要综合主客观评价,且使两者赋权的各个特征信息权重差值处于最小化下识别核心专利的应用情境
多算法赋权组合方法 G1、G2、熵权、离差最大化分别计算权重 基于最大熵原理计算组合权重,并计算排序专利核心程度 面向需要综合主客观方法评价,且使组合赋权的各个特征信息处于综合表现均衡的核心专利识别的应用情境
Table 8  不同核心专利组合识别方法及其应用的比较
[1] 韩志华. 核心专利判别的综合指标体系研究[J]. 中国外资, 2010(4): 193-196.
[1] (Han Zhihua. Research on the Comprehensive Index System of Core Patent Identification[J]. Foreign Investment in China, 2010(4): 193-196.)
[2] Kim D, Lee B, Lee H J, et al. A Graph Kernel Approach for Detecting Core Patents and Patent Groups[J]. IEEE Intelligent Systems, 2014, 29(4): 44-51.
[3] Hu P, Huang M L, Zhu X Y. Finding Nuggets in Patent Portfolios: Core Patent Mining and Its Applications[J]. Tsinghua Science and Technology, 2013, 18(4): 339-352.
doi: 10.1109/TST.2013.6574672
[4] 马永涛, 张旭, 傅俊英, 等. 核心专利及其识别方法综述[J]. 情报杂志, 2014, 33(5): 38-43.
[4] (Ma Yongtao, Zhang Xu, Fu Junying, et al. Summary of Core Patent and Its Identification Methods[J]. Journal of Intelligence, 2014, 33(5): 38-43.)
[5] 亢川博, 王伟, 穆晓敏, 等. 核心专利识别的综合价值模型[J]. 情报科学, 2018, 36(2): 67-70.
[5] (Kang Chuanbo, Wang Wei, Mu Xiaomin, et al. Comprehensive Value Model of Core Patents Identification[J]. Information Science, 2018, 36(2): 67-70.)
[6] 祁延莉, 刘西琴. 核心专利识别方法研究[J]. 情报理论与实践, 2016, 39(11): 5-9.
[6] (Qi Yanli, Liu Xiqin. Research on the Methods of Identifying Core Patents[J]. Information Studies: Theory & Application, 2016, 39(11): 5-9.)
[7] 罗立国, 赵志浩, 罗丽珍. 核心专利识别指标理论与实证研究[J]. 中国发明与专利, 2020, 17(6): 100-105.
[7] (Luo Liguo, Zhao Zhihao, Luo Lizhen. Theory and Empirical Research on Core Patent Identification Indicators[J]. China Invention & Patent, 2020, 17(6): 100-105.)
[8] 季鹏飞, 华松逸, 张煜晨, 等. 基于引文分析的集成电路领域核心专利识别与分析[J]. 竞争情报, 2021, 17(6): 40-48.
[8] (Ji Pengfei, Hua Songyi, Zhang Yuchen, et al. Identification and Analysis of Core Patents in IC Field Based on Citation Analysis[J]. Competitive Intelligence, 2021, 17(6): 40-48.)
[9] 钱过, 李文娟, 袁润. 识别核心专利的综合价值指数[J]. 情报杂志, 2014, 33(6): 44-48.
[9] (Qian Guo, Li Wenjuan, Yuan Run. Index System of Composite Value of Core Patent[J]. Journal of Intelligence, 2014, 33(6): 44-48.)
[10] 王曰芬, 张露, 张洁逸. 产业领域核心专利识别与演化分析——以人工智能领域为例[J]. 情报科学, 2020, 38(12): 19-26.
[10] (Wang Yuefen, Zhang Lu, Zhang Jieyi. Identification and Evolution Analysis of Core Patent in the Industrial Field: Taking the Field of Artificial Intelligence as an Example[J]. Information Science, 2020, 38(12): 19-26.)
[11] 滕飞, 卢宝锋, 李龙飞, 等. 基于PatentSight的核心专利识别研究——以汽车轻量化制造工艺为例[J]. 科学观察, 2021, 16(1): 73-81.
[11] (Teng Fei, Lu Baofeng, Li Longfei, et al. Research on Core Patent Identification Based on PatentSight: Take Automobile Lightweight Manufacturing Process as an Example[J]. Science Focus, 2021, 16(1): 73-81.)
[12] Jeon J, Suh Y. Multiple Patent Network Analysis for Identifying Safety Technology Convergence[J]. Data Technologies and Applications, 2019, 53(3): 269-285.
doi: 10.1108/DTA-09-2018-0077
[13] 李娟, 李保安, 方晗, 等. 基于AHP-熵权法的发明专利价值评估——以丰田开放专利为例[J]. 情报杂志, 2020, 39(5): 59-63.
[13] (Li Juan, Li Baoan, Fang Han, et al. Evaluation of Invention Patent Value Based on AHP-Entropy Weight Method—Taking Toyota’s Open-Source Patent as an Example[J]. Journal of Intelligence, 2020, 39(5): 59-63.)
[14] 潘金兰, 徐庆娟, 刘合香. 基于AHP-TOPSIS最优组合赋权的台风灾害风险评估[J]. 南宁师范大学学报(自然科学版), 2021, 38(1): 60-67.
[14] (Pan Jinlan, Xu Qingjuan, Liu Hexiang. Risk Assessment of Typhoon Disaster in South China Based on Optimal Combination Weights of AHP-Anti-Entropy-TOPSIS[J]. Journal of Nanning Normal University (Natural Science Edition), 2021, 38(1): 60-67.)
[15] 杨大飞, 杨武, 田雪姣, 等. 基于专利数据的核心技术识别模型构建及实证研究[J]. 情报杂志, 2021, 40(2): 47-54.
[15] (Yang Dafei, Yang Wu, Tian Xuejiao, et al. Research on Construction and Empirical Study of Core Technology Identification Model Based on Patent Data[J]. Journal of Intelligence, 2021, 40(2): 47-54.)
[1] 刘小玲, 谭宗颖. 基于专利多属性融合的技术主题划分方法研究[J]. 数据分析与知识发现, 2022, 6(2/3): 45-54.
[2] 陈浩, 张梦毅, 程秀峰. 融合主题模型与决策树的跨地区专利合作关系发现与推荐*——以广东省和武汉市高校专利库为例[J]. 数据分析与知识发现, 2021, 5(10): 37-50.
[3] 高伊林,闵超. 中美对“一带一路”沿线技术扩散结构比较研究*[J]. 数据分析与知识发现, 2021, 5(6): 80-92.
[4] 隗玲,李姝影,方曙. 技术路线图:方法及其应用综述*[J]. 数据分析与知识发现, 2020, 4(9): 1-14.
[5] 武玉英, 孙平, 何喜军, 蒋国瑞. 新能源领域专利转让加权网络中主体间技术交易机会预测*[J]. 数据分析与知识发现, 2018, 2(11): 73-79.
[6] 王雪颖, 王昊, 张紫玄. 中文专利文献中连续符号串的语义识别*[J]. 数据分析与知识发现, 2018, 2(5): 11-22.
[7] 李姝影, 方曙. 测度技术融合与趋势的数据分析方法研究进展*[J]. 数据分析与知识发现, 2017, 1(7): 2-12.
[8] 翟东升, 郭程, 张杰, 夏军. 基于专利的企业潜在研发伙伴推荐方法研究[J]. 数据分析与知识发现, 2017, 1(3): 10-20.
[9] 史丽萍, 苑婧婷, 唐书林. 一种带文化嵌入摄动的集群核心企业专利合作能力动态评价方法研究[J]. 现代图书情报技术, 2014, 30(3): 96-103.
[10] 肖宇锋, 江洪, 董克. 专利权人引用网络中的媒介角色研究[J]. 现代图书情报技术, 2011, (11): 60-66.
[11] 张鹏 刘平 唐田田 高祥林 邓亮 孙大龙. 布拉德福定律在专利分析系统中的应用[J]. 现代图书情报技术, 2010, 26(7/8): 84-87.
[12] 唐田田,刘平,张鹏,葛富斌,李明. 冈珀兹曲线模型在专利发展趋势预测中的应用[J]. 现代图书情报技术, 2009, 25(11): 59-63.
[13] 马建霞,孙成权. 专利情报分析软件的现状和趋势[J]. 现代图书情报技术, 2006, 22(1): 66-70.
[14] 邵诚敏,仇琛. 两大中国专利检索系统的比较分析[J]. 现代图书情报技术, 2005, 21(4): 86-87.
[15] 曾闻, 王曰芬. 专业技术领域核心专利组合识别方法构建及其应用比较 [J]. 数据分析与知识发现, 0, (): 1-.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn