同族专利可视化分析工具设计与实现
刘玉琴1, 彭茂祥2
1.中国科学技术信息研究所 北京 100038
2.北京理工大学管理与经济学院 北京 100081
摘要

采用双曲树可视化方法,对转换成树形结构的同族专利可视化进行研究,提出优先权模式和国家模式的两种同族专利可视化表示。设计实现同族专利可视化分析工具,阐述该工具的技术思路、结构框架、主要功能和关键技术实现,并以苹果公司的触摸屏专利为例进行实证研究。

关键词: 同族专利; 双曲树; 可视化
Design and Implementation of Visualization System of Patent Family
Liu Yuqin1, Peng Maoxiang2
1.Institute of Scientific & Technical Information of China, Beijing 100038, China
2.School of Management and Economics, Beijing Institute of Technology, Beijing 100081, China
Abstract

This paper studies the visualization method of patent family which is transformed into tree structure,then puts formard two visualization methods including country mode and priority mode.Then a patent family visualization system is designed and implemented,and its technical idea,basic framework,main functions and key technologies are elaborated.At last, an empirical illustration about Apple’s touch screen patent is proposed.

Keyword: Patent family; Hyperbolic tree; Visualization
1 引 言

同族专利分析在所有专利信息分析中占有重要的地位[ 1]。通过对同族专利的分析,科研管理人员可以得知申请人就相同技术主题在哪些国家申请了专利,其法律状态如何;科技研发人员可以获悉同类技术最新的研究进展、不同阶段的改进方案,也可以通过本国范围内的同族专利理解其他国家范围的同族专利;专利审查员可以参考其他专利机构审批相同主题专利的审批结果。

为准确、高效地进行同族专利分析,本文构建了同族专利可视化分析工具,将基于搜索引擎的网页搜索应用于同族专利信息获取过程;将同族专利通过适当变换转换成树形结构,采用双曲树进行可视化呈现,以此来提高同族专利分析的效率。

2 需求分析及技术思路
2.1 需求分析

目前,针对同族专利的分析有检索列表浏览法、数量统计法、同族专利解析表和可视化4种。检索列表是对专利检索系统检出的同族专利进行简单的罗列,用户在使用时按照页码进行翻页,分析效率不高,欧洲专利局和德温特专利数据库均采用该方法。数量统计法则是通过对专利的同族专利数量进行统计分析,用以作为判断专利重要性的参考指标之一[ 2],一般在进行专利价值评估和专利战略分析等宏观层面使用[ 3, 4]。同族专利解析表是对检索列表进行人工改写,在一张表格中顺序列出每个同族专利的“国家、申请日、申请号、主标识、辅标识、公开日、公开号、优先权”等信息[ 5]。同族专利解析表侧重于微观层面的分析,其优点是解析信息易扩展、分析结果有条理,不足之处在于其内容均由人工完成,在同族专利数量较多时,人力成本增加,而且表格的浏览方式使得使用者很难快速准确地定位所关注的信息。同族专利可视化分析以商业专利检索系统SooPAT为典型[ 6],提供了同族专利发展图、星形图和花形放射图三种可视化分析图形。该系统的同族专利数据更新较欧洲专利局具有明显的延迟,其可视化显示以专利公开号、公开日为主,且在同族数量较多时可读性降低,服务由最初的免费转向收费。

基于以上分析,设计开发一个能够全面并高效地获取同族专利数据、多角度展示同族专利所蕴含的各类信息的同族专利分析工具是十分必要的。

2.2 技术思路

信息可视化是利用计算机支撑的、交互的、对抽象数据的可视表示,来增强人们对这些抽象信息的认识[ 7]。其内涵是将数据通过图形化、地理化形象真实地表现出来并且找到数据背后蕴含的信息[ 8]。在各种可视化技术中,基于双曲几何的双曲树是操纵大型层次结构数据方面应用广泛的可视化技术之一[ 9]。同族专利集合经过适当的变换可转换成树形结构,而且转换后的树形结构具有数据节点多、申请时间跨度长等特点,与双曲树可视化具有很好的拟合性。

本文构建的同族专利分析工具采用信息可视化的原理,按照同族专利的优先权时间和申请国将同族专利转化成两种树形结构,进而基于双曲树算法把同族专利之间的关系以树形结构形象化地展示出来。具体的转换规则如下:

(1)以被分析专利作为树形结构的根节点;以被分析专利所有同族专利的共有优先权日期集合为根节点的子节点集合,即二级节点集合;将具有相同优先权日(二级节点集合中的单个节点)的专利集合按照公开日期进行排序,作为二级节点的三级、四级……子节点,形成树形结构。

(2)以被分析专利作为树形结构的根节点;以被分析专利所有同族专利的所属国集合为根节点的子节点集合,即二级节点集合(相同的元素合并后节点集合元素唯一);将所属国相同的专利集合按照公开日期进行排序,作为二级节点的三级、四级……子节点,形成树形结构。

3 系统设计
3.1 结构设计

同族专利可视化分析系统框架主要由同族专利信息的采集、清洗转换和可视化分析几个功能模块组成。同族专利信息主要来源于欧洲专利局的官方检索平台INPADOC数据库。在同族专利采集过程中引入搜索引擎技术,以实现同族专利信息的搜索;清洗转换采集的同族信息提供给分析引擎进行分析并存储;采用可视化手段呈现分析结果。系统的结构框架如图1所示:

图1 同族专利可视化系统结构框架

3.2 界面设计

同族专利可视化分析工具的界面设计如图2所示:

图2 同族专利可视化分析工具主页面

菜单栏主要包括:文件、模式、显示、语言、帮助5个菜单项;工具栏主要包括:打开、保存、搜索、网络连接、背景设置、根节点、截图、图形样式、主页链接、退出10项;界面下方为可视化图形输出区域。

该工具支持输入专利同族信息实时搜索与可视化呈现,也支持图形文件“打开”对离线的数据进行可视化呈现。

3.3 功能设计

同族专利可视化分析工具的功能设计如下:

(1)同族专利数据搜索。在工具栏的搜索文本框中输入待分析专利,点击搜索按钮获取同族专利数据。

(2)同族专利数据可视化表示。搜索到的同族专利数据以双曲树的形式显示在图形区,通过菜单栏的模式按钮在优先权模式和国家模式之间进行可视化图形的切换。通过菜单栏的显示按钮使节点显示内容在专利申请人、发明人、公开日、国际分类号、欧洲分类号或美国分类号之间切换。通过鼠标单击专利节点将其布置在屏幕中心。

(3)查看同族专利详细信息。对于屏幕中心的专利,单击菜单栏的网络连接,调取专利在欧洲专利局的详细信息页面。

(4)图像文件的保存。截取可视化结果为JPG格式的图片,或通过类的序列化将其保存到硬盘,再通过文件打开进行可视化输出。

(5)可视化图形样式设置。应用工具栏中的背景和图形样式设置,修改背景、图形节点、连线和文字颜色。

4 系统实现
4.1 同族信息搜索与提取

选取同族专利数据库收录范围广、更新及时且免费的欧洲专利局INPADOC数据库为同族专利搜索来源[ 10]。以C#语言Web请求类HttpWebRequest向服务器发送GET请求,请求内容设置如下:

"Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&r=1&p=1&f=G&l=50&d=PTXT&S1={0}.PN.&OS=PN/{0}";//{0}为专利号的占位符

请求返回包括同族信息的HTML页面,应用以下正则表达式进行同族信息的提取:

"

Inventor:

((?(.|\s)*?))

Applicant:

((?(.|\s)*?))

EC:

((?(.|\s)*?))

IPC:

((?(.|\s)*?))

Publication\sinfo:

((?(.|\s)*?))

Priority\sdate:

((?(.|\s)*?))"

提取的同族专利集合,被转换形成两个树结构,存储在C#结构类TreeView中。

4.2 双曲树算法

双曲树算法是将树结构在双曲空间进行布局,然后映射到欧式空间的庞莱卡圆盘进行显示,映射示意图如图3所示:

图3 双曲空间映射示意图

欧式空间中两个相同大小的区域离庞莱卡圆盘中心越近,在双曲空间中所占用的空间越小;反之,双曲空间中两个大小相同的区域离原点越近在庞莱卡圆盘中所占用的空间越大。当关注的树节点被放到双曲空间的原点后,欧式空间中该节点显示在圆盘中心(电脑屏幕中心),且占用的空间最大。

算法包括双曲空间树节点布局,双曲空间向欧式空间映射两个主要步骤。将树的根节点坐标设置为双曲平面的原点(0,0);把根节点的扇形区域平分给根节点的子节点,每个二级子节点拥有自己的扇形区域,再把每个二级子节点的扇形区域平分给其三级子节点,依次类推进行节点的分布;采用庞莱卡投影把双曲空间中的点映射到欧式空间的庞莱卡圆盘上。具体技术实现步骤如下:

(1)以复数类HTCoordinate(double x, double y)表示双曲空间中点坐标,复数的实部、虚部分别与双曲空间中点的横、纵坐标对应,扇形类HTSector(HTCoordinate p1,HTCoordinate p2)表示双曲空间中的扇形区域;

(2)在双曲空间中对树结构中的每个节点进行布局,除根节点布局在原点(0,0)外,其他子节点调用如下布局过程进行坐标的递归设置;

HTCoordinate w = parent. Coordinates();//当前父节点坐标

double angle = sector. Angle();//当前节点父节点所拥有的扇面

z.x = length * Math.Cos(angle);//当前节点相对于父节点的位置坐标

z.y = length * Math.Sin(angle);

z.Translate(w);//经过变换设置当前节点在双曲空间中的坐标

其中,坐标变换函数HTCoordinate.Translate(HTCoordinate w)的变换规则如下:

double deltax = x * w.x + y * w.y;

double deltay = y * w.x - x * w.y;

double newx = x + w.x;

double newy = y + w.y;

x = (newx * deltax + newy * deltay)/(deltax * deltax + deltay * deltay);

y = (newy * deltax - newx * deltay)/(deltax * deltax + deltay * deltay);

(3)将双曲空间点Z的坐标映射到欧式空间,映射规则如下:

x = Math.Round(z.x * (double) max.x)+ org.x;

//max为庞卡莱圆盘的大小

y =-Math.Round(z.y * (double) max.y)+ org.y;

//org为庞卡莱圆盘中心的欧式空间坐标

4.3 可视化图形渲染

可视化图形的输出基于微软.NET Framework 3.0绘图技术开发框架Windows Presentation Foundation(WPF)实现,分别进行节点和连线的图形渲染:

DrawingContext g=new DrawingContext();

g.DrawRectangle(nodeFillColorsBrush,nodeBorderColorPen,x, y, width, heigh);

g.DrawLine(lineColorPen,StartPoint,EndPoint);

4.4 同族信息可视化表示

通过对同族专利数据的转换与双曲树算法的实现,同族专利可视化分别在“优先权模式”和“国家模式”下进行,如图4图5所示:

图4 优先权模式下的同族专利可视化表示

图5 国家模式下的同族专利可视化表示

(1)“优先权模式”下首先关注被分析专利在世界范围内的同族专利所有优先权日期,距离被分析专利最近的一层为优先权日;然后,对同一优先权日下的专利按照国家进行划分,形成第二层分支结构;最后,就同一国家下的专利按照公开时间进行更深层级的排序。

(2)“国家模式”下首先关注被分析专利在各个国家的同族专利申请情况,距离被分析专利最近的一层为国家缩写代码;然后,依据同族专利在各国的优先权日对该国范围内申请或授权的同族专利进行划分,形成第二层分支结构;最后,就同一优先权下的专利按照公开时间进行更深层级的排序。

两种模式使用户可以迅速获取“被分析专利在哪里有同族,优先权在什么时候,来自哪个国家”等信息,并按照用户的关注内容进行专利的“申请日、申请人、发明人、国际分类号、欧洲分类号、美国分类号”等显示内容的切换。

5 实证应用

对苹果公司在美国的专利进行跟踪,发现其专利号为US2008128182的专利在INPADOC数据库内共有391件同族专利,使用本文构建的同族专利可视化工具进一步了解这些同族专利的情况。

输入被分析专利号进行同族数据采集,获取同族信息,分别在国家模式和优先权模式下进行可视化。在国家模式下,发现该专利在澳大利亚、奥地利、加拿大、中国、德国、欧洲专利局、西班牙、中国香港地区、以色列、日本、韩国、美国、世界知识产权组织范围内具有同族专利,如图6所示:

图6 US2008128182国家模式下同族专利

图7 US2008128182中国同族专利

图8 US2008128182中国授权同族专利

图9 US2008128182中国同族专利IPC分布

双击“CN”节点,展开中国范围内的同族专利,发现其同族专利优先权从2004-7-30始到2008-1-6止,共有11个,如图7所示;其中优先权为2005-9-16的专利CN101384977获得授权,如图8所示;按照国际分类号的分类准则,这些专利大多隶属于G06F3/048,即“图形用户界面的交互技术”,如图9所示;按照欧洲分类号的分类准则,这些专利大多隶属G06F3/048A3和G06F3/048A3T,即“计算机用户接口,特别是通过触摸式的”和“计算机用户接口,把屏幕拆分成独立的区域块”,与国际分类准则的技术分类信息一致,如图10所示;对于每件专利的发明人,从文字上粗略地看出这些专利的发明人比较分散,并没有集中在少数发明人手中,如图11所示。

图10 US2008128182中国同族专利UPC分布

图11 US2008128182同族专利发明人分布

在优先权模式下,发现最早优先权日为1998-1-26,以该日期为优先权日的同族专利在美国、日本、韩国、欧洲专利局申请相对较多,但只在美国、韩国获得了授权,如图12所示;最近优先权日为2008-1-6,在美国、中国、澳大利亚、欧洲专利局进行了布局,如图13所示;在对技术类别分析时,可以得到同“国家模式”一致的结论;再对发明人分析,发现同一优先权下的同族专利发明人相对固定,如图14所示的优先权日为2006-10-24的同族专利发明人多为HUPPI BRIAN,FADELL ANTHONY M,BARRENTINE DEREK,FREEMAN DANIEL,比较集中。

图12 US2008128182优先权模式下同族专利

图13 US2008128182最近优先权日下同族专利布局

图14 US2008128182优先权模式下同族专利发明人分布

综上,可得出以下结论:苹果公司在计算机触摸式操作上的技术研发从20世纪90年代开始,且持续性投入,但不同阶段的主要发明人有所变动,专利布局的国家范围比较广。同时,也发现并不是所有同族专利都获得授权,即便是相同优先权下的同族专利在不同国家范围内的授权状态也有所不同,分析原因主要有两个:各个国家的专利制度不同,如欧洲和中国专利局相对美国对于软件专利的可专利性要求更加严格;不同审查员的审查水平、判别标准不一。

6 结 语

鉴于同族专利分析在专利信息分析中的重要作用,本文设计了同族专利的可视化分析工具及技术实现,将基于搜索引擎的网页搜索应用于同族专利数据获取,使用双曲树可视化技术对同族专利进行展示,分别实现“国家模式”和“优先权模式”的同族专利可视化。在下一步的研究中,将对简单同族、复杂同族、扩展同族进行更加细致的可视化表示。

参考文献
[1] 赵沛丰, 赵欣. 同族专利信息分析及应用(上)[J]. 中国发明与专利, 2010(8): 85-88.
(Zhao Peifeng, Zhao Xin. Patent Family Information Analysis and Applications (PART 1)[J]. China Invention and Patent, 2010(8): 85-88. ) [本文引用:1]
[2] Sampat B N. Determinants of Patent Quality: An Empirical Analysis [EB/OL]. [2012-01-01]. http://www.immagic.com/eLibrary/ARCHIVES/GENERAL/COLUMBIA/C050902S.pdf. [本文引用:1]
[3] Michel J, Bettels B. Patent Citation Analysis-A Closer Look at the Basic Input Data from Patent Search Reports[J]. Scientometrics, 2002, 51(1): 185-201. [本文引用:1] [JCR: 2.133]
[4] Wang S J. Factors to Evaluate a Patent in Addition to Citations[J]. Scientometrics, 2007, 71(3): 509-522. [本文引用:1] [JCR: 2.133]
[5] 赵沛丰, 赵欣. 同族专利信息分析及应用(下)[J]. 中国发明与专利, 2010(9): 81-84.
(Zhao Peifeng, Zhao Xin. Patent Family Information Analysis and Applications (PART 2)[J]. China Invention and Patent, 2010(9): 81-84. ) [本文引用:1]
[6] Soopat[EB/OL]. [2012-03-11]. http://www.jetro.go.jp/world/asia/cn/ip/pdf/report_201003_4-5.pdf. [本文引用:1]
[7] 周宁, 张玉锋, 张李义. 信息可视化与知识检索[M]. 北京: 科学出版社, 2005: 1-2.
(Zhou Ning, Zhang Yufeng, Zhang Liyi. Information Visualization and Knowledge Retrieval[M]. Beijing: Science Press, 2005: 1-2. ) [本文引用:1]
[8] 张兆锋, 桂婕, 乔晓东, . 专利引证分析工具的设计与实现[J]. 数字图书馆论, 2010(9): 20-25.
(Zhang Zhaofeng, Gui Jie, Qiao Xiaodong, et al. Design and Implementation of a Patent Citation Analysis Tool[J]. Digital Library Forum, 2010 (9): 20-25. ) [本文引用:1] [CJCR: 0.5836]
[9] 窦长威. 层次信息可视化技术的一种实现方法[J]. 工程地质计算机应用, 2007(2): 11-15.
(Dou Changwei. One Implementation Method of Hierarchical Information Visualization Techniques[J]. Engineering Geology Computer Application, 2007(2): 11-15. ) [本文引用:1]
[10] 同族专利检索[EB/OL]. [2012-01-01]. http://wenku.baidu.com/view/32479c3510661ed9ad51f368.html.( Patent Family Retrieval[EB/OL]. [2012-01-01]. http://wenku.baidu.com/view/32479c3510661ed9ad51f368.html [本文引用:1]