Advanced Search

数据分析与知识发现, 2020, 4(2/3): 60-67 doi: 10.11925/infotech.2096-3467.2019.0677

专辑

基于可视化的基金资助热点及其演化发现方法研究*

陈挺1,2,3, 王海名,,3, 王小梅3

1中国科学院文献情报中心 北京 100190

2中国科学院大学经济与管理学院图书情报与档案管理系 北京 100190

3中国科学院科技战略咨询研究院 北京 100190

Detecting Funding Topics Evolutions with Visualization

Chen Ting1,2,3, Wang Haiming,,3, Wang Xiaomei3

1National Science Library, Chinese Academy of Sciences, Beijing 100190, China

2Department of Library, Information and Archives Management, University of Chinese Academy of Sciences,Beijing 100190, China

3Institutes of Science and Development, Chinese Academy of Sciences, Beijing 100190, China

通讯作者: 王海名, ORCID: 0000-0002-7077-180X, E-mail:wanghaiming@casisd.cn

收稿日期: 2019-06-14   修回日期: 2019-08-11   网络出版日期: 2020-02-25

基金资助: *本文系中国科学院科技战略咨询研究院青年基金项目“科研项目布局分析中关键技术方法研究”.  Y7X1161Q01
中国科学院文献情报领域引进优秀人才计划项目“空间科技领域战略情报分析方法研究”的研究成果之一.  Y15391001

Received: 2019-06-14   Revised: 2019-08-11   Online: 2020-02-25

摘要

【目的】 设计基于可视化的基金资助热点发现方法,用于分析科研立项重点以及发现其演化过程。【方法】 基于NASA小企业研发计划基金申请书的文本特征,绘制连续时间窗口下基金资助图谱,通过识别图谱中项目密度分布较高的区域定位资助热点,并根据两期图谱中热点位置、内容变化分析研判资助热点演变趋势。【结果】 在两个时间窗口内,可明确区分出消亡的、持续的和新兴的资助热点及其演化过程。【局限】 分析方法中涉及文本特征提取、可视化与概率密度计算等多个步骤需要多次调优,热点与演化判断分析尚未形成计算指标,无法脱离领域专家的判读。【结论】 本文提出的基于可视化图谱的基金资助热点及其演化的发现方法,可直观地反映资助机构的资助布局热点变化情况,经领域专家判读与其认知相符,或可在科研管理与决策者审视宏观科研布局中起到辅助作用。

关键词: 可视化 ; 核密度 ; 基金资助热点 ; 演化

Abstract

[Objective] This study tries to detect funding topics and their evolution based on data from NASA’s Small Business Innovation Research Program.[Methods] First, we created funding maps with two-time windows for topics of funding applications. Then, we identified areas with higher number of topics in the map. Finally, we determined the trends by comparing the changes of hotspots from the two maps.[Results] The proposed method identified the disappeared, continuous and emerging funding topics from the maps.[Limitations] The algorithm parameters and results need to be adjusted and evaluated manually.[Conclusions] The proposed method could effectively detect funding toipics and their evolution, which helps scientific management and policy decision making.

Keywords: Visualization ; Kernel Density ; Funding Focus ; Evolution

PDF (2878KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

陈挺, 王海名, 王小梅. 基于可视化的基金资助热点及其演化发现方法研究*. 数据分析与知识发现[J], 2020, 4(2/3): 60-67 doi:10.11925/infotech.2096-3467.2019.0677

Chen Ting. Detecting Funding Topics Evolutions with Visualization. Data Analysis and Knowledge Discovery[J], 2020, 4(2/3): 60-67 doi:10.11925/infotech.2096-3467.2019.0677

1 引 言

从科技信息中发现研究热点,把握研究领域中的热点与发展态势是科研人员与科研管理者关注的焦点之一。科研人员在确立研究方向,科研管理者在制定发展规划时均需要准确地了解世界科技研究热点方向与发展态势。已有不少研究将发表的研究论文作为研究素材,设计分析方法发掘研究热点,本研究则尝试从项目资助数据自动发现研究热点及其趋势变化。

相较从科研论文发现科学发展的热点及发展趋势,基于基金数据的热点发现与趋势分析的延迟更短,无需等待论文发表与引文积累。从这个角度看,利用科研资助基金数据挖掘资助的热点与趋势可能与科学家心目中的真正研究热点更相近。同时基金资助数据一般需经严格同行评议,资助机构拿出相应资源资助相关研究,通常符合资助机构的实际需求。如果能从海量基金资助数据中揭示具体的资助思路,进一步发现资助热点与演化趋势,从而展现宏观科研布局,可以辅助科研咨询与管理人员前瞻把握科技发展的方向与趋势。

一些学者已经开展了基于基金资助项目的科研热点研究。笔者所在研究团队对基本科学指标数据库(ESI)研究前沿进行聚类,选取其中包含6个以上研究前沿的聚类作为研究热点,进一步分析研究热点内基金资助情况[1]。这种利用资助论文反推资助热点的分析方法存在较长的滞后性,更适用于对过往资助的整体评估。也有学者通过资助机构自身划分的资助细分领域进行统计分析[2,3,4],找出某个研究方向下细分领域中的资助热点与变化情况,这种资助热点分析方法易于操作但受限于各资助机构提供数据分类差异较大,适用性不强。

近年来,越来越多的资助热点与演化分析采用基金申请书中的关键词、主题词、领域实体统计分析[5,6,7]的方法,这类分析方法较为简单易行,但通过词频的增长变化表征资助热点存在一定的局限性:现阶段很难突破自然语言的一词多义或一义多词的歧义限制;同时词本身过于抽象且解释性弱,分析人员往往需要充分发挥想象力进行解读。此外,笔者曾用文本聚类结合时序趋势变化的分析方法分析美国国家科学基金(NSF)材料领域的资助热点[8]。但利用文本聚类也同样存在一定的局限性,大规模样本下聚类后续判读命名难度大,且聚类问题本身难度很大,难以有效评估聚类效果,往往出现聚类划分牵强的现象。

随着自然语言处理与机器学习相关方法的发展,文本语义特征抽取模型有了长足的进步,基于已有的基金可视化研究成果,本文通过抽取基金项目申请书的文本特征构建可视化图谱,并在此基础上,结合地理信息研究中区域热力图概念,从图谱中识别出密度较高区域。密度高的区域代表有大量语义相近的资助项目,如果在一个时间段内出现大量相似的项目,认为这些项目可以被视为一个资助热点。识别出热点资助区域后,通过分割时间窗口进一步分析发现资助热点变化趋势,通过比对不同时期图谱中热点分布变化情况发现资助热点的消亡、持续与新兴。

2 数据来源

本文采用的基金分析数据为美国国家航空航天局(NASA)资助的“小型企业创新研究(SBIR)计划”包含的项目。“SBIR计划”是为支持小型科技企业发展并充分发挥小企业在美国高科技产业中机制灵活的优势,在1982年美国国会专门通过立法实施的支持计划。该计划规定联邦政府中的国防部、国立卫生研究院、国家科学基金会、美国国家航空航天局、能源部等11个政府部门每年必须拨出其研究经费的1.25 %用于支持高科技型小企业的技术创新与开发活动。

NASA对SBIR计划极为重视,旨在通过与小企业之间的合作,催化并开发新的技术以支持NASA的技术需求,是其空间技术研发体系的重要组成部分。NASA SBIR计划资助的项目所涉及的研究领域包括航空研究、空间运行、空间科学以及探索系统。NASA的SBIR计划由埃姆斯研究中心(Ames Research Center, ARC)负责总体管理,NASA各领域中心负责相应项目的管理。笔者从NASA SBIR计划网站获取2000-2017财年所有资助项目相关数据7 695条,包括资助项目标题、摘要、资助日期、经费、所属部门、受资助企业等。

3 研究方法

鉴于笔者之前开展的基金资助可视化方法研究[8]在布局准确性上有很好的效果,相似项目在图中较为集中,且主题、子主题之间都有明显的轮廓,因此本研究在此基础上进一步计算项目在可视化图谱中分布的密度情况,形成可视化资助项目密度图,通过资助项目分布的密度变化发现热点方向及其演化过程。之后通过划分时间窗口展示不同时间窗口下资助热点的变化情况,比对不同时期热点分布图分析资助热点的消亡、持续与新兴。

采用可视化图中计算密度分布的方法发现热点主要基于以下两点考虑:

(1)传统聚类算法效果难以保证,笔者曾尝试使用文本聚类的方式发现资助热点,但测试了基于空间划分、层次或者密度的多种聚类算法,经过判读都很难得到较好的结果。因为现有的聚类算法多数是硬聚类,每个样本都被分入一个类中,很多时候不同内容的项目被“硬”聚到一起,聚类效果可控性较差,很难保证聚类结果的类间一致性与类外差异性,有时还常常出现有些资助项目被过度切分,有些聚类中项目数量过大无法切分的情况。此外,聚类判读量过大,往往需要人工对所有样本进行浏览才能确定每个聚类的内容。

(2)图谱中高密度区域可能是资助热点。如果基金资助图谱中很小的区域内分布了大量的资助项目,这意味着有大量的语义相似的项目得到资助,这些项目很可能是这段时间内的资助热点。

通过图谱的密度发现资助热点有两个优势:

(1)密度高的区域面积相对较小,能确保该区域内所分布的项目在内容上非常接近,相比聚类的结果,密度高的热点中杂项很少。

(2)相比聚类大大减少了专家的判读工作,专家只需判断几个热点区域内的项目即可,提升了分析效率。

3.1 项目资助热点发现方法设计

项目资助热点发现流程如图1所示。

图1

图1   项目资助热点发现流程

Fig.1   Procedures for the Discovery of Funding Hotspots


为最大程度地保证后续降维效果,对NASA SBIR项目申请书文本进行数据清洗与预处理,包括去停用词、词性还原和词根提取;利用LDA主题模型提取项目申请书文本的主题特征,根据之前项目可视化图谱构建经验,通常将LDA主题特征的维度控制在20-50维,有利于后续降维可视化布局;再使用非线性降维算法t-SNE将高维特征映射入二维形成项目可视化图谱;最后利用KDE核密度算法发现研究内容高度类似的研究簇,即项目资助热点。

3.2 基于主题特征与降维的基金可视化方法

本研究提出的分析方法的基础为基金资助项目可视化,尽可能做到语义相近的资助项目在二维图谱中的位置更相近。因此采用基于申请书主题特征的降维可视化方法[8]。文本的特征往往是在高维空间中,通常维度从20到10 000维都有可能,而人类视觉只能理解三维及三维以下的图形。基于文本相似度矩阵的网络可视化图谱只能在整体结构上有较好的表现,在局部结构的角度上很难达到满意的可视化效果,无法满足基于密度的资助热点发现需求。随着机器学习的高速发展,降维可视化技术也从之前线性降维发展到基于流行学习的非线性降维算法,文本的高维特征降维至二维或三维的效果在稳定性和准确性方面都有极大提高。

本文设计的热点发现方法第一步是将基金项目申请书文本特征进行可视化,主流的文本特征提取方法有TF-IDF词袋模型、期望交叉熵、互信息、潜在语义分析模型、LDA主题模型等。笔者在之前的研究中发现主题模型应用于绘制基金图谱时有较好的效果,通过词汇在不同潜在主题分布下呈现不同的概率分布,在文档与词汇之间形成一个虚拟的主题特征层。从而减少一词多义或一义多词对特征向量空间准确性的影响,去除了原始向量空间中的一些“噪音”,提高信息检索的精确度,同时大大降低文本特征的维度,简化文本向量维度并大幅提高后续非线性降维算法的运算速度。鉴于LDA主题模型是公认效果较好、应用广泛的主题模型,本研究使用LDA主题模型抽取基金项目申请书的文本特征。

获取基金申请书文本的主题特征后,选用非线性降维t-SNE算法[9]作为基金文本可视化算法,它是一种非监督降维算法,无需预先给定样本的分类标签信息。目前t-SNE已成功应用于很多真实高维数据集,如图像文字、生物信息、新闻文本数据等[10,11,12,13]

NASA SBIR计划的整体资助项目可视化图谱如图2所示。

图2

图2   NASA 针对小企业研发资助项目的可视化图谱

Fig.2   Visual Map of NASA SBIR Awards


本研究将基金文本的高维LDA主题特征通过t-SNE降维算法映射在二维图谱中,每个坐标点代表一个项目,不同的颜色代表NASA不同部门授出的研究项目。图谱中x,y轴为高维特征降入二维空间的虚拟坐标系,二维空间中越接近的两个点代表它们高维空间的主题特征越相近,也代表着这两个项目的申请书相似度越高。从图2可以看出,资助项目形成了若干个轮廓清晰的项目簇,通过人工判读,进一步确认了项目簇内部项目申请书语义层面更接近,证明本文使用的可视化图谱算法有较好的可视化效果。

3.3 从可视化中发现资助热点

虽然通过基金资助图谱能有效掌握总体态势布局,但整个图谱坐标点的密度分布很不均匀,图中坐标点在某些区域有很强的重叠效果。只通过目测图谱中的面积无法清晰地识别出资助的重点,因此在图谱基础上计算项目的密度分布,密度高的区域表示大量相似的项目得到资助,很有可能代表一个资助热点。

空间点的聚集分析即热点分析在很多领域都有广泛的应用,如地理学、经济学、流行病学等[14,15,16]。常用的密度发现算法有点密度和核密度估计算法,本文采用空间点聚集分析最常用的核密度估计(Kernel Density Estimation, KDE)算法[17]自动发现项目资助热点区域。核密度估计通过计算空间中坐标点周围的密度构建平滑表面,实现从离散对象模型到连续场模型的转变,图谱中任意坐标点都可估计一个密度值,而不仅仅只计算已有的样本坐标的密度值。同时优化了点密度算法容易出现的边界效应。核密度估计算法中极为重要的一个自由参数是带宽h,h的选择对所得到的估计值有很大影响。笔者不希望挖掘的基金资助热点所含基金内容是繁杂且宽泛的对象,因此h值选择0.2,这样高密度区域在图谱中自主内容更聚焦,发现的资助热点在文本层面尽量接近。

4 案例分析

为进一步分析与发现资助热点与其演化过程,将NASA SBIR资助数据按照资助年分为两个时间窗口,2000-2008财年为第一个时间窗口,2009-2017财年为第二个时间窗口,分别包含3 963项和3 732项资助项目。在两个时间窗口的基金资助图谱上分别采用核密度估算算法发现若干个局部空间中大量聚集的空间点簇,这些簇代表资助机构在一段时期内获得大量资金投入资助且研究内容高度相似的资助项目,这些区域很可能是项目资助的热点方向。

两个时间窗口的资助热点变化如图3所示,选取资助热点时需要满足两个条件,第一为核密度值超过0.000 9的区域,第二为高密度区域内包含的资助项目超过20项,如同时满足以上两个条件则将该区域选定为热点资助方向。第一个时间窗口形成8个资助热点,第二个时间窗口高密度区域个数有所下降,只形成6个资助热点。通过辨别资助热点图谱中的位置与研究内容,发现有些热点在两期图谱中都能形成高密度的区域,而有些热点却只在单期中出现。根据热点在两个时期内分布位置差异,判断是持续热点还是新兴热点,如果第二个时间窗口中的热点在前个窗口中相同位置已经出现,则该热点为持续资助的热点,反之如果之前对应位置上未出现热点,则该热点为新兴资助热点。将14个资助热点分为4个消亡的资助热点(紫色)、7个持续资助的热点(黄色)和3个新兴的资助热点(红色)。经过人工判读,资助热点研究内容如表1-表3所示。

图3

图3   NASA SBIR 资助项目可视化图谱与资助热点变化

Fig.3   Visual Map and the Changes in the Funding Hotspots of NASA SBIR Awards


表1   持续资助热点

Table 1  Continuous Funding Hotspot

2000-2008财年2009-2017财年
簇号项目数量研究内容簇号项目数量研究内容
1-124数据挖掘、决策系统软件工具2-1105用于航空航天系统的软件工具开发(人机交互系统、可视化分析工具、无人机系统命令与控制,空管系统规划、运行和控制,决策支持系统等)
1-225用于航空航天系统的软件工具开发(人机交互系统、可视化分析工具、航空管理系统等)
1-374纳米材料、复合材料等多种材料及其航空航天应用2-231纳米材料、复合材料等多种材料及其航空航天应用
1-567航空器空气动力学算法、建模和仿真工具(声学、气动弹性力学、CFD工具、旋翼机建模、燃烧等)2-431航空器空气动力学算法、建模和仿真工具(声学、气动弹性、湍流等)

新窗口打开| 下载CSV


表2   消亡的资助热点(2000-2008财年)

Table 2  Withered Funding Hotspots (FY 2000 to 2008)

簇号项目数量研究内容
1-431基于MEMS的空间望远镜可变形镜面技术
1-658基于HgCdTe、AlGaN、GaAs等材料的探测及成像半导体光电器件
1-729高性能锂离子电池及其纳米复合电极、电解液材料开发
1-928用于航天器各系统的监视及检测技术

新窗口打开| 下载CSV


表3   新兴资助热点(2009-2017财年)

Table 3  Emerging Funding Hotspots (FY 2009 to 2017)

簇号项目数量研究内容
2-386用于空间极端环境的电子器件
2-671用于采样返回等太阳系探测任务的新型推进器技术
2-756大型太阳能阵列部署结构

新窗口打开| 下载CSV


图3中标有黄色圈的为持续资助的热点,表1是持续资助热点研究内容,可以清晰看到,NASA对“用于航空航天系统的软件工具开发”主题(簇号1-1,1-2,2-1)进行了持续密集资助,累计资助该主题的研究项目154项。在2000-2008财年,“用于航空航天系统的软件工具开发”主题的项目聚焦在人机交互系统、可视化分析工具、航空管理系统等的研究。与2000-2008财年相比,2009-2017财年的研究内容既有延续又有新的发展,新出现的主要研究内容包括无人机系统(UAS)命令与控制,空管系统(NAS)规划、运行和控制以及决策支持系统等。

“纳米材料、复合材料等多种材料及其航空航天应用”主题(簇号1-3,2-2)持续获得资助,受资助项目共计105项。2000-2008财年获得资助的项目数量达74项,2009-2017财年获得资助的项目数量达31项。该方向的研究持续聚焦在开发用于低温高温环境、增强结构、轻质结构、抗腐蚀、抗氧化等用途的纳米复合材料、聚合物材料、陶瓷基复合材料(CMC)、SiC材料、金属基复合材料等内容持续研究。

“航空器空气动力学算法、建模和仿真工具”主题(簇号1-5,2-4)也是获得NASA SBIR计划持续资助的热点研究方向,累计受资助项目数量达98项。在2000-2008财年有67项项目获得资助,在2009-2017财年共有31项项目获资助。该方向两期都聚焦在噪声预测及模拟、气动弹性力学算法及模拟工具、飞行器计算流体力学(CFD)工具开发和应用、旋翼机建模、燃烧模拟等内容持续投入。

资助热力图中有4个标有紫色圈的为消亡的资助热点,如表2所示,分别是“基于MEMS的空间望远镜可变形镜面技术”主题(簇号1-4)31项资助项目,主要研究内容聚焦在轻质、大孔径和低温空间望远镜的可变形镜片制造技术方向。“基于HgCdTe、AlGaN、GaAs等材料的探测及成像半导体光电器件”主题(簇号1-6)58项,主要研究内容聚焦在基于HgCdTe、AlGaN、GaAs等材料的雪崩光电二极管探测器、非制冷焦平面阵列、高效量子点热光电池、光电二极管相机、高效光电探测器等方向。“高性能锂离子电池及其纳米复合电极、电解液材料开发”主题(簇号1-7)29项,主要研究内容聚焦在高性能锂离子电池的电解液、纳米复合阴极材料、阳极材料以及高性能固态锂电池等方向。“用于航天器各系统的监视及检测技术”主题(簇号1-9)28项,主要研究内容聚焦在航天器功率监视、航天员健康监视系统、可植入生物电监测、航天服监测、透射超声相机等方向。

2009-2017财年的资助热力图中有3个新兴的资助热点,如表3所示,分别是“用于空间极端环境的电子器件”主题(簇号2-3)86项资助项目,主要研究内容聚焦在基于SiC等材料的抗辐射功率器件、集成电路、电子器件、栅极驱动器等方向。“用于采样返回等太阳系探测任务的新型推进器技术”主题(簇号2-6)71项,主要研究内容聚焦在用于火星、彗星采样返回任务的多种推进器技术,用于月球、火星、彗星等目标的太阳系探索推进器技术,以及小型推进器、绿色推进器、混合推进器等技术概念方向。“大型太阳能阵列部署结构”主题(簇号2-7)56项,用于空间任务的超高功率太阳能阵列,高度可扩展、紧凑型、模块化、轻质大型太阳能阵列系统,以及用于太阳能阵列的桁架、复合臂等结构。

空间科学领域的情报人员对本文的研究热点及其热点类型进行判读,认为发现的研究热点中的项目内容有很高的一致性,两期(2000-2008财年、2009-2017财年)持续资助的热点所含项目内容也有较高的延续性。但针对消亡或者新兴的热点,情报人员表示判断热点是否为消亡或新兴难度太大,还需要更多领域专家介入共同判断。

5 结 语

本文提出一种基于基金资助可视化的热点发现及其演化分析方法,旨在从海量基金数据中快速发现资助热点,并揭示其演化过程。以NASA针对小企业资助项目为例,将基金项目申请书特征高质量地映射入二维图中,在布局基础上利用密度分布自动发现大量相似项目集中的区域,这些区域很有可能是这段时期内的研究资助热点。还利用分割时间窗口的方式对比两期热点分布变化情况,通过对比图谱中位置变化进一步发现热点的演化,包括资助热点的持续、消亡和新兴。

通过密度图识别基金资助热点及其演化的分析方法相比其他主题词或者文本聚类方法具有以下优势:

(1)解释性强。主题词统计过于抽象,存在几个主题都包含许多相同主题词的情况,在解释热点内容时往往缺乏辨析力。而通过聚类发现研究热点存在聚类难度高、聚类中存在杂项等的问题。本文提出的分析方法只聚焦在最“热”的区域,保证了热点中基金内容有很高的相似性,不容易出现所谓的杂项,同时还能大幅减少专家判读基金数据的工作量。

(2)算法的全流程的一致性高。从特征选取、可视化布局发现、热点发现以及演化发现整个流程在算法层面得到统一,分析结果会有更好的一致性与统一性。不会出现可视化与聚类用两套方法,导致结果不统一的矛盾现象。

目前基金热点及其演化发现工作尚处于实验探索阶段,未对更多不同资助机构的项目文本进行测试。未来将进一步验证基金可视化方法在不同数据集、不同资助机构数据集中的可视化效果。最终将形成一整套完善的基金热点分析方法与工具,以供情报分析人员与科技决策者使用。

作者贡献声明:

陈挺:提出研究思路,设计并完成实验,起草论文;

王海名:数据获取与预处理,分析结果判读,论文起草与定稿;

王小梅:提出研究问题,论文修改与定稿。

利益冲突声明:

所有作者声明不存在利益冲突关系。

支撑数据:

支撑数据由作者自存储,https://gist.github.com/jy00295005/64be57a559f52e7bb304c61990f7bfba

[1]王海名. NASA 小企业资助数据.csv. 实验数据.

参考文献

王小梅, 李国鹏, 陈挺 .

中国与世界主要科技强国的科学资助分析:基于科学结构图谱2010-2015

[J]. 中国科学基金, 2018,32(4):424-433.

[本文引用: 1]

( Wang Xiaomei, Li Guopeng, Chen Ting .

Scientific Funding of Scientific Prowess Nations: Analysis Based on the Science Map 2010-2015

[J]. Bulletin of National Natural Science Foundation of China, 2018,32(4):424-433.)

[本文引用: 1]

杜建, 唐小利 .

美国国立卫生研究院与中国国家自然科学基金资助艾滋病细分领域分析

[J]. 中国预防医学杂志, 2012,13(9):718-722.

[本文引用: 1]

( Du Jian, Tang Xiaoli .

Analysis of the AIDS Segment by the National Institutes of Health and the National Natural Science Foundation of China

[J]. Chinese Preventive Medicine, 2012,13(9):718-722.)

[本文引用: 1]

申艳军, 杨更社, 唐丽云 , .

2006-2015年“寒区岩土力学与工程”领域国家自然科学基金资助情况统计及发展趋势浅析

[J]. 冰川冻土, 2015,37(5):1294-1303.

[本文引用: 1]

( Shen Yanjun, Yang Gengshe, Tang Liyun , et al.

Development Trend and Statistics of the Field of Geotechnical Mechanics and Engineering in Cold Regions Funded by NSFC During 2006-2015

[J]. Journal of Glaciology and Geocryology, 2015,37(5):1294-1303.)

[本文引用: 1]

邓方, 宋苏, 刘克 , .

国家自然科学基金自动化领域数据分析与研究热点变化

[J]. 自动化学报, 2018,44(2):377-384.

[本文引用: 1]

( Deng Fang, Song Su, Liu Ke , et al.

Data and Research Hotspot Analyses of National Natural Science Foundation of China in Automation Field

[J]. Acta Automatica Sinica, 2018,44(2):377-384.)

[本文引用: 1]

Park J, Blume-Kohout M, Krestel R , et al.

Analyzing NIH Funding Patterns over Time with Statistical Text Analysis

[C]// Proceedings of the 30th AAAI Conference on Artificial Intelligence. 2016.

[本文引用: 1]

Pellicano E, Dinsmore A, Charman T .

What Should Autism Research Focus upon? Community Views and Priorities from the United Kingdom

[J]. Autism, 2014,18(7):756-770.

[本文引用: 1]

Schwedt T J, Shapiro R E .

Funding of Research on Headache Disorders by the National Institutes of Health

[J]. Headache, 2009,49(2):162-169.

[本文引用: 1]

陈挺, 李国鹏, 王小梅 .

基于t-SNE降维的科学基金资助项目可视化方法研究

[J]. 数据分析与知识发现, 2018,2(8):1-9.

[本文引用: 3]

( Chen Ting, Li Guopeng, Wang Xiaomei .

Visualizing Appropriation of Research Funding with t-SNE Algorithm

[J]. Data Analysis and Knowledge Discovery, 2018,2(8):1-9. )

[本文引用: 3]

van der Maaten L, Hinton G .

Visualizing Data Using t-SNE

[J]. Journal of Machine Learning Research, 2008,9:2579-2605.

[本文引用: 1]

Zhong G Q, Cheriet M .

Large Margin Low Rank Tensor Analysis

[J]. Neural Computation, 2014,26(4):761-780.

[本文引用: 1]

Li W T, Cerise J E, Yang Y N , et al.

Application of t-SNE to Human Genetic Data

[J]. Journal of Bioinformatics and Computational Biology, 2017,15(4):1750017.

[本文引用: 1]

Pezzotti N, Lelieveldt B P F, van der Maaten L , et al.

Approximated and User Steerable tSNE for Progressive Visual Analytics

[J]. IEEE Transactions on Visualization and Computer Graphics, 2017,23(7):1739-1752.

[本文引用: 1]

Liu S S, Bremer P T, Thiagarajan J J , et al.

Visual Exploration of Semantic Relationships in Neural Word Embeddings

[J]. IEEE Transactions on Visualization and Computer Graphics, 2018,24(1):553-562.

[本文引用: 1]

Xu X Y, Yan Z, Xu S L .

Estimating Wind Speed Probability Distribution by Diffusion-Based Kernel Density Method

[J]. Electric Power Systems Research, 2015,121:28-37.

[本文引用: 1]

Xia Z X, Yan J .

Kernel Density Estimation of Traffic Accidents in a Network Space

[J]. Computers, Environment and Urban Systems, 2008,32(5):396-406.

[本文引用: 1]

Anderson T K .

Kernel Density Estimation and K-means Clustering to Profile Road Accident Hotspots

[J]. Accident Analysis and Prevention, 2009,41(3):359-364.

[本文引用: 1]

Dehnad K .

Density Estimation for Statistics and Data Analysis

[J]. Technometrics, 1987,29(4):495-495.

[本文引用: 1]

/

版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn