基于引文细粒度情感量化的学术评价研究*
姜霖,张麒麟

Research on Academic Evaluation Based on Fine-Grain Citation Sentimental Quantification
Jiang Lin,Zhang Qilin
表7 引用内容示例
Table 7 The Examples of Citation Content
被引文献编号 施引文献 引用内容 情感量化结果
1 基于Ontology的中文信息抽取系统的研究与实现 由于它是基于Ontology的抽取,因此这种方法对文档的结构没有依赖性。从理论上讲,只要领域Ontology足够强大,它就能在该领域的信息抽取中达到很高的抽取精确率和召回率。 (-0.5)×(-0.87)+1.5×0.76=1.575
3 基于深度学习的图像检索 相比较一般的多层神经网络来说,深度信念网络DBN利用它的基本结构RBM来给网络赋了一个比较好的初值,预防了整个网络陷入局部最小值,而且结构简单,易于扩展 0.75×0.84+0.74+0.73=2.1
领域文本句子基本概念结构抽取研究 用深度学习处理文本并提取文本信息及文本之间的隐含关系,可以明显提高分析的效率,发现一些隐秘却有价值的有用信息。 0.85=0.85
9 基于领域词库的新闻提取技术的研究及应用 这种抽取方式大多都是通过人工制定规则,很难用计算机自动发现规则,特别是如今网络流行语千奇百怪更难发现其规则性,所以十分困难 1.5×(-0.67)+1.5×(-0.67)+1.5×(-0.71)=-3.075
支持DOM模板可视化配置的网页抽取方法 手动配置对专业要求较高,需要了解网页结构、正则表达式等知识;又因其配置过程复杂且需手动输入而使效率低下且容易出错 (-0.67)+(-0.63)+(-0.73)+(-0.57)=- 2.6
26 基于Web数据挖掘的多因素科技专家信息提取方法 但该文并没有区分 Table 标签的两种不同作用,对于结构复杂、噪音较多的网页会留下多的噪音信息。 0.75×(-0.62)=- 0.465
31 基于混合机器学习模型的多文档自动摘要 如张晗、赵玉虹提出了基于语义图的医学多文档摘要模型,能够有效识别文本中的核心内容。 0.68=0.68