基于学术论文全文的创新研究评价句抽取研究 *
章成志,李铮

Extracting Sentences of Research Originality from Full Text Academic Articles
Chengzhi Zhang,Zheng Li
表5 非评价句的标志词(频次排序前10位)
标志词 频次(比率) 例句
源于 3 965(24.1%) “碎片化信息大多源于微媒体”
第一个 1 210(7.4%) “选择关键词构建共词矩阵是共词分析中的第一个关键步骤”
始于 1 081(6.6%) “佛山市智能图书馆建设始于2011年”
开创 816(5.0%) “移动电子商务开创了产品与服务新的模式”
追溯到 297(1.8%) “修谱者往往愿意将自己的祖先追溯到某个名人”
最早······出现 225(1.4%) “Twitter作为最早出现的微博, 发展相对成熟, 是学术界微博研究者的主要研究对象”
首创 214(1.3%) “统计表明,美国的技术创新有78%为其首创”
首先······分析 213(1.3%) “本研究首先对三种活动类型的特征进行调查分析, 包括普及性和价值性两个方面”
创始人 202(1.2%) “Twitter创始人之一埃文·威廉姆斯曾表示, 微博的真正价值不是粉丝数而是转发量”
首次······出现 112(0.7%) “重要的内容首次出现的位置通常在标题中”