基于文本和公式的科技文档相似度计算*
徐建民, 许彩云

Computing Similarity of Sci-Tech Documents Based on Texts and Formulas
Xu Jianmin,Xu Caiyun
表1 数据集统计
数据集构成 贝叶斯检索(60篇) 个性化推荐(60篇) 人脸识别(60篇) 用户影响力(60篇) 文本分类(60篇)
基准文档 1 1 1 1 1
天然相似 17 11 11 11 11
背靠背修改 24 48 48 48 48
中英互译 18 0 0 0 0