%A 李传席, 张智雄, 刘建华, 钱力 %T 半监督的网络科技信息分类模型 %0 Journal Article %D 2014 %J 数据分析与知识发现 %R 10.11925/infotech.1003-3513.2014.11.08 %P 53-58 %V 30 %N 11 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_3973.shtml} %8 2014-11-25 %X

[目的] 开放的网络科技信息网页内容之间区分度较小, 传统基于规则和统计学习的方法无法满足网络科技信息网页分类的具体应用需求.[方法] 通过深入分析网络科技信息主题网页的内容和结构, 利用开放本体等资源实现领域特征的学习, 构建半监督的网络科技信息分类模型.[结果] 实验结果表明提出的方法在网络科技信息分类实验中的精度、召回率和F1值分别达到0.9016、0.8756和0.8884, 相比贝叶斯方法具有明显优势.[局限] 该方法在应用到其他类别的网络科技信息分类时, 仍然需要领域专家提供相关领域的核心种子特征.[结论] 该方法可以满足网络科技信息深度加工的需求, 实现有效的网络科技信息网页分类.