Please wait a minute...
Advanced Search
数据分析与知识发现  2023, Vol. 7 Issue (7): 32-45     https://doi.org/10.11925/infotech.2096-3467.2022.0651
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于特征测度和PhraseLDA模型的领域学科交叉主题识别研究——以纳米技术的农业环境应用领域为例*
张振青,孙巍()
中国农业科学院农业信息研究所 北京 100081
Interdisciplinary Subject Recognition Based on Feature Measurement and PhraseLDA Model——Case Study of Nanotechnology in Agricultural Environment
Zhang Zhenqing,Sun Wei()
Institute of Agricultural Information, Chinese Academy of Agricultural Sciences, Beijing 100081, China
全文: PDF (1459 KB)   HTML ( 12
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 基于特征测度方法和PhraseLDA模型,对领域学科交叉主题进行识别。【方法】 通过主题的学科交叉特征分析,构建学科交叉主题测度指标体系,结合PhraseLDA模型识别领域学科交叉主题,最后在纳米技术的农业环境应用领域进行实证研究。【结果】 客观识别出纳米技术的农业环境应用领域包括催化剂制备、土壤生物修复等交叉主题24个,相较于传统识别方法,交叉主题识别率提升71.40%,细粒度主题识别率提升42.86%。【局限】 PhraseLDA主题模型的主题数量和学科交叉主题识别指标等阈值是经过反复计算调试而设定,因此,本文方法对相关阈值设定的合理性存在一定依赖性。【结论】 本文方法可有效识别领域中的学科交叉主题,为相关领域开展科学决策和科技创新研究提供辅助参考。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
张振青
孙巍
关键词 学科交叉主题主题识别学科交叉特征PhraseLDA模型    
Abstract

[Objective] This paper aims to identify the interdisciplinary subjects based on the feature measure method and the PhraseLDA model. [Methods] First, we analyzed the subjects’ interdisciplinary characteristics and constructed their measurement index system. Then, we identified the interdisciplinary subjects with the help of the PhraseLDA model. Finally, we conducted an empirical study of nanotechnology applications in agricultural environments. [Results] A total of 24 cross-topic were objectively identified, including catalyst preparation, soil bioremediation, and many more. Compared with the traditional identification method, the cross-topic recognition rate of the proposed method increased by 71.40%, and the recognition rate of fine-grained topics increased by 42.86%. [Limitations] The number of topics and interdisciplinary topic identification indicators of the PhraseLDA topic model were decided after repeating calculation and debugging. Therefore, the proposed method depends on the rationality of the relevant thresholds. [Conclusions] The proposed method can effectively identify interdisciplinary topics and support scientific decision-making and technological innovation research in related fields.

Key wordsInterdisciplinary Subject    Subject Recognition    Interdisciplinary Characteristics    PhraseLDA Model
收稿日期: 2022-06-24      出版日期: 2023-09-07
ZTFLH:  TP393  
  G350  
基金资助:*农业农村部支撑性任务项目(JBYW-AII-2022-18);中国农业科学院农业信息研究所2022年度科技创新工程任务(CAAS-ASTIP-2016-AII);国家社会科学基金项目的研究成果之一(18CTQ028)
通讯作者: 孙巍,ORCID:0000-0002-6419-0953,E-mail: sunwei@caas.cn。   
引用本文:   
张振青, 孙巍. 基于特征测度和PhraseLDA模型的领域学科交叉主题识别研究——以纳米技术的农业环境应用领域为例*[J]. 数据分析与知识发现, 2023, 7(7): 32-45.
Zhang Zhenqing, Sun Wei. Interdisciplinary Subject Recognition Based on Feature Measurement and PhraseLDA Model——Case Study of Nanotechnology in Agricultural Environment. Data Analysis and Knowledge Discovery, 2023, 7(7): 32-45.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2022.0651      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2023/V7/I7/32
指标方法 具体公式 公式含义 优点 不足
Rao-Stirling指数 R S = 1 - i , j S i j P i P j P i P j S i j分别表示学科 i , j在总学科类别中所占比例和学科相似度 综合考虑学科距离和学科
相似性
学科交叉性测量结果区分度较低
True Diversity指标 T D = 1 1 - R S R S指Rao-Stirling指数 R S指数基础上,结果具有高区分度 未考虑凝聚性
DIV指标 D I V = ( n c / N ) × ( 1 - G i n i c ) × i = 1 , j = 1 , i j i = n c , j = n c d i j / n c × ( n c - 1 ) n c表示学科类别, N表示学科类别总数 满足“平衡性”的要求,独立操作学科丰富性、平衡性、差异性 无法用百分比增长或下降讨论学科交叉性
DIV*指标 D I V * = n c × 1 - G i n i × i = 1 , j = 1 , i j i = n c , j = n c d i j / n c × ( n c - 1 ) n c表示学科类别 在DIV指标基础上解决了变异因子的影响,被称为“真正”的学科交叉性衡量指标 学科多样性值并不是精确值
Table 1  现有主流学科交叉性测度指标
Fig.1  学科交叉主题识别方法框架
Fig.2  PhraseLDA模型结构
符号 含义
D , K , V 文档数量,主题数量,词表长度
x , t , i , k 文档索引,短语在文档的索引,词语在文中的索引,主题及词索引
G x x篇文档中短语的数量
N x x篇文档中词语的数量
W x , t x篇文档中第t个短语具有的词语数
θ x x篇文档中主题的多项分布
Z x , t , j x篇文档中第t个短语的第j个词语的主题
φ x 主题k的多项分布
N k 主题k的词语数目
N x , k 主题k在第x篇文档的词语数目
α , β 狄利克雷超参数
C x , t x篇文档的第t个群体
Z x , t , j j = 1 W x , t x篇文档的第t个短语的所有随机变量集合
Table 2  PhraseLDA符号释义
Fig.3  主题抽取流程
Fig.4  主题的学科交叉特征
指标名称 测度公式 公式含义 指标作用
学科丰富性(子指标) V = 1 n i = 1 n S u m S C ( i ) Vni S u m S C i分别表示主题的关联文献集涵盖的学科类别数量,该主题关联的n篇。文献,该主题下的第i篇文献,第i篇文献所属学科类别。 量化和筛选学科交叉主题
学科均衡性(子指标) B = 1 n i = 1 n 2 i - m - 1 χ i m χ i Bn分别表示主题的关联文献集涵盖的学科分布均匀度,该主题关联的n篇文献,i为索引, χ i属于第i个学科的引用文献量,m为引用文献总数。 量化和筛选学科交叉主题
学科差异性(子指标) D = 1 n ( 1 - s i j ) Dn分别表示主题的关联文献集涵盖的学科性质差异,该主题关联的n篇文献; s i j表示文献i所属学科和文献j所属学科的相似性值。 量化和筛选学科交叉主题
学科交叉性(综合指标) I = 1 n i = 1 n 1 ( 1 - s i j ) P i P j I n分别表示主题的关联文献集合的学科交叉性,该主题关联文献总数; s i j P j P i分别表示文献i和文献jn学科相似性,学科类别i和学科类别j的参考文献数量占所有参考文献数量的比例。 进一步量化和排序识别的学科交叉主题
Table 3  主题的学科交叉性测度指标体系
Fig.5  单一主题的学科交叉性测度流程
Fig.6  学科交叉主题识别流程
Fig.7  主题短语词项分布
主题名称 词组(英文) 词组(中文)
电化学
传感器
electrochemical sensors; sensing platform; electrical conductivity; proposed sensor; electrochemical sensing; filter paper; electrochemical performance; polycyclic aromatic hydrocarbon; current response; sensor array 电化学传感器;传感平台;电导率;提出的传感器;电化学传感;滤纸;电化学性能;多环芳烃;电流响应;传感器阵列
高效液相色谱分析 high sensitivity; high performance liquid chromatography; ionic liquid; high selectivity; good reproducibility; ionic strength; analytical performance; sensitivity selectivity; thermal stability; high affinity 高灵敏度;高效液相色谱;离子液体;高选择性;重复性好;离子强度;分析性能;灵敏度选择性;热稳定性;高亲和力
Table 4  短语主题分布结果(部分)
本文方法识别的交叉主题 交叉性
指数
差异性 均衡性 丰富性 传统方法识别的交叉主题 Rao-Stirling指数 主题内容
一致性
对比
主题粒度对比
T21 催化剂及其制备 23.07 0.914 0.998 33.34 新增 -
T35 污染土壤生物修复 21.49 0.919 0.998 33.03 T8 污染土壤修复 0.940 一致 粒度更细
T20 表面增强拉曼光谱技术 20.88 0.920 0.998 29.07 T9 表面增强拉曼光谱技术 0.934 一致 -
T30 大气颗粒污染物分布 20.69 0.918 0.998 30.89 新增 -
T22 公共卫生环境与人类健康 20.65 0.917 0.998 31.67 新增 -
T45 固相微波法合成包合物 20.57 0.921 0.998 30.48 新增 -
T43 水热法合成纳米材料 20.48 0.914 0.998 30.36 新增 -
T42 氧化应激与DNA损伤 20.43 0.916 0.998 30.35 新增 -
T27 亚甲基蓝理化性质及应用 20.35 0.917 0.998 30.26 新增 -
T50 纳米材料光学传感检测方法 20.28 0.917 0.998 32.05 T10 传感器应用 0.932 一致 粒度更细
T16 纳米粒子的合成及性能 20.19 0.921 0.998 29.45 T13 纳米粒子的合成及性能 0.942 一致 -
T31动力学模型与吸附实验 19.89 0.917 0.998 31.85 T4 动力学模型与吸附实验 0.938 一致 -
T26 介孔材料 19.81 0.921 0.998 29.39 新增 -
T37 傅里叶变换红外光谱法 19.64 0.919 0.998 29.33 T14 傅里叶变换红外光谱法 0.938 一致 -
T19 吸附技术及热力学参数 19.54 0.918 0.998 30.68 T2 吸附技术 0.936 一致 粒度更细
T2 纳米二氧化钛可见光催化 19.54 0.914 0.998 28.68 T7 光催化 0.937 一致 粒度更细
T4 X射线光电子能谱表征碳量子点 19.43 0.921 0.998 29.78 T6 X射线光谱技术 0.934 一致 粒度更细
T3 有机材料成分分析方法 19.42 0.917 0.998 29.53 新增 -
T36 水溶液中的电化学反应 19.13 0.916 0.998 29.42 T12 水溶液中的电化学反应 0.934 一致 -
T49 反应时间对复合膜接触角的影响 19.12 0.914 0.998 29.96 新增 -
T23 环境友好型纳米材料制备应对有机污染 19.06 0.92 0.998 29.11 新增 -
T18 扫描电子显微镜应用 19.02 0.919 0.998 28.72 T3 电子显微镜应用 0.934 一致 粒度更细
T15 高比表面积新型材料制备 18.98 0.918 0.997 29.16 新增 -
T14 去除水中的重金属离子 18.60 0.917 0.998 28.38 T11 去除水中的重金属离子 0.934 一致 -
T1 环境检测 0.923 新增 -
T5 纳米二氧化钛与可见光 0.937 新增 -
Table 5  与传统方法识别结果的对比
Fig.8  主题不同测度值的分布情况
克隆巴赫Alpha系数 项数 个案数
0.872 2 24
Table 6  信度检验结果
KMO取样适切性量数 巴特利特球形度检验
近似卡方 自由度 显著性
0.676 137.688 6.000 0.000
Table 7  效度检验结果
学科交叉主题 所属主要学科类群 关键词组 主要研究内容
T21 催化剂及其制备 材料科学、化学、物理应用、生物化学、分子生物学、工程环境 胰蛋白酶、乙酰胆碱酯酶、抑菌活性、硅藻、亲水性、电催化检测、酶活性 复合纳米结构的绿色合成、表征与杀菌活性、乙酰胆碱酯酶抑制机理、抗菌复合材料的制备及生物毒性检测
T35 污染土壤生物修复 工程环境、化学、纳米技术、生物技术应用微生物学、绿色可持续科技 受污染土壤、麦秸、粉煤灰、显著增加、微纳米、重金属抗性、纳米孔活性炭、水热处理 重金属污染土壤的修复、对土壤中硫磷农药的检测
T20 表面增强拉曼光谱技术 化学分析、材料科学、纳米技术、化学物理、光谱学、食品科学技术、仪器仪表、电化学 表面增强拉曼散射、基质、增强因子、热点、若丹明、拉曼光谱、农药 表面增强拉曼光谱法癌症诊断和检测农药、爆炸物和药物的检测分析
T30 大气颗粒污染物分布 环境科学、材料科学、工程化学、化学物理、纳米技术、工程环境、高分子科学 粒度、空气污染、颗粒物、孔隙大小分布、主成分分析、平均大小、药物输送、粒子扩散 环境污染检测、监测和修复、纳米碳颗粒暴露引起的肺部炎症、颗粒物中微量元素的浓度分布
T22 公共卫生环境与人类健康 化学分析、纳米技术、环境科学、电化学、物理应用、食品科学技术、仪器仪表、生物物理学 人类健康、食品安全、农产品、公共卫生、水生环境、人类健康环境、长期稳定、副作用、威胁人类健康、给药 水生环境对人类健康的挑战、碳排放威胁人类健康、农产品有毒金属去除、水产品及其代谢物的过滤
T45 固相微波法合成包合物 工程环境、环境科学、化学、纳米技术、高分子科学、工程化学、电化学、仪器仪表 β环糊精、席夫碱、活性氧、石英晶体、固态、结晶紫、自由能、氧物种、活性氧 新型固相萃取吸附剂测定重金属
T43 水热法合成纳米材料 化学分析、环境科学、毒理学、化学、生物化学研究方法、食品科学技术、纳米技术 水热处理、水热法、纳米材料、合成 水热法合成纳米材料
T42 氧化应激与DNA损伤 化学分析、环境科学、化学多学科、纳米技术、毒理学、生物化学研究方法 氧化应激、DNA损伤、副作用、显著增加、过氧化物酶活动、浓度水平 纳米颗粒驱动快速检测DNA损伤、碳纳米颗粒肺氧化应激检测
T27 亚甲基蓝理化性质及应用 化学、化学分析、材料科学、化学物理、工程化学、纳米技术、环境科学 官能团、介孔二氧化硅、亚甲蓝、氨基酸、带负电荷、羧基组、氢键、氨基酸组、肠杆菌 亚甲基蓝吸附性能的研究、介孔二氧化硅的制备
T50 纳米材料光学传感检测方法 电化学、环境科学、材料科学、化学物理、工程环境、纳米、纳米技术、水资源 基于材料、基于传感器、分析技术、化学传感器、基于纳米材料、基于生物传感器、遥感应用、光学传感器、光学性质、实际应用 基于纳米材料的电化学传感器、农药检测生物传感器、农药的高灵敏可见光活化光电化学生物传感
T16 纳米粒子的合成及性能 纳米技术、电化学、物理应用、化学物理、仪器仪表、光谱学、环境科学 金纳米粒子、银纳米粒子、核心壳、纳米粒子、氧化锌、二氧化钛、动态光散射 纳米离子的修饰、纳米生物杂化材料的合成、表征及应用
T31动力学模型与吸附实验 工程化学、化学物理、纳米技术、化学分析、工程环境、物理应用、高分子科学 伪指令、朗缪尔模型、平衡数据、伪序动力学模型、朗缪尔等温线、动力学数据 吸附剂的表面相互作用和行为、纳米复合材料动力学去除水溶液重金属
…… …… …… ……
Table 8  学科类群-关键词组-研究内容的映射表
[1] 路甬祥. 学科交叉与交叉科学的意义[J]. 中国科学院院刊, 2005, 20(1):58-60.
[1] (Lu Yongxiang. Implications in the Disciplinary Cross-Breeding and Inter-Disciplinary Sciences[J]. Bulletin of Chinese Academy of Sciences, 2005, 20(1): 58-60.)
[2] 李春景, 刘仲林. 现代科学发展学科交叉模式探析——一种学科交叉模式的分析框架[J]. 科学学研究, 2004, 22(3): 244-248.
[2] (Li Chunjing, Liu Zhonglin. A Research on the Mode of Interdisciplinarity for Development in Modern Sciences——A Theoretical Analysis Framework of the Mode of Interdisciplinarity[J]. Studies in Science of Science, 2004, 22(3): 244-248.)
[3] Jacobs J A, Frickel S. Interdisciplinarity: A Critical Assessment[J]. Annual Review of Sociology, 2009, 35: 43-65.
doi: 10.1146/soc.2009.35.issue-1
[4] 李江. “跨学科性”的概念框架与测度[J]. 图书情报知识, 2014(3): 87-93.
[4] (Li Jiang. The Concept and Measurement of Interdisciplinarity[J]. Document, Informaiton & Knowledge, 2014(3): 87-93.)
[5] 马费成, 陈柏彤. 我国人文社会科学学科多样性研究[J]. 情报科学, 2015, 33(1): 3-8.
[5] (Ma Feicheng, Chen Baitong. Study of Discipline Diversity in the Field of Chinese Humanities and Social Sciences[J]. Information Science, 2015, 33(1): 3-8.)
[6] 黄颖, 张琳, 孙蓓蓓, 等. 跨学科的三维测度——外部知识融合、内在知识会聚与科学合作模式[J]. 科学学研究, 2019, 37(1): 25-35.
[6] (Huang Ying, Zhang Lin, Sun Beibei, et al. Interdisciplinarity Measurement: External Knowledge Integration, Internal Information Convergence and Research Activity Pattern[J]. Studies in Science of Science, 2019, 37(1): 25-35.)
[7] 王志楠, 汪雪锋, 黄颖, 等. 高被引学者论文跨学科特征分析: 以经济与商业领域为例[J]. 科学学研究, 2016, 34(6): 807-813.
[7] (Wang Zhinan, Wang Xuefeng, Huang Ying, et al. Cross-Discipline Analysis on Papers of Highly Cited Researchers: A Case Study on Economics and Business Field[J]. Studies in Science of Science, 2016, 34(6): 807-813.)
[8] 顾秀丽, 黄颖, 孙蓓蓓, 等. 图书情报领域中的交叉科学研究: 进展与展望[J]. 情报学报, 2020, 39(5): 478-491.
[8] (Gu Xiuli, Huang Ying, Sun Beibei, et al. Interdisciplinary Research in Information Science and Library Science: Progress and Prospects[J]. Journal of the China Society for Scientific and Technical Information, 2020, 39(5): 478-491.)
[9] Stirling A. A General Framework for Analysing Diversity in Science, Technology and Society[J]. Journal of the Royal Society, Interface, 2007, 4(15): 707-719.
pmid: 17327202
[10] Rousseau R. On the Leydesdorff-Wagner-Bornmann Proposal for Diversity Measurement[J]. Journal of Informetrics, 2019, 13(3): 906-907.
doi: 10.1016/j.joi.2019.03.015
[11] Leydesdorff L, Wagner C S, Bornmann L. Interdisciplinarity as Diversity in Citation Patterns among Journals: Rao-Stirling Diversity, Relative Variety, and the Gini Coefficient[J]. Journal of Informetrics, 2019, 13(1): 255-269.
doi: 10.1016/j.joi.2018.12.006
[12] 张琳, 刘冬东, 吕琦, 等. 论文学科交叉测度研究: 从全部引文到章节引文[J]. 情报学报, 2020, 39(5): 492-499.
[12] (Zhang Lin, Liu Dongdong, Lyu Qi, et al. Interdisciplinarity Measurement in Publications: From Full Reference Analysis to Sectional Reference Analysis[J]. Journal of the China Society for Scientific and Technical Information, 2020, 39(5): 492-499.)
[13] Zhang L, Rousseau R, Glänzel W. Diversity of References as an Indicator of the Interdisciplinarity of Journals: Taking Similarity Between Subject Fields into Account[J]. Journal of the Association for Information Science and Technology, 2016, 67(5): 1257-1265.
doi: 10.1002/asi.2016.67.issue-5
[14] 陈琼, 朱庆华, 闵华, 等. 基于领域主题的学科交叉特征识别方法研究——以医学信息学为例[J]. 现代情报, 2022, 42(4): 11-24.
doi: 10.3969/j.issn.1008-0821.2022.04.002
[14] (Chen Qiong, Zhu Qinghua, Min Hua, et al. Research on Method of Recognizing Interdisciplinary Features Based on Domain Topics—Taking Medical Informatics for Example[J]. Modern Information, 2022, 42(4): 11-24.)
doi: 10.3969/j.issn.1008-0821.2022.04.002
[15] Hammarfelt B. Interdisciplinarity and the Intellectual Base of Literature Studies: Citation Analysis of Highly Cited Monographs[J]. Scientometrics, 2011, 86(3): 705-725.
doi: 10.1007/s11192-010-0314-5
[16] Porter A L, Roessner J D, Cohen A S, et al. Interdisciplinary Research: Meaning, Metrics and Nurture[J]. Research Evaluation, 2006, 15(3): 187-195.
doi: 10.3152/147154406781775841
[17] Porter A L, Chubin D E. An Indicator of Cross-Disciplinary Research[J]. Scientometrics, 1985, 8(3): 161-176.
doi: 10.1007/BF02016934
[18] Porter A L, Cohen A S, Roessner J D, et al. Measuring Researcher Interdisciplinarity[J]. Scientometrics, 2007, 72(1): 117-147.
doi: 10.1007/s11192-007-1700-5
[19] Porter A L, Rafols I. Is Science Becoming More Interdisciplinary? Measuring and Mapping Six Research Fields over Time[J]. Scientometrics, 2009, 81(3): 719-745.
doi: 10.1007/s11192-008-2197-2
[20] Small H. Maps of Science as Interdisciplinary Discourse: Co-Citation Contexts and the Role of Analogy[J]. Scientometrics, 2010, 83(3): 835-849.
doi: 10.1007/s11192-009-0121-z
[21] 黄晓斌, 吴高. 学科领域研究前沿探测方法研究述评[J]. 情报学报, 2019, 38(8): 872-880.
[21] (Huang Xiaobin, Wu Gao. Research Review of Frontier Detection Methods in Subject Fields[J]. Journal of the China Society for Scientific and Technical Information, 2019, 38(8): 872-880.)
[22] 李长玲, 高峰, 牌艳欣. 试论跨学科潜在知识生长点及其识别方法[J]. 科学学研究, 2021, 39(6): 1007-1014.
[22] (Li Changling, Gao Feng, Pai Yanxin. Research on Potential Interdisciplinary Knowledge Growth Points and Its Identification Methods[J]. Studies in Science of Science, 2021, 39(6): 1007-1014.)
[23] Callon M, Courtial J P, Turner W A, et al. From Translations to Problematic Networks: An Introduction to Co-Word Analysis[J]. Social Science Information, 1983, 22(2): 191-235.
doi: 10.1177/053901883022002003
[24] 闵超, 孙建军. 基于关键词交集的学科交叉研究热点分析——以图书情报学和新闻传播学为例[J]. 情报杂志, 2014, 33(5): 76-82.
[24] (Min Chao, Sun Jianjun. Discipline-Crossing Research Hotspots Analysis Based on Keyword Intersection: An Example of Library and Information Science and Journalism and Communication Studies[J]. Journal of Intelligence, 2014, 33(5): 76-82.)
[25] 闵超, 孙建军. 学科交叉研究热点聚类分析——以国内图书情报学和新闻传播学为例[J]. 图书情报工作, 2014, 58(1): 109-116.
[25] (Min Chao, Sun Jianjun. Clustering Analysis on Discipline-Crossing Research Hotspots: An Example of Library and Information Science and Journalism and Communication Studies[J]. Library and Information Service, 2014, 58(1): 109-116.)
[26] 隗玲, 许海云, 郭婷, 等. 基于弱共现和突发监测的情报学学科研究主题及交叉性分析[J]. 图书情报工作, 2015, 59(21): 105-114.
doi: 10.13266/j.issn.0252-3116.2015.21.016
[26] (Wei Ling, Xu Haiyun, Guo Ting, et al. Study on the Interisciplinary Topics of Information Science Based on Weak Co-Occurrence and Burst Detecting[J]. Library and Information Service, 2015, 59(21): 105-114.)
doi: 10.13266/j.issn.0252-3116.2015.21.016
[27] Dong K, Xu H Y, Luo R, et al. An Integrated Method for Interdisciplinary Topic Identification and Prediction: A Case Study on Information Science and Library Science[J]. Scientometrics, 2018, 115(2): 849-868.
doi: 10.1007/s11192-018-2694-x
[28] 杜德慧, 李长玲, 相富钟, 等. 基于引文关键词的跨学科相关知识发现方法探讨[J]. 情报杂志, 2020, 39(9): 189-194.
[28] (Du Dehui, Li Changling, Xiang Fuzhong, et al. Discussion on the Method of Interdisciplinary Related Knowledge Discovery Based on Citation Keywords[J]. Journal of Intelligence, 2020, 39(9): 189-194.)
[29] 韩正琪, 刘小平, 寇晶晶. 基于Rao-Stirling指数和LDA模型的领域学科交叉主题识别——以纳米科技为例[J]. 情报科学, 2020, 38(2): 116-124.
[29] (Han Zhengqi, Liu Xiaoping, Kou Jingjing. Interdisciplinary Literature Discovery Based on Rao-Stirling Diversity Indices: Case Studies in Nanoscience and Nanotechnology[J]. Information Science, 2020, 38(2): 116-124.)
[30] Raimbault J. Exploration of an Interdisciplinary Scientific Landscape[J]. Scientometrics, 2019, 119(2): 617-641.
doi: 10.1007/s11192-019-03090-3
[31] 张斌. 交叉学科主题探究: 从主题聚类视角[J]. 情报科学, 2020, 38(10): 49-55.
[31] (Zhang Bin. Interdisciplinary Subject Exploration: From the Perspective of Topic Clustering[J]. Information Science, 2020, 38(10): 49-55.)
[32] 李牧南, 王流云. 三维打印技术的潜在风险识别: 跨学科主题词挖掘视角[J]. 科研管理, 2019, 40(1): 89-104.
[32] (Li Munan, Wang Liuyun. Identifying Potential Risks of 3D Printing from the Perspective of Mining Terms of Trans-Disciplinary Areas[J]. Science Research Management, 2019, 40(1): 89-104.)
[33] El-Kishky A, Song Y L, Wang C, et al. Scalable Topical Phrase Mining from Text Corpora[J]. Proceedings of the VLDB Endowment, 2014, 8(3): 305-316.
doi: 10.14778/2735508.2735519
[34] 张琴, 张智雄. 基于PhraseLDA模型的主题短语挖掘方法研究[J]. 图书情报工作, 2017, 61(8): 120-125.
doi: 10.13266/j.issn.0252-3116.2017.08.015
[34] (Zhang Qin, Zhang Zhixiong. Topical Phrase Mining Based on the PhraseLDA Model[J]. Library and Information Service, 2017, 61(8): 120-125.)
doi: 10.13266/j.issn.0252-3116.2017.08.015
[35] Li B, Wang B, Zhou R, et al. CITPM: A Cluster-Based Iterative Topical Phrase Mining Framework[C]// Proceedings of the 21st International Conference on Database Systems for Advanced Applications. 2016: 197-213.
[36] Klopfer P H, MacArthur R H. On the Causes of Tropical Species Diversity: Niche Overlap[J]. The American Naturalist, 1961, 95(883): 223-226.
doi: 10.1086/282179
[37] 岳天祥. 生物多样性研究及其问题[J]. 生态学报, 2001, 21(3): 462-467.
[37] (Yue Tianxiang. Studies and Questions of Biological Diversity[J]. Acta Ecologica Sinica, 2001, 21(3): 462-467.)
[38] 金薇吟. 学科交叉方法探析[J]. 科学学研究, 2006, 24(5): 667-671.
[38] (Jin Weiyin. Analysis of the Discipline-Crossing Method[J]. Studies in Science of Science, 2006, 24(5): 667-671.)
[39] 赵婉颖. 交叉学科中主题交互融合模式研究——以细胞科学为例[D]. 武汉: 武汉大学, 2018.
[39] (Zhao Wanying. Study on Topic Interactions in Interdisciplinary Domain, Take Cell, Biology Field as an Example[D]. Wuhan: Wuhan University, 2018.)
[40] Wang J, Thijs B, Glänzel W. Interdisciplinarity and Impact: Distinct Effects of Variety, Balance, and Disparity[J]. PLoS One, 2015, 10(5): e0127298.
doi: 10.1371/journal.pone.0127298
[41] Gini C. Measurement of Inequality of Incomes[J]. The Economic Journal, 1921, 31(121): 124-125.
doi: 10.2307/2223319
[42] 关鹏, 王曰芬. 科技情报分析中LDA主题模型最优主题数确定方法研究[J]. 现代图书情报技术, 2016(9): 42-50.
[42] (Guan Peng, Wang Yuefen. Identifying Optimal Topic Numbers from Sci-Tech Information with LDA Model[J]. New Technology of Library and Information Service, 2016(9): 42-50.)
[43] Asuncion A, Welling M, Smyth P, et al. On Smoothing and Inference for Topic Models[OL]. arXiv Preprint, arXiv: 1205.2662.
[44] Griffiths T L, Steyvers M. Finding Scientific Topics[J]. PNAS, 2004, 101(S1): 5228-5235.
[45] 李军莲. 基于共被引耦合与LDA模型的研究前沿识别方法优化研究[D]. 北京: 中国科学院大学, 2020.
[45] (Li Junlian. Identification Optimization of Research Fronts Based on Co-citation-Coupling Network and LDA Model[D]. Beijing: University of Chinese Academy of Sciences, 2020.)
[46] 王婷婷, 韩满, 王宇. LDA模型的优化及其主题数量选择研究——以科技文献为例[J]. 数据分析与知识发现, 2018, 2(1): 29-40.
[46] (Wang Tingting, Han Man, Wang Yu. Optimizing LDA Model with Various Topic Numbers: Case Study of Scientific Literature[J]. Data Analysis and Knowledge Discovery, 2018, 2(1): 29-40.)
[47] TopMine[EB/OL]. [2019-12-20]. https://github.com/anirudyd/topmine/blob/master/.
[48] 孙亚茹, 刘婷, 尹翠艳, 等. 儿童乘车风险行为诊断量表的汉化及信效度检验[J]. 中国儿童保健杂志, 2022, 30(10): 1063-1067.
doi: 10.11852/zgetbjzz2021-1640
[48] (Sun Yaru, Liu Ting, Yin Cuiyan, et al. Reliability and Validity Test of Chinese Version of the Children's Riding Risk Behavior Diagnostic Scale[J]. Chinese Journal of Child Health Care, 2022, 30(10): 1063-1067.)
doi: 10.11852/zgetbjzz2021-1640
[49] 章青兰, 毋文豪, 陈永聪, 等. 亲子互动量表的信度和效度检验[J]. 中国初级卫生保健, 2022, 36(2): 61-63.
[49] (Zhang Qinglan, Wu Wenhao, Chen Yongcong, et al. Reliability and Validity Tests of the Parent-Child Interaction Scale[J]. Chinese Primary Health Care, 2022, 36(2): 61-63.)
[1] 李佳蕾, 安培浚, 肖仙桃. 学科交叉主题识别方法研究综述*[J]. 数据分析与知识发现, 2023, 7(4): 1-15.
[2] 王红斌,王健雄,张亚飞,杨恒. 主题不平衡新闻文本数据集的主题识别方法研究*[J]. 数据分析与知识发现, 2021, 5(3): 109-120.
[3] 张金柱, 于文倩. 基于短语表示学习的主题识别及其表征词抽取方法研究[J]. 数据分析与知识发现, 2021, 5(2): 50-60.
[4] 丁晟春,俞沣洋,李真. 网络舆情潜在热点主题识别研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 29-38.
[5] 刘博文,白如江,周彦廷,王效岳. 基金项目数据和论文数据融合视角下科学研究前沿主题识别 *——以碳纳米管领域为例[J]. 数据分析与知识发现, 2019, 3(8): 114-122.
[6] 李真, 丁晟春, 王楠. 网络舆情观点主题识别研究*[J]. 数据分析与知识发现, 2017, 1(8): 18-30.
[7] 叶春蕾, 冷伏海. 科技文献全文主题识别方法实证研究[J]. 现代图书情报技术, 2012, 28(1): 53-57.
[8] 邵晓良,刘红. Web主题信息采集中信息主题的识别[J]. 现代图书情报技术, 2004, 20(10): 51-54.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn