Please wait a minute...
Advanced Search
数据分析与知识发现  2022, Vol. 6 Issue (4): 130-138     https://doi.org/10.11925/infotech.2096-3467.2019.0893
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于关键词抽取算法的隐喻研究趋势分析*
张冬瑜1,顾丰1,崔紫娟2,胡绍翔1,张伟1,林鸿飞3()
1大连理工大学软件学院 大连 116620
2大连理工大学国际合作与交流处 大连 116024
3大连理工大学计算机科学与技术学院 大连 116023
Reviewing Metaphor Research Based on Keyword Extraction Algorithm
Zhang Dongyu1,Gu Feng1,Cui Zijuan2,Hu Shaoxiang1,Zhang Wei1,Lin Hongfei3()
1School of Software, Dalian University of Technology, Dalian 116620, China
2International Office, Dalian University of Technology, Dalian 116024, China
3School of Computer Science and Technology, Dalian University of Technology, Dalian 116023, China
全文: PDF (1181 KB)   HTML ( 29
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 针对中国近40年隐喻研究的发展和演变规律进行梳理和定量分析,旨在为相关语言学家和计算语言学家提供参考,缩小中国隐喻研究与国外先进水平的差距。【方法】 采用关键词抽取算法将隐喻文献映射为关键词集合,结合科学计量学原理筛选出6个有效特征作为回归模型参数预测下一年的热点词频度,对隐喻发展进行历时和共时分析。【结果】 对比5种回归模型预测结果,发现拟合程度最好的梯度上升回归树模型对下一年度的关键词预测精度最高,特征消融实验的结果也证实所选的每一个特征均有效。【局限】 关键词抽取算法的准确性有待进一步提高。【结论】 隐喻研究正在向多领域、多学科交叉的方向发展。本文特征选择的方法可以为隐喻自动识别研究提供参考。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
张冬瑜
顾丰
崔紫娟
胡绍翔
张伟
林鸿飞
关键词 隐喻热点预测回归模型历时分析共时分析    
Abstract

[Objective] This paper reviews the developments of metaphor research in China in the past 40 years, aiming to provide references for linguists and then narrow the gaps between Chinese and foreign researchers. [Methods] First, we used keywords extraction algorithms to map metaphor documents into keyword sets. Then, we chose effective features as parameters for the regression models, which helped us predict the frequency of trending words in the next year. Finally, we analyzed the developments of metaphor research diachronically and synchronously. [Results] Our study compared the results of five regression models. Among them, the GBR model with the best fitting degree had the highest prediction accuracy for next year’s trending words. The feature ablation experiment also confirmed that our selected features were effective. [Limitations] The accuracy of keyword extraction algorithm could be optimized. [Conclusions] Metaphor research is developing towards the direction of cross-domains and inter-disciplines. The method of feature selection provides more references for research in prediction models.

Key wordsMetaphor    Trend Prediction    Regression Model    Diachronic Analysis    Synchronic Analysis
收稿日期: 2019-07-30      出版日期: 2022-05-12
ZTFLH:  TP393  
基金资助:*辽宁省社会科学规划基金项目(L20BYY023)
通讯作者: 林鸿飞,ORCID: 0000-0003-0872-7688     E-mail: hflin@dlut.edu.cn
引用本文:   
张冬瑜, 顾丰, 崔紫娟, 胡绍翔, 张伟, 林鸿飞. 基于关键词抽取算法的隐喻研究趋势分析*[J]. 数据分析与知识发现, 2022, 6(4): 130-138.
Zhang Dongyu, Gu Feng, Cui Zijuan, Hu Shaoxiang, Zhang Wei, Lin Hongfei. Reviewing Metaphor Research Based on Keyword Extraction Algorithm. Data Analysis and Knowledge Discovery, 2022, 6(4): 130-138.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2019.0893      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2022/V6/I4/130
摘要 候选关键词 文章关键词
特别是在词汇多义研究领域,认知语言学致力于......概念隐喻理论......英语教师的教学策略......[19] 隐喻;语言;教学;词汇 原则性多义网络;英语介词;中国英语学习者;习得
根据弗雷德里克·詹姆逊的看法,文学文本是......利用家庭关系作为社会秩序的隐喻......在空间流动中面对诱惑......具有特殊的象征功能[20] 隐喻;空间;功能;文学 乔纳森·弗兰岑;伦理责任;新教伦理;自由市场
他精辟地指出......“不合身的长袍”的隐喻.......喻义层面看.......现实政治是所指[21] 隐喻;意义;政治;分析 伊格尔顿;《麦克白》; 名分;能指;所指
由于中外在语言、思维以及文化之间存在诸多差异......通过字词结构和音韵的组合......探讨小说中蕴含的民间信仰以及文化隐喻的翻译[22] 隐喻;小说;结构;思维 法译;格非;《人面桃花》;古典性
纳博科夫在转喻与隐喻的强烈对比中展示着故乡的美好与现今的漂泊感[23] 隐喻;转喻;诗歌;对比 纳博科夫;爱情;自我意识
Table 1  关键词对比的文章示例
特征 特征说明
F1 候选关键词t在第i年作为关键词的频数
F2 候选关键词t在第i年出现在文档摘要中的频数
F3 候选关键词t截止到第i年出现过的存在年限
F4 候选关键词t在第i年中新作者的论文提及数
F5 候选关键词t在第i年中的重点基金论文提及数
F6 候选关键词t在第i年中期刊提及数
Table 2  隐喻研究趋势的主要特征
模型 MAE R2决定系数
LR 14.785 0.790
DTR 9.862 0.909
KNR 8.711 0.938
RFR 8.072 0.952
GBR 7.803 0.964
Table 3  不同回归模型的实验效果
特征选择 MAE R2决定系数
Baseline 8.735 0.859
Baseline+F3 8.247 0.913
Baseline+F3+F4 7.959 0.894
Baseline+F3+F4+F5 8.091 0.950
Baseline+F3+F4+F5+F6 7.803 0.964
Table 4  特征消融实验结果
Fig.1  Top-1隐喻
Fig.2  Top-13小说
Fig.3  Top-43情感
Fig.4  Top-75语料库
Fig.5  Top5-35候选关键词F1特征随时间变化趋势集合
Fig.6  隐喻热点共时分析示意
[1] Johnson M, Lakoff G. Metaphors We Live by[M]. Chicago: University of Chicago Press, 1980.
[2] Cameron L. Metaphor in Educational Discourse[M]. London: Continuum, 2003.
[3] Steen G, Dorst A G, Herrmann J B, et al. A Method for Linguistic Metaphor Identification: From MIP to MIPVU[M]. John Benjamins Publishing, 2010.
[4] Shutova E, Teufel S. Metaphor Corpus Annotated for Source-Target Domain Mappings[C]// Proceedings of the 7th Conference on International Language Resources and Evaluation. 2010: 3255-3261.
[5] Fainsilber L, Ortony A. Metaphorical Uses of Language in the Expression of Emotions[J]. Metaphor and Symbolic Activity, 1987, 2(4):239-250.
doi: 10.1207/s15327868ms0204_2
[6] Kovecses Z. Metaphor: A Practical Introduction[M]. New York: Oxford University Press, 2010.
[7] Averill J R. Inner Feelings, Works of the Flesh, the Beast Within, Diseases of the Mind, Driving Force, and Putting on a Show: Six Metaphors of Emotion and Their Theoretical Extensions[J]. Metaphors in the History of Psychology, 1990, 2:104-132.
[8] Thibodeau P H, Boroditsky L. Metaphors We Think with: The Role of Metaphor in Reasoning[J]. PLoS One, 2011, 6(2):e16782.
doi: 10.1371/journal.pone.0016782
[9] Malinowski J E, Horton C L. Metaphor and Hyperassociativity: The Imagination Mechanisms Behind Emotion Assimilation in Sleep and Dreaming[J]. Frontiers in Psychology, 2015, 6:1132.
doi: 10.3389/fpsyg.2015.01132 pmid: 26347669
[10] Jabbi M, Bastiaansen J, Keysers C. A Common Anterior Insula Representation of Disgust Observation, Experience and Imagination Shows Divergent Functional Connectivity Pathways[J]. PLoS One, 2008, 3(8):e2939.
doi: 10.1371/journal.pone.0002939
[11] 林鸿飞, 张冬瑜, 杨亮, 等. 情感隐喻计算及其应用研究[J]. 大连理工大学学报, 2015, 55(6):661-670.
[11] ( Lin Hongfei, Zhang Dongyu, Yang Liang, et al. Computational Processing of Affective Metaphors and Its Applications[J]. Journal of Dalian University of Technology, 2015, 55(6):661-670.)
[12] 田嘉, 苏畅, 陈怡疆. 隐喻计算研究进展[J]. 软件学报, 2015, 26(1):40-51.
[12] ( Tian Jia, Su Chang, Chen Yijiang. Computational Metaphor Processing[J]. Journal of Software, 2015, 26(1):40-51.)
[13] 束定芳. 隐喻学研究[M]. 上海: 上海外语教育出版社, 2000.
[13] ( Shu Dingfang. Studies in Metaphor[M]. Shanghai: Shanghai Foreign Language Education Press, 2000.)
[14] 林书武. 隐喻研究的基本现状、焦点及趋势[J]. 外国语, 2002(1):38-45.
[14] ( Lin Shuwu. Studies on Metaphor: State of Arts, Focuses, and Trend[J]. Journal of Foreign Languages, 2002(1):38-45.)
[15] 贾玉祥, 俞士汶. 基于词典的名词性隐喻识别[J]. 中文信息学报, 2011, 25(2):99-105.
[15] ( Jia Yuxiang, Yu Shiwen. Nominal Metaphor Recognition Based on Lexicons[J]. Journal of Chinese Information Processing, 2011, 25(2):99-105.)
[16] 张冬瑜, 杨亮, 郑朴琪, 等. 情感隐喻语料库构建与应用[J]. 中国科学: 信息科学, 2015, 45(12):1574-1587.
[16] ( Zhang Dongyu, Yang Liang, Zheng Puqi, et al. Construction and Application of Affective Metaphor Corpus[J]. Scientia Sinica: Informationis, 2015, 45(12):1574-1587.)
[17] 孙亚, 钱玉彬, 马婷. 国外隐喻研究现状及发展趋势[J]. 现代外语, 2017, 40(5):695-704.
[17] ( Sun Ya, Qian Yubin, Ma Ting. The Current Status and Development Trends in Metaphor Studies[J]. Modern Foreign Languages, 2017, 40(5):695-704.)
[18] 方俊伟, 崔浩冉, 贺国秀, 等. 基于先验知识TextRank的学术文本关键词抽取[J]. 情报科学, 2019, 37(3):75-80.
[18] ( Fang Junwei, Cui Haoran, He Guoxiu, et al. Keyword Extraction of Academic Text with TextRank Model Based on Prior Knowledge[J]. Information Science, 2019, 37(3):75-80.)
[19] 李亚平. 基于原则性多义模式的中国英语学习者空间介词Under, Below, Beneath习得研究[D]. 临汾: 山西师范大学, 2017.
[19] ( Li Yaping. A Study of the Acquisition of English Prepositions Under, Below and Beneath by Chinese EFL Learners Based on Principled-polysemy Model[D]. Linfen: Shanxi Normal University, 2017.)
[20] 陆贇. 乔纳森·弗兰岑小说中的伦理责任主题研究[D]. 南京: 南京大学, 2017.
[20] ( Lu Yun. Ethical Responsibility in Jonathan Franzen’s Fiction[D]. Nanjing: Nanjing University, 2017.)
[21] 张薇. 伊格尔顿对《麦克白》的政治符号学解读[J]. 国外文学, 2017(4): 41-50, 154.
[21] ( Zhang Wei. Eagleton’s Political Semiotic Interpretation of Macbeth[J]. Foreign Literatures, 2017(4):41-50, 154.)
[22] 甘露. 格非《人面桃花》法译本研究[D]. 南京: 南京大学, 2016.
[22] ( Gan Lu. A Study of the French Version of Ren Mian Tao Hua[D]. Nanjing: Nanjing University, 2016.)
[23] 刘德伟. 纳博科夫小说爱情主题初探[D]. 济南: 山东师范大学, 2008.
[23] ( Liu Dewei. On the Theme of Love in Nabokov’s Novels[D]. Ji’nan: Shandong Normal University, 2008.)
[24] 郭涵宁. 新兴研究领域识别计量[M]. 北京: 科学出版社, 2017.
[24] ( Guo Hanning. Measurement of Identifying Emerging Research Areas[M]. Beijing: Science Press, 2017.)
[25] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016.
[25] ( Zhou Zhihua. Machine Learning[M]. Beijing: Tsinghua University Press, 2016.)
[26] 郭战江. 新媒体: 角色和路径——从互联网的迅猛发展思考传统广播电视台的转型[J]. 中国广播, 2015(1):32-34.
[26] ( Guo Zhanjiang. New Media: Roles and Paths——Thinking About the Transformation of Traditional Broadcasting Stations from the Rapid Development of the Internet[J]. Chinese Broadcasts, 2015(1):32-34.)
[1] 郭樊容, 黄孝喜, 王荣波, 谌志群, 胡创, 谢一敏, 司博宇. 基于Transformer和图卷积神经网络的隐喻识别*[J]. 数据分析与知识发现, 2022, 6(4): 120-129.
[2] 张卫, 王昊, 陈玥彤, 范涛, 邓三鸿. 融合迁移学习与文本增强的中文成语隐喻知识识别与关联研究*[J]. 数据分析与知识发现, 2022, 6(2/3): 167-183.
[3] 张冬瑜,崔紫娟,李映夏,张伟,林鸿飞. 基于Transformer和BERT的名词隐喻识别*[J]. 数据分析与知识发现, 2020, 4(4): 100-108.
[4] 苏传东,黄孝喜,王荣波,谌志群,毛君钰,朱嘉莹,潘宇豪. 基于词嵌入融合和循环神经网络的中英文隐喻识别*[J]. 数据分析与知识发现, 2020, 4(4): 91-99.
[5] 黄孝喜, 李晗雨, 王荣波, 王小华, 谌志群. 基于卷积神经网络与SVM分类器的隐喻识别*[J]. 数据分析与知识发现, 2018, 2(10): 77-83.
[6] 黄孝喜, 张华, 陆蓓, 王荣波, 吴铤. 一种基于词语抽象度的汉语隐喻识别方法[J]. 现代图书情报技术, 2015, 31(4): 34-40.
[7] 左美云, 陆杨. 互联网产品中隐喻表达的设计研究[J]. 现代图书情报技术, 2011, 27(5): 20-27.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn