Please wait a minute...
Advanced Search
数据分析与知识发现  2021, Vol. 5 Issue (5): 30-40     https://doi.org/10.11925/infotech.2096-3467.2020.1190
     研究论文 本期目录 | 过刊浏览 | 高级检索 |
西方媒体新闻中的中国经济形象提取*
许光,任明(),宋城宇
中国人民大学信息资源管理学院 北京 100872
Extracting China’s Economic Image from Western News
Xu Guang,Ren Ming(),Song Chengyu
School of Information Resource Management, Renmin University of China, Beijing 100872, China
全文: PDF (2068 KB)   HTML ( 20
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 使用文本挖掘技术从西方媒体的新闻文本数据中提取中国的经济形象。【方法】 基于人类的认知图式分析了形象的文字呈现方式,提出从主题、观点、倾向三个层次来提取国家形象,进而提出相应的文本挖掘方法和流程。【结果】 从达沃斯论坛期间的西方媒体新闻中提取的中国经济形象可以概括为:充满活力、有巨大成就、为世界带来机遇和挑战、可能撼动世界格局的新兴发展中国家。【局限】 主题模型使用人工解释,会带来个体差异。【结论】 从主题、观点、倾向三个层次进行文本挖掘有利于把新闻数据和媒体形象联系起来,该方法对国家、地区、城市等媒体形象提取研究和实践也具有借鉴意义。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
许光
任明
宋城宇
关键词 文本挖掘国家形象新闻中国达沃斯论坛    
Abstract

[Objective] This paper uses text mining techniques to extract China’s economic image from news published by western media. [Methods] First, we analyzed the representation of image by textual message based on the cognitive schema of human. Then, we extracted the image from topics, viewpoints and sentiment. Finally, we developed text mining process and methods to retrieve China’s image from Western reports. [Results] China’s economic image from news published by Western media covering Davos Forum was summarized as a developing country full of vitality, with great achievements, bringing opportunities and challenges to the world, and possibly affecting the world order. [Limitations] The human interpretation of LDA models inevitably leads to individual difference. [Conclusions] The proposed method could benefit research and practice on extracting image of a country, a region, or a city from news reports.

Key wordsText Mining    Economic Image    News    China    Davos Forum
收稿日期: 2020-11-30      出版日期: 2021-03-08
ZTFLH:  TP391  
基金资助:*本文系国家自然科学基金项目的研究成果之一(71772177);*本文系国家自然科学基金项目的研究成果之一(72072177)
通讯作者: 任明     E-mail: renm@ruc.edu.cn
引用本文:   
许光,任明,宋城宇. 西方媒体新闻中的中国经济形象提取*[J]. 数据分析与知识发现, 2021, 5(5): 30-40.
Xu Guang,Ren Ming,Song Chengyu. Extracting China’s Economic Image from Western News. Data Analysis and Knowledge Discovery, 2021, 5(5): 30-40.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2020.1190      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2021/V5/I5/30
Fig.1  基于文本挖掘的国家形象提取的流程
Fig.2  基于Transformer模型提取观点
Fig.3  基于Bi-GRU模型提取倾向
华尔街日报 纽约时报 卫报 金融时报 总计
347篇 491篇 205篇 897篇 1 940篇
Table 1  达沃斯论坛期间涉华新闻数量(2005-2020)
编码层 解码层
参数 参数值 参数 参数值
heads 8 heads 8
hidden_size 512 hidden_size 768
layers 6 layers 6
dropout 0.2 dropout 0.2
Table 2  观点提取模型的参数
参数 参数值 参数 参数值
max_sequence 512 batch_size 32
隐藏层个数 2 learning_rate 0.001
隐藏层的节点 256 dropout 0.25
全连接层的节点 512 训练周期 5
输出层节点 1
Table 3  倾向提取模型的参数
Fig.4  西方媒体报道中的中国经济形象
Fig.5  7个主题下的新闻数量(2005-2020)
Fig.6  主题层面的倾向及变化
Fig.7  中美关系中不同主题报道的数量变化
Fig.8  中美关系的不同主题下各年情感倾向得分示意图
[1] 钟智锦, 王童辰. 大数据文本挖掘技术在新闻传播学科的应用[J]. 当代传播, 2018(5):12-18.
[1] ( Zhong Zhijin, Wang Tongchen. Applications of Big Data Text Mining Technology in Journalism and Communication[J]. Contemporary Communication, 2018(5):12-18.)
[2] Anholt S. Understanding National Image[A]//Competitive Identity[M]. Palgrave Macmillan, London, 2007: 43-62.
[3] Li X, Chitty N. Reframing National Image: A Methodological Framework[J]. Conflict & Communication Online, 2009,8(2):1-11.
[4] Boulding K E. National Images and International Systems[J]. Journal of Conflict Resolution, 1959,3(2):120-131.
doi: 10.1177/002200275900300204
[5] Kunczik M. Globalisation: News Media, Images of Nations and the Flow of International Capital with Special Reference to the Role of Rating Agencies[J]. Journal of International Communication, 2002,8(1):39-79.
doi: 10.1080/13216597.2002.9751921
[6] Zhou H, Chen X H, Wu X. The Image of the United States in the Chinese Media: An Examination of the Evaluative Component of Framing[J]. Public Relations Review, 2012,38(5):676-683.
doi: 10.1016/j.pubrev.2012.09.001
[7] 郭晴, 王宏江, 余婷婷, 等. 北京奥运背景下的中国国家形象研究[J].体育科学, 2009(8):3-11.
[7] ( Guo Qing, Wang Hongjiang, Yu Tingting, et al. A Study on Chinese National Image under the Background of Beijing Olympic Games[J]. China Sport Science, 2009(8):3-11.)
[8] 葛岩, 赵海, 秦裕林, 等 . 国家, 地区媒体形象的数据挖掘——基于认知心理学与计算机自然语言处理技术的视角[J]. 学术月刊, 2015,47(7):163-170.
[8] ( Ge Yan, Zhao Hai, Qin Yulin, et al. Mining National and Regional Images from Newspaper Reports——A Cognitive and Text Mining Approach[J]. Academic Monthly, 2015,47(7):163-170.)
[9] 约翰·安德森. 认知心理学及其启示[M]. 秦裕林, 程瑶,周海燕等译. 7版. 北京: 人民邮电出版社, 2013: 58- 59, 169-200.
[9] ( Anderson J. Cognitive Psychology and Its Implications[M]. Translated by Qin Yulin, Cheng Yao, Zhou Haiyan, et al. The 7th Edition. Beijing: Posts and Telecom Press, 2013:58-59, 169-200.)
[10] Brewer W F, Treyens J C. Role of Schemata in Memory for Places[J]. Cognitive Psychology, 1981,13(2):207-230.
doi: 10.1016/0010-0285(81)90008-6
[11] Fazio R H, Powell M C, Williams C J. The Role of Attitude Accessibility in the Attitude-to-Behavior Process[J]. Journal of Consumer Research, 1989,16(3):280-288.
doi: 10.1086/jcr.1989.16.issue-3
[12] Holland R W, Verplanken B, van Knippenberg A. From Repetition to Conviction: Attitude Accessibility as a Determinant of Attitude Certainty[J]. Journal of Experimental Social Psychology, 2003,39(6):594-601.
doi: 10.1016/S0022-1031(03)00038-6
[13] Fiske S T. Stereotyping, Prejudice, Discrimination at the Seam Between the Centuries: Evolution, Culture, Mind, and Brain[J]. European Journal of Social Psychology, 2000,30(3):299-322.
doi: 10.1002/(ISSN)1099-0992
[14] 刘小燕. 关于传媒塑造国家形象的思考[J]. 国际新闻界, 2002(2):61-66.
[14] ( Liu Xiaoyan. Thinking on Shaping of State Images by the Media[J]. Chinese Journal of Journalism & Communication, 2002(2):61-66.)
[15] McCombs M E, Shaw D L. The Agenda-Setting Function of Mass Media[J]. Public Opinion Quarterly, 1972,36(2):176-187.
doi: 10.1086/267990
[16] Gerbner G, Gross L, Morgan M, et al. Growing up with Television: Cultivation Processes[A]//Bryant J, Zillmann D. LEA’s Communication Series. Media Effects: Advances in Theory and Research[M]. Lawrence Erlbaum Associates Publishers, 2002: 43-67.
[17] Bolin G, Miazhevich G. The Soft Power of Commercialised Nationalist Symbols: Using Media Analysis to Understand Nation Branding Campaigns[J]. European Journal of Cultural Studies, 2018,21(5):527-542.
doi: 10.1177/1367549417751153
[18] 周小普, 赵喆. 中国对外报道现状分析与国家形象建构——以央视英语新闻频道《中国24小时》为例[J]. 国际新闻界, 2013,35(11):117-129.
[18] ( Zhou Xiaopu, Zhao Zhe. China’s External Reporting and National Image Building: A Study of CCTV NEWS’ China 24[J]. Chinese Journal of Journalism & Communication, 2013,35(11):117-129.)
[19] Peng Z. Representation of China: An Across Time Analysis of Coverage in the New York Times and Los Angeles Times[J]. Asian Journal of Communication, 2004,14(1):53-67.
doi: 10.1080/0129298042000195170
[20] Syed N A. The Effect of Beijing 2008 on China’s Image in the United States: A Study of US Media and Polls[J]. The International Journal of the History of Sport, 2010,27(16-18):2863-2892.
doi: 10.1080/09523367.2010.508277
[21] Choi J. National Image of North Korea in South Korean News Media[J]. Journal of Public Affairs, 2018,18(4):e1710.
doi: 10.1002/pa.v18.4
[22] 侯杰. 西方媒体视野中的中国经济形象——基于2014-2015《经济学人》的批评话语分析[J]. 文教资料, 2018 ( 1):113-115.
[22] ( Hou Jie. Analysis of China’s Economic Image from the Perspective of Western Media—A Study of Critical Discourse Analysis of the Economist During 2014 and 2015[J]. Data of Culture and Education, 2018 ( 1):113-115.)
[23] 计冬桢. 澳大利亚主流报纸中的中国形象研究2007-2010[D]. 上海: 华东师范大学, 2018.
[23] ( Ji Dongzhen. A Study of China’s Image in Australian Mainstream Newspaper 2007-2010[D]. Shanghai: East China Normal University, 2018.)
[24] Xu G, Ren M. Comparing China’s Self-image and Western Media Projected Image: From the Perspective of Davos Forum[C]// Proceedings of the 10th International Conference on Knowledge Discovery and Information Retrieval. 2018: 385-395.
[25] Rubin R B, Rubin A M, Haridakis P M. Communication Research: Strategies and Sources[M]. Nelson Education, 2009.
[26] 赵为学. 新闻传播学研究中话语分析的应用: 现状、局限与前景[J]. 上海大学学报(社会科学版), 2008,15(4):90-99.
[26] ( Zhao Weixue. Discourse Analysis in News Communication: Status Quo, Limitation and Prospect[J]. Journal of Shanghai University(Social Sciences Edition), 2008,15(4):90-99.)
[27] 郭金龙, 许鑫, 陆宇杰. 人文社会科学研究中文本挖掘技术应用进展[J]. 图书情报工作, 2012,56(8):10-17.
[27] ( Guo Jinlong, Xu Xin, Lu Yujie. Progress of Text Mining Applications in Humanities and Social Science[J]. Library and Information Service, 2012,56(8):10-17.)
[28] Liu Y. Fine-Tune BERT for Extractive Summarization[OL]. arXiv Preprint, arXiv: 1903. 10318.
[1] 黄名选,蒋曹清,卢守东. 基于词嵌入与扩展词交集的查询扩展*[J]. 数据分析与知识发现, 2021, 5(6): 115-125.
[2] 尹鹏博,潘伟民,张海军,陈德刚. 基于BERT-BiGA模型的标题党新闻识别研究*[J]. 数据分析与知识发现, 2021, 5(6): 126-134.
[3] 张国标,李洁. 融合多模态内容语义一致性的社交媒体虚假新闻检测*[J]. 数据分析与知识发现, 2021, 5(5): 21-29.
[4] 代冰,胡正银. 基于文献的知识发现新近研究综述 *[J]. 数据分析与知识发现, 2021, 5(4): 1-12.
[5] 王红斌,王健雄,张亚飞,杨恒. 主题不平衡新闻文本数据集的主题识别方法研究*[J]. 数据分析与知识发现, 2021, 5(3): 109-120.
[6] 赵天资, 段亮, 岳昆, 乔少杰, 马子娟. 基于Biterm主题模型的新闻线索生成方法 *[J]. 数据分析与知识发现, 2021, 5(2): 1-13.
[7] 吕华揆,刘政昊,钱宇星,洪旭东. 异质性财经新闻与股市关系研究*[J]. 数据分析与知识发现, 2021, 5(1): 99-111.
[8] 余传明, 王曼怡, 林虹君, 朱星宇, 黄婷婷, 安璐. 基于深度学习的词汇表示模型对比研究*[J]. 数据分析与知识发现, 2020, 4(8): 28-40.
[9] 夏天. 面向中文学术文本的单文档关键短语抽取 *[J]. 数据分析与知识发现, 2020, 4(7): 76-86.
[10] 马建霞,袁慧,蒋翔. 基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 78-88.
[11] 杜建. 医学知识不确定性测度的进展与展望*[J]. 数据分析与知识发现, 2020, 4(10): 14-27.
[12] 关鹏,王曰芬. 国内外专利网络研究进展*[J]. 数据分析与知识发现, 2020, 4(1): 26-39.
[13] 黄名选,卢守东,徐辉. 基于加权关联模式挖掘与规则后件扩展的跨语言信息检索 *[J]. 数据分析与知识发现, 2019, 3(9): 77-87.
[14] 杨亚楠,赵文辉,张健,谭珅,张贝贝. 基于多视图协同的政策文本可视化研究*[J]. 数据分析与知识发现, 2019, 3(6): 30-41.
[15] 张梦吉,杜婉钰,郑楠. 引入新闻短文本的个股走势预测模型[J]. 数据分析与知识发现, 2019, 3(5): 11-18.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn