Please wait a minute...
Advanced Search
数据分析与知识发现  2023, Vol. 7 Issue (9): 25-38     https://doi.org/10.11925/infotech.2096-3467.2022.1128
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
元宇宙的冷与热——融合BERT与动态主题模型的微博文本分析*
贺超城1,2,黄茜1,李欣儒1,王春迎3,吴江1()
1武汉大学信息管理学院 武汉 430072
2武汉大学深圳研究院 深圳 518052
3郑州大学信息管理学院 郑州 450018
Trending Topics on Metaverse: A Microblog Text Analysis with BERT and DTM
He Chaocheng1,2,Huang Qian1,Li Xinru1,Wang Chunying3,Wu Jiang1()
1School of Information Management, Wuhan University, Wuhan 430072, China
2Shenzhen Research Institute of Wuhan University, Shenzhen 518052, China
3School of Information Management, Zhengzhou University, Zhengzhou 450018, China
全文: PDF (3934 KB)   HTML ( 43
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】直观、全面地刻画元宇宙概念所引发的舆情态势及其变迁,为元宇宙相关政策与产业规划提供借鉴。【方法】基于2021年9月-2023年2月元宇宙相关微博文本数据,采用BERT模型和DTM模型抽取其语义和主题特征,借助K-means算法实现主题聚类,解读元宇宙话题的演化规律。【结果】大众对元宇宙的关注焦点发轫于非同质化代币(Non-Fungible Token, NFT)和游戏,随着数字产业的资本炒作,进一步引发文娱产业的跟进以及实体产业的尝试。而ChatGPT的出现则引发了大众对元宇宙产业现状、技术创新和应用展望的进一步探讨。【局限】未结合外文数据(如Twitter)对比分析国内外对元宇宙话题关注点的侧重、趋势等方面的差异。【结论】本研究从定量与宏观的角度解读了元宇宙相关话题的社会关注度特征及演化规律,对正确引导元宇宙网络舆情走向、避免舆论泡沫等工作具有一定参考借鉴意义。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
贺超城
黄茜
李欣儒
王春迎
吴江
关键词 元宇宙微博BERT动态主题模型    
Abstract

[Objective] This paper comprehensively examines the evolution of public opinion triggered by the metaverse concepts, which provides insights for metaverse-related policies and industry planning. [Methods] We retrieved Weibo textual posts on metaverse-related from September 2021 to February 2023. Then, we utilized BERT and DTM models to extract semantic and topic features. Third, we employed the K-means algorithm for topic clustering and explored their evolutionary patterns. [Results] The public attention on the metaverse originated around NFTs and gaming. With capital speculation within the digital industry, the entertainment and physical industries joined the race. The emergence of ChatGPT further prompted the public’s exploration of the status quo of the metaverse, technology innovation, and prospective applications. [Limitations] We did not include foreign language data from Twitter to compare the focus and trends of the metaverse topics among domestic and international users. [Conclusions] This study examines the characteristics and evolution of social attention on topics related to the meta-universe from quantitative and macro perspectives. It helps us regulate online public opinion in the meta-universe.

Key wordsMetaverse    Microblog    BERT    Dynamic Topic Model
收稿日期: 2022-10-28      出版日期: 2023-09-12
ZTFLH:  TP391  
  G350  
基金资助:*国家自然科学基金项目(72204189);广东省基础与应用基础研究基金项目(2022A1515110972);教育部哲学社会科学研究重大课题攻关项目(20JZD024)
通讯作者: 吴江,ORCID: 0000-0002-3342-9757,E-mail: jiangw@whu.edu.cn。   
引用本文:   
贺超城, 黄茜, 李欣儒, 王春迎, 吴江. 元宇宙的冷与热——融合BERT与动态主题模型的微博文本分析*[J]. 数据分析与知识发现, 2023, 7(9): 25-38.
He Chaocheng, Huang Qian, Li Xinru, Wang Chunying, Wu Jiang. Trending Topics on Metaverse: A Microblog Text Analysis with BERT and DTM. Data Analysis and Knowledge Discovery, 2023, 7(9): 25-38.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2022.1128      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2023/V7/I9/25
Fig.1  元宇宙微博文本数量的月度分布
Fig.2  研究流程框架
Fig.3  主题一致性随主题数量的变化情况
模型评估系数 BERT-DTM BERT-LDA BERT TF-IDF
CV 0.570 0.548 0.435 0.319
SS 0.207 0.170 0.063 0.061
Table 1  4种主题建模模型的元宇宙微博话题识别效果对比
Fig.4  种主题建模模型的UMAP二维聚类可视化效果
主题 主题词(time=1) …… (time=18)
topic1
应用展望
世界,现在,概念,现实,知道,未来,人类,看到,生活,东西,宇宙,今天,喜欢,时间,游戏,玩家,朋友,希望,虚拟世界,时代 …… 现在,世界,人类,捂脸,CXK,知道,喜欢,知,概念,虚拟,故事,时代,意识,游戏,看到,楼,地球,东西,未来,时间
topic2
NFT和游戏
NFT,海盗,社区,项目,PIRATECOIN,BALA,币,游戏,格里芬,手游,链,FLOKI,GART,区块,中国,生态,上线,加密,价值,目前 …… 链,区块,NFT,游戏,币,WEB3,数字,项目,藏品,社区,FLOKI,比特,中国,加密,平台,货币,以太,用户,坊,SAND
topic3
技术创新
技术,世界,发展,现实,互联网,数字,未来,新,科技,实现,应用,网络,虚拟,需要,经济,人类,行业,概念,内容,产业 …… 发展,技术,AI,数字,CHATGPT,应用,人工智能,产业,新,领域,未来,经济,创新,数据,中国,企业,科技,AIGC,智能,研究
topic4
实体产业
股份,科技,板,能源,新,药业,汽车,文化,龙头,东方,集团,电子,智能,中青宝,发展,医药,湖北,光伏,医疗,视讯 …… 股份,科技,智能,沉香,数字,深圳,信息,数科,天娱,电子,如屑,应渊,唐周,信创,板,在线,备注,数据
topic5
微观股市
板块,亿,涨停,股,指数,个股,概念,沪,两市,创业板,涨幅,超,资金,今日,买入,震荡,电力,上涨,涨,点 …… 概念,人工智能,涨停,板块,个股,指数,数字,CHATGPT,经济,板,两市,跌,科技,股,概念股,亿,资金,云,市场,震荡
topic6
企业投资
公司,相关,业务,投资者,产品,增长,亿元,市场,VR,行业,领域,投资,企业,目前,项目,亿,研发,同比,汽车,市值 …… 公司,亿,亿元,项目,产品,市值,业务,投资,总,元,服务,研发,现价,技术,企业,相关,同比,拟,增长,中国
topic7
数字产业
FACEBOOK,公司,游戏,扎克伯格,META,AR,投资,VR,苹果,巨头,宣布,表示,美国,亿美元,平台,计划,社交,微软,万美元,市场 …… 公司,CHATGPT,META,微软,亿美元,团队,美国,宣布,表示,苹果,推出,全球,用户,裁员,市场,业务,投资,计划,VR,员工
topic8
文娱产业
大学,艺术,中国,拥有,音乐,文化,作品,一起,艺术家,设计,伊斯坦布尔,系列,时尚,AESPA,旅游,舞台,视频,北京,主题,时间 …… 文化,活动,艺术,音乐,旅游,中国,舞台,一起,感受,传统,赞多,制作,视频,期待,CXK,魅力,时间,龚俊,新,设计
topic9
宏观股市
板块,市场,今天,关注,机会,继续,行情,反弹,明天,方向,资金,趋势,上涨,目前,个股,调整,短线,热点,新能源,龙头 …… 板块,市场,今天,继续,资金,机会,行情,关注,目前,指数,方向,调整,预期,炒作,出现,经济,题材,点,概念,科技
topic10
产业现状
虚拟,概念,发布,数字,科技,游戏,文章,VR,头条,商标,世界,体验,提问,申请,百度,布局,新,未来,打造,虚拟人 …… 数字,虚拟,体验,发布,科技,VR,产业,AR,新,大会,世界,场景,品牌,打造,文章,技术,头条,直播,沉浸,平台
Table 2  各个子时期内主题-主题词映射(部分)
Fig.5  各主题下微博文本数量分布
Fig.6  各主题演化热力图
Fig.7  各主题下微博数量演化图
Fig.8  关键词共现网络图
[1] 王儒西, 向安玲. 2020-2021 年元宇宙发展研究报告[R]. 北京: 清华大学新媒体研究中心, 2021.
[1] (Wang Ruxi, Xiang Anling. Research Report on the Development of Metaverse in 2020-2021[R]. Beijing: New Media Research Center, Tsinghua University, 2021.)
[2] 赵星, 陆绮雯. 元宇宙之治:未来数智世界的敏捷治理前瞻[J]. 中国图书馆学报, 2022, 48(1): 52-61.
[2] (Zhao Xing, Lu Qiwen. Governance of the Metaverse: A Vision for Agile Governance in the Future Data Intelligence World[J]. Journal of Library Science in China, 2022, 48(1): 52-61.)
[3] 王文喜, 周芳, 万月亮, 等. 元宇宙技术综述[J]. 工程科学学报, 2022, 44(4): 744-756.
[3] (Wang Wenxi, Zhou Fang, Wan Yueliang, et al. A Survey of Metaverse Technology[J]. Chinese Journal of Engineering, 2022, 44(4): 744-756.)
[4] 何诚颖, 黄轲, 张左敏暘, 等. 元宇宙产业发展:重塑效应、阶段特征及演进前景[J]. 安徽师范大学学报(人文社会科学版), 2022, 50(5): 111-122.
[4] He Chengying, Huang Ke, Zhang Zuominyang, et al. Meta-cosmic Industry Development: Remolding Effect, Stage Characteristics and Evolution Prospect[J]. Journal of Anhui Normal University (Humanities & Social Science), 2022, 50(5): 111-122.)
[5] 向安玲, 高爽, 彭影彤, 等. 知识重组与场景再构:面向数字资源管理的元宇宙[J]. 图书情报知识, 2022, 39(1): 30-38.
[5] (Xiang Anling, Gao Shuang, Peng Yingtong, et al. Knowledge Reorganization and Scene Reconstruction: A Metaverse for Digital Resources Management[J]. Documentation, Information & Knowledge, 2022, 39(1): 30-38.)
[6] 刘大同, 郭凯, 王本宽, 等. 数字孪生技术综述与展望[J]. 仪器仪表学报, 2018, 39(11): 1-10.
[6] (Liu Datong, Guo Kai, Wang Benkuan, et al. Summary and Perspective Survey on Digital Twin Technology[J]. Chinese Journal of Scientific Instrument, 2018, 39(11): 1-10.)
[7] Qi Q L, Tao F. Digital Twin and Big Data Towards Smart Manufacturing and Industry 4.0: 360 Degree Comparison[J]. IEEE Access, 2018, 6: 3585-3593.
doi: 10.1109/ACCESS.2018.2793265
[8] Jeong H, Yi Y, Kim D. An Innovative E-Commerce Platform Incorporating Metaverse to Live Commerce[J]. International Journal of Innovative Computing, Information and Control, 2022, 18(1): 221-229.
[9] 潘教峰. 新科技革命与三元融合社会——关于雄安新区建设的宏观思考[J]. 中国科学院院刊, 2017, 32(11): 1177-1184.
[9] (Pan Jiaofeng. New Science and Technology Revolution and Ternary Fusion Society——Macroscopic Views on Xiongan New Area Construction[J]. Bulletin of Chinese Academy of Sciences, 2017, 32(11): 1177-1184.)
[10] 张雷, 谭慧雯, 张璇, 等. 基于LDA模型的高校师德舆情演化及路径传导研究[J]. 情报科学, 2022, 40(3): 144-151.
[10] (Zhang Lei, Tan Huiwen, Zhang Xuan, et al. Evolution and Path of Public Opinions about Teachers’ Ethics in Colleges and Universities Based on LDA Model[J]. Information Science, 2022, 40(3): 144-151.)
[11] 王卓, 刘小莞. 元宇宙:时空再造与虚实相融的社会新形态[J]. 社会科学研究, 2022(5): 14-24.
[11] (Wang Zhuo, Liu Xiaowan. Metaverse: A New Social Form of the Fusion of Virtual and Reality and the Reconstruction of Time and Space[J]. Social Science Research, 2022(5): 14-24.)
[12] 王伟杰. 元宇宙开启文旅产业新未来[N]. 中国文化报, 2022-09-05.
[12] (Wang Weijie. Metaverse Opens up a New Future for the Cultural Tourism Industry[N]. China Culture Daily, 2022-09-05.)
[13] 冯贞翔. 元宇宙时代的混合式办公初探[J]. 办公自动化, 2022, 27(18): 10-12, 45.
[13] (Feng Zhenxiang. A Preliminary Study on Mixed Office in the Metaverse Era[J]. Office Informatization, 2022, 27(18): 10-12, 45.)
[14] 曾圣钧, 周涛. 元宇宙产业发展与银行金融创新研究[J]. 国际金融, 2022(3):15-20.
[14] (Zeng Shengjun, Zhou Tao. Research on Metaverse Industry Development and Banking Financial Innovation[J]. International Finance, 2022(3):15-20.)
[15] 沈金萍, 杨宇卓. 元宇宙在艺术和教育领域中的应用——以百度“希壤”元宇宙平台为例[J]. 传媒, 2022 (14): 23-24.
[15] (Shen Jinping, Yang Yuzhuo. The Application of Metaverse in Art and Education——Taking Baidu “Xirang” Metaverse Platform as an Example[J]. Media, 2022 (14): 23-24.)
[16] Hollensen S, Kotler P, Opresnik M O. Metaverse-The New Marketing Universe[J]. Journal of Business Strategy, 2023, 44(3): 119-125.
doi: 10.1108/JBS-01-2022-0014
[17] Chalmers D, Fisch C, Matthews R, et al. Beyond the Bubble: Will NFTs and Digital Proof of Ownership Empower Creative Industry Entrepreneurs?[J]. Journal of Business Venturing Insights, 2022, 17: e00309.
doi: 10.1016/j.jbvi.2022.e00309
[18] Park S M, Kim Y G. A Metaverse: Taxonomy, Components, Applications, and Open Challenges[J]. IEEE Access, 2022, 10: 4209-4251.
doi: 10.1109/ACCESS.2021.3140175
[19] Tsai Y C. The Value Chain of Education Metaverse [OL]. arXiv Preprint, arXiv: 2211.05833.
[20] Thien H T, Pham Q V, Pham X Q, et al. Artificial Intelligence for the Metaverse: A Survey[J]. Engineering Applications of Artificial Intelligence, 2023, 117: 105581.
doi: 10.1016/j.engappai.2022.105581
[21] Rospigliosi P. Metaverse or Simulacra? Roblox, Minecraft, Meta and the Turn to Virtual Reality for Education, Socialisation and Work[J]. Interactive Learning Environments, 2022, 30(1): 1-3.
doi: 10.1080/10494820.2022.2022899
[22] Zhu H Y. MetaOnce: A Metaverse Framework Based on Multi-Scene Relations and Entity-Relation-Event Game[OL]. arXiv Preprint, arXiv:2203.10424.
[23] 曾祥敏, 董华茜. 媒介认知、深度融合辨识与数字具身共存 ——2022年媒体融合研究综述[J]. 现代出版, 2023(1): 28-42.
[23] (Zeng Xiangmin, Dong Huaxi. Coexistence of Media Cognition, Deep Integrative Identification and Digital Embodiment: Overview of Media Convergence Research in 2022[J]. Modern Publishing, 2023(1): 28-42.)
[24] 王兆其. 虚拟人合成研究综述[J]. 中国科学院研究生院学报, 2000, 17(2): 89-98.
[24] (Wang Zhaoqi. Study on Synthesis of Virtual Human[J]. Journal of the Graduate School Academia Sinica, 2000, 17(2): 89-98.)
[25] 吕鹏. 元宇宙技术与人类“数字永生”[J]. 人民论坛, 2022(7): 21-25.
[25] (Lv Peng. Metaverse Technology and Human “Digital Immortality”[J]. People’s Forum, 2022 (7): 21-25.)
[26] Huang Y J. Comparative Study: How Metaverse Connect with China Laws[J]. SSRN Electronic Journal, DOI: 10.2139/ssrn.3955900.
[27] Lee L H, Lin Z J, Hu R, et al. When Creators Meet the Metaverse: A Survey on Computational Arts[OL]. arXiv Preprint, arXiv:2111.13486.
[28] Mystakidis S. Metaverse[J]. Encyclopedia, 2022, 2(1): 486-497.
doi: 10.3390/encyclopedia2010031
[29] 曾梦宁. 2021热词回眸[J]. 中国金融家, 2022(1): 168-169.
[29] (Zeng Mengning. Review of 2021 Hot Words[J]. China Financialyst, 2022(1): 168-169.)
[30] 贾丽. 2022世界5G大会热词:元宇宙、6G、工业互联网[N]. 证券日报, 2022-08-11.
[30] (Jia Li. 2022 World 5G Conference Hot Words: Metaverse, 6G, Industrial Internet[N]. Securities Daily, 2022-08-11.)
[31] 谢倩. “元宇宙”出版热潮中的冷思考[J]. 中国图书评论, 2022(6): 83-93.
[31] (Xie Qian. Cold Thoughts on the “Metaverse” Publishing Boom[J]. China Book Review, 2022(6): 83-93.)
[32] Cui Y M, Che W X, Liu T, et al. Pre-training with Whole Word Masking for Chinese BERT[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2021, 29: 3504-3514.
doi: 10.1109/TASLP.2021.3124365
[33] 王磊, 黄广君. 结合概念语义空间的语义扩展技术研究[J]. 计算机工程与应用, 2012, 48(35): 106-109.
[33] (Wang Lei, Huang Guangjun. Research of Semantic Query Expansion Related to Concept Semantic Space[J]. Computer Engineering and Applications, 2012, 48(35): 106-109..)
[34] 吴江, 刘涛, 刘洋. 在线社区用户画像及自我呈现主题挖掘——以网易云音乐社区为例[J]. 数据分析与知识发现, 2022, 6(7): 56-69.
[34] (Wu Jiang, Liu Tao, Liu Yang. Mining Online User Profiles and Self-Presentations: Case Study of NetEase Music Community[J]. Data Analysis and Knowledge Discovery, 2022, 6(7): 56-69.)
[35] 王秀红, 高敏. 基于 BERT-LDA 的关键技术识别方法及其实证研究——以农业机器人为例[J]. 图书情报工作, 2021, 65(22): 114-125.
doi: 10.13266/j.issn.0252-3116.2021.22.012
[35] (Wang Xiuhong, Gao Min. The Key Technology Identification Method Based on BERT-LDA and Its Empirical Research: A Case Study of Agricultural Robots[J]. Library and Information Service, 2021, 65(22): 114-125.)
doi: 10.13266/j.issn.0252-3116.2021.22.012
[36] Röder M, Both A, Hinneburg A. Exploring the Space of Topic Coherence Measures[C]// Proceedings of the 8th ACM International Conference on Web Search and Data Mining. 2015: 399-408.
[1] 赵雪峰, 吴德林, 吴伟伟, 孙卓荦, 胡瑾瑾, 廉莹, 单佳宇. 基于深度学习与多分类轮询机制的高质量“卡脖子”技术专利识别模型——以专利申请文件为研究主体*[J]. 数据分析与知识发现, 2023, 7(8): 30-45.
[2] 本妍妍, 庞雪芹. 融入词性的医疗命名实体识别研究*[J]. 数据分析与知识发现, 2023, 7(5): 123-132.
[3] 徐康, 余胜男, 陈蕾, 王传栋. 基于语言学知识增强的自监督式图卷积网络的事件关系抽取方法*[J]. 数据分析与知识发现, 2023, 7(5): 92-104.
[4] 闫尚义, 王靖亚, 刘晓文, 崔雨萌, 陶知众, 张晓帆. 基于多头自注意力池化与多粒度特征交互融合的微博情感分析*[J]. 数据分析与知识发现, 2023, 7(4): 32-45.
[5] 苏明星, 吴厚月, 李健, 黄菊, 张顺香. 基于多层交互注意力机制的商品属性抽取*[J]. 数据分析与知识发现, 2023, 7(2): 108-118.
[6] 赵一鸣, 潘沛, 毛进. 基于任务知识融合与文本数据增强的医学信息查询意图强度识别研究*[J]. 数据分析与知识发现, 2023, 7(2): 38-47.
[7] 王宇飞, 张智雄, 赵旸, 张梦婷, 李雪思. 中文科技论文标题自动生成系统的设计与实现*[J]. 数据分析与知识发现, 2023, 7(2): 61-71.
[8] 张思阳, 魏苏波, 孙争艳, 张顺香, 朱广丽, 吴厚月. 基于多标签Seq2Seq模型的情绪-原因对提取模型*[J]. 数据分析与知识发现, 2023, 7(2): 86-96.
[9] 王昊, 龚丽娟, 周泽聿, 范涛, 王永生. 融合语义增强的社交媒体虚假信息检测方法研究*[J]. 数据分析与知识发现, 2023, 7(2): 48-60.
[10] 曹喆, 郭慧兰, 吴江, 胡忠义. 元宇宙的理想与现实:基于评论挖掘的VR产品用户感知研究*[J]. 数据分析与知识发现, 2023, 7(1): 49-62.
[11] 施运梅, 袁博, 张乐, 吕学强. IMTS:融合图像与文本语义的虚假评论检测方法*[J]. 数据分析与知识发现, 2022, 6(8): 84-96.
[12] 郑洁, 黄辉, 秦永彬. 一种融合法律知识的相似案例匹配模型*[J]. 数据分析与知识发现, 2022, 6(7): 99-106.
[13] 边晓慧, 徐童. 重大突发公共卫生事件下的公众情感演进分析:基于新冠肺炎疫情的考察*[J]. 数据分析与知识发现, 2022, 6(7): 128-140.
[14] 吴江, 刘涛, 刘洋. 在线社区用户画像及自我呈现主题挖掘——以网易云音乐社区为例*[J]. 数据分析与知识发现, 2022, 6(7): 56-69.
[15] 潘慧萍, 李宝安, 张乐, 吕学强. 基于多特征融合的政府工作报告关键词提取研究*[J]. 数据分析与知识发现, 2022, 6(5): 54-63.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn