Please wait a minute...
Advanced Search
数据分析与知识发现  2019, Vol. 3 Issue (9): 124-134     https://doi.org/10.11925/infotech.2096-3467.2018.1332
     研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于主题挖掘的超额募资农产品众筹项目文本特征研究 *——以众筹网为例
黄漫宇1,云琪1(),彭虎锋2,窦雪萌1
1 中南财经政法大学工商管理学院 武汉 430073
2 中南财经政法大学信息与工程管理学院 武汉 430073
Analyzing Textual Features of Excess-funded Agricultural Products——Case Study of Crowdfunding Website
Manyu Huang1,Qi Yun1(),Hufeng Peng2,Xuemeng Dou1
1 School of Business Administration, Zhongnan University of Economics and Law, Wuhan 430073, China
2 School of Information and Safety Engineering, Zhongnan University of Economics and Law, Wuhan 430073, China
全文: PDF (549 KB)   HTML ( 13
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】揭示超额募资的农产品众筹项目的文本特征以及典型主题的时间演化规律。【方法】运用TOT主题分析模型, 从众筹网提取2013年9月-2018年4月获得超额募资的1 137项农产品众筹项目的推介文本, 得到各个主题下各词项的概率分布, 并对各个主题的时间演变趋势进行分析。【结果】超额募资的农产品众筹项目集中于茶、酒和蜂蜜等品类, 在文本特征方面聚焦于消费者价值、农产品属性与社会效应, 2014年-2017年关于消费者价值与农产品属性的主题强度呈U型分布。【局限】农产品众筹领域可以获取的高质量数据有限。【结论】众筹发起方在撰写推介文本时应当强调农产品的高品质和参与的独特体验以提升文本吸引力, 从而获得更多资金支持。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
黄漫宇
云琪
彭虎锋
窦雪萌
关键词 主题挖掘超额募资农产品众筹文本特征TOT模型    
Abstract

[Objective] This paper aims to identify the textual features of excess-funded agricultural products with the crowdfunding services and the time evolution rules of typical topics. [Methods] We used the TOT analysis model to retrieve the texts of 1137 excess-funded agricultural product between September 2013 and April 2018 from the crowdfunding website. Then, we obtained the probability distribution of the terms with each theme. Finally, we examined the time evolution trends of each topic. [Results] The excess-funded agricultural products were in the categories of tea, wine and honey. Text characteristics of these projects focused on the value of customers, quality of the agricultural products and social benefits. The distribution of topic intensity on value of customers and quality of agricultural products from 2014 to 2017 showed the U pattern. [Limitations] The high-quality crowdfunding data of agricultural products is relatively limited. [Conclusions] The projects seeking more crowdfunding support should emphasize the high quality of the products and the unique experience of participation .

Key wordsTopic Mining    Excess-funded    Crowdfunding Project of Agricultural Products    Textual Features    TOT Model
收稿日期: 2018-11-27      出版日期: 2019-10-23
ZTFLH:  TP391 G35  
基金资助:*本文系教育部人文社会科学一般项目“基于农业众筹的农产品流通体系优化研究”(项目编号: 17YJA790032);湖北省技术创新专项软科学项目“乡村振兴背景下湖北省农村电商赋能的路径与模式创新研究”(项目编号: 2019ADC150);中南财经政法大学研究生教育创新资助项目“农业众筹优化农产品流通体系的路径与模式分析”(项目编号: 201811055)
引用本文:   
黄漫宇,云琪,彭虎锋,窦雪萌. 基于主题挖掘的超额募资农产品众筹项目文本特征研究 *——以众筹网为例[J]. 数据分析与知识发现, 2019, 3(9): 124-134.
Manyu Huang,Qi Yun,Hufeng Peng,Xuemeng Dou. Analyzing Textual Features of Excess-funded Agricultural Products——Case Study of Crowdfunding Website. Data Analysis and Knowledge Discovery, 2019, 3(9): 124-134.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2018.1332      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2019/V3/I9/124
  研究思路
  超额募资的农产品众筹项目文本时间演化分析模型
符号 描述
K 超额募资的农产品众筹项目推介文本的数量
M 超额募资的农产品众筹项目推介文本相关文档的数量
V 超额募资的农产品众筹项目推介文本词项的数量
Nm 文档m中单词的数量
${{\vec{\vartheta }}_{m}}$ 文档m上的主题多项分布, Θ =$\{{{\vec{\vartheta }}_{m}}\}_{m=1}^{M}$(M×K matrix)
${{\vec{\varphi }}_{k}}$ 主题k上的词项多项分布, Φ =$\{{{\vec{\varphi }}_{k}}\}_{k=1}^{K}$(K×V matrix)
${{\vec{\psi }}_{k}}$ 主题k随时间变化的贝塔分布, Ψ =$\{{{\vec{\psi }}_{k}}\}_{k=1}^{K}$(K×2 matrix)
${{z}_{m,n}}$ 文档m中第n个词的主题
${{w}_{m,n}}$ 文档m中第n个词
${{t}_{m,n}}$ 文档m中第n个词的时间戳
$\vec{\alpha }$ 文档多项分布${{\vec{\vartheta }}_{m}}$的狄利克雷先验分布, K维向量
$\vec{\beta }$ 主题多项分布${{\vec{\varphi }}_{k}}$的狄利克雷先验分布, V维向量
  参数说明
排序 品类 项目个数 项目比率
1 茶叶 176 15.5%
2 79 6.9%
3 蜂蜜 70 6.2%
4 大米 65 5.7%
5 橙橘 45 4.0%
6 坚果 36 3.2%
7 枣类 34 3.0%
8 22 1.9%
9 枸杞 20 1.8%
10 其他 590 51.9%
  超额募资的众筹项目涉及农产品的品类分布
序号 关键词及权重值
Topic1 苹果 0.012883, 健康 0.012853, 种植 0.008783, 分享 0.008691, 产品 0.006641, 提供 0.005906, 农民 0.005692,
食品 0.005049, 农场 0.004743, 营养 0.004621, 家乡 0.004437, 铁皮石 0.004284
Topic2 价值 0.044918, 产品 0.02133, 手工 0.017231, 活动 0.013384, 食品 0.013216, 蜂巢 0.012965, 放心 0.012547,
绿色 0.011962, 体验 0.009619, 会员 0.008532, 采摘 0.008114, 享受 0.007946
Topic3 土蜂 0.017136, 水果 0.010551, 蜂蜜 0.009802, 放心 0.007558, 食品 0.006585, 黑木耳 0.00651, 环境 0.00636,
木桶 0.006286, 特产 0.006061, 黄豆 0.005762, 发起 0.005612, 中华 0.005612
Topic4 苹果 0.116188, 栖霞 0.035779, 烟台 0.031104, 精品 0.015708, 快递 0.014149, 果园 0.010971, 价格 0.010908,
新鲜 0.010659, 品尝 0.010036, 种植 0.009288, 红富士 0.00854, 达成 0.008415
Topic5 传统 0.034746, 茶叶 0.02506, 价值 0.023994, 红茶 0.023549, 工艺 0.013685, 制作 0.012441, 茶园 0.011552,
达成 0.010131, 福鼎 0.010042, 海鲜 0.009242, 茶农 0.008353, 奖励 0.008087
Topic6 价值 0.02788, 世界 0.012021, 会员 0.009378, 礼盒 0.009208, 享受 0.008867, 参与 0.008782, 天麻 0.008611,
加入 0.008355, 了解 0.007929, 加工 0.007759, 信号 0.007503, 粮食 0.006309
Topic7 枸杞 0.040668, 新疆 0.011153, 云南 0.011002, 产品 0.009408, 农家 0.008801, 辣酱 0.008574, 会员 0.007056,
城市 0.006146, 生态 0.006146, 精美 0.005918, 甜蜜 0.005766, 养殖 0.00569
Topic8 蜂蜜 0.03456, 核桃 0.015488, 龙须菜 0.014208, 扶贫 0.01024, 爱心 0.009728, 玉米 0.009728, 资金 0.009088,
农民 0.008256, 农村 0.007552, 公司 0.007296, 农产品 0.007232, 食品 0.006784
Topic9 花香 0.018301, 大米 0.016517, 体验 0.013064, 五常 0.012431, 活动 0.01082, 免费 0.010647, 价值 0.010302,
礼盒 0.009035, 优惠 0.00869, 草莓 0.008633, 新鲜 0.008633, 采摘 0.008402
Topic10 大米 0.039687, 五常 0.01604, 父亲 0.015664, 水稻 0.009639, 生态 0.008811, 分享 0.008736, 香榧 0.00738,
参与 0.007004, 活动 0.006853, 稻田 0.006702, 幸福 0.006401, 安全 0.005949
Topic11 阳澄湖 0.013868, 价值 0.012727, 市场价 0.011498, 定制 0.010884, 礼品 0.010445, 健康 0.010094, 礼盒 0.009567,
适合 0.008514, 品质 0.0079, 原浆 0.007812, 石榴 0.007812, 枇杷 0.007285
Topic12 樱桃 0.023376, VIP 0.012183, 生态 0.011787, 价值 0.011589, 蜜柚 0.0104, 顺丰 0.010301, 种植 0.010103,
幸运 0.010004, 健康 0.009608, 新鲜 0.009608, 花生 0.009113, 基地 0.008815
Topic13 原生态 0.01888, 免费 0.015518, 体验 0.013578, 产品 0.012608, 价值 0.011121, 梦想 0.009052, 预定 0.00847,
板栗 0.007565, 全国 0.007565, 乡村 0.006983, 地址 0.006595, 精美 0.00653
Topic14 花椒 0.014352, 蔬菜 0.013056, 种植 0.011761, 生活 0.011295, 产品 0.008652, 原生态 0.008393, 栗子 0.007772,
核桃 0.007046, 农业 0.00658, 采摘 0.006114, 绿色 0.006114, 孩子 0.005699
Topic15 茶叶 0.025476, 咖啡 0.022074, 铁观音 0.016574, 绿茶 0.013824, 高山 0.012231, 春茶 0.010205, 茶农 0.009771,
茶树 0.008613, 作用 0.008468, 发展 0.008323, 普洱茶 0.007599, 自然 0.00731
Topic16 新疆 0.053813, 红枣 0.019016, 和田 0.016467, 核桃 0.014115, 营养 0.011468, 大枣 0.011076, 葡萄 0.01039,
玫瑰 0.010096, 运费 0.008724, 阿克苏 0.00794, 美味 0.007842, 统一 0.007842
Topic17 果园 0.037619, 生活 0.026533, 猕猴桃 0.024534, 葡萄酒 0.019627, 秦岭 0.01363, 精选 0.012721, 免费 0.012631,
香菇 0.010995, 订制 0.009814, 葡萄 0.009632, 愉快 0.008814, 冰糖 0.008632
Topic18 西藏 0.02197, 芒果 0.021736, 小米 0.019937, 脐橙 0.019468, 长白山 0.017905, 红薯 0.01681, 木耳 0.016654,
老人 0.016028, 种植 0.015637, 海南 0.013995, 宁夏 0.013839, 内蒙古 0.012353
Topic19 礼盒 0.020906, 预定 0.012037, 专用 0.011826, 柿饼 0.011826, 黄河 0.011192, 酱油 0.009819, 黄花菜 0.009503,
产品 0.008975, 达成 0.008447, 富平 0.008447, 陕西 0.007602, 文化 0.007602
Topic20 红糖 0.042929, 鸡蛋 0.02264, 手工 0.016956, 会员 0.010879, 价格 0.010781, 团队 0.010781, 私人 0.010291,
古法 0.009311, 甘蔗 0.009311, 品质 0.009115, 价值 0.009115, 限量 0.008037
  样本TOT模型主题挖掘结果
一级维度 二级维度 涵盖的主题 代表性关键词
消费者
价值
体验 Topic2、Topic6、Topic9、Topic10、Topic13、Topic17 采摘、活动、分享、免费、订制
时令礼品 Topic11、Topic19 礼品、礼盒、预定、专用、健康
农产品
属性
健康绿色 Topic1、Topic3、Topic12、Topic14 健康、营养、放心、环境、生态、原生态、新鲜、绿色
原产地 Topic4、Topic7、Topic16、Topic18 苹果、栖霞、烟台、红富士、枸杞、新疆、云南、红枣、和田、阿克苏、芒果、海南
畅销品类 Topic5、Topic15 茶叶、红茶、茶园、茶农、铁观音、绿茶、高山、春茶、普洱茶
生产工艺 Topic20 私人、古法、手工、限量
社会效应 扶贫 Topic8 扶贫、爱心、资金、农民、农村
  超额募资的农产品众筹项目文本特征
  超额募资的农产品众筹项目文本主题的时间演化趋势
[1] Belleflamme P, Lambert T, Schwienbacher A . Crowdfunding: Tapping the Right Crowd[J]. Journal of Business Venturing, 2014,29(5):585-609.
doi: 10.1016/j.jbusvent.2013.07.003
[2] Ordanini A, Miceli L, Pizzetti M , et al. Crowd-funding: Transforming Customers into Investors Through Innovative Service Platforms[J]. Journal of Service Management, 2011,22(4):443-470.
doi: 10.1108/09564231111155079
[3] 刘明霞, 黄丹 . 基于扎根理论的奖励型众筹发起者参与动机研究[J]. 科技进步与对策, 2015,32(24):6-11.
[3] ( Liu Mingxia, Huang Dan . Motivations of Creators to Participate in Reward-based Crowd Funding Based on Grounded Theory[J]. Science & Technology Progress and Policy, 2015,32(24):6-11.)
[4] Cordova A, Dolci J, Gianfrate G . The Determinants of Crowdfunding Success: Evidence from Technology Projects[J]. Procedia-Social and Behavioral Sciences, 2015,181:115-124.
[5] 曾江洪, 甘信禹 . 社会资本对众筹项目融资成功率影响的实证研究[J]. 技术经济, 2014,33(11):90-95, 115.
[5] ( Zeng Jianghong, Gan Xinyu . Empirical Research on Effect of Social Capital to Success Rate of Crowdfunding Project[J]. Technology Economics, 2014,33(11):90-95, 115.)
[6] Bi S, Liu Z, Usman K . The Influence of Online Information on Investing Decisions of Reward-based Crowdfunding[J]. Journal of Business Research, 2017,71:10-18.
[7] 王伟, 陈伟, 祝效国 , 等. 众筹融资成功率与语言风格的说服性——基于 Kickstarter的实证研究[J]. 管理世界, 2016(5):81-98.
[7] ( Wang Wei, Chen Wei, Zhu Xiaoguo , et al. The Persuasion of Crowdfunding Success Rate and Language Style——An Empirical Study Based on Kickstarter[J]. Management World, 2016(5):81-98.)
[8] 邱瑾, 张淑楠 . 基于数据挖掘的互联网众筹成功进度分位数回归模型[J]. 统计与信息论坛, 2018,33(2):36-45.
[8] ( Qiu Jin, Zhang Shu’nan . The Quantile Regression Model for the Internet Crowdfunding’s Successful Progress Based on Data Mining[J]. Statistics & Information Forum, 2018,33(2):36-45.)
[9] Jegelevičiūtė S, Valančienė L . Comparative Analysis of the Ways Crowdfunding is Promoted[J]. Procedia-Social and Behavioral Sciences, 2015,213:268-274.
[10] 余涛 . 众筹规制探究——一个规范分析的路径[J]. 证券市场导报, 2015(3):12-19.
[10] ( Yu Tao . Crowdfunding Regulation Research—A Path of Normative Analysis[J]. Securities Market Herald, 2015(3):12-19.)
[11] Belleflamme P, Omrani N, Peitz M . The Economics of Crowdfunding Platforms[J]. Information Economics and Policy, 2015,33:11-28.
[12] 张雅, 孙晓辉 . 农业众筹的起源、特点与未来[J]. 中国农业大学学报: 社会科学版, 2016,33(6):96-150.
[12] ( Zhang Ya, Sun Xiaohui. The Origin , Features and Future of Agriculture Crowdfunding[J]. Journal of China Agricultural University: Social Sciences Edition, 2016,33(6):96-150.)
[13] 蒋文龙, 崔丽 . 玩转农业众筹, 助推品牌农业[J]. 江西农业, 2015(5):19-22.
[13] ( Jiang Wenlong, Cui Li . Promote Agricultural Crowdfunding and Boost Brand Agriculture[J]. Jingxi Agriculture, 2015(5):19-22.)
[14] 郑风田 . “众筹农业”的未来在哪里[J]. 中国畜牧业, 2014(13):41.
[14] ( Zheng Fengtian . Where is the Future of “Crowdfunding Agriculture”?[J]. China Animal Husbandry, 2014(13):41.)
[15] 吕映秀, 郭丽芳, 马家齐 . “互联网+”环境下农业众筹发展现状及对策研究[J]. 管理现代化, 2017(6):4-7.
[15] ( Lv Yingxiu, Guo Lifang, Ma Jiaqi . Research on the Current Situation and Countermeasures of Agricultural Crowdfunding Development Under the “Internet +” Environment[J]. Modernization of Management, 2017(6):4-7.)
[16] 肖建, 朱泓宇, 贾晋 . 农业众筹融资平台的对比研究与最优选择[J]. 农村经济, 2017(1):24-29.
[16] ( Xiao Jian, Zhu Hongyu, Jia Jin . Comparative Study and Optimal Choice of Agricultural Crowdfunding Financing Platform[J]. Rural Economy, 2017(1):24-29.)
[17] 孟枫平, 江洋 . 基于QCA的涉农小微企业众筹融资关键影响因素研究[J]. 江淮论坛, 2017(6):18-22, 59.
[17] ( Meng Fengping, Jiang Yang . Study on Key Factors Affecting Crowdfunding of Small and Micro-Agricultural Enterprises Based on QCA[J]. Jianghuai Forum, 2017(6):18-22, 59.)
[18] 杜俊娟, 李姚矿 . 农产品众筹发起人特征对融资达成率的影响研究——基于信任理论视角[J]. 中国农村经济, 2018(3):15-28.
[18] ( Du Junjuan, Li Yaokuang . The Impact of Initiators’ Characteristics on Crowdfunding Performance of Agricultural Projects: An Analysis Based on the Trust Theory[J]. Chinese Rural Economy, 2018(3):15-28.)
[19] 黄漫宇, 李若男 . 农业众筹项目融资绩效影响因素的实证分析[J]. 统计与决策, 2018(11):172-175.
[19] ( Huang Manyu, Li Ruonan . Empirical Analysis on Influencing Factors of Financing Performance of Agricultural Crowd-funding Projects[J]. Statistics and Decision, 2018(11):172-175.)
[1] 陈杰,马静,李晓峰. 融合预训练模型文本特征的短文本分类方法*[J]. 数据分析与知识发现, 2021, 5(9): 21-30.
[2] 胡广伟, 滕婕, 刘露. 政民互动中社会诉求主题挖掘和省际差异研究*——基于省级政府领导电子信箱语料的分析[J]. 数据分析与知识发现, 2021, 5(10): 15-27.
[3] 杨磊,王子润,侯贵生. 基于Q-LDA主题模型的网络健康社区主题挖掘研究 *[J]. 数据分析与知识发现, 2019, 3(11): 52-59.
[4] 杨贵军,徐雪,赵富强. 基于XGBoost算法的用户评分预测模型及应用*[J]. 数据分析与知识发现, 2019, 3(1): 118-126.
[5] 温廷新, 李洋子, 孙静霜. 基于改进的果蝇优化算法的文本特征选择优化模型[J]. 数据分析与知识发现, 2018, 2(5): 59-69.
[6] 王树义, 廖桦涛, 吴查科. 基于情感分类的竞争企业新闻文本主题挖掘*[J]. 数据分析与知识发现, 2018, 2(3): 70-78.
[7] 唐晓波, 房小可. 微博中文本特征质量对检索效果的影响[J]. 现代图书情报技术, 2014, 30(6): 79-86.
[8] 路永和, 何新宇. 锐化高斯模板在文本特征项权重调整方法中的应用[J]. 现代图书情报技术, 2012, (12): 39-44.
[9] 路永和, 曹利朝. 基于粒子群优化的文本特征选择方法[J]. 现代图书情报技术, 2011, 27(7/8): 76-81.
[10] 杨陟卓,韩燮. 一种基于特征抽取的文档信息过滤算法研究[J]. 现代图书情报技术, 2008, 24(4): 29-34.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn