Please wait a minute...
Advanced Search
现代图书情报技术  2015, Vol. 31 Issue (5): 80-87    DOI: 10.11925/infotech.1003-3513.2015.05.11
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
利用通信数据的移动用户行为分析
黄文彬, 徐山川, 马龙, 王军
北京大学信息管理系 北京 100871
Analysis of Mobile User Behaviors with Telecommunication Data
Huang Wenbin, Xu Shanchuan, Ma Long, Wang Jun
Department of Information Management, Peking University, Beijing 100871, China
全文: PDF(2073 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]了解移动用户的行为模式并建立用户模型。[方法]基于国内电信运营商随机抽取某市一万个移动用户一周的日志记录, 包含4万余条通话记录和200余万条网络请求, 每条请求包含对应的基站标号以及基站地理位置。从消费能力、通话量、网络请求量、位移量4个维度在这批数据中提取14种基本特征指标, 并利用K-means方法聚类。[结果]将移动用户区分成规律通话型、随机上网型、居家节约型和随机高消费型4类用户模型。[局限]用户量与数据量有限, 没有采用更复杂的机器学习算法构建用户模型。[结论]研究结果对移动应用个性化服务的改进具有重要的参考价值。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王军
徐山川
马龙
黄文彬
关键词 用户行为分析移动用户研究聚类数据挖掘    
Abstract

[Objective] This paper proposes a user model to understand mobile user behaviors. [Methods] Mobile user behaviors based on communication records from a Chinese telecom, including 10 thousand mobile users in a week with 40 thousand calls and 2 million network requests with locational information are analyzed. 14 fundamental indicators from the data are adopted based on four different categories, namely consumption level, call volume, network request, and amount of movement. [Results] Four user types, regular motion with large conversation, erratically motion with high network accessing, stay-in with economization, and erratically motion with high consumption, are finally deduced in this study by using K-means clustering method. [Limitations] Because of the limitation of user number and the quantity of data, complex machine learning methods are not used to create user model. [Conclusions] The results are valuable references to improve personalized services in mobile applications.

Key wordsUser behavior analysis    Mobile user study    Cluster    Data mining
收稿日期: 2014-10-31     
:  G35  
基金资助:

本文系国家自然科学基金项目“面向电子商务生态平衡的目录导购机制研究”(项目编号:71373015)的研究成果之一。

通讯作者: 徐山川,ORCID:0000-0002-9840-1157,E-mail:aisensiy@163.com。     E-mail: aisensiy@163.com
作者简介: 作者贡献声明: 黄文彬: 提出设计研究方案, 起草论文;徐山川: 获取、提供与分析数据, 撰写论文;马龙: 进行实验, 分析数据;王军: 提出研究思路, 论文最终版本修订。
引用本文:   
黄文彬, 徐山川, 马龙, 王军. 利用通信数据的移动用户行为分析[J]. 现代图书情报技术, 2015, 31(5): 80-87.
Huang Wenbin, Xu Shanchuan, Ma Long, Wang Jun. Analysis of Mobile User Behaviors with Telecommunication Data. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2015.05.11.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2015.05.11

[1] Moe W W. Buying, Searching, or Browsing: Differentiating Between Online Shoppers Using In-store Navigational Clickstream [J]. Journal of Consumer Psychology, 2003, 13(1-2): 29-39.
[2] Zhao G, Shan Q, Xiao S, et al. Modeling Web Browsing on Mobile Internet [J]. IEEE Communications Letters, 2011, 15(10): 1081-1083.
[3] Xu K, Wang F. Behavioral Graph Analysis of Internet Applications [C]. In: Proceedings of 2011 IEEE Global Telecommunications Conference (GLOBECOM'11), Houston, USA. IEEE, 2011: 1-5.
[4] Hung C, Peng W. A Regression-based Approach for Mining User Movement Patterns from Random Sample Data [J]. Data & Knowledge Engineering, 2011, 70(1): 1-20.
[5] Yavas G, Katsaros D, Ulusoy Ö, et al. A Data Mining Approach for Location Prediction in Mobile Environments [J]. Data & Knowledge Engineering, 2005, 54(2): 121-146.
[6] Zhu Y, Zhang Y, Shang W, et al. Trajectory Enabled Service Support Platform for Mobile Users' Behavior Pattern Mining [C]. In: Proceedings of the 6th Annual International Mobile and Ubiquitous Systems: Networking & Services (MobiQuitous' 09), Toronto, Canada. IEEE, 2009: 1-10.
[7] Akoush S, Sameh A. Mobile User Movement Prediction Using Bayesian Learning for Neural Networks [C]. In: Proceedings of the 2007 International Conference on Wireless Communications and Mobile Computing (IWCMC'07). New York: ACM, 2007: 191-196.
[8] 谭钧元, 宋国杰, 谢昆青, 等. 一种有效的基于生活熵的移动用户分类算法 [J]. 计算机研究与发展, 2009, 46(Sl): 433-438. (Tan Junyuan, Song Guojie, Xie Kunqing, et al. An Effective Mining Method for Mobile Subscribers Based on Life Entropy [J]. Journal of Computer Research and Development, 2009, 46(Sl): 433-438.)
[9] Shafqat Ali Shad. 移动用户轨迹与行为模式挖掘方法研究[D]. 合肥: 中国科学技术大学, 2013. (Shafqat Ali Shad. Mobile User Trajectory and Profile Mining [D]. Hefei: University of Science and Technology of China, 2013.)
[10] 梁鹏, 李兵, 郭文君. 移动数据业务用户行为模型研究[J]. 中兴通讯技术, 2005(4): 70-74. (Liang Peng, Li Bing, Guo Wenjun. Research on User Behavior Models of Mobile Data Services [J]. ZTE Communications, 2005(4): 70-74.)
[11] 吕洋. 基于用户行为数据分析的移动互联业务推荐模型[D]. 武汉: 华中科技大学, 2011. (Lv Yang. A Mobile Internet Business Recommendation Model Based on Data Analysis of User Behavior [D]. Wuhan: Huazhong University of Science and Technology, 2011.)
[12] Liu Y, Yuan P. A Study of User Downloading Behavior in Mobile Internet Using Clickstream Data [C]. In: Proceedings of the 3rd International Symposium on Intelligent Information Technology and Security Informatics, Jinggangshan, China. IEEE, 2010: 255-257.
[13] Zhao G, Lai W, Xu C, et al. Analysis of User Behavior in Mobile Internet Using Bipartite Network [C]. In: Proceedings of the 8th International Conference on Mobile Ad-hoc and Sensor Networks, Chengdu, China. IEEE, 2012: 38-44.
[14] 赖志伟, 梁勇华. 移动互联网用户行为分析[J]. 科技风, 2014(4): 249. (Lai Zhiwei, Liang Yonghua. Analysis of Mobile Internet User Behavior [J]. Technology Wind, 2014(4): 249.)
[15] 李勇, 徐振宁, 张维明. Internet 个性化信息服务研究综述[J]. 计算机工程与应用, 2002, 38(19): 183-188. (Li Yong, Xu Zhenning, Zhang Weiming. Internet Personalized Information Service Overview [J]. Computer Engineering and Applications, 2002, 38(19): 183-188.)
[16] 王国霞, 刘贺平. 个性化推荐系统综述[J]. 计算机工程与应用, 2012, 48(7): 66-76. (Wang Guoxia, Liu Heping. Survey of Personalized Recommendation System [J]. Computer Engineering and Applications, 2012, 48(7): 66-76.)
[17] McKinney W. Python for Data Analysis: Data Wrangling with Pandas, NumPy and Ipython [M]. O'Reilly Media Inc., 2012.

[1] 李柯,佐々木勇和. 基于多维小波聚类的空间文本数据情感分布分析[J]. 数据分析与知识发现, 2019, 3(7): 14-22.
[2] 张勇,李树青,程永上. 基于频次有效长度的加权关联规则挖掘算法研究 *[J]. 数据分析与知识发现, 2019, 3(7): 85-93.
[3] 周成,魏红芹. 专利价值评估与分类研究*——基于自组织映射支持向量机[J]. 数据分析与知识发现, 2019, 3(5): 117-124.
[4] 陆泉,朱安琪,张霁月,陈静. 中文网络健康社区中的用户信息需求挖掘研究*——以求医网肿瘤板块数据为例[J]. 数据分析与知识发现, 2019, 3(4): 22-32.
[5] 吴江,赵颖慧,高嘉慧. 医疗舆情事件的微博意见领袖识别与分析研究*[J]. 数据分析与知识发现, 2019, 3(4): 53-62.
[6] 牟冬梅,法慧,王萍,孙晶. 基于结构方程模型的疾病危险因素研究*[J]. 数据分析与知识发现, 2019, 3(4): 80-89.
[7] 肖连杰,郜梦蕊,苏新宁. 一种基于模糊C-均值聚类的欠采样集成不平衡数据分类算法*[J]. 数据分析与知识发现, 2019, 3(4): 90-96.
[8] 席林娜,窦永香. 基于计划行为理论的微博用户转发行为影响因素研究*[J]. 数据分析与知识发现, 2019, 3(2): 13-20.
[9] 叶佳鑫,熊回香. 基于标签的跨领域资源个性化推荐研究*[J]. 数据分析与知识发现, 2019, 3(2): 21-32.
[10] 张涛,马海群. 一种基于LDA主题模型的政策文本聚类方法研究*[J]. 数据分析与知识发现, 2018, 2(9): 59-65.
[11] 李湘东,高凡,李悠海. 共通语义空间下的跨文献类型文本自动分类研究*[J]. 数据分析与知识发现, 2018, 2(9): 66-73.
[12] 牟冬梅,金姗,琚沅红. 基于文献数据的疾病与基因关联关系研究*[J]. 数据分析与知识发现, 2018, 2(8): 98-106.
[13] 王秀芳,盛姝,路燕. 一种基于话题聚类及情感强度的微博舆情分析模型*[J]. 数据分析与知识发现, 2018, 2(6): 37-47.
[14] 杨震,王红军,周宇. 一种截断距离和聚类中心自适应的聚类算法*[J]. 数据分析与知识发现, 2018, 2(3): 39-48.
[15] 范馨月,崔雷. 基于文本挖掘的药物副作用知识发现研究[J]. 数据分析与知识发现, 2018, 2(3): 79-86.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn