Please wait a minute...
Advanced Search
数据分析与知识发现  2019, Vol. 3 Issue (6): 75-82     https://doi.org/10.11925/infotech.2096-3467.2018.1085
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
轨迹数据融合用户表示方法的重要位置发现*
曾庆田1,2,戴明弟2,李超1,3(),段华2,赵中英2
1(山东科技大学电子信息工程学院 青岛 266590)
2(山东科技大学计算机科学与工程学院 青岛 266590)
3(同济大学嵌入式系统与服务计算教育部重点实验室 上海 201804)
Discovering Important Locations with User Representation and Trace Data
Qingtian Zeng1,2,Mingdi Dai2,Chao Li1,3(),Hua Duan2,Zhongying Zhao2
1(College of Electronic Information Engineering, Shandong University of Science and Technology, Qingdao 266590, China)
2(College of Computer Science and Engineering, Shandong University of Science and Technology, Qingdao 266590, China)
3(Key Laboratory of Embedded System and Service Computing, Ministry of Education, Tongji University, Shanghai 201804, China)
全文: PDF (2389 KB)   HTML ( 4
输出: BibTeX | EndNote (RIS)      
摘要 

目的】发现重要位置, 为用户行为轨迹特征和规律的研究提供良好数据支撑。【方法】提出融合用户表示方法的重要位置预测模型, 提出基于Word2Vec的用户行为轨迹的向量化表示方法; 基于用户向量相似度构建用户关系网络, 提取访问位置上的核心用户; 通过核心用户的访问行为进行重要位置预测。【结果】实验结果表明, 基于本文方法过滤后的核心用户对重要位置进行标注, 比直接标注的正确率提升7%。在地图上显示标注区域, 能够有效发现对应的住宅区和商业区。【局限】本文方法只能够识别居住地和工作地, 更加细粒度的标注有待进一步实现。【结论】本文所提基于用户表示学习的核心用户过滤方法, 对重要位置的标注具有重要意义, 同时为研究用户的轨迹行为特征和规律提供了更为科学的决策支持。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
曾庆田
戴明弟
李超
段华
赵中英
关键词 重要位置轨迹挖掘表示学习支持向量机    
Abstract

[Objective] This paper tries to discover the important locations of users, aiming to provide good data support for user behavior studies. [Methods] We presented a model for predicting important locations based on user representation. First, we proposed a vectorized representation method to predict user behaviors based on Word2Vec. Then, we constructed a user relationship network based on the similarity of user vectors to extract core users. Finally, we predicted the important locations by the behaviors of core users. [Results] The precison of important locations classifiction was 7% higher than those of the exisitng methods. Moreover, the residential and commercial areas were shown in the labeled map. [Limitations] Our method can only identify residential and business areas. [Conclusions] The proposed method could effectively find important locations and provide more supports to study user behaviors.

Key wordsImportant Locations    Trajectory Mining    Representation Learning    Support Vector Machine
收稿日期: 2018-09-28      出版日期: 2019-08-15
基金资助:*本文系教育部人文社会科学青年基金项目“网络大数据环境下的学习者行为挖掘”(项目编号: 16YJCZH041)、教育部人文社会科学青年基金项目“大数据环境下基于学习者行为挖掘的个性化用户建模研究”(项目编号: 17YJCZH262)和教育部人文社会科学规划基金项目“基于大数据的政府处置突发事件网络口碑动态演化跟踪与评估方法研究”(项目编号: 18YJAZH017)的研究成果之一
引用本文:   
曾庆田,戴明弟,李超,段华,赵中英. 轨迹数据融合用户表示方法的重要位置发现*[J]. 数据分析与知识发现, 2019, 3(6): 75-82.
Qingtian Zeng,Mingdi Dai,Chao Li,Hua Duan,Zhongying Zhao. Discovering Important Locations with User Representation and Trace Data. Data Analysis and Knowledge Discovery, 2019, 3(6): 75-82.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2018.1085      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2019/V3/I6/75
[1] 章志刚, 金澈清, 王晓玲, 等. 面向海量低质手机轨迹数据的重要位置发现[J]. 软件学报, 2016, 27(7): 1700-1714.
[1] (Zhang Zhigang, Jin Cheqing, Wang Xiaoling, et al.Discovering Important Locations from Massive and Low-Quality Cell Phone Trajectory Data[J]. Journal of Software, 2016, 27(7): 1700-1714.)
[2] Isaacman S, Becker R, Cáceres R, et al.Identifying Important Places in People’s Lives from Cellular Network Data[C]// Proceedings of the 2011 International Conference on Pervasive Computing. 2011: 133-151.
[3] 陈佳, 胡波, 左小清, 等. 利用手机定位数据的用户特征挖掘[J]. 武汉大学学报: 信息科学版, 2014, 39(6): 734-738, 744.
[3] (Chen Jia, Hu Bo, Zuo Xiaoqing, et al.Personal Profile Mining Based on Mobile Phone Location Data[J]. Geomatics & Information Science of Wuhan University, 2014, 39(6): 734-738, 744.)
[4] Bao J, Zheng Y, Mokbel M F.Location-Based and Preference-Aware Recommendation Using Sparse Geo-Social Networking Data[C]// Proceedings of the 20th International Conference on Advances in Geographic Information Systems. ACM, 2012: 199-208.
[5] 文长江. 基于社交数据用户行为的时空特性分析[D]. 成都: 电子科技大学, 2018.
[5] (Wen Changjiang.Analysis of Spatio-temporal Characteristics of User Behavior Based on Social Data[D]. Chengdu: University of Electronic Science and Technology of China, 2018.)
[6] Ashbrook D, Starner T.Using GPS to Learn Significant Locations and Predict Movement Across Multiple Users[J]. Personal & Ubiquitous Computing, 2003, 7(5): 275-286.
[7] 丰江帆, 熊雨虹. 一种基于个人位置信息的重要地点识别方法[J]. 小型微型计算机系统, 2013, 34(3): 503-507.
[7] (Feng Jiangfan, Xiong Yuhong.An Important Place Identification Algorithm Based on Personal GPS Location[J]. Journal of Chinese Computer Systems, 2013, 34(3): 503-507.)
[8] Cho E, Myers S A, Leskovec J.Friendship and Mobility: User Movement in Location-based Social Networks[C]// Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2011: 1082-1090.
[9] Ma C L, Ma T, Shan H.A New Important-Place Identification Method[C]// Proceedings of the 2015 IEEE International Conference on Computer & Communications. IEEE, 2016: 151-155.
[10] Mikolov T, Sutskever I, Chen K, et al.Distributed Representations of Words and Phrases and Their Compositionality[C]// Proceedings of the 26th International Conference on Neural Information Processing Systems. 2013: 3111-3119.
[11] Kiros R, Zhu Y, Salakhutdinov R, et al.Skip-Thought Vectors[C]// Proceedings of the 28th International Conference on Neural Information Processing Systems. 2015: 3294-3302.
[12] Le Q, Mikolov T.Distributed Representations of Sentences and Documents[C]// Proceedings of the 31st International Conference on Machine Learning. 2014: 1188-1196.
[13] Liu Y, Liu Z, Chua T S, et al.Topical Word Embeddings[C]// Proceedings of the 29th AAAI Conference on Artificial Intelligence. 2015: 2418-2424.
[14] Grover A, Leskovec J.Node2Vec: Scalable Feature Learning for Networks[C]// Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. ACM, 2016: 855-864.
[15] Feng S, Cong G, An B, et al.POI2Vec: Geographical Latent Representation for Predicting Future Visitors[C]// Proceedings of the 31st AAAI Conference on Artificial Intelligence. 2017: 102-108.
[16] Sadilek A, Kautz H, Bigham J P.Finding Your Friends and Following Them to Where You are[C]// Proceedings of the 5th ACM International Conference on Web Search and Data Mining. 2012: 723-732.
[17] Freeman L C.Centrality in Social Networks Conceptual Clarification[J]. Social Networks, 1978, 1(3): 215-239.
[1] 陈文杰,文奕,杨宁. 基于节点向量表示的模糊重叠社区划分算法*[J]. 数据分析与知识发现, 2021, 5(5): 41-50.
[2] 张鑫,文奕,许海云. 一种融合表示学习与主题表征的作者合作预测模型*[J]. 数据分析与知识发现, 2021, 5(3): 88-100.
[3] 张金柱, 于文倩. 基于短语表示学习的主题识别及其表征词抽取方法研究[J]. 数据分析与知识发现, 2021, 5(2): 50-60.
[4] 沈旺, 李世钰, 刘嘉宇, 李贺. 问答社区回答质量评价体系优化方法研究 *[J]. 数据分析与知识发现, 2021, 5(2): 83-93.
[5] 余传明, 张贞港, 孔令格. 面向链接预测的知识图谱表示模型对比研究*[J]. 数据分析与知识发现, 2021, 5(11): 29-44.
[6] 冯昊, 李树青. 基于多种支持向量机的多层级联式分类器研究及其在信用评分中的应用*[J]. 数据分析与知识发现, 2021, 5(10): 28-36.
[7] 余传明, 王曼怡, 林虹君, 朱星宇, 黄婷婷, 安璐. 基于深度学习的词汇表示模型对比研究*[J]. 数据分析与知识发现, 2020, 4(8): 28-40.
[8] 丁晟春,俞沣洋,李真. 网络舆情潜在热点主题识别研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 29-38.
[9] 余传明,钟韵辞,林奥琛,安璐. 基于网络表示学习的作者重名消歧研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 48-59.
[10] 龚丽娟,王昊,张紫玄,朱立平. Word2Vec对海关报关商品文本特征降维效果分析*[J]. 数据分析与知识发现, 2020, 4(2/3): 89-100.
[11] 丁勇,陈夕,蒋翠清,王钊. 一种融合网络表示学习与XGBoost的评分预测模型*[J]. 数据分析与知识发现, 2020, 4(11): 52-62.
[12] 张金柱,主立鹏,刘菁婕. 基于表示学习的无监督跨语言专利推荐研究*[J]. 数据分析与知识发现, 2020, 4(10): 93-103.
[13] 余传明,李浩男,王曼怡,黄婷婷,安璐. 基于深度学习的知识表示研究:网络视角*[J]. 数据分析与知识发现, 2020, 4(1): 63-75.
[14] 秦贺然,刘浏,李斌,王东波. 融入实体特征的典籍自动分类研究 *[J]. 数据分析与知识发现, 2019, 3(9): 68-76.
[15] 王若佳,张璐,王继民. 基于机器学习的在线问诊平台智能分诊研究[J]. 数据分析与知识发现, 2019, 3(9): 88-97.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn