Data Analysis and Knowledge Discovery  2020, Vol. 4 Issue (12): 136-147    DOI: 10.11925/infotech.2096-3467.2020.0596
Identifying Traffic Events from Weibo with Knowledge Graph and Target Detection
Sun Xinrui1,Meng Yu2,Wang Wenle1()
1School of Software, Jiangxi Normal University, Nanchang 330022, China
2School of Mathematics Science, Qufu Normal University, Qufu 273100, China
[Objective] This paper identifies traffic events from Weibo (microblog) posts with the help of knowledge graph and target detection techniques, aiming to address traffic management issues. [Methods] First, we constructed traffic knowledge graph and event evolution graph based on open data. Then, we identified traffic events from microblog texts. Third, we retrieved microblog images with target detection to further improve the recognition accuracy of three types of events. [Results] We examined our method with microblog data on Qingdao’s traffics in 2018. The precision of traffic event detection based on texts and images were 94.55% and 95.53%. [Limitations] More research is needed to reduce the manual construction of traffic knowledge graph, and improve the target detection algorithm. [Conclusions] The proposed method could help urban traffic management departments detect road incidents or traffic problems, and then facilitate their decision-makings.

Key wordsIntelligent Traffic System (ITS)      Traffic Knowledge Graph      Traffic Event Identification      Traffic Target Detection     
Received: 23 June 2020      Published: 25 December 2020
ZTFLH:  G350  
Sun Xinrui,Meng Yu,Wang Wenle. Identifying Traffic Events from Weibo with Knowledge Graph and Target Detection. Data Analysis and Knowledge Discovery, 2020, 4(12): 136-147.

Technical Roadmap
事件类别 基础要素 补充信息 计算指标
交通拥堵 位置、时间、拥堵特征表述(词、短句) 程度、原因、建议 完备度、拥堵指数、可信度
交通事故 位置、时间、事故特征表述 涉事车辆/人物、程度、后果 完备度、严重指数、可信度
交通反馈 位置、时间、反馈对象、对象状态/行为 后果 完备度、紧急指数、可信度
Traffic Event Extraction Template
Schematic Diagram of Basic Construction Process of Traffic Knowledge Graph
顶层节点 包含实体 实体属性 数据来源
司机、行人、交警、路段养护人员、商贩等 性别、年龄段等 自定义
按用途分类、按行驶道路条件分类 通用属性,包括大小、颜色、别称等,进一步细化到车的品牌、型号等 《中国汽车分类标准(GB9417-89)》、
城市市区道路 路名、类型、交叉路、方向、车道数、所属区域 城市公开数据、交通管理部门提供数据
信息点(Point of Information, POI) 名称、所属道路、所属区域 中国POI数据网采集
环境 天气 名称、类别 天气种类自定义
道路交通安全设施 名称、类别、作用、正常状态、异常状态 交通百科
Four Elements of Traffic Knowledge Graph
Basic Event Chain in Traffic Event Graph
Event Extraction Process of Traffic Microblog
事件类型 表述形式 示例 标注
交通拥堵 直接表述-关键词 堵车、堵了、拥堵 EV-CON-D-S
直接表述-状态短语 堵成、堵的、堵到 EV-CON-D-S
间接表述-指代词 交通瘫痪、交通压力 EV-CON-I-S
交通事故 直接表述-关键词(名) 交通事故、车祸 EV-ACC-KWN
直接表述-关键词(动) 追尾、碰撞、刮蹭、撞 EV-ACC-KWV
间接表述-示意词 吻了、亲密接触 EV-ACC-I-NS
交通反馈 直接表述-基础事件词 乱停车、违停、闯红灯 EV-FD-KW-BH
Traffic Incident Triggers’ Identification and Marking
地点要素 表述形式 示例词 标注
路名 全称 山东路、香港路 LO-RD
简称 海尔桥、杭鞍高架、杭鞍 LO-RD-S
别称 东西快速路->杭鞍高架路 LO-RD-B
定位信息 附属定位词 交叉口、入口、路口 LO-CW
车道 直行车道、左转车道 LO-RD-LA
POI名称 鞍山路小学、市图书馆 LO-POI
距离描述词 一公里、100米 LO-DIS
方向 双向、北向南、东往西 LO-RD-DI
Location Information’s Identification and Marking
表述形式 示例词 标注
时间点 9点10分、9:30、八点半 TIME-CP
时间段-一天不同时段 上午、早、晚上 PERIOD-DAY
时间段-日期 7月5日、今天、昨日 PERIOD-DATE
时间点-指代表述 这个点、此时、这个时候 TIME-RW
时间段-持续时间 半个小时、40多分钟、100秒 PERIOD-HMS
时间段-模糊表述 早高峰、高峰时段 TIME-PE-NC
Time Information’s Identification and Marking
抽取要素 表述形式 示例词 标注
车信息 车型 公交车、轿车、SUV VE-TP
大小 大车、小车 VE-SIZE
品牌、型号 奔驰车、斯柯达、奥迪A4 VE-MB
颜色 红车、白车 VE-CO
车牌 鲁B12345 VE-PL
数量词 量词+车 两车、一辆 VE-NUM
Vehicle Elements’ Identification and Marking
环境元素 表述形式 示例词 标注与抽取方法
天气 形容词+天气 好天气、下雨天 EN-WE-DW
具体天气词 大雨、大雾、大雪、雾霾 EN-WE-TP
动词+天气词 下雨、下雪 EN-WE
交通安全设施 信号灯 信号灯、红绿灯、红灯 EN-TL
交通标志 禁停标志、直行标志 EN-TS
交通标线 斑马线、黄色网格线 EN-TLM
道路护栏 护栏、栏杆、隔离 EN-GB
路面状态 直接表述 路面破损 EN-RDSF
间接表达-状态 坑坑洼洼、积水深 EN-RDSF-DW
其他 直接表述 电线杆、天桥、花坛 EN-OTE
Environment Elements’ Identification and Marking
人物元素 表述形式 示例词 标注
司机 车+司机 公交车司机、宝马司机 PE-DR-VE
描述信息+司机 男司机、女司机、无德司机 PE-DR-DE
行人 群指-无明确个人 行人、路人 PE-CP
个指-有描述信息 老人、小孩、学生 PE-CH
交警 原称 交警、警察 PE-PO
别称 交警蜀黍、焦警 PE-PO-B
其他 道路服务人员 施工人员、清洁工 PE-RS
商贩 商贩、摊贩 PE-SE
行乞人员 乞讨者 PE-BE
Character Elements’ Identification and Marking
Target Detection Data
关键词组合方式 具体内容
城市名+路名 青岛+1180条青岛市区道路名称
城市名+交通种子词 青岛+8个基础道路交通事件特征词(堵、事故、车祸、追尾、撞、信号灯、红绿灯、乱停车)
@+城市交通官方账号 20个青岛交通官方微博账号(青岛交通广播FM897、青岛交警、青岛邱磊、市北交警、李沧交警、青岛发布、青岛公安、市南交警、青岛随手拍、半岛都市报等)
Key Words Combination of Data Collection
事件类别 完备事件数 独立事件数
交通拥堵 2 991 1 826
交通事故 1 046 680
交通反馈 2 463 1 450
总计 6 500 3 956
Traffic Event Results Based on Traffic Knowledge Graph Extraction
事件类别 准确率/% 召回率/% F1值/%
交通拥堵 96.46 94.58 95.51
交通事故 94.31 93.27 93.79
交通反馈 92.89 90.51 91.68
总计 94.55 92.79 93.66
Test Results of Traffic Incident Detection
检测目标 准确率/% 召回率/% F1值/%
轿车(Car) 92.61 88.67 90.60
公交车(Bus) 93.42 85.94 89.52
卡车(Truck) 92.17 87.69 89.87
货车(Van) 90.33 89.91 90.12
摩托车(Motorbike) 95.29 90.64 92.91
行人(Person) 96.47 87.58 91.81
信号灯(Traffic Light) 91.58 90.13 90.85
Test Results of Traffic Target Element Detection
Image Detection Examples
事件类型 准确率/% 召回率/% F1值/%
交通拥堵 96.64 95.19 95.91
交通事故 94.88 92.83 93.84
交通反馈 95.07 91.33 93.16
总计 95.53 93.12 94.30
Experimental Result
事件类型 应识别数 正确
交通拥堵 50 47 100.00 94.00 96.91
Experimental Results of Incomplete Traffic Congestion Event Picture and Event Detection
