[an error occurred while processing this directive]
现代图书情报技术, 2016, 32(7): 21-31
doi: 10.11925/infotech.1003-3513.2016.07.04
面向政府决策需求的社会舆情信息语义组织研究*
Semantic Analysis of Social Public Opinion Information for Government Decision Making
王曰芬1,2,, 邢梦婷1

摘要:

目的】对海量异构的社会舆情信息进行语义组织, 揭示社会舆情信息之间的多维度关联, 以为后期的挖掘、分析和决策支持提供重要支撑。【方法】从政府决策需求出发, 建立基于本体的社会舆情信息语义组织框架, 根据社会舆情信息本体的特点, 采用七步法的本体构建方法, 以ABC事件本体为参考模型, 明确其中的概念以及概念间的关系, 建立社会舆情信息之间的语义关联。【结果】构建适用于社会舆情信息描述的POIOM模型, 完成本体管理模块的设计。【局限】论文以访谈和统计分析为主要需求获取渠道, 有待更多的政府决策者用户群体对需求加以验证和完善。【结论】POIOM模型对社会舆情信息具有良好的描述能力, 从内容角度深层次地揭示同一案例不同特征项内容之间的关联, 以及多舆情事件之间的逻辑关系和内在联系, 基本验证了基于需求的社会舆情信息语义组织方法的可行性和有效性。

关键词: 政府决策需求 ; 社会舆情信息 ; 本体 ; 语义组织

Abstract:

[Objective] This paper identifies multi-dimensional associations among social public opinion data with the help of semantic organization analysis technology. It also provides important support for data mining and decision-making tasks in the future. [Methods] We first studied the governmental decision-making needs to establish a semantic organization framework for the public opinion information. Second, we analyzed the characteristics of these information and then adopted the “seven-step-method” as well as the ABC event Ontology model to create a new one. Finally, we established the semantics connection among the public opinion information elements. [Results] We proposed a new POIOM model and management module for the public opinion information. [Limitations] This paper used interviews and statistical analysis to assess the information needs. More participants should be included in future studies. [Conclusions] The POIOM model could effectively describe the social public opinion information. It can also reveal the association among different features of the same case, as well as the logical and internal relationship among multiple public opinion events. This study shows that the semantic organization method is feasible and effective to process social public opinion information.

Key words: Government decision demands ; Public opinion ; Ontology ; Semantics organization

1 引 言

随着新技术与新媒体的发展, 社会舆情信息也凸显出海量(Volume)、瞬刻(Velocity)、全息(Variety)、价值低密(Value)、虚实莫辨(Veracity)的大数据特征, 同时伴随着各种舆情事件的风起云涌, 社会舆情的测度和分析日益复杂化, 急需一种有效的社会舆情信息组织方式将多种媒介的各类社会舆情信息融合起来, 实现社会舆情信息的细粒度揭示和多维度关联, 以为后期的挖掘、分析和决策支持提供重要支撑。

近年来, 国内外都十分关注网络环境下信息组织系统的理论构建、技术及实践研究, 诸如概念关系揭示、语义网络构建、知识的语义化表达、叙词表、语义网络、主题图、概念图及本体等信息组织技术及其实践应用研究等[1]。已有一些学者和科研单位也专注于知识组织工具的研究, 并有成功的实践案例。国外的On-To-Knowledge[2]、KAON[3]、统一医学语言系统(UMLS)[4]和国内的中国医学语言系统[5]、中国农业知识本体[6]都是具有代表性的基于语义的网络信息组织的实践应用成果, 国内的代表性研究还有董慧等[7-8]和申欣等[9]的研究成果, 分别为数字图书馆资源组织和语义信息检索做出了一定的贡献, 当前国内存在的问题, 主要是面向具体领域的实际应用项目太少。

基于语义的舆情信息组织方面的技术主要涉及本体、语义网等, 主要的研究成果如: Kinsella等[10]利用语义网技术揭示了社会网络中用户及其生成内容之间的关系; Sleeman等[11]提出了基于FOAF的社会语义网络研究方法, 采用规则和机器学习的相关技术发现FOAF文档, 并提取网络参与者的相关信息; 王兰成等[12]提出一种基于语义相似度的Web文本分类方法; 随后又提出基于情报语义关联集成分析的新方法ISAIA, 并运用在智能网络舆情的热点发现与倾向分析研究中[13]。现有舆情本体方面的研究, 主要是采用内容分析的方法, 借助人工编码或专门的分析软件解读舆情本体中高频词汇所反映的现象, 且这些研究主要是以典型案例为研究对象, 如凤凰古城收费事件[14]、立顿茶包事件[15]等。可以发现基于语义的舆情信息组织的相关研究受到越来越多学者的关注, 但未形成一定的规范和标准; 此外, 以典型案例为依托的研究, 虽然问题说明更明确具体, 但广泛适用性和可扩展性较弱, 还需进一步的深入研究。

本研究借助于本体的思想与技术, 将零散的社会舆情信息基于语义关联视角进行组织, 以经典的ABC事件本体[16]为参考, 建立社会舆情信息本体模型POIOM, 基于信息宽时间、广维度和多事件的多维度视角, 从内容角度深层次地揭示同一案例不同特征项内容之间的关联, 以及多舆情事件之间的逻辑关系和内在联系, 将多种媒介的各类社会舆情信息融合起来, 有利于揭示舆情事件相关信息深层次的含义, 从而对政府应对措施的制定提供更好的决策支持。

2 面向政府决策需求的社会舆情信息语义组织的意义与思路
2.1 面向政府决策需求特征的社会舆情信息特征分析

通过调研了解到: 政府决策过程的不同阶段对信息的需求也存在差异, 其主要可以分为来源、载体等外部特征和包含涉及群体、时间点、地域、敏感话题等内容特征的需求。本研究结合社会舆情信息的基本特征(包括事件类型、参与主体、主题、时间、地点等), 参考《网络舆情蓝皮书》[17]、《中国社会舆情与危机管理报告》[18]、《危如朝露: 2010~2011中国网络舆情报告》[19]等舆情报告, 政府决策需求特征可从数据来源、数据载体形式、事件类型、涉及群体、时间点、地域、敏感话题、热门话题这几个方面进行提炼, 结果具体如表1所示。

表1 政府决策需求

以近几年的热点社会舆情案例为对象, 具体选取2007年至2014年时间段所发生的舆情事件案例, 来源于各大舆情报告以及互联网上报道发布的各大热点社会舆情事件, 如人民网每年度发布的《中国互联网舆情分析报告》等, 并依据上文分析得到的政府决策者在群体、时间点、地域、敏感话题等内容特征方面的需求为依据, 以人工筛选的方式选取符合其需求的社会舆情案例总计213件, 对事件表述内容借助于ICTCLAS[20]进行分词处理, 保留了具有实际意义的名词和动词, 辅以人工干预的措施, 按照词频选取代表性的词作为各类社会舆情案例的主题标签。对于社会舆情案例的分类, 中国传媒大学互联网信息研究院发布的《中国开始进入互联网“新常态”——2014中国网络舆论生态环境研究报告》[21], 将其分为反腐倡廉、司法执法、国防外交、社会民生、时事政治、教育教学、事故灾害、交通运输、企业财经和文化建设10大类, 人民网舆情工作室所建案例库将其按领域分为经济生活、社会民生、公共管理、司法事件、文化科教、群体事件、港台国际、地方形象和企业形象9大类[22], 并综合宋余超等[23]提出的分类, 将用于确定社会舆情信息采集与组织的特征标签分为: 政府管理、社会民生、国防外交、教育教学、事故灾害、企业财经和文化建设7大类。所选取的案例在各类别的分布如下: 政府管理类78个、社会民生类51个、国防外交类20个、教育教学类12个、事故灾害类32个、企业财经类13个和文化建设类7个, 部分案例如表2所示。

表2 用于确定社会舆情信息组织标签的部分案例

社会舆情案例的标签如表3所示, 在具体采集与组织时可以选已经定义好的标签, 也可以自主添加标签, 政府决策者也可根据自己的需要进行修改和完善。

表3 社会舆情案例组织的部分标签

2.2 本体应用于社会舆情信息语义组织与支撑政府决策的意义

本体(Ontology)的出现有效地解决了信息组织中的语义冲突方面的问题, 其概念最早来源于哲学领域, 指研究存在的本质的哲学问题, 目前被广泛接受和使用的定义是1993年Gruber[24]提出的“本体是共享的概念模型的形式化规范说明”。本体描述的是某个特定领域的一种形式化、共享的概念化模型, 它通过对概念的严格定义和概念之间的关系来确定概念的精确含义, 提供对某个领域一种共享的、通用的理解, 帮助人和计算机进行交流, 其支持语义级的交换[25]。目前不同的领域积极开发自己领域的本体, 如生物医药本体、金融本体、法律知识本体、电子政务本体、新闻本体、旅游本体、生物基因本体等, 现已有4种国内外主要的通用本体库WordNet、DBpedia、Cyc、HowNet和两个比较成功的专业领域本体库生物医学和企业领域本体库[26], 然而社会舆情本体的研究鲜有学者涉猎。社会舆情信息组织是一个复杂的过程, 目前此方面的研究大多停留在信息的结构化聚合层面, 未建立社会舆情信息的多维度关联体系。随着大数据时代的来临, 研究者的着眼点已不再局限于揭示信息之间的因果关系, 而是更关注相关关系, 通过应用相关关系, 可以比以前更容易、更快捷、更清楚地分析事物。

在政府公共决策制定与实施过程中, 技术发展带来的有关民情、民意、民智等社会舆情信息与知识的传播日益复杂化, 然而在混乱纷杂的数据中寻找有用的信息和知识也成为政府决策者必须面对的挑战。基于本体的社会舆情信息组织研究对于政府部门及时、高效地获取有序化、集成化和知识化的社会舆情信息, 并采取有效措施干预与引导社会舆情的走向具有实践指导意义, 是社会舆情研究对于政府决策突破困境的有力支持。

单个社会舆情分析案例都是宝贵的知识财富, 通过对社会舆情个案进行不断的存储和积累, 形成不同类型社会舆情事件的历史案例数据库, 通过对不同的社会舆情个案进行关联和纵向分析, 能够提炼出相关社会舆情的规律和特点, 可以增强对同类型舆情事件的认知和理解, 有助于政府在面临新的社会舆情事件时, 进行更加精确的推断和预测, 洞悉其未来的演化趋势。有了社会舆情本体库的支撑, 政府部门在决策时能够减少因数据缺乏而造成的分析偏差, 也可以避免个人意志带来的主观性、片面性和局限性决策, 从而优化和完善公共事务决策流程, 使数据驱动的社会决策与科学治理常态化, 为社会有序运行提供可靠的保证。

2.3 基于本体的社会舆情信息语义组织思路

本研究选取社会舆情为研究对象, 主要对社会舆情的事件所属主题、参与主体、发生地点、发生时间、网民情感倾向等方面的概念及概念间的关系进行描述。借助本体所建立的关联, 将社会舆情信息的多维语义特征内容进行整合, 由于设置的案例知识库的字段更加细粒度, 更容易为新增事件提供相关案例的参考。构建社会舆情本体的目标是要形成对于社会舆情信息组织结构的共同认可、理解并分析舆情领域的知识, 为其他领域本体的构建提供有章可循的方法和技术路线, 同时为进一步建立舆情领域语义Web奠定坚实的基础。

针对从新闻报道、微博、博客、论坛等各种舆情信息源采集的社会舆情信息, 分析主要涉及的概念, 构建社会舆情信息本体的概念模型。社会舆情信息语义组织的框架可从外部特征和内容特征两条主线进行设定, 社会舆情信息的外部特征如标题、时间、来源等, 可通过简单的预处理、消歧、过滤等操作获取, 而内容特征如人物、地点、机构、媒体、事件、主题、情感等, 这些知识单元抽取的步骤主要包括中文分词、词性标注、命名实体识别、去停用词、情感提取。从外部特征和内容特征两个方面展开舆情特征的抽取工作, 并将抽取的知识单元基于构建的社会舆情信息本体揭示其内在的多维度关联, 最后存储到数据库中。

3 社会舆情信息语义组织框架的建立
3.1 社会舆情信息本体构建方法

目前已有几种经典的本体构建方法, 如IDEF、骨架法、TOVE法、METHONTOLOGY法、七步法等[27-28], 但还未形成统一的标准。总的来说, 主要有两种本体构建思路: 一种是利用本体技术直接构建本体模型; 另一种是借鉴或者复用已有的成熟本体进行构建。本研究的本体构建将按照七步法的步骤, 借鉴已有的成熟本体, 在分析现有事件模型的基础上, 构建基于本体的社会舆情信息模型(Public Opinion Information Ontology Model, POIOM)。

虽然尚未有包含各类社会舆情信息的成熟本体, 但事件是社会舆情信息的依托, 已有一些成熟的事件本体模型, 如ABC[16]、PROTON[29]、Event-Model-F[30]等, 相比较而言, ABC本体具有轻量级、通用性好且概念清晰等优势, 能够对一般事件过程进行良好的表达[31], 本研究以ABC本体作为借鉴对象; 此外, 也有一些研究者着眼于具体领域的舆情本体的研究, 如旅游危机事件网络舆情本体[14]、食品安全网络舆情本体[15]等, 这都是本研究构建POIOM的参考。

3.2 社会舆情信息本体POIOM建模

POIOM建模的目标是帮助舆情事件参与主体, 特别是政府机构在舆情发展变化的关键节点及时有效地采取措施、解决问题、平息舆论风波。为了更有效地表达社会舆情案例的发展过程和知识结构, 本文在ABC本体的基础上进行精简和扩展, 增加个人、组织等主体概念和情感、主题等概念, 具体表述如下:

(1) 个人(Person)和组织(Organization)都是概念Agent的扩展子类, 个人和组织作为参与主体共同作用于社会舆情事件, 影响其发展与演变。为了更好地体现参与主体中政府机构的应对效应, 将组织类进一步分为Government、Media、Social三个子类, 分别表示政府、媒体、社会组织这三类实体, 为了避免概念的混淆, 这里的媒体不包含在社会组织中, 社会组织界为除政府、媒体之外的各类企业、单位、群体、团队等。

(2) 用情感倾向(Sentiment)来表达某个事件发生后的情感状态(Situation), 具有时间依赖性。

(3) 用舆情主题(Topic)来表示社会民众在很长时间内普遍关注的中介性社会事项, 利于政府决策者对舆情整体的把握。

在构建POIOM模型时, 将社会舆情领域信息分成了层: 事件层、过程层、行动层、决策层, 如图1所示。其中, 描述性的知识定义在事件层, 指定社会舆情事件相互之间的关系; 过程性知识主要定义在过程层, 描述了社会舆情事件涉及到的一系列情感状态; 行动层主要定义政府回应社会舆情事件所采取的行动知识; 决策层主要定义社会舆情事件应对方案、应急预案等知识, 层之间的关系包括参与、响应、参考等。

图1 POIOM建模

3.3 社会舆情信息的语义关联特征抽取

(1) POIOM中的概念及其界定

本研究定义的社会舆情信息本体POIOM的概念如下所示:

| Thing | Happening | Time | Place | File | Resource | Agent | Topic | Event | Sentiment | Action | Case | Person | Organization | Media | Social | Government | News | Weibo | Government_management | Social_living | Defence_diplomacy | Education | Corporate_finance | Accident_disaster | Cultural_construction |

社会舆情信息本体主要包含1个顶级类Thing、7个一级类、15个二级类和3个三级类, 其中Thing是万物之源, 其余涉及的概念和类具体如下:

①Happening是所有舆情事件的父类, Event、Sentiment、Action和Case是其4个子类, 各子类的具体含义如下: Event表示动态事件的概念, 多个Event共同组成一个具体的案例; Sentiment描述事件发生之前及后续状态, 以事件发展过程中的情感表现, 主要是针对微博发文、微博评论及新闻跟帖的情感倾向分析结果的体现; Action也指发生的事件, 但它有明确主体, 侧重描述参与主体采取的针对Event事件的行动措施; Case是指具有关联关系的事件集, 它能够描述由一个关系事件引起的, 并被相关子事件推动发展的一个完整的案例。

②Agent是 Person、Organization的父类, 用于表示事件中的Who/Whom要素, 即施事者和受事者。其中Organization下又包括Government、Media、Social三个子类, 分别表示政府、媒体、社会组织这三类实体。

③Topic表示舆情主题, 包含Defence_diplomacy、Government_management、Education、Social_living、Corporate_finance、Accident_disaster、Cultural_construction这7个子类, 分别表示国防外交、政府管理、教育教学、社会民生、企业财经、事故灾难、文化建设这几类舆情类型, 具体划分标准参考宋余超等[23]对舆情主题的划分, 每类舆情事件都有对应的舆情主题, 当有新主题时可以自定义添加补充, 如表4所示:

表4 各类舆情主题部分示例

④Time表示事件涉及的时间, 包括案例的开始时间和结束时间、事件发生的时间、行动发生的时间等, 它可以是十分明确、具体的时间指示词, 如“2015年12月12日”, 也可以是类似“昨天、两天前”这样的相对时间表述词。

⑤Place表示事件涉及的地点, 一般由具体的地名展示。

⑥File表示已有的应急预案、国家的政策、标准等, 可供具体的社会舆情事件案例参考。

⑦Resource是事件的载体, 指向具体的资源数据, 包括News、Weibo两个子类, 分别表示新闻资源和微博资源。

(2) POIOM中概念的数据属性

对于POIOM中的每个概念都有数据属性, 其中子类继承父类的全部属性, 因此子类的某些与父类相同的属性不再赘述, 具体如表5所示:

表5 社会舆情信息本体数据属性

3.4 建立社会舆情信息语义关联

事件及其涉及的实体可能会与其他事件(或实体)相关, 社会舆情事件与事件之间也存在此类关联, 这些关系可以是时间上并发、空间上并现, 也可以是时序关系、相似关系、耦合关系、因果关系等, 通过语义关联的获取, 可以得到相关事件的集合。

本研究总结了POIOM本体中涉及的概念间关系, 如表6所示, 其中省略了子类与父类之间的subClassOf关系。

表6 POIOM的语义关系及其示例

4 社会舆情信息语义组织的实现与管理
4.1 本体构建与实现结果

通过上文的研究, 可将社会舆情信息本体POIOM形式化表示为: DomO={C, RH, RP, I, A}, 其中C代表概念; RH指概念之间或实例之间的层次关系; RP指概念之间或实例之间的语义关系, 其将不同的概念和不同的实例联系起来; I指实例, 代表某个类的具体实体; A指公理, 代表永真断言。

采用Protégé [32]实现了社会舆情信息本体的构建, 实现本体类、属性、关系的定义, 并且为每个类创建对应的实例, 填充各个实例的属性值。Protégé 4.3还提供了本体的可视化展示, 加载Graphviz 2.28插件, 选择Protégé 4.3中的OWLViz选项, 将所构建的社会舆情信息本体可视化地展示出来, 具体实现的部分结果如图2图3所示。

图2 社会舆情本体的树图

图3 社会舆情本体的部分实现结果

4.2 本体管理模块设计

社会舆情信息采集及组织系统以为政府决策提供结构化、有序、具有语义关联的社会舆情信息为系统设计出发点, 相当于信息获取与组织的工具, 应包括4大功能:

(1) 信息采集: 利用网络爬虫技术针对新闻媒体、微博等舆情信息源进行采集, 可选择具体社会舆情事件类型领域, 也可以针对某个具体的采集关键词实施采集;

(2) 语义特征抽取: 通过中文分词、命名实体识别、去停用词、情感倾向性分析等代码的调用, 抽取出人名、组织机构名、媒体名、事件、行动等信息, 并进行存储;

(3) 本体管理: 可实现对所建本体的管理, 不需重新利用本体编辑软件重新写回修改, 可不断根据政府决策者的需求对所建的社会舆情信息本体POIOM进行修改和完善;

(4) 信息检索: 提供社会舆情信息检索功能, 可对具体实例信息进行检索, 能够展示搜索结果及其关联信息, 也可查看到该实例的具体信息。

系统的核心建立在POIOM本体的基础上, 对本体的管理是系统的主要功能模块。本体管理模块主要包括两部分的内容: 类管理与属性管理, 具体界面如图4图5所示, 可进行添加属性值、修改属性值、删除属性值、添加关系、修改关系和删除关系等本体管理操作。

图4 “南航急救门事件”案例类管理

图5 “南航急救门事件”案例实例管理

5 结 语

社会舆情信息是最有价值的社会信息资源, 对其进行语义组织有助于进行深层次的社会舆情信息资源开发, 为社会提供更好的信息和知识服务。本研究以面向政府决策需求为出发点, 基于语义关联的理论构建了社会舆情信息本体模型, 并对其实现步骤等进行探讨。然而, 社会舆情信息语义组织工作是一项复杂的系统工程, 今后需要在进一步梳理与细致界定政府决策需求的基础上, 对社会舆情本体进化以及数据关联关系利用等方面继续开展深入研究。

作者贡献声明:

王曰芬: 提出研究思路, 拟定研究方案, 论文修改定稿;

邢梦婷: 采集数据, 构建模型, 撰写论文初稿。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据由作者自存储, E-mail: 274686493@qq.com。

[1] 邢梦婷, 王曰芬. 访谈提纲.doc.关于“政府舆情信息需求情况”的访谈提纲.

[2] 邢梦婷, 王曰芬. 案例列表.doc. 2007年-2014年政府关注的社会舆情案例.

[3] 邢梦婷, 王曰芬. 语义关联特征抽取方法.doc. 语义关联特征抽取方法.

[4] 邢梦婷, 王曰芬. 南航急救门事件发展过程.doc. 南航急救门事件发展过程.

参考文献

[1] 中国图书馆学会. 2011-2012年图书馆学学科发展报告[M]. 北京: 中国科学技术出版社, 2012: 1-5.
[本文引用:1]
(Library Society of China. Report on Advances in Library Science [M]. Beijing: Science and Technology China Press, 2012: 1-5.)
[2] Sure Y, Akkermans H, Broekstra J, et al.On-To-Knowledge: Semantic Web Enabled Knowledge Management [C]. In: Proceedings of Web Intelligence.Springer-Verlag, 2003: 277-300.
[本文引用:1]
[3] Staab S, Maedche A, Handschuh S.An Annotation Framework for the Semantic Web [C]. In: Proceedings of the 1st Workshop on Multimedia Annotation, Tokyo, Japan. 2001: 30-31.
[本文引用:1]
[4] 方平. 试论一体化医学语言系统(UMLS)超级叙词表的特点[J]. 图书情报工作, 1998, 42(10): 26-29, 41.
DOI:10.3969/j.issn.0252-3116.1998.10.010      URL     [本文引用:1]
(Fang Ping.The Characteristics of the UMLS Metathesaurus[J]. Library and Information Service, 1998, 42(10): 26-29, 41.)
[5] 李萍萍, 李书宾. 基于语义Web的知识组织方法与应用[J]. 中华医学图书情报杂志, 2009, 18(4): 8-11.
介绍了传统知识组织到语义Web环境下知识组织的转换,阐述了语义Web知识组织的方法、知识组织工具和知识组织体系,探讨了基于语义Web的国内知识组织发展现状和前景。
DOI:10.3969/j.issn.1671-3982.2009.04.003      URL     [本文引用:1]
(Li Pingping, Li Shubin.Semantic Web-based Knowledge Organization Methods and Their Application[J]. Chinese Journal of Medical Library and Information Science, 2009, 18(4): 8-11.)
[6] 苏晓路, 钱平, 颜蕴, . 农业科技信息智能检索系统中的知识组织[J]. 现代图书情报技术, 2005(12): 34-38.
<p>介绍了采用文献计量方法对《中国农业科技文献数据库》中的分类和主题标引进行分析,揭示主题词与类目之间的关系,用于构建农业初级本体。同时,以该初级本体作为检索知识库并利用纯XML数据库技术,建立了农业科技智能检索系统。</p>
Magsci     URL     [本文引用:1]
(Su Xiaolu, Qian Ping, Yan Yun, et al.The Knowledge Organization in the Agricultural Intelligent Retrieval System[J]. New Technology of Library and Information Service, 2005(12): 34-38.)
[7] 董慧, 杜文华. 基于本体和多代理的数字图书馆信息检索模型[J]. 中国图书馆学报, 2004, 30(2): 63-65.
在分析图书馆传统的信息检索机制的局限性的基础上,提出了基于本体和多代理的数字图书馆信息检索模型,并介绍了该模型各部分的作用和功能。
DOI:10.3969/j.issn.1001-8867.2004.02.016      URL     [本文引用:1]
(Dong Hui, Du Wenhua.A Modal of Digital Library Information Retrieval Based on Ontology and Multiple Agents[J]. Journal of Library Science in China, 2004, 30(2): 63-65.)
[8] 董慧, 王菲, 姜赢, . 基于数字图书馆的本体应用环境研究[J]. 中国图书馆学报, 2009, 35(5): 52-58.
语义Web框架虽已提出多年,但大部分应用都只是系统模型,很少 投入实际的商业运作.为此,笔者从实用的角度提出本体应用环境的概念与框架.本体应用环境以本体技术为核心,以知识管理为目标,较好地解决了各领域知识管 理中的各种问题,如知识组织、知识检索和知识推理等.目前,本体应用环境已经成功应用于数字图书馆、数字档案馆等领域,为语义Web的发展提供了一种可行 的思路.
URL     [本文引用:1]
(Dong Hui, Wang Fei, Jiang Ying, et al.A Study of the Ontology Application Environment Based on the Digital Library[J]. Journal of Library Science in China, 2009, 35(5): 52-58.)
[9] 申欣, 田爱奎, 朱瑞瑾. 基于语义网的信息检索系统的研究与实现[J]. 山东理工大学学报: 自然科学版, 2011, 25(1): 92-97.
以本体为依据,通过构建本体和推理规则,运用Jena实现了语义推理与检索功能,得出潜在的语义查询结果.
DOI:10.3969/j.issn.1672-6197.2011.01.023      URL     [本文引用:1]
(Shen Xin, Tian Aikui, Zhu Ruijin.Research and Implementation of Information Retrieval System Based on Semantic Web[J]. Journal of Shandong University of Technology: Natural Science Edition, 2011, 25(1): 92-97.)
[10] Kinsella S, Breslin J G, Passant A, et al.Applications of Semantic Web Methodologies and Techniques to Social Networks and Social Websites [A]. // Reasoning Web[M]. Springer Berlin Heidelberg, 2008: 171-199.
[本文引用:1]
[11] Sleeman J, Finin T.Computing FOAF Co-reference Relations with Rules and Machine Learning [C]. In: Proceedings of the 3rd International Workshop on Social Data on Web, Shanghai, China.2010: 595-608.
[本文引用:1]
[12] 王兰成, 徐震. 主题舆情分析中的语义Web文本分类研究[J]. 情报学报, 2012, 31(4): 340-344.
文本分类是网络主题舆情分析中的关键技术,传统Web文本分类将文本关键词的相似度作为分类依据,丢失许多重要的语义信息,导致分类结果不够准确且计算量大.本文提出一种基于语义相似度的Web文本分类方法,利用特定的领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量,给出Web文本相似度的计算公式并实现基于语义相似度的KNN算法.结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少计算量并提高了分类精确度.
DOI:10.3772/j.issn.1000-0135.2012.04.001      URL     [本文引用:1]
(Wang Lancheng, Xu Zhen.Research on Semantic Web Text Categorization in Subject Public Opinion Analysis[J]. Journal of the China Society for Scientific and Technical Information, 2012, 31(4): 340-344.)
[13] 王兰成. 网络舆情情报语义集成分析法的理论与实践探析[J]. 情报理论与实践, 2013, 36(2): 48-50.
分析基于情报研究方法的网络舆情发现与分析的研究现状,在综合情 报学有着广泛研究的链接分析法、聚类分析法和内容分析法的基础上,提出基于情报语义关联集成分析ISAIA新方法,在知识技术支持下集成链接分析法、聚类 分析法和内容分析法,面向网络舆情处理拓展和深入情报学方法的研究.最后将ISAIA方法运用在智能网络舆情的热点发现与倾向分析研究中,构建和优化网络 舆情系统.
URL     [本文引用:1]
(Wang Lancheng.Analysis on Theory and Practice of Intelligence Semantic Association Integrates Analysis[J]. Information Studies: Theory & Application, 2013, 36(2): 48-50.)
[14] 付业勤, 郑向敏, 雷春, . 旅游危机事件网络舆情的本体分析[J]. 重庆理工大学学报: 社会科学, 2015, 29(2): 47-53.
舆情本体是危机事件相关信息的网络文本内容,决定了网络舆情的热 度和危害性.以湖南凤凰古城收费事件为例,甄选网络舆情本体的高频词汇,从词汇类目和演化阶段两个维度,对旅游危机事件网络舆情本体进行研究.研究发现: 网络舆情受媒体议程设置影响,网民对事件的探讨基于媒体的报道内容,在了解事实的基础上进行个性化和深入的内容生产;“用脚投票”“抵制”是网民表达不去 旅游的意愿和负面情绪的最主要方式;网络舆情的发散追因现象明显,将旅游事件发展成社会事件,将事件的负面影响扩大到整个旅游地,将个别案例扩展到国家和 社会的层面;网络舆情的群体极化和网络暴力现象明显,极端表现是层出不穷的语言暴力、人肉搜索、网络恶搞或造谣诽谤;应对网络舆情的冲击和影响,需要从提 升网民和政府的媒介素养、加强媒体的职业道德和自律、重视网络舆情的反馈作用以及建构网络舆情监测与预警系统等方面着手.
DOI:10.3969/j.issn.1674-8425(s).2015.02.007      URL     [本文引用:2]
(Fu Yeqin, Zheng Xiangmin, Lei Chun, et al.Analysis on Network Opinion Ontology of Tourism Crisis[J]. Journal of Chongqing University of Technology: Social Science, 2015, 29(2): 47-53.)
[15] 李宏伟, 林萍, 洪小娟. 食品安全网络舆情本体学习研究[J]. 南京邮电大学学报: 社会科学版, 2013, 15(4): 72-77.
食品安全网络舆情本体在一定程度上可以提升舆情信息的抽取与检索效率,但海量的文本信息使得该领域本体的构建需要借助本体学习技术。本体学习的主要任务是概念获取以及概念间关系获取。研究中概念的获取采用了基于领域相关度和领域均匀度综合评价方法,概念间关系的获取采用了基于关联规则的概念间关系分析方法。考虑到中文词语的构成,在关联规则分析的基础上,进一步采用了基于词距判定的概念间关系分析方法,这可在一定程度上识别新概念及概念间关系。最后采集了229篇"立顿茶包"事件相关文档,采用上述方法构建了领域本体。
DOI:10.3969/j.issn.1673-5420.2013.04.011      URL     [本文引用:2]
(Li Hongwei, Lin Ping, Hong Xiaojuan.Research on Ontology Learning of Internet Public Sentiment Concerning Food Safety[J]. Journal of Nanjing University of Posts and Telecommunications: Social Science, 2013, 15(4): 72-77.)
[16] Lagoze C, Hunter J.The ABC Ontology and Model[J]. Journal of Digital Information, 2002, 2(2): 1-18.
[本文引用:2]
[17] 方兴东, 熊剑. 网络舆情蓝皮书[M]. 北京: 电子工业出版社, 2015: 34-60.
[本文引用:1]
(Fang Xingdong, Xiong Jian.The Blue Book of Net-mediated Public Sentiment [M]. Beijing: Publishing House of Electronics Industry, 2015: 34-60.)
[18] 谢耘耕. 中国社会舆情与危机管理报告[M]. 北京: 社会科学文献出版社, 2014: 1-10.
[本文引用:1]
(Xie Yungeng.The Report on Chinese Social Opinion and Crisis Management [M]. Beijing: Social Sciences Literature Press, 2014: 1-10.)
[19] 杜骏飞, 邹鸿强. 危如朝露:2010~2011中国网络舆情报告[M]. 杭州: 浙江大学出版社, 2011: 7-10.
[本文引用:1]
(Du Junfei, Zou Hongqiang.Report on Public Opinion of China Internet 2010-2011 [M]. Hangzhou: Zhejiang University Press, 2011: 7-10.)
[20] ICTCLAS汉语分词系统[EB/OL]. [2015-11-25]. .
URL     [本文引用:1]
(ICTCLAS, Institute of Computing Technology, Chinese Lexical Analysis System [EB/OL]. [2015-11-25].
URL    
[21] 张树庭, 李未柠, 孔清溪. 中国开始进入互联网“新常态”——2014中国网络舆论生态环境研究报告[J]. 现代传播, 2015, 37(3): 1-9.
2014年中国互联网发生了积极而深刻的变化。这一年,网络空间更加清朗,网络正能量更加巨大,中国开始进入互联网"新常态"。本文基于中国传媒大学互联网信息研究院数据库统计数据,对2014年1月1日至12月31日期间的网络舆情热点进行监测与分析,试图从舆论平台、舆论主体和舆论话题等多个侧面,对2014中国网络舆论生态环境进行全方位的解析,进而对未来的中国网络舆论场发展态势做出客观研判。
URL     [本文引用:1]
(Zhang Shuting, Li Weining, Kong Qingxi.China Began to Enter the Internet New Normal—— The 2014 Report on the Ecological Environment of the Network Public Opinion in China[J]. Modern Communication, 2015, 37(3): 1-9.)
[22] 人民网舆情工作室案例库[EB/OL]. [2015-12-17]. .
URL     [本文引用:1]
(Cases in Public Opinion Monitoring Office of People.cn [EB/OL]. [2015-12-17].
URL    
[23] 宋余超, 陈福集. 面向主题分类的网络舆情博弈形成机制研究——基于三主体研究[J]. 情报杂志, 2015, 34(8): 122-126, 121.
对存在三类利益主体的网络舆情形成机制进行研究。在对舆情主题类别划分的基础之上,进行舆情主题与不同的参与主体组合的匹配,然后构建对应的三方博弈模型,运用演化博弈的思想求解不同情境下各个参与主体的演化稳定策略。进一步,通过分析演化均衡解的结构,得出相应的舆情应对指导方案。
DOI:10.3969/j.issn.1002-1965.2015.08.023      URL     [本文引用:2]
(Song Yuchao, Chen Fuji.The Formation Mechanism of Online Public Opinion Based on Topic Classification and Game Theory: A Study Based on the Three Subjects Involved[J]. Journal of Intelligence, 2015, 34(8): 122-126, 121.)
[24] Gruber T R.A Translation Approach to Portable Ontologies Specificationsspecifications specifications specifications[J]. Knowledge Acquisition, 1993, 5(2): 199-220.
ABSTRACT To support the sharing and reuse of formally represented knowledge among AI systems, it is useful to define the common vocabulary in which shared knowledge is represented. A specification of a representational vocabulary for a shared domain of discourse&mdash;definitions of classes, relations, functions, and other objects&mdash;is called an ontology. This paper describes a mechanism for defining ontologies that are portable over representation systems. Definitions written in a standard format for predicate calculus are translated by a system called Ontolingua into specialized representations, including frame-based systems as well as relational languages. This allows researchers to share and reuse ontologies, while retaining the computational benefits of specialized implementations.We discuss how the translation approach to portability addresses several technical problems. One problem is how to accommodate the stylistic and organizational differences among representations while preserving declarative content. Another is how to translate from a very expressive language into restricted languages, remaining system-independent while preserving the computational efficiency of implemented systems. We describe how these problems are addressed by basing Ontolingua itself on an ontology of domain-independent, representational idioms.
DOI:10.1006/knac.1993.1008      URL     [本文引用:1]
[25] 白同强, 刘磊. 语义Web的研究与展望[J]. 吉林大学学报: 信息科学版, 2004, 22(2): 154-159.
对一系列Web新技术的总称——语义Web进行了综述,在分析语义Web的研究背景、研究价值及现有语义Web模型的基础上,对W3C组织的语义Web研究现状和语义Web研究领域当前的研究状况进行了分析;对其今后的研究工作进行了展望;总结了未来语义Web基础研究和应用研究的方向:语义Web的基础研究主要包括本体的发展、语义Web语言的形式语义和确信(Trust)与证据(Proof)模型的开发;应用研究主要集中在Web-services、基于代理的分布式计算、基于语义的网页搜索引擎和基于语义的数字图书馆几个方面。
DOI:10.3969/j.issn.1671-5896.2004.02.014      URL     [本文引用:1]
(Bai Tongqiang, Liu Lei.Research and Prospect in Semantic Web[J]. Journal of Jilin University: Information Science Edition, 2004, 22(2): 154-159.)
[26] 白如江, 于晓繁, 王效岳. 国内外主要本体库比较分析研究[J]. 现代图书情报技术, 2011(1): 3-13.
<p>介绍4种国内外主要的通用本体库WordNet、DBpedia、Cyc、HowNet和两个比较成功的专业领域本体库生物医学和企业领域本体库,从描述语言、存储方式、查询语言、构建平台和应用领域5个方面分别对4种通用本体库和领域本体库进行比较分析,为国内外学者在本体库及其应用研究方面提供帮助。</p>
Magsci     URL     [本文引用:1]
(Bai Rujiang, Yu Xiaofan, Wang Xiaoyue.The Comparative Analysis of Major Domestic and Foreign Ontology Library[J]. New Technology of Library and Information Service, 2011(1): 3-13.)
[27] 杜文华. 本体构建方法比较研究[J]. 情报杂志, 2005, 24(10): 24-25.
介绍了七种主要的本体构建方法,并将七种方法与IEEE标准相比较,总结出本体构建的原则。
DOI:10.3969/j.issn.1002-1965.2005.10.008      URL     [本文引用:1]
(Du Wenhua.The Comparative Analysis of Approaches in Constructing Ontology[J]. Journal of Information, 2005, 24(10): 24-25.)
[28] 刘宇松. 本体构建方法和开发工具研究[J]. 现代情报, 2009, 29(9): 17-24.
语义网的提出与发展促使了本体机制作为一种能够描述语义的新型知识组织方式受到了前所未有的重视,本体的构建及其应用成为知识工程领域的研究热点.本体构建是本体应用的基础,需要各领域的专家遵循一定的本体构建原则.在合理方法论的指导下,采用恰当的关键技术或使用便捷的本体开发工具加以实现.
URL     [本文引用:1]
(Liu Yusong.Research of Approaches and Development Tools in Constructing Ontology[J]. Journal of Modern Information, 2009, 29(9): 17-24.)
[29] Kiryakov A, Popov B, Ognyanoff D, et al.Semantic Annotation, Indexing, and Retrieval[M]. The Semantic Web - ISWC 2003. Springer Berlin Heidelberg, 2003: 484-499.
[本文引用:1]
[30] Scherp A, Franz T, Saathoff C, et al.F--A Model of Events Based on the Foundational Ontology dolce+DnS Ultralight [C]. In: Proceedings of the 5th International Conference on Knowledge Capture. ACM, 2009: 137-144.
[本文引用:1]
[31] 王文俊, 杨鹏, 董存祥. 应急案例本体模型的研究及应用[J]. 计算机应用, 2009, 29(5): 1437-1440, 1445.
应急案例是应急指挥决策的重要依据。以网页形式存储的应急案例数据量呈指数趋势上升,但是网页开放性特点决定数据异构性强,导致应急案例信息理解和利用困难。针对上述问题,提出了应急案例本体模型(ECOM),构建应急案例知识模型,模型包括上层本体和应用层本体。以ABC本体为基础扩展形成eABC作为上层本体,应用层本体则从应急主体、客体、发展过程、救援过程等方面建立应急案例概念、关系、函数、公理和实例的五元组,其中考虑应急案例网页位置信息以评估信息可信度。最后,以汶川地震描述为实例验证了ECOM模型。
Magsci     [本文引用:1]
(Wang Wenjun, Yang Peng, Dong Cunxiang.Study and Application of Emergency Case Ontology Model[J]. Journal of Computer Applications, 2009, 29(5): 1437-1440, 1445.)
[32] Protégé [EB/OL]. [2013-11-30]. .
URL     [本文引用:1]
资源
PDF下载数    
RichHTML 浏览数    
摘要点击数    

分享
导出

相关文章:
关键词(key words)
政府决策需求
社会舆情信息
本体
语义组织

Government decision deman...
Public opinion
Ontology
Semantics organization

作者
王曰芬
邢梦婷

Wang Yuefen
Xing Mengting
[an error occurred while processing this directive]