留学人物数据库GIS应用的设计与实现
黄勇
暨南大学珠海校区图书馆 珠海 519070
摘要

为满足用户对留学人物地域信息进行查询、展示与分析的需求,提出基于Google Maps API实现GIS应用的解决方案和技术思路。利用Google Maps API、JavaScript、PHP、MySQL及相关技术将留学人物数据库与Google地图进行整合,构建留学名人足迹、留学人物分布等GIS应用,以增强数据库可用性并提升用户体验。

关键词: GIS; Google; Maps; API; 人物数据库; 中国留学生; 高校图书馆
Design and Implementation of GIS Applications for Overseas Chinese Students Database
Huang Yong
Library of Zhuhai Campus, Jinan University, Zhuhai 519070, China
Abstract

In order to meet the user needs of geographic information retrieval, revelation and analysis about overseas Chinese students, this paper proposes a solution of GIS applications. Using Google Maps API, JavaScript, PHP, MySQL and inserting the Google Maps into the overseas Chinese students database, some GIS functions are implemented such as footprints maps and distribution maps, which can enhance the availability of the database and improve the user experience.

Keyword: GIS; Google; Maps; API; Figures database; Overseas; Chinese students; Academic library
1 引 言

GIS是20世纪60年代在北美洲、欧洲、澳大利亚等地出现、兴起并快速发展的一种地理空间技术与交叉学科,主要表述形式有地理信息系统(Geographic Information System)、地理信息科学(Geographic Information Science),其主要目的是帮助人们进行地理空间数据(Geospatial Data)的获取、存储、分析与管理。国内外尤其是美国高校图书馆普遍开展了内容丰富的GIS服务[ 1],并且开发了多种功能各异的GIS应用系统[ 2],很好地发挥了高校图书馆在用户利用GIS进行学习和科研过程中的支持和促进作用。

人物数据库是图书馆数字资源建设的重要内容,我国许多高校图书馆以人物为立足点开展了人物数据库建设。人物具有出生地点、受教育地点、工作地点、活动发生地点与影响范围、籍贯、国籍、民族等地域属性[ 3],如何有效揭示人物的地域特征是高校图书馆在建设人物数据库中应该思考的问题。本文以留学人物数据库[ 4]为例,利用Google Maps API及相关技术设计并实现名人足迹、人物分布等GIS应用,增强数据库可用性,提升用户体验,期望为我国高校图书馆人物数据库建设提供一些有益参考。

2 需求分析与设计思路
2.1 应用现状

为了解GIS在我国高校图书馆人物数据库中的应

用现状,笔者对教育部公布的39个“985工程”高校图书馆进行了网站调查,其中支持公开访问的人物数据库如表1所示:

表1 部分高校图书馆人物数据库的基本情况

调查发现,我国“985工程”高校图书馆中一些人物数据库提供了籍贯、民族、国籍等地域信息的检索字段,但暂无人物数据库利用GIS技术揭示其收录人物的地域特征。文献调查也很难找到我国高校图书馆深入研究人物数据库GIS应用的相关资料。

为获取人物数据库GIS应用的典型案例,笔者以《英文参考源的检索与利用》一书中列举的8个人物数据库[ 5]为样本进行了网站调查。调查发现,由美国郝若贝教授创建的中国历代人物传记资料库(China Biographical DataBase,CBDB)是人物数据库GIS应用的典型案例。相关资料表明:利用CBDB与中国历史地理信息系统(CHGIS)两者输出数据,对中国宋代进士群体进行地理空间分析,能快速发现多种空间分布模式与社会关系网络,从而支持基于群体传记法(Prosopography)的历史研究[ 6]。借鉴CBDB的建设经验,我国高校图书馆人物数据库也可开发GIS应用,为用户开展人物研究提供一种可视化分析工具,从而增强人物数据库辅助学术研究的功能效用。

2.2 需求分析

研究人员是留学人物数据库的主要目标用户群体,研究人员在留学研究中存在对人物地域信息进行查询、展示与分析的需求。由于历史的演变,一些地方的地名及行政区划发生了改变(如广东香山),在查考近代留学生的籍贯、出生地点、受教育地点等过程中需要利用GIS发现古地名及其相关的地理特征;留学生典型代表(如容闳、辜鸿铭、严复、王国维)是留学研究的重要对象,为了发现人物的时空关系,需要利用GIS展示留学人物的历史、地理信息;留学生群体分析是留学研究的重要内容,为了在大量的传记资料与文献资料中发现一定的人物分布模式,还需要利用GIS进行地理空间分析。从用户需求的角度出发,留学人物数据库中应该著录人物的地域信息,并利用GIS技术开展地理空间数据服务。基于此,留学人物数据库GIS应用的设计要点为:利用GIS技术对留学人物的地域信息进行地理位置定位;利用GIS技术直观展示留学人物个体的历史足迹;利用GIS技术对留学人物群体的地域信息进行聚类分析。

2.3 方案设计

用户需求促使笔者采用一定的方案在留学人物数据库中设计GIS应用,存在两种方案:

(1)引进GIS软件。引进ArcGIS、SuperMap等国内外GIS软件,用户利用GIS软件导入留学人物数据库提供的数据并进行显示与分析。

(2)基于WebGIS API自行开发GIS应用。用户访问查询留学人物网站,网页返回WebGIS界面及分析结果。

两者比较:前者功能齐全,但初期投入大、且对用户GIS技能要求高;后者实现复杂(特别是分析功能),但开发成本低、且简单直观的互动方式更易被用户所接受。笔者决定采用方案(2),但方案(2)又存在Google Maps API、Yahoo Maps API、Baidu Maps API等多种选择;由于留学人物在出国留学与归国创业等过程中产生了大量有关国内及国外的地域信息,在综合考虑地图功能及地理空间数据分析功能后,笔者采用基于Google Maps API(V3)开发GIS应用的方案。

2.4 技术思路

根据方案设计,留学人物数据库GIS应用的技术思路如图1所示:

图1 留学人物数据库GIS应用的技术思路

(1)留学人物数据库的构建:留学人物数据库采用开源ECMS软件[ 7]为数据库平台,并建立基于CentOS、Apache、MySQL、PHP的服务器端与开发环境,建立基于浏览器(IE、Firefox、Opera等)的客户端和客户查询端,提供查询和显示留学人物信息的功能。

(2)留学人物地域信息表的构建及Google地图的调用:在留学人物数据库中构建地域信息表存储地域信息及相应的地理坐标,在留学人物网站中利用Google Maps API调用并控制Google地图;用户在网站中发送地理空间数据请求,Google地图返回地理位置定位及周边地图。

(3)Google地图中路径绘制、聚类分析的功能实现:利用Google Maps API及相关技术进行开发,实现留学名人足迹、留学人物分布等GIS应用;用户可进一步在Google地图及海量地理空间数据的基础上对留学人物进行探索、发现与分析。

3 功能实现
3.1 人物地域信息表的构建与数据整理

(1)构建人物地域信息的存储表

根据留学人物数据库GIS应用的技术思路,为了存储人物地域信息数据,需要在服务器端MySQL数据库中设计足迹表、籍贯表等多种地域信息表,其结构主要包括人物姓名、历史时间、历史事件、地点、经度、纬度、信息来源等字段。表创建完成后,即可存储人物地域信息数据。

(2)人物地域信息的数据整理

留学人物信息来源主要包括本馆馆藏文献、网络数据库与互联网,不管是数据套录,还是文献数字化,都无法直接生成完整、可靠的留学人物地域信息数据集。针对籍贯、国家、民族及各种人物地域信息,需要人工来进行相关数据的提取或录入;针对各种地域信息,需要利用Google地图进行考证并提取地理坐标数据。地域信息数据是实现GIS应用的基础,需要持续进行数据更新,并始终保证数据质量。从2011年5月至2012年3月,留学人物数据库已收录1.4万条人物地域信息数据,数据合乎CALIS规范并均已通过CALIS元数据校验。

3.2 GIS应用的实现

(1)基本功能

要将留学人物数据库的人物地域信息显示在Google Maps上,首先需要实现Google地图的加载及控制。在留学人物网站的功能页面中嵌入一段JavaScript代码即可完成Google地图加载及其API的调用,配置Google Maps API内置控件即可实现地图缩放、地图类型切换等基本GIS功能。为使留学人物数据库可以与Google地图协同处理人物地域信息,还需在Google地图上对地域信息进行定位并显示为地标。需要连接MySQL数据库并调用其地域信息表,然后构建LatLng对象并以{纬度, 经度}的顺序显示Marker地标,并构建InfoWindow对象使用户触发Marker地标时弹出信息窗口、显示提示信息。至此,用户能在Google地图中查询留学人物的地域信息及其地图位置情况。

(2)留学名人足迹

留学名人足迹GIS应用的主要作用是将用户查询到的留学人物个体的历史足迹显示在Google地图上,从而反映其在一段历史时期内的时空关系。首先需要从足迹表中调出相应人物个体的多个足迹点信息并逐个显示为Marker地标,然后按时间先后顺序将各个地标进行连线。通过配置Polyline对象的方法即可绘制多个LatLng坐标之间的折线,而多个足迹点的数据调用则存在从MySQL数据库中直接调用、XML文件调用、JSON文件调用等多种方法,笔者采用JSON文件调用方法从足迹表中读取数据。根据足迹表数据,JSON文件结构为:var data = {"figure": "姓名","point": [{"place": "地点", "latitude": "纬度", "longitude": "经度"…},…]}。留学人物数据库中收录有大量留学人物,每个人物在足迹表中又对应于多条足迹数据,以手工编写的方式逐个生成JSON文件,不仅增加了工作量,也无法保证JSON文件的数据质量。针对足迹数据调用,笔者利用PHP语言编写批处理程序,从MySQL数据库的足迹表中读取数据并自动生成格式统一的JSON文件。

在留学人物数据库名人足迹网页中调用Google地图、JSON文件并绘制折线,能直观呈现留学人物屡遭曲折磨难的生命历程。以容闳(中国留学生之父)为例,根据《西学东渐记》(容闳自传)记载的重要历史事件,容闳足迹如图2所示:

图2 容闳足迹(注:数据整理自《西学东渐记》。)

(3)留学人物分布

留学人物分布GIS应用的主要作用是将用户查询到的一批留学人物的地域信息显示在Google地图上并加以分析,从而得到一个地理空间分布模式。以籍贯分析为例,首先需要从籍贯表中调出所有人物或部分人物(如某个学科、行业或党派)的籍贯坐标数据并逐个显示为Marker地标,然后根据地理特征对所有地标进行聚类分析。实现留学人物籍贯分布GIS应用的技术难点在于聚类分析功能,笔者采用Google 地图提供的MarkerClusterer工具库[ 8]实现留学人物籍贯数据的聚类分析功能,基本步骤如下:

①在留学人物籍贯分布的功能页面中调用MarkerClusterer的JavaScript文件,创建MarkerClusterer对象,配置gridSize、maxZoom、styles、zoomOnClick等参数;

②针对籍贯数据调用,从MySQL数据库的籍贯表中读取数据并生成JSON文件,然后在MarkerClusterer对象中调用JSON文件的所有地理坐标数据;

③对Google地图功能及显示效果进行调试。

程序调试完成后,发现Google地图能快速显示海量籍贯地理坐标并生成坐标群集,利用颜色不同的图标与数字不同的统计数据进行多级聚类显示,用户点击各种图标可进一步放大地图或弹出信息窗口。以《中国留学生大辞典》(南京大学出版社1999年出版)收录的近4 000名较有影响的中国留学生的籍贯数据为例,其分布情况如图3所示:

图3 留学人物籍贯分布(注:数据整理自《中国留学生大辞典》。)

3.3 应用效果

利用Google Maps API及相关技术,在不增加经费投入的情况下,图书馆在留学人物数据库中实现了多种GIS应用。从暨南大学“华人留学文化研究所”的使用情况来看,留学人物数据库GIS应用功能正常、数据丰富且对留学研究具备一定的支持能力:

(1)用户在留学人物数据库网页中查阅Google地图的过程中,通过鼠标拖曳、滚动、点击就能实现地图移动、缩放与弹出信息窗口等操作,且Google地图在响应用户操作时无需刷新页面,这使用户获得了与GIS桌面软件相似的使用体验;

(2)通过留学名人足迹地图及其弹出的信息窗口,用户不仅能在Google地图中发现大量典型留学人物的出生地点、求学地点、海外活动地点与归国活动地点等地域信息,还能获取与留学人物相关的其他信息资源;

(3)通过留学人物籍贯分布地图,用户发现,除了在之前学界已达成的共识之外,还有一些尚未注意到的留学现象。所谓的共识,是指留学人物集中分布于我国东南沿海地区和长江流域地区;始料未及的是,而今北京、天津、山东等地出身的有影响力的留学人物为数并不算多,我国东北、西北、西南一些边境地区也存在留学现象。这种留学现象的对比结果让人感到惊讶,但同时也能将研究人员引入更深的留学研究领域。

4 结 语

本文以留学人物数据库为例,对高校图书馆人物数据库GIS应用现状、需求分析、设计思路及其实现方法等内容进行了探讨。留学人物数据库GIS应用可方便用户进行留学人物的地域信息查询、时空关系发现、地理空间分析,增强了数据库的可用性,提升了用户的使用体验。GIS应用的实现过程无需破坏原有人物数据库的结构,可作为一个独立模块进行添加与管理。但显然现有数据处理与分析功能并不能完全替代专业GIS软件,本文只是在用户需求驱动下,改进人物数据库功能设计、提升用户体验的一次尝试,需要不断完善和丰富。

参考文献
[1] Good H N. Trend of GIS Services in US Academic Libraries: From Comparison of Past Surveys and Current Situation of the University of Pittsburgh[J]. Information Science & Technology Association, 2009, 59(11): 539-544. [本文引用:1] [CJCR: 1.112]
[2] Bradley W B, Lauren H M. Utilizing Geographic Information Systems (GIS) in Library Research[J]. Library Hi Tech, 2010, 28(4): 536-547. [本文引用:1]
[3] 张晓源. 人物数据库人物收录标准研究[J]. 图书与情报, 2006(1): 69-73, 79. (Zhang Xiaoyuan. Research on Collection Stand ard of People Database[J]. Library and Information, 2006(1): 69-73, 79. ) [本文引用:1] [CJCR: 1.3855]
[4] 留学人物数据库[DB/OL]. [2012-03-08]. http://overseasdb.jnu.edu.cn/renwu/.(OverseasChineseStudentsDatabase[DB/OL]. [2012-03-08]. http://overseasdb.jnu.edu.cn/renwu/ [本文引用:1]
[5] 黄如花. 英文参考源的检索与利用[M]. 北京: 海洋出版社, 2010: 207-210.
(Huang Ruhua. Retrieval and Use of the English Reference Source[M]. Beijing: Ocean Press, 2010: 207-210. ) [本文引用:1]
[6] Bol P K. GIS, Prosopography, and History[J]. Historical Mapping and GIS, 2012, 18(1): 3-15. [本文引用:1]
[7] 帝国网站管理系统[EB/OL]. [2012-03-08]. http://www.phome.net/product/Ecms.html.(EmpireCMS[EB/OL]. [2012-03-08]. http://www.phome.net/product/Ecms.html [本文引用:1]
[8] Google Code. Google-Maps-Utility-Library-V3-Revision 367[EB/OL]. [2012-03-08]. http://google-maps-utility-library-v3.googlecode.com/svn/trunk/markerclusterer/. [本文引用:1]