Content uploaded by Tinghua Ai
Author content
All content in this area was uploaded by Tinghua Ai on Jul 25, 2016
Content may be subject to copyright.
书书书
第41卷 第2期
2016年4月
测绘 地 理信 息
JournalofGeomatics
Vol.41No.2
A
p
r.2016
基金项目:国家 自 然科 学基 金资 助项 目(
41531180
);国 家高 技术 研究 发展 计划 (
863计 划)资 助 项目(
2015AA1239012
)。
犉狅狌狀犱犪狋犻狅狀狊狌
狆狆
狅狉狋
:
TheNationalNaturalScienceFoundationofChina
(
41531180
);
the NationalHi
g
h Technolo
gyResearchandDevelo
p
ment
Pro
g
ram ofChina
(
863Pro
g
ram
)(
2015AA1239012
)
.
犇犗犐
:
10.14188
/
j
.20956045.2016.02.001 文章 编 号:
20956045
(
2016
)
02000107
大数据驱动下的地图学发展
艾廷华1
1武汉大学资源与环境科学学院,湖北 武 汉 ,
430079
犇犲狏犲犾狅
狆
犿犲狀狋狅犳犆犪狉狋狅
犵
狉犪
狆
犺
狔犇狉犻狏犲狀犫
狔犅犻
犵犇犪狋犪
犃犐犜犻狀
犵
犺狌犪
1
1SchoolofResourceandEnvironmentalSciences
,
WuhanUniversit
y
,
Wuhan430079
,
China
摘 要:地 图 作 为 地学 研 究 的 可视 化 工 具 和研 究 成 果 的 传 播
载体,在空 间 大 数据 研 究 中 发 挥 重 要 作 用 ,通过尺度变换将
空间大 数据 变“小”,通 过 视 觉 语言 可 视 化 将大 数 据 特 征 直 观
展示,通过 投 影变 换 将 大 数 据 降 维。在完成该工作中,空 间
大数 据 的新 的 技术 特 征 将 推 动 地 图 综 合 、地 图 可 视 化 与 地 图
投影的新发展。同时 ,在 大 数 据 驱 动 下,地图 应用 可拓 宽到 非
空间数据的表达中,对泛在 网络空间 的网络行为、集 合空间 的语
义信息可视化表达,产生赛 博地图、隐 喻地图等 新的地图形式。
关键词 :大数据;地图学;隐喻地图;可视化挖掘
中图法 分类 号 :
P28
文献标志码:
A
犃犫狊狋狉犪犮狋
:
Asthevisualizationtoolofg
eoscienceex
p
lorin
g
andthecommunicationcarrierofresearchresult
,
the ma
p
andma
pp
in
gp
la
y
sanim
p
ortantroleinbi
gg
eodatastud
y
.
Thecarto
g
ra
p
h
yhasthe abilit
yto chan
g
ebi
g g
eodatato
smallb
yscaletransferrin
g
,
discoverthehiddeninformation
b
yvisualex
p
lorin
gandreducethedatadimension b
yma
p
p
ro
j
ection.Tofinishthesetasks
,
thenew characteristicsof
bi
gdata will makethedevelo
p
mentof ma
pg
eneralization
,
ma
pvisualizationand ma
pp
ro
j
ection.Driven b
ybi
gdata
,
thema
pa
pp
licationcanalsobeextendedtonons
p
atialdo
main
,
includin
gthewebactionin ubi
q
uitouss
p
aceandthe
semanticre
p
resentationinsets
p
ace.Somenew ma
pvisual
izations
,
suchasc
y
berma
p
andmeta
p
horma
pwillbe
g
enerated.
测绘地 理信 息 2016年4月
犓犲
狔狑狅狉犱狊
:
bi
g
data
;
carto
g
ra
p
h
y
;
meta
p
horma
p
;
visualiza
tiondataminin
g
大数据的产生促使各相关学科与技术领域都在
思 考大 数 据驱 动 下 本 学 科 的 发 展 问 题,该 问 题 体 现
在两个方面:一 是 大 数 据 的 新 特 点 促 使 相 关 学 科 领
域 过去 既 有技 术 方 法 的 改 变;二 是 面 向 大 数 据 的 新
问 题相 关 技术 方 法 如 何 跟 进,从 各 自 学 科 视 角 为 大
数据问题解决如何做些贡献。与地理 位置 、空间、区
位 相关 的 空间 大 数 据 是 大 数 据 中 的 重 要 分 支,本 学
科领域通常用80% 这个数字来诠释空间相关信息在
整个 信息资 源所占 的比重 ,该 数 字 的 来 源 无 从 考 证 ,
在IT 技术 背景 下基 于 维基百 科等众 源 信息 ,有关学
者对该数字重新进行了考察[
1
]
,得到的结 论是57%的
信息是空间相关的,尽 管 比 传 统 认 识 有 所 下 降,但 丝
毫不 减空间 相 关信 息 的重 要 意义。地 图 学 作 为 空 间
认知与表达的经典学科,与空间大 数据 有着 紧密的联
系。地图 作为地 理学家的第 二语 言,在研究地学特征
规律 、揭示 地理 过程机 理、挖 掘 空 间 分 布 模 式 方 面 承
担两大功能:一是作为 分析表 达工 具探 求地 理学 中的
科学问题;二是 作为载体传 播工具交流传 输地 学研 究
成果。从符号 学角度看,以空 间认 知表 达符 号为 主要
特征的地图,与 代 表 语 言 的 文 字 符 号 和 代 表 数 量 的
数字符号,成为人们认 知世 界的三 大文 化工具,在 漫
长的 研究 历史 中 形 成 的 经 典 地 图 学,同 时 涉 足 科 学 、
技术、艺术三大范畴。当经 典的地 图学遭遇现 代的 大
数据时,地图学的 内涵与外延 都面临 着拓宽与深 入。
1
空间大数据概述
大 数 据 现 象 刚 产 生 时,大家关注的是数据本身
的特点 ,分 别 从 数 据 的 体 量 、变 化 、结 构 、价 值 、来 源
等方面用4个V或5个V对其描 述[
2
]
,随着大数据
的技术、方法的发展,大 数据的 研究 群 体、研究分支、
研究任务逐渐深入、明 细 ,大数据研究被作为一种新
的科学研究范式提出,关 系 型 数 据 库 专 家 图 灵 奖 得
主Jim Gra
y将 其定 义 为 数 据密 集 型 研 究 范 式 ,为 经
验验证、逻辑推理、科 学 实 验 之 后 的 第 四 研 究 范 式 ,
该研究范式与过去的传统范式在对待数据的方式上
有较大差异。基 于 采 样、实 验 获 取 小 数 据 的 研 究 具
有很强的目的性,采集数据的方式、类型与加工处理
过程为事先设计好的方案,研 究 的 过 程 往 往 表 现 为
验证(证实或证伪)。 而 大 数 据 往 往 非 主 观 预 先 设
计,具有很强的自发性,通过众源渠道获得的大数据
推出的结论具有非预见性,大 数 据 研 究 的 价 值 也 体
现在研究结论的惊喜。
纵 观 大 数 据 研 究 的 典 型 案 例,不论是基于搜索
引 擎关 键 词预 测 流 感 的 爆 发,还 是 通 过 电 话 信 号 分
析人流量的迁移,不 论 是 基 于 大 众 点 评 的 签 到 数 据
探测 城 市的 热点区 域,还 是通过 GPS记 录 出 行 轨 迹
数据分 析城 市不同 类型 的 用地 划分,发 现一 个特征 :
该 类研 究 中数 据 的 功 效 发 生 了 转 移,即 之 前 通 过 传
感器、网络用户志愿者等渠道采集数据、存储记 录是
针对
犃
目标,但后来该数据的功效在
犅
目标上展示
出来,该 特征 可 形 象 地 理 解 为 数 据 的 “跨 界 ”。 大 数
据的“跨 界”将 不 同 领 域 关 联 起 来,从而使得大数据
可探求 相关 性,而不再关注因果性。针 对 空 间 大 数
据而言 ,该“跨 界”特征体现在两个方面:一 是数 据 的
尺度跨 界,即 从个体 到群 体的变 化,使 得数据 在一 定
规 模的 新 尺度 下 展 示 群 体 目 标 的 新 的 空 间 特 征;二
是专业 领域 的跨界 ,数据是否跨界可作为界定大数
据研究 的标 准之一 ,过去有些研究数据量也很大,如
遥感影 像的 研究,但 影像 采集前 传感 器 的设 计、卫 星
发射就 确立 了其服 务目 标(如国土资源调查、气 象预
报等),后 来按 照 既 定 的 目 标 发 挥 影 像 的 作 用,便 不
属于大 数据 的研究 范畴 。
空 间 大 数 据 产 生 的 来 源 丰 富,有 官 方 权 威 部 门
采集的(如 人 口调 查 、第 二 次 国 土 资 源 大 调 查 、地 理
国 情调 查 等 ),也 有 通 过 开 放 性 由 众 多 参 与 者 完 成
的[
3
]
,该形式采集的地理信息具有来源广泛性、操 作
开放性 、形 式 多 样 性 特 征 ,被 称 为 “众 源 ”数 据[
4
,
5
]
。
从测绘 学科 角度,众 源地 理数据 分两 大 类:基 础地 理
数据(网 络 上 传 的 矢 量 地 图、
GPS 轨 迹 、
POI 点 位
置)和专题 数据 (带有位置信息的微博、文本、地 名地
址、地 理 参 照 的 照 片 、视 频 等 多 媒 体 信 息 )两 大 类 。
OSM(
o
p
enstreetma
p
)是基础 地理 数 据类 型的典 型
代表,是 全 球范 围 内 开 放 免 费 的 基 础 地 理 数 据 源 。
志 愿者 能 够 随 时编 辑 提 交 地 理 数 据 到 OSM 数据库
中,并 快 速更 新 地 图 。例 如,
OSM 志愿者在海地地
震 事 发 48 h 内 绘 制 出 了 完 整 详 细 的 救 灾 资 源 、篷
房、可饮用水等资源的分布地图,在 地震救 灾中 发 挥
了重要作用。由于众源地理信息具备的开放性、泛
在性、高时效性使得其在揭示社会行为时空规律、发
现空间 模式 特征、诠 释地 理过程 机理 、预测时 空演 变
趋势上 具有 重要作 用。然 而 ,由 于开 放 、非 专业 化 特
征使得 众源 地理信 息缺 乏 精确 性、结 构化 、完 备 性特
点,该类信息资源难于直接开发应用,需 要专门 的数
据加工 处理 对其增 强,提 升其附 加值 ,其中针 对众 源
数据实 施尺 度变换 ,并通过视觉语言可视化揭示时
空规律 ,是地图学在大数据研究中应扮演的角色。
2
大数据驱动下地图学三大技术方法的发展
基 于尺 度 范围 和 专 题 领 域 的 “跨 界 ”,空 间 大 数
据研究 在于 揭示时 空规 律 、分布特征与过程机理,与
地图对 地理 空间的 表达 目 标一 致。词语“地 图”对 应
2
第41 卷第2期 艾廷华:大 数 据驱 动下 的 地图 学发展
的英文其动词意义为“映 射”,是 数 学 中 函 数 相 关 的
一个概念,即对地理空间的原像转换为新的镜像,映
射变换不是简单的写真式表达,包 含 了深 刻的变 化。
在对空间映射表达中,地 图 学 形 成 了 独 特 的 空 间 思
维模式:抽 象 概括 、形 象 化展 示和定 量化 表达。基 于
尺度变换实现地理概念抽象、几 何 维数 降低、空间实
体聚集、语 义 特征 归 并 等 行 为 ,体 现 出 一 览 性 ;基 于
符 号化 视 觉语 言 展 示 地 图 的 形 象 艺 术 化 特 点,体 现
出直观性;基于地图数学基础与空间参考系,地图表
达 担当 了欧 氏 空 间 的 几 何 度 量 ,体 现 出 可 量 算 性 。
以 上特 征 形成 经 典 地 图 学 的 三 大 技 术 方 法:地 图 综
合、地 图 可视 化与地 图投 影。空间 大数 据 的出 现,一
方面为 地图 学三 大技术方法 提出挑 战,需根 据大数 据
处理 对象 的变 化 扩 展 技 术 的 外 延、深 化 技 术 的 内 涵 ;
另一方面,地图学的 经典的 长期积累 的空 间思 维模 式
与技 术方法 可以为空间 大数据研究 作特有 的贡献。
2.1
让 空 间 大 数 据 变“小”——— 地图综合
正如名称所示,大数据因为容量大、规模大,在
存储、传输、解 译 上 都 产 生 困 难,一 个 显 而 易 见 的 问
题便是如何将大数据变“小”,如 果 精 练 的 小 数 据 能
不 失真 地还 原 大 数 据 的 功 效 ,我 们 宁 愿 要 小 数 据 。
以 当前 城 市空 间 分 析 的 热 点 数 据 对 象 出 租 车 轨 迹、
基础设施POI 点、用 户 签 到 地 址 、轨道交通刷卡数
据、电话通讯地址等为例,由于众源用户的广泛性和
时间积 累,该类数据的规模都超出了常规空间数据
的表达 。我们 一方面 通过 有 关规 则和常 识剔 除其中
大量的粗差,另一方面要对数据做抽象概括处理,不
仅是压 缩数 据量,更主要的是提取时空分布主特征
规律。当前针对城市时空大数据的压缩与特征提取
方面,主要采用了空间统计的聚类分析,将相近 的位
置信息 集成 用类的 分布 来 反映 主体特 征。
在 地 图 学 方 法 中,地 图 综 合 即 是 通 过 尺 度 变 换
与 抽象 概 括舍 弃 次 要 信 息 内 容,简 化 地 图 数 据 量 并
提炼 主 体特 征,与大数据变“小”目标一致。地图综
合 在地 图 学长 期 发 展 中 形 成 了 完 善 的 综 合 原 理、尺
度变换 方法 、几何变换模型、过 程 控制 与质量 评价 方
法体系 。运用 既有的 地图 综 合的 方法对 空间 大数据
做压缩 、概 括处理 ,是 地图学 在空 间大数 据处 理 方面
的重要贡献,是在大数据变小问题上对空间统计方
法的有 益补 充。不同 于 空 间 统 计 “数”的分析方法,
地图综 合是 基于“形”的分析,对 不同 来源、非 结构 化
的海量 数据 进行跨 尺度 变 换、几 何维 数 降低 、分 辨 率
调整、语 义重 分类等 尺度 变换,更 多地 要依赖 于几 何
学 的原 理 (
Delauna
y三角网、
Voronoi图 等 )。 图1
为众 源轨 迹数 据 实 施 地 图 综合 获 得 的 道 路 结 构 线 示
例,该方法运用 Delauna
y三角 网对复 杂的 线束 进行 尺
度变换,而不是像传统地图综合那样对单根曲线化简。
图1
基于出 租车 众 源轨 迹数 据 的地 图综合 获得 道 路结 构线
Fi
g
.1
GeneralizationofCrowdSourcin
gTaxiTra
j
ector
yDatatoGettheStructuredRoadCenterLine
传统地图综合主要针对标准比例尺地形图和一
定技术规范的专题地图,实施尺度变换的比例尺、压
缩率 、载 负量 等 控 制 指 标 明 确 。而 从 网 络 众 源 渠 道
获得的空间大数据往往缺乏尺度、参 考 系、量纲等基
本元数据内容,尺 度 特 征 需 要 专 门 的 方 法 去 识 别 。
因此,针 对 空间 大 数 据 的 地 图 综 合 与 传 统 地 图 综 合
有一定区别,表 现 在 地 图 综 合 目 标 、综 合 程 度 、上 下
文关联、领 域 知 识 联系 等 方 面 ,具体差异总结如表1
所示,其中,地图综合目标的不同是关键。如果把地
图看作是对地理空间作绘画,画 得 像 不 像 可 以 借 用
中国画中的术语“形 似”和“神 似”描 述 。旨在简化图
形表达、缩 小 数据 量 的 常 规 地 图 综 合 是 “形 似 ”的 地
图综合,讲 究 与原 数 据 形 态 相 似 ,综 合 程 度 小 ;而 旨
在 提取 空 间 知 识 的 大 数 据 地 图 综 合 是 “神 似 ”的 综
合,综合程度大,导致 结构比 例关 系失 调,但空间主体
特征被突出 展示,图2展 示了基于同一数据 对象 实施
两种 不同目 标 地图 综 合的 差 异。两种地图综合的不
同有层次之 分,犹 如绘画初学 者的 素描 与艺 术大 师的
作品创作。通过“神 似”地 图 综 合 从 大 数 据 中 提 取 空
间知识具有一定难度,但却是地 图综合发展 的方向 。
表1
传统地 图综 合 与面 向大 数 据地 图综合 的比 较
Tab.1
Com
p
arisonsBetweentheTraditionalMa
p
GeneralizationandThatAimin
g
atBi
gData
差异比较 传统地图综合 面向大数据的地图综合
综合目标 图形简化、数据压缩 结构特征提取、知识发现
综合程度 小,保持图形相似 大,感兴趣特征夸大
上下 文 关联 弱 ,局部考虑 强,宏观决策
领域知识联系 松,仅关注几何图形 紧,融入语义模型与领域知识
3
测绘地 理信 息 2016年4月
图2
基于同一道路网数据的两种尺度变换:
“形似 ”与“神 似”地 图综 合示 例
Fi
g
.2
DifferenceBetweenthe “
S
p
iritResemblance
Generalization
”
and “
Ima
g
eImitationGeneralization
”
BasedontheSameRoadNetwork
面向大数据空间知识提取的地图综合研究是地
图学面临的新挑战,需 要 将 空 间 数 据 挖 掘 方 法 与 地
图抽象概括思想结合,变 换 的 控 制 指 标 由 过 去 的 单
纯 空间 尺度 拓 宽 为 空 间 、时 间 、语 义 三 种 尺 度 的 联
合。同时,在 计 算方 法 上 通 常 采 用 “分 治”的 算 法 思
想来提高计算效率,在并行化、高性能计算平台下实施。
2.2
让大数据背后特征可“显”——— 地图可视化
大 数 据 所 蕴 含 的 时 空 特 征、分布规律等空间知
识 可以 通 过抽 象 概 括 用 数 字、自 然 语 言 或 其 他 方 式
表达,其中基于视觉语言的可视化表达最直接,具有
形象 、易 感受 等 特 点 。广 义 的 可 视 化 是 一 种 认 知 工
具,在 科 学研 究 中 发 挥 重 要 作 用,
2008 年诺贝尔化
学 奖授 予 荧光 蛋 白 材 料 的 发 现,被 认 为 在 分 析 化 学
中 找到 了 一 种新 的 可 视 分 析 方 法 。在 地 学 研 究 领
域,可视分析在空间知识发掘上同样扮演重要角色。
1912 年,魏 格 纳 从地 图 上 注意 到 大 西 洋 两 侧 的 大 陆
形状走势十分相似(比 如 非 洲 和 南 美 洲 ),据 此 提 出
大 陆板 块 若干 年 前 是 聚 居 在 一 起 的 假 设,进 一 步 发
展了大陆漂移学说,其 中 基 于 地 图 的 可 视 分 析 功 不
可没。
20 世 纪 30 年 代 ,我 国 人 口 地 理 学 家 胡 焕 庸
在点值法表达的中国人口地图上通过视觉分析发现
了 从吉 林 瑷珲 到 云 南腾 冲 的 著 名 的 “胡 焕 庸 直 线 ”,
揭 示了 我 国人 口 地 域 分 布 悬 殊 的 特 征,一 直 延 续 到
当今该规律仍然存在,甚 至 于 在 大 数 据 时 代 QQ 在
线网络用户也有类似分布特征(如 图 3和 图 4所
示)。这些 案 例表 明 基 于 地 图 的 可 视 化 分 析 在 地 学
规律探求上可发挥举足轻重的作用。
在 当 今 大 数 据 时 代,应用地图可视分析发现隐
藏 在数 据 背后 的 特 征 规 律 是 值 得 关 注 的 问 题,体 现
了形象思维的重要。在逻辑学中把思维区分为抽象
思维与形象思维两种,抽象思维通过形式化表达、公
式演算、模 型 分析 、逻 辑 推理 获得抽 象结 论。形象思
维基 于 直观 表 象 的 思 维 意 象、直 感 、想 象 等 观 念 ,运
用感官所感知的图形、图像、图式和符号思考获得新
图3
1930狊的中 国人 口 分布 与胡焕 庸直 线 图
Fi
g
.3
DistributionofChinesePo
p
ulationin1930s
andtheRe
p
resentationof HuHuan
y
on
gLine
图4
某时刻 犙犙 在 线人数 的分 布
Fi
g
.4
DistributionofQQ WebChattin
gUserson
LineatSomeTime
的结论 。两种 思维在 大数 据 分析 与知识 发现 上同样
重要,基 于地 图“形”的 视 觉 思 维 可 以 补 充 基 于 “数”
的逻辑 抽象 思维。空 间大 数 据的 出现推 动了 本学科
领域空 间统 计的空 前繁 荣 ,但要注意到,并 不是 所有
规律都 可以 用“数”统 计分析 出来 的 。“胡焕庸直线”
所 表达 的 人口 分 布 是 一 个 典 型 的 聚 集 型 空 间 分 析,
可 以用 基 本的 空 间 聚 类 分 析 实 现 。试 想,如 果 不 是
可 视化 分 析得 出 该 分 布 规 律,而 是 通 过 聚 类 分 析 演
算,得出的结论将是多片区域的热点分布,远 没有这
一条直 线表 达意义 重大 。
基 于 地 图 可 视 化 分 析 揭 示 大 数 据 特 征,可以在
两 个层 次发 挥 作 用 ,一 是 利 用 地 图 符 号 、动 画 、
3D
、
虚拟现 实、新媒体等可视化工具将空间信息形象化
展示,从而启发人的大脑更易发现特征规律,地图可
视 化发 挥 辅助 支 持 作 用;二是应用新型的可视化工
具直接 探求 、揭示、模拟空间现象的地学规律,地 图
可 视化 直 接 参 与 到 大 数 据 的 地 学 规 律 的 发 现 过 程
中。“胡 焕 庸直 线”的 发 现是 属于前 者。在 现代图 形
可视化 技术 支持下 ,产生了一批可视化工具可以深
层 次揭 示空 间 相 关 、空 间 聚 集、时 空 过 程 演 变 等 特
征,在数据挖掘领域有一种可视化挖掘方法,可 以引
入到地 图学 与空间 特征 结 合用 于大数 据的 分析。
《大数据 时代 》的作者 舍恩 伯 格指 出大数 据揭 示
4
第41 卷第2期 艾廷华:大 数 据驱 动下 的 地图 学发展
现象间的关联规则[
6
]
,而不关注现象间的因果联系,
在 地理 现 象 中 有一 种 空 间 关 联 表 现 为 空 间 共 存 (
co
location
),即 两种 类 型 的 地理 实 体 总 是 伴 随 存 在 ,发
现该规则在城市设施规划、管理中具有重要意义,一
直是空间数据挖掘的重要内容。常规的数据挖掘方
法主要是基于 A
p
riroi算 法 在 空 间 邻 域探 测 基 础 上
实现,作 者 基 于 颜 色 色 相 合 并 (即 地 图 符 号 的 加 色
法)同 样发 现 了 城市 街 道 网 上 的 POI点的空间共存
规则。如图5所 示 ,将 两 类 设 施 的 POI 点(如 餐 馆
与商场便利店)投 影 到 道 路 上 ,选 取 两 种 颜 色 (如 红
与绿),基于核密度估计思想构建颜色的扩张与衰减
模型,运用加色法原理(红+绿=黄),计算道路任意
位 置 的 颜 色 值,得到红、绿、黄 不 同 色 系 的 分 布。分
析道路可视化结果,黄色表示两种设施关联度高,具
有colocation 分 布规 则 。这 里 只 是 作 为 案 例 表 明 ,
空间大数据的分布模式规律通过可视化方法同样可
获得,地 图 可视 化 方 法 在 空 间 大 数 据 特 征 揭 示 方 面
大有用武之地。
图5
基于色彩加色法可视化获得犘犗犐点的空间共存特征
Fi
g
.5
To DiscoverthePrinci
p
leofCoLocationofPOI
FeaturesBasedontheColorAdd Visualization Method
值得注意的是,传 统 地 图 可 视 化 技 术 主 要 回 答
了“在 何处 ? 有 何 物?”的Where 问 题 ,对于空间分
布模式的关联性、因果性的 How Wh
y问题关注不
够。在大数据时代,后 一 个 可 视 化 问 题 将 是 地 图 可
视化的热点问题,要 面 向 大 数 据 对 象 发 展 新 型 的 地
图可视化方法,迎 接 新的 挑战。
2.3
让空间大数据可“量”———地 图数 学基础(参考 系)
空间大数据是多 维的,集 成 了 空 间 、时 间 、语 义
特征描述,空间维又可划分为三维或二维,为了从不
同视角分析大数据,需要运用数据库原理中的投影、
选择运算对数据降 维,提 起 数 据 的 主 成 分 特 征 。例
如,对 于 运动 目标的 轨迹 线,投影到时间轴上做时间
序列分析,或 者 投 影 到 二 维 空 间 参 考 系 下 做 空 间 分
布分析。对 于空 间 大 数 据 ,除 了 在 元 组 结 构 上 基 于
关 系代 数 原理 的 投 影 运 算 外,在 空 间 域 上 还 有 进 一
步的以几何降维为目的的地图投影问题。
在地图学中,地 图 投 影 是 对 欧 氏 空 间 变 换 建 立
地图数学基础的过程,可 实 现 地 球 椭 球 体 数 据 到 平
面的转 换,并建立不同经纬度位置的投影变形模型。
地图投 影、地图数学基础曾经被认为是地图学原理
方法中 最完 备的,很长一段时间没有或很少有该领
域的研 究成 果发表 ,在地图学的三大技术方法中也
很少有 课题 资助该 分支 的 研究 。大数据 的到 来激活
了 该分 支 的 研 究 。由于大数据具有跨学科融合、多
视角空 间观 测、实时动态表达等特点,地 图数 学基础
与 参考 系 的构 建 要 能 胜 任 多 分 辨 率、多 水 平 观 察 不
同尺度空间,能胜任与地球科学各领域的不同参考
数据的 有效 融合,能实现观察视角任意变换(包 括从
空中俯 视、从 地面仰 视、室内外一体化通视等)。
应对大数据 的挑战,一方面对 既有的地图投 影进
行改进,使其适应 大数据的要 求,另一方 面,需要重新
建立 全新 的 地 图 数 学 基 础 模 型 原 理。Goo
g
leMa
p为
了表 达金字 塔式的多级 瓦片地图,在传 统 Mercator投
影基础 上 将 椭 球 体 简 化 为 标 准 球 体 建 立 了 Web
Mercator投影。该 投 影保 证 了 经 纬 网 的 正 交 ,满 足
了 邻近 级 别 瓦 片 地 图 之 间 一 分 为 四 的 矩 形 剖 分 需
求,该投影开辟了网络地图的全新的阅读模式。
地 球系 统 各分 支 诸 如 海 洋 、气 象 、地 质 、环境等
具 有全 球 性大 区 域 尺 度 研 究 的 领 域,需 要 在 球 面 上
集 成各 不 同专 题 参 考 数 据,面 向 该 需 求 建 立 的 网 格
参考系 ,基于正六边形等几何单元可以精确地拼接
椭球体 表面 ,并能在纵向上归并单元获得不同层次
的表 达 ,较 好 地 适 应 地 球 系 统 的 应 用。为应对大数
据时代 街景 图、地标参考全景图以及各种透视图的
需要,将几何透视投影与经典的地图投影集成,实现
从 地面 仰 视空 间 的 效 果 ,并完成精确几何度量。而
以道路 导航 为代 表的 LBS 位置服务,则要建立空间
行 为驱 动 的线 性 参 考 系,实时获取以移动目标为中
心的动 态场 景表达 。对于不同来源的大数据建立全
空间信 息系 统,实 现 室 内 与 室 外 、地上与地下、大 陆
与海洋 、近地表与深空等全空间信息的表达,则 需要
建立广 泛、普 适、一体化的空间参考系。以 上所 列需
求可 看作是 地图投影在 大数据时代 所面临 的新挑战。
3
泛空间 下的大 数 据地 图 可视化
大数据 时代 的地图 可以 突 破其 “本 职 工作 ”而 对
非 空间 数 据可 视 化 表 达 ,产生新型的地图形式。泛
在网络 中的 大数据 有些 不 具备 空间定 位或 定位性 很
弱,可以人为构造一个几何空间,按 照一定 规则 把 相
关 现象 布 设到 空 间 中,用地图可视化来揭示现象间
的关联 、因 果、聚 集 等 规 则,发 挥 地 图 学 对 大 数 据 研
究的新 贡献 作用。
3.1
网络空间下的赛博地图
广 义 的 空 间 包 括 除 地 表 以 外 的 网 络 虚 拟 空 间 、
5
测绘地 理信 息 2016年4月
月球等其他星体空间、微 观 小 空 间 、社交媒体空间、
社会心理空间等等,发生在这些空间的事物、现象与
过程可借助地图这一熟悉的形式来模拟表达。以各
种通讯网、因 特 网、物联网和专业传感网所构成的泛
在网络空间,以“无 所 不 在”的 技 术 特 征 获 取 、记 录 、
传输、处理网络信息,构成了泛在网络空间的典型代
表。应 用地 图 可视 化 形 式 通 过 视 觉 语 言 、形 象 思 维
对泛在网络信息进行定位分析,以 揭 示 网 络 空 间 行
为特征、预 测 信息 过程趋 势、发掘现象空域规律具有
重要意义。为 了对 赛 博 空 间 里 存 在 的 事 物 、发 生 的
现象与过程进行可视化表达,为 虚 拟 空 间 的 导 航 与
分析服务,计 算 机 网 络 领 域 建 立 了 一 种 专 门 的 可 视
化技术 C
y
berma
p
,翻 译 为赛 博地图[
7
,
8
]
。
赛博地图表达泛在网络虚拟空间发生的信息交
流、点击访问、上 传 下 载 、数 据 传 输 等 网 络 事 件 与 过
程,在零时间、零 距 离 下 完 成 。与实空间一样,赛 博
地图里也存在导航,面对众多链接的网页访问,达 到
一定深度时也出现类似实空间困在迷宫中迷路的情
形,在点击访问过程中,浏览者的大脑会出现一幅用
拓扑结构连接站点的心象地图[
7
]
。赛 博地 图 对 赛 博
空间的点击导航、信息传输等网络事件、网络现象的
可视化表达,是 一 个 还 正 处 于 研 究 的 信 息 可 视 化 技
术。目 前赛 博 地图 表 达 的 主 要 内 容 包 括 :网 络 结 点
导航、点击率、
DNS域 名 分布 、访 问 记 忆 、信息流量、
因特网发展态势、服务器节点分布、信 息 容 量 等 ,图
6是赛博网络图的一个实例。赛博地图可视化的主
要 特点 是 采用 拓 扑 结 构 表 达 信 息 内 容,关 注 结 点 链
接、在 线/离线 、访问通 达性 等 拓扑 信息,而不关心节
点连接的距离、节点切换的方位,表明赛博地图对网
络现象的空间定位是粗化的、抽 象 的,不关注精准的
距离、角度等度量特征。
图6
赛博地图示例
Fi
g
.6
AnIllustrationofC
y
berMa
p
值得注意的是,赛 博 地 图 与 另 一 个 网 络 相 关 的
概念 Webma
p是 完 全 不 同 的 ,尽 管 都 与 网 络 有 关,
C
y
berma
p是 指可 视 化的 对 象 为 网 络 空 间 ,
Webma
p
是 指可 视 化的 技 术 手 段 为 网 络 ,
Webma
p可视化的
内 容仍 然 是实 空 间 的 现 象 与 事 件,只是我们采用网
络技术 来发 布地图 、浏览地图、下 载收集 不同 站点的
数 据来 制 作 地 图 。因此从形式上看,
Webma
p跟 过
去 的常 规 地图 没 有 太 多 区 别 (动 态 性 功 能 可 能 是 一
个差别)。 但C
y
berma
p与 常 规 地 图 的 差 别 就 比 较
大了,赛 博空 间 已 经 不 是 一 个 欧 氏 空 间,距 离、方 位
的度量 意义 不存在 ,传统意义上的地图制作数学法
则(包括地 图投 影 、比例尺、图 幅 定 位 )失去作用,从
地图学 角度 ,赛博网络图的设计面临众多挑战性问
题有待 研究 。
3.2
空间无关数据的可视化——— 隐 喻 地 图
大数据 中存 在大量 纯粹 记 录表 达语义 特征 的非
空间数 据,涉及描述对象的构成、性 质、类 型、功 效等
本体特 征,常 规 的 表 达 方 法 是 通 过 文 字、数 字、统 计
图 表等 形 式来 描 述 其 体 量 大 小、结 构 成 分 与 过 程 趋
势等。作为空间可视化的地图对该类非空间信息同
样可发 挥作 用,可以人为构造一个虚拟空间,在 语义
信息的 集合 中,按照语义相关性、层 次性 、因 果 联系 、
过程序 列等 规则,将语义信息布设到该虚拟空间中,
获得形 象、直观的集合空间表达,该 类可 视 化由 于其
表 达对 象 的空 间 特 征 不 是 直 接 的,而是隐藏在语义
信息的 联系 中,被称为隐喻地图。隐喻地图是对语
义 信息 从 集合 空 间 映 射 为 欧 氏 空 间 后 形 象、直观的
表达。隐喻地图的典型代表便是知识产权成果可视
化 表达 的 专 利 地 图 (
p
atentma
p
),专 利 申 请 数 据 的
技术领 域广 泛、层 次 性 强 、年 度 变 化 快 ,因此数据的
体 量 大、结 构 复 杂。用 统 计 表 格 、文 字 、常规图表描
述 难于 揭 示专 利 在 不 同 技 术 领 域 的 分 布 差 异、年 度
变化趋 势、新 兴技术 、夕阳技术的发展变化。通 过专
利地图 虚拟 构造一个 DEM 描述 不 同 技 术 分 支 领 域
(虚 拟定 位 点 )的专利申请数量(定 位 点 的 竖 向 高
度),在此基 础上 建立三 维可 视 化获 得地表 起伏 可视
化,该三维可视化中的山峰、洼 地、山 脊、谷 底以及 山
头包含 关系 、动态山头的起伏变化等可以轻松地将
上 述专 利 信 息 的特 征 刻 画 出 来 ,认 知 效 果 显 著 ,图7
为专利 地图 表达的 一个 案 例。
隐喻地 图在 非空间 性语 义 信息 特征表 达上 具有
突出功 效,究其原因在于人对周围现象的认知通过
长期的 学习 、训练产生了强烈的空间感,借 助 于空 间
尺度来 感知 一个抽 象的 概 念是 一个便 捷的 途径。我
们在 描 述诸 如 宇 宙、星 球 的 年 龄 、大 小 ,描述夏天连
续暴雨 的降 雨量时 ,给出一个巨大数字后,往 往作进
一步解 释,采 用 诸 如 “相当于绕地球多少圈”、“相 当
6
第41 卷第2期 艾廷华:大 数 据驱 动下 的 地图 学发展
图7
隐喻地图的代表——— 专利地图示例
Fi
g
.7
AnIllustrationofPatentMa
p
,
theT
yp
ical
Meta
p
horMa
p
于一年时间的多少秒”、“相当于几个东湖的水量”等
等,用 一 个有 形 的 空 间 大 小、远 近 、高低等模拟描述
一个抽象的数字,达到直观、形 象的感 知效 果 。
众多的大数据是通过关系型数据库存储表达
的,关系数据库模型的基础为集合论,而集合空间表
达的信息内容对于人的认知而言过于抽象。针对该
问题,隐 喻 地图 实 现 了 将 集 合 空 间 的 信 息 内 容 映 射
到欧氏几何空间的转换,解 决 了 抽 象 信 息 内 容 的 直
观认知,可 以 认为 这 是 地 图 学 对 非 空 间 型 大 数 据 表
达的重要贡献。集合论中对集合、元素的表达有韦
恩图方法,这 是 集 合 空 间 信 息 可 视 化 表 达 的 初 步 方
法,隐喻地图则是对韦恩图的深入发展,借助常规地
图可视化的 DEM 或 其 他 场 景 表 达 集 合 空 间 元 素 、
子集的关系、尺 度 特征 。由于大数据的类型丰富、数
据间的结构关系多样,隐喻地图的表达规则、图形模
式、认知效应有待于深入研究,也是地图学在大数据
时代对表达空间对象扩充后面临的新问题。
4
结束语
地 图 学 作 为 空 间 认 知 与 表 达 的 技 术 方 法,在 研
究地学特征规律、揭示地理过程机理、挖掘空间分布
模式方面,既是科学探究工具,也是研究成果传播载
体。当 经典 的 地图 科 学 遭 遇 现 代 大 数 据 时 ,面 临 大
数据 驱 动下 的 学 科 发 展 问 题 。该问题具有双重性,
一方面,大 数 据的 新 特 征 促 使 地 图 制 图 技 术 既 有 的
地图综合、地 图 投 影 、地 图 可 视 化 要 发 展 技 术 内 涵 ,
扩充技术外延,产 生 诸 如 面 向 空 间 知 识 提 取 的 空 间
数据尺度变换、基 于 形分 析的可 视化 挖掘、多种几何
变 换集 成 的复 杂 投 影 变 换 等 技 术,这些新的技术方
法可在空间大数据的 处理、可 视 化 与 信 息 提 取 中 发
挥重要作用;另一方面,在非空间型大数据的处理中,
地 图学 方 法得 到 了 发 展,产生了网络泛在空间的可
视化、隐喻地图等技术方法,这对地 图学 而 言是 新的
学科技 术生 长点。为 将地 图 可视 化对象 从传 统的地
表表达 的欧 氏空间 推广 到 网络 虚拟空 间、集 合空间 ,
面对非 欧几 何空间 的可 视 化需 要建立 全新 的地图 表
达规则 、可视化规则等原理方法,从 而推 动 地图 学的
发展。
参考文 献
[
1
]
Stefan H,
Dirk B.How MuchInformationis Geos
p
a
tiall
yReferenced
?
NetworksandCo
g
nition
[
J
]
.Interna
tionalJournal of Geo
g
ra
p
hical Information Science
,
2013
,
27
(
6
):
11711189
,
DOI
:
10.1080
/
13658816.
2012.743664
[
2
]
Ziko
p
oulosP
,
ChrisEatonC.Understandin
gBi
gDa
ta
:
Anal
y
ticsforEnter
p
riseClassHadoo
p
andStream
in
gData[
M]
.New York
:McGrawHillEducation
,
2012
[
3
]
Goodchild M.CitizensasSensors
:
the WorldofVol
unteeredGeo
g
ra
p
h
y[
J
]
.GeoJournal
,
2007
,
69 (
4
):
211221
,
DOI
:
10.1007
/
s107080079111
y
[
4
]
Dod
g
e M,
KitchinR.Ma
pp
in
gEx
p
erience
:
Crowdsourced
Carto
g
ra
p
h
y
[
J
]
.EnvironmentandPlannin
gA,
2013
,
45 (
1
):
1936
,
DOI
:
10.1068
/
a44484
[
5
]
Goetz M,
Zi
p
fA.TheEvolutionofGeoCrowdsourc
in
g
:
Brin
g
in
gVolunteered GeoGra
p
hicInformationto
theThird Dimension
[
M]// SuiD
,
Elwood S
,Good
child M.Crowdsourcin
gGeo
g
ra
p
hicKnowled
g
e.Dor
drecht
:
S
p
rin
g
er
,
2013
[
6
]
维 克 托 迈 尔
舍 恩 伯 格 ,肯 尼 斯 库 克 耶 .
大 数 据 时 代
[
M]
.
周涛.
杭州:浙江人民出版社,
2013
Ma
y
erSchnber
g
erV,
CukierK.Bi
gData
:
A Revolu
tion That WillTransform How WeLive
,Workand
Think
[
J
]
.Zhou Tao.Han
g
zhou
:
Zhe
j
ian
gPeo
p
le
’
s
Publishin
gHouse
,
2013
[
7
]
艾廷华 .
适宜空间认知结果表达的地图形式[
J
]
.
遥 感
学报,
2008
,
12
(
2
):
347354
AiTin
g
hua.Ma
p
sAda
p
tabletoRe
p
resentS
p
atialCo
g
nition
[
J
]
.Journalof RemoteSensin
g
,
2008
,
12
(
2
):
347354
[
8
]
Jian
gB,
Ormelin
gFJ.C
y
berma
p
:
the Ma
p
forC
y
ber
s
p
ace
[
J
]
.Carto
g
ra
p
hicJournal
,
1997
,
34 (
2
):
111116
收稿 日 期:
20160223
作者 简 介:艾 廷华 ,博士,教授 ,博士 生 导 师 ,主 要 研 究 领 域 为 地 图 综
合、空间数据挖掘。
犃狌狋犺狅狉
:
AITin
g
hua
,
PhD
,
p
rofessor
,
PhDsu
p
ervisor
,
withresearch
interestsofma
pg
eneralizationands
p
atialdataminin
g
.
犈犿犪犻犾
:
tin
g
hua
_
ai
@
tom.com
7