2000–2014年中国西北地区面积≥10_km2主要湖泊边界数据集 中华文库
2000–2014年中国西北地区面积≥10 km2主要湖泊边界数据集 作者:张大弘 李晓锋 姚晓军 2018年11月14日 |
|
摘要&关键词
摘要:中国西北地区深居内陆,气候干旱,湖泊面积变化可在一定程度上反映区域水资源时空分配变化特征。本数据集在综合分析降水数据并结合Landsat系列卫星影像实际覆盖情况确定解译时间的基础上,参考“中国2005–2006年1∶25万面积1.0 km2以上湖泊数据集”,选取西北地区113个面积在10 km2以上的非干盐湖,采用人工目视解译方法提取该区域2000–2014年共15期湖泊边界矢量数据。参照科技部科技基础性工作专项“中国湖泊水质、水量与生物资源调查”确定的湖泊范围人工目视解译原则,解译精度控制在一个像元以内。本数据集包括中国西北地区范围矢量数据、2000–2014年湖泊边界矢量数据、湖泊点位及面积统计矢量文件3部分,基本反映了2000–2014年中国西北地区湖泊边界变化情况,可作为其湖泊时空变化、气候变化以及地区水资源人工干预等研究的基础数据。
关键词:湖泊;西北地区;Landsat;目视解译
Abstract & Keywords
Abstract: Deeply inland, northwest China has a dry climate. Variations of lake area can reflect the temporal and spatial distribution of regional water resources to a certain extent. This data set is based on a comprehensive analysis of meteorological data and the actual coverage of Landsat satellite images to determine the interpretation time. Referring to “A 1:250000 data set of lakes with an area above 1km2 in China (2005-2006)”, the study selected 113 non-dry salt lakes with an area above 10 km2 as vectorization objects, all of which are in natural conditions. The lake boundary vector data of 15 periods from 2000 to 2014 were extracted by using artificial visual interpretation. Abiding by the principle of artificial visual interpretation of lake area stipulated by the Ministry of Science and Technology, we controlled the accuracy of interpretation within one pixel. The data set includes three parts of data: (1) regional boundary vector data of northwest China; (2) lake boundary vector data from 2000 to 2014, and (3) lake location and area statistics vector data. The data set basically reflects the change in lake boundaries in northwest China from 2000 to 2014, which can be used as basic data for research on temporal and spatial changes of lakes in the region, climate change, and human intervention in regional water resources.
Keywords: lake; northwest China; Landsat; visual interpretation
数据库(集)基本信息简介
数据库(集)名称 | 2000–2014年中国西北地区面积≥10 km2湖泊边界数据集 |
数据作者 | 张大弘,李晓锋,姚晓军 |
数据通信作者 | 姚晓军(yaoxj_nwnu@163.com) |
数据时间范围 | 2000–2014年 |
地理区域 | 中国西北地区地理范围为31°36–49°36′N,73°29′–111°27′E。涉及天山、阿尔金山、祁连山、昆仑山、阿尔泰山、准噶尔盆地、塔里木盆地、吐鲁番盆地等地理单元,行政单元包括陕西省、甘肃省、青海省、新疆维吾尔自治区和内蒙古自治区的阿拉善盟、乌海市和鄂尔多斯市。 |
空间分辨率 | 30 m |
数据量 | 37.9 MB |
数据格式 | ESRI Shapefile文件(压缩为.zip格式) |
数据服务系统网址 | http://www.sciencedb.cn/dataSet/handle/621 |
基金项目 | 中国科学院冰冻圈科学国家重点实验室开放基金项目(SKLCS-OP-2016-10);科技部科技基础性工作专项(2013FY111400) |
数据库(集)组成 | 数据集共包括3个数据文件:1. Boundary_NWC.zip是中国西北地区边界数据,数据量1.29 MB;2. Lake_NWC_2000-2014.zip是2000–2014年中国西北地区面积≥10 km2湖泊边界数据,数据量36.56 MB;3. Location_NWC.zip是湖泊点位数据,属性表包含2000–2014年湖泊面积变化统计数据,数据量0.01 MB。 |
Dataset Profile
Title | A dataset of lakes in northwest China with an area above 10 km2 (2000 – 2014) |
Data corresponding author | Yao Xiaojun (yaoxj_nwnu@163.com) |
Data author(s) | Zhang Dahong, Li Xiaofeng, Yao Xiaojun |
Time range | 2000 – 2014 |
Geographical scope | Northwest China (31°36’ – 49°36’N, 73°29’E – 111°27’E); specific areas include: Tianshan Mountain, Altun Mountain, Qilian Mountain, Kunlun Mountain, Altai Mountain, Junggar Basin, Tarim Basin and Turpan Basin. Administrative units include: Shaanxi Province, Gansu Province, Qinghai Province, the Xinjiang Uygur Autonomous Region and Inner Mongolia Autonomous region of Alxa League, Wuhai City and Ordos City. |
Spatial resolution | 30 m |
Data volume | 37.9 MB |
Data format | ESRI Shapefile file (compressed in *.zip) |
Data service system | http://www.sciencedb.cn/dataSet/handle/621 |
Source(s) of funding | Open Foundation of the State Key Laboratory of Cryosphere Sciences, Chinese Academy of Sciences (SKLCS-OP-2016-10); Fundamental Program from the Ministry of Science and Technology of China (MOST) (2013FY111400) |
Dataset composition | The dataset consists of 3 subsets in total: (1) Boundary_NWC.zip is made up of boundary data of regions in northwest China, with a data volume of 1.29 MB; (2) Lake_NWC_2000-2014.zip is made up of boundary data of lakes in northwest China with an area above 10 km2, with a data volume of 36.56 MB, and (3) Location_NWC.zip is made up of location data of the lakes, including statistical data of lake area changes in 2000–2014, with a data volume of 0.01 MB. |
引 言
湖泊是揭示全球气候变化与区域响应的重要信息载体,在维护区域食物、生态与环境安全方面具有特殊的地位[1][2]。湖泊变迁敏感地记录着气候与环境变化的信息,是全球变化的直接反映[3][4][1]。湖泊面积变化能在一定程度上体现区域水资源时空分配变化特征,因而湖泊边界矢量数据是开展湖泊时空变化、气候变化以及地区水资源利用等研究的基础数据。随着遥感技术发展,半自动或自动提取湖泊水体信息成为可能,但获取长时序、大范围湖泊数据仍受很多条件限制,主要是藻类覆盖、湖泊水质(泥沙含量、盐度等)、湖泊水深、影像阴影、云等造成的同物异谱问题。作为传统的湖泊遥感识别方法,人工目视解译尽管存在工作量大、对工作人员知识经验水平要求高等缺点,但具有能充分利用先验知识、解译精度高等优点,并在湖泊遥感识别中得到广泛应用。
近50年来,伴随我国西北地区土地资源的大规模开发,人类活动通过修筑大量水利设施拦截入湖地表径流,加剧下游湖泊水资源的短缺,导致湖泊迅速萎缩、咸化甚至干涸等问题,严重危及湖泊及其毗邻区域的生态环境,造成湖泊生物多样性丧失、湖滨地区荒漠化加剧等问题。2014年,中国科学院启动科技服务网络(STS)计划项目——“西北地区生态变化综合评估”,任务之一是结合遥感资料对西北地区过去15年的生态变化过程进行详细评估。作为此次综合评估的重要内容之一,认识西北地区湖泊当前状况及变化特征是制订科学保护对策的基础。近年来虽有部分湖泊相关数据集已公开共享[5],如基于被动微波产品的高亚洲、基于MODIS产品的青藏高原湖泊水面数据集[6][7],但覆盖整个中国西北地区、数据精度高且时间序列长的湖泊基础数据仍为空白。本数据集基于Landsat系列遥感影像、“中国2005–2006年1∶25万面积1.0 km2以上湖泊分布数据集”[5]、“2000–2011年可可西里地区主要湖泊边界矢量数据”[8]和《中国湖泊志》[9]等资料,同时参照科技部科技基础性工作专项“中国湖泊水质、水量与生物资源调查”确定的湖泊范围判识原则[2],采用人工目视解译方法获得2000–2014年中国西北地区各年湖泊边界矢量数据,解译精度控制在一个像元以内。利用近期或2000年以前的遥感数据产品扩展本数据时序,可分析研究区内湖泊面积、水量的时空变化,结合气象数据,亦可在湖泊对气候变化的响应机理、区域内水资源的时空分配变化等方面开展相关研究。
1 数据采集和处理方法
受季节性降水影响,湖泊面积年内波动往往较为剧烈。为便于比较,应尽可能选择湖泊范围年内较为稳定时期的遥感影像。以距离最近为原则,从中国气象数据网(http://data.cma.cn)下载并整理了33个气象站点自建站以来的逐月气温与降水数据。湖泊人工目视解译所用遥感影像底图来自美国USGS网站(https://glovis.usgs.gov),共下载Landsat TM/ETM+/OLI系列卫星影像590景,数据量约450 GB。确定湖泊解译对象所用的“中国2005–2006年1∶25万面积1.0 km2以上湖泊分布数据集”来自国家地球系统科学数据共享服务平台——湖泊–流域科学数据中心(http://lake.geodata.cn),湖泊名称属性采用《中国湖泊志》[9]中给出的湖泊名称,在解译可可西里地区湖泊边界时同时参考了“2000–2011年可可西里地区主要湖泊边界矢量数据”数据集[8]。
1.1 解译对象及遥感影像选取
根据“中国2005–2006年1∶25万面积1.0 km2以上湖泊分布数据集”[5],我国西北地区共有面积大于1.0 km2的自然湖泊437个,面积2.03×104 km2,分别占全国湖泊相应总量的16.2%和24.9%。其中面积大于10.0 km2的湖泊共143个,面积1.93×104 km2,占西北地区湖泊总面积的95.1%,为本区湖泊的主体。考虑到干盐湖受季节性降水影响强烈,以及建有拦水坝或大量引水设施的湖泊无法反映自然状态下的湖泊自身变化,在实际工作中剔除了此类湖泊,并选取113个面积大于10.0 km2的湖泊作为解译对象(图1),其中青海省77个,新疆维吾尔自治区33个,甘肃省、陕西省和内蒙古自治区各1个,这些湖泊总面积占西北地区湖泊总面积(1.0 km2以上)的81.76%,基本可以反映西北地区湖泊面积总体变化特征。
图1 本数据集所包括的湖泊分布图
为最大程度减少湖泊面积年内变化影响和保证不同年份湖泊边界的可比较性,首先对西北地区33个国家基本气象站自建站以来的月降水数据进行分析,了解各区域降水年内变化特征,并选取降水较少且稳定的月份作为湖泊解译最佳时间。然后根据确定的月份下载Landsat系列卫星遥感影像,并选取云量和积雪较少的遥感影像作为解译湖泊边界的底图。经统计,10月和11月的遥感影像数量最多,分别为256景和179景;其次为9月、8月和12月,共136景。此外,少量湖泊在个别年份选用了1月、2月和7月的遥感影像,共计19景。
1.2 数据处理过程
本数据集的生产主要包括遥感影像读取与波段合成、遥感影像质量检查、湖泊边界人工目视解译、湖泊属性录入及湖泊边界质量检查5个步骤,具体描述如下:
(1)遥感影像读取与波段合成:批量解压下载的遥感影像压缩文件后,采用Arcpy脚本方式批量抽取人工目视解译需要的波段(标准假彩色组合:NIR-R-G),并按波段顺序合成为多波段数据集(tif格式)。
(2)遥感影像质量检查:输入待解译湖泊质心坐标数据,检查遥感影像上待解译湖泊表面是否少云少雪。如不满足,检查同一年份其他遥感影像质量,直至满足条件。
(3)湖泊边界人工目视解译:以质量满足条件的遥感影像为底图,显示比例尺控制在1∶500–1∶1000,沿水陆界线像元中心数字化湖泊边界,精度控制在1个像元以内。若湖泊存在湖心岛,则在湖泊边界多边形中剔除该部分。为确保人工目视解译准确度,各湖泊边界矢量数据由工作组其他成员至少核查一遍。
(4)湖泊属性录入:在湖泊边界矢量数据属性表中手工录入湖泊代码、湖泊名称、湖泊性质、所属湖区、所属省份、所属一级流域名称、所属二级流域名称、Landsat遥感影像行列号、采集日期和传感器类型,并自动计算湖泊面积、周长、质心经度、质心纬度、较上一年湖泊面积变化趋势等信息。
(5)湖泊数据质量检查:采用直接评价方法,即逐一检查各湖泊边界图形数据和属性数据,确保各数据项无遗漏和录入正确。
2 数据样本描述
2.1 数据图形样本
“2000–2014年中国西北地区面积≥10 km2湖泊边界数据集”命名遵循如下规则:Lake_NWC_YYYY,其中Lake表示湖泊,NWC表示中国西北地区,YYYY表示年份,通过文件名能够获取此数据文件的时间信息。区域内湖泊分布样本如图2所示,选取了3个解译对象,分别展示其在整个数据时序内的变化情况,a、b、c分别表示阿雅克库木湖、博斯腾湖和艾比湖。如图2所示2000–2014年间a、b、c三个湖泊边界均在水平方向上发生了不同程度的变化:阿雅克库木湖的面积呈持续增大趋势,增量达335.01 km2,扩张了1.52倍,在湖区东部由于湖盆较为平坦,湖岸线水平位移量最大达30 km以上;博斯腾湖的面积减少216.31 km2,较2000年萎缩了约19.21 %,变化体现在湖盆开阔的边缘区域,湖泊主体变化并不大;艾比湖面积减小39.52 %,减量达238.93 km2,湖泊主体形状变化明显,面积整体呈减少趋势,但局部呈波动状况,并在2003和2012年出现两个峰值,变化较大。上述3个湖泊无论是面积还是形状变化都在整个区域具有代表性,可以反映湖泊的边界及变化信息,足以体现本数据集的价值所在。
图 2 15年来湖泊面积变化示意图
2.2 数据属性表
研究区湖泊解译成果数据库包括15个属性字段,描述了湖泊的几何参数与坐标参数,也包括一些归属参数及理化参数,部分为非必填属性。其中湖泊编码(Code)是数据表的唯一主键,编码参照第二次冰川编目格式,结构如下:LnnnnnnEmmmmmN。其中,L表示湖泊,n表示2000年湖泊的质心经度,m表示2000年湖泊的质心纬度,E、N分别代表东经和北纬,n的前三位和m的前两位分别表示经纬度的整数部分,后三位表示其小数前三位。另外,东居延海质心经纬度以2002年为准。详细数据库内容如表1所示。
表1 2000–2014年中国西北地区面积≥10 km2湖泊边界数据集属性表说明
序号 | 名称 | 数据类型 | 字符长度 | 是否必填 | 字段描述 |
1 | Code | string | 14 | 是 | 湖泊编码 |
2 | Name | string | 30 | 否 | 湖泊名称 |
3 | Property | string | 10 | 是 | 湖泊性质 |
4 | Region | string | 20 | 是 | 所属湖区 |
5 | Province | string | 20 | 是 | 所属省份 |
6 | Basin_F | string | 20 | 是 | 所属一级流域 |
7 | Basin_S | string | 30 | 是 | 所属二级流域 |
8 | Area | double | 16 | 是 | 湖泊面积 |
9 | Perimeter | double | 16 | 是 | 湖泊周长 |
10 | Long_Cen | float | 8 | 是 | 湖泊质心经度 |
11 | Lat_Cen | float | 8 | 是 | 湖泊质心纬度 |
12 | RC_Landsat | string | 6 | 是 | Landsat遥感影像行列号 |
13 | Date_DS | date | - | 是 | Landsat遥感影像采集日期 |
14 | Sensor | string | 20 | 是 | Landsat遥感影像传感器类型 |
15 | Area_Ch | string | 10 | 是 | 湖泊面积较上一年变化趋势 |
3 数据质量控制和评估
解译时参考马荣华等[2]遵循的湖泊边界遥感判译原则。湖泊目视解译的精度与影像数据分辨率、时相、配准精度,湖泊面积大小以及人工经验等有关,湖泊的绝对面积精度采用廖淑芬等[10]计算湖泊边界矢量化面积误差的方法来评定,相对面积精度取绝对面积精度与湖泊面积的比值。
人工目视解译方法自身存在误差(如混合象元、解译时图层缩放等级等),可以看作随机误差,与湖泊边界的长度成正比,这些是不可避免的,但可以在后续统计计算中有效回避。为科学评判湖泊变化状况,使用本数据集提取各湖泊面积变化状态时建议采用李晓锋等[11]采用的误差控制方法。
4 数据价值
本数据集与其他湖泊数据集相比较[6][7],主要区别在于较大范围、较长时序、较高的时间分辨率。对于本研究区而言,采用Landsat系列影像作为目视解译底图,已属中高空间分辨率,这类数据集目前还是较为少见的。另外,采用目视解译的方法生产数据,极大程度保证了数据的可靠性。本数据集可反映中国西北地区2000–2014年湖泊现状,湖泊的总体变化特征、变化分异规律等内容,因此可作为湖泊研究相关领域的基础数据。
5 数据使用方法和建议
本数据集解压后可使用支持ESRI Shapefile文件格式的GIS软件打开、显示、编辑、查看、统计等,如ArcGIS。数据采用WGS-84地理坐标系,平面坐标统一采用Albers等积投影,可直接统计湖泊面积变化、变化速率等参数。数据集可直接使用也可扩展,利用近期或2000年以前的遥感数据产品延长数据时序,结合气象数据,分析研究区内湖泊面积、水量的时空变化,可探究湖泊对气候变化的响应机理、区域内水资源的时空分配变化,以期为政府部门在局部水资源分配人工干预等方面提供更合理的理论支撑。
参考文献
- ^ 1.0 1.1 丁永建, 刘时银, 叶柏生, 等. 近50 a 中国寒区与旱区湖泊变化的气候因素分析[J]. 冰川冻土, 2006, 28(5): 623-632.
- ^ 2.0 2.1 2.2 马荣华, 杨桂山, 段洪涛, 等. 中国湖泊的数量、面积与空间分布[J]. 中国科学: 地球科学, 2011, 41(3): 394-401.
- ↑ 张鑫, 吴艳红, 张鑫. 1972–2012年青藏高原中南部内陆湖泊的水位变化[J]. 地理学报, 2014, 69(7): 993-1001.
- ↑ 朱刚, 高会军, 曾光. 近35 a来新疆干旱区湖泊变化及原因分析[J]. 干旱区地理, 2015, 38(1): 103-110.
- ^ 5.0 5.1 5.2 国家科技基础条件平台——国家地球系统科学数据共享服务平台——湖泊-流域科学数据中心. http://lake.geodata.cn.
- ^ 6.0 6.1 卢善龙, 金继明, 贾立, 等. 基于MODIS MOD09Q1的青海、西藏湖泊水面数据集(2000~2012年)[J/OL]. 中国科学数据, 2017, 2(2). DOI: 10.11922/csdata.170.2016.0113.
- ^ 7.0 7.1 邱玉宝, 郭华东, 阮永俭, 等 . 2002~2016 年高亚洲地区中大型湖泊微波亮温和冻融数据集 [J/OL]. 中国科学数据 , 2017, 2(2). DOI: 10.11922/csdata.170.2017.0117.
- ^ 8.0 8.1 姚晓军, 刘时银, 李龙, 等. 近40年可可西里地区湖泊时空变化特征[J]. 地理学报, 2013, 68(7): 886-896.
- ^ 9.0 9.1 王苏民, 窦鸿身. 中国湖泊志[M]. 北京: 科学出版社, 1998.
- ↑ 廖淑芬, 王欣, 谢自楚, 等. 近40 a来中国喜马拉雅山不同流域冰湖演化特征[J]. 自然资源学报, 2015, 29(1): 293-303.
- ↑ 李晓锋, 姚晓军, 孙美平, 等. 2000–2014年我国西北地区湖泊面积的时空变化[J]. 生态学报, 2018, 38(1): 96-104.
数据引用格式
张大弘, 李晓锋, 姚晓军. 2000–2014年中国西北地区面积≥10 km2湖泊边界数据集[DB/OL]. Science Data Bank, 2018. (2018-06-28). DOI: 10.11922/sciencedb.621.