2013–2017年海南岛陆域水体遥感提取数据集
作者:许芬 孟庆岩 张琳琳
2019年5月10日
本作品收录于《中国科学数据
许芬, 孟庆岩, 张琳琳. 2013–2017年海南岛陆域水体遥感提取数据集[J/OL]. 中国科学数据, 2019, 4(2). (2019-04-18). DOI: 10.11922/csdata.2018.0068.zh.


    摘要&关键词

    摘要:陆域水体分布是全球水资源安全和管理、气候变化研究、生态环境动态监测等不可或缺的重要基础信息。本文基于高分1号数据与Landsat 8 OLI数据,通过最小冗余最大相关性特征选择(mRMR)算法,采用面向对象知识规则集自动化提取海南岛2013–2017年连续5年的陆域水体分布信息,结合高空间分辨率遥感影像与Google Earth对分类结果进行精度验证,得到Kappa系数分别为84.67%,85.98%,80.61%,88.66%,90.66%,分类结果精度较高。本数据集可直接用于陆域地表水体时空分布研究,也可为水环境如水体水质研究、水资源安全评估等提供数据基础。

    关键词:陆域水体;面向对象知识规则集;海南岛;中高分辨率遥感

    Abstract & Keywords

    Abstract: Inand water distribution is an indispensable component of global water resource security and management, climate research and ecological environment dynamic monitoring. Based on GF-1 data and Landsat8 OLI data, we used the minimum-redundancy maximum-relevancy (mRMR) feature selection algorithm and the object-oriented knowledge rule set to automatically extract the land water distribution of Hainan Province during 2013–2017. Then assisted by high-resolution remote sensing images and Google Earth images to verify the classification accuracy. Results show a Kappa coefficient of 84.67%,85.98%,80.61%,88.66% and 90.66% for the subsets, respectively, demonstrating a high accuracy of the classification results. This dataset can be directly used to study the spatial and temporal distribution of land surface water. It also provides data basis for water environment research, such as water body studies and water resource safety assessment.

    Keywords: inland water; object-oriented knowledge rule set; Hainan Island; medium and high resolution remote sensing data

    数据库(集)基本信息简介

    数据库(集)名称 2013–2017年海南岛陆域水体遥感提取数据集
    数据作者 许芬、孟庆岩、张琳琳
    数据通信作者 孟庆岩(mengqy@radi.ac.cn)
    数据时间范围 2013–2017年
    地理区域 海南岛:北纬18°10′–20°10′,东经108°37′–111°03′
    空间分辨率 15 m、16 m
    数据量 11.6 MB
    数据格式 *.shp
    数据服务系统网址 http://www.sciencedb.cn/dataSet/handle/673
    基金项目 海南省重大科技计划项目(ZDKJ2016021);四川省科技计划(2018JZ0054)。
    数据库(集)组成 数据集由6部分数据组成,分别为5个不同年份(2013–2017年)水体分布结果数据与1个验证样本点数据,每部分数据包含*.dbf,*.prj,*.shp,*.shx ,*.jpeg,*.sbx,*.sbn,*.xml 8个文件,示例如下:

    1. 2015.dbf为2015年矢量数据dBASE表文件; 2. 2015.prj为2015矢量数据坐标投影文件; 3. 2015.shp为2015矢量数据主文件; 4. 2015.shx为2015矢量数据索引文件,存储地理数据几何特征的索引; 5. 2015.jpeg为2015年水体产品分布结果图; 6. 2015*.sbx为2015年矢量数据索引文件,存储地物特征的索引; 7. 2015*.sbn为2015年矢量数据索引文件,存储地物特征的索引; 8. 2015*.xml为对2015年数据的描述,方便实现数据交换。

    Dataset Profile

    Title A dataset of inland water distribution in Hainan Island based on remote sensing during 2013–2017
    Data corresponding author Meng Qingyan (mengqy@radi.ac.cn)
    Data authors Xu Fen, Meng Qingyan, Zhang Linlin
    Time range 2013–2017
    Geographical scope Hainan Island (18°10′N–20°10′N, 108°37E′–111°03′E)
    Spatial resolution 15 m,16 m
    Data volume 11.6 MB
    Data format *.shp
    Data service system <http://www.sciencedb.cn/dataSet/handle/673>
    Sources of funding Major Science and Technology Plan of Hainan Province (ZDKJ2016021); Science and Technology Program of Sichuan Province (2018JZ0054).
    Dataset composition This dataset consists of six subsets in total, which store data of water distribution in five consecutive years and a verification point data. Each subset contains eight files: *.dbf, *.prj, *.shp, *.shx.,* .jpeg, *.sbx, *.sbn, *.xml. An example is shown as follows:

    2015.dbf is the dBASE table file for vector data in 2015. 2015. prj is the coordinate projection file for vector data in 2015. 2015. shp is the main file for vector data in 2015. 2015. shx is the index file for vector data in 2015; geographic data geometric feature index. 5. 2015.jpeg is the water distribution image product for the year 2015. 6. 2015*.sbx is the vector data index files, storage features characteristic index. 7.2015*.sbn is the vector data index files, storage features characteristic index. 8. 2015*.xml is the description of the data and convenient to realize data exchange.


    引 言

    水是人类赖以生存和社会发展不可替代的战略资源,是全球水资源安全和管理、气候变化研究、生态环境动态监测[1][2][3]等不可或缺的重要基础信息。海南岛河流众多,水资源丰富,人均水资源占有量达3 700m3,是全国平均水平的1.76倍[4]。随着自然环境的变化与社会经济的发展,由地表水带来的洪水泛滥和水体污染等问题已成为当前人类社会关注的热点问题[5][6]。因此,及时快速监测地表水体动态变化,掌握地表水体空间变化规律,减少其带来的灾害威胁,需开展地表水体产品研制。

    国内外大中尺度地表水体产品生成和制图研究成果,主要依赖低空间分辨率卫星数据[7],如由联合国环境规划署世界保护监测中心(WCMC)提供的Global Lakes and Wetlands Database(GLWD)主要采集包括湖泊、水库和湿地在内的水体,利用多边形矢量的面积、体积来判断水体,其空间分辨率为30弧秒(大约1 km),覆盖范围在60°S至90°N。然而,大多数的内陆水体面积相对较小,低空间分辨率卫星数据难以有效提取出小范围水体信息[8],因此,中高空间分辨率遥感影像对于中尺度区域的水体提取具有重要意义。本文利用高分1号数据与Landsat 8 OLI多光谱与全色波段融合后的15 m空间分辨率数据,采用面向对象的知识规则集对海南岛雨季水体进行自动化提取,最后加以人工修正,得到2013–2017年间陆域地表水体信息,一方面为揭示水体分布和动态变化规律提供有效信息,另一方面为水体水质监测、水环境评估提供准确的水体边界信息,本文基于中高空间分辨率遥感影像提取的覆盖海南岛陆域范围的地表水信息能为水资源和环境变化研究提供数据支撑。

    1 数据采集和处理方法

    1.1 数据采集

    1.1.1 区域范围

    海南岛位于北纬18°10′–20°10′,东经108°37′–111°03′,属热带季风气候,存在明显的干湿季。每年5–10月份是多雨季,总降水量达1 500mm左右,占全年总降水量的70%~90%;每年11月至翌年4月为少雨季节,降水量仅占全年的10%~30%。地势中部高四周低,河流大都发源于中部山区,组成辐射状水系,河流众多,自然形成的湖泊较少,人工水库居多。

    1.1.2 影像数据源

    高空间分辨率遥感影像为准确提取陆域水体信息提供了重要的数据源,但随着空间分辨率的提高,影像覆盖范围变小,覆盖全岛所需数据量增大,同时海南岛云雨天气较多,无云或少云的数据难以满足覆盖整体的要求。而中高空间分辨率数据一方面能满足水体信息准确提取的要求,另一方面能满足覆盖整体范围的需求。本文以2013–2017年雨季(5–10月)覆盖整个海南岛陆域范围的高分1号WFV传感器产品及Landsat 8 OLI多光谱与全色波段融合后的数据为数据源,空间分辨率分别为16 m、15 m,云量均低于9%,其中高分1号WFV影像数据来源于中国资源卫星应用中心(http://www.cresda.com/CN/),Landsat 8 OLI传感器影像来源于地理空间数据云网站(http://www.gscloud.cn/),遥感影像覆盖范围如图1。


    图1 研究区遥感影像(假彩色合成)图注:图为2017年Landsat 8 OLI数据镶嵌结果,同时以波段5、4、3分别对应R、G、B合成的结果


    1.2 数据处理

    本数据集以经过正射校正、大气校正等预处理后的高分1号及Landsat8 OLI数据为数据源,再通过影像分割,生成能合理表现地物类型,特别是水体信息的影像对象层;选取对象样本进行特征提取,根据最优特征信息构建知识规则集提取水体信息;最后对分类结果进行滤除碎斑、人工修正等后处理,对分类进行精度评价,得到海南岛陆域范围的水体分布产品,具体处理流程如图2。


    图2 数据处理流程图


    1.2.1 数据预处理

    首先结合DEM数据对高分1号数据与Landsat 8数据进行正射校正,消除原本由地势起伏等原因所导致的影像几何畸变[9];再根据数据的定标系数,通过辐射定标消除各种辐射失真[10];同时采用改进的6S大气校正模型进行大气校正,基于查找表逐像元计算的方式,对太阳天顶角、水蒸气、臭氧浓度、气溶胶光学厚度等参数进行敏感性分析,得到每个点的大气校正系数用以修正地表反射率影像,从而消除大气的影响[11]。最终得到研究区域的地表反射率产品。

    1.2.2 水体信息的提取

    首先基于异质性最小原则的区域合并算法FNEA(Fractal Net Evolution Approach),考虑光谱异质性、形状异质性对影像进行多尺度分割,形成影像对象层,统计影像对象层中对象的特征信息,其次基于最小冗余最大相关特征选择算法mRMR(minimum-redundancy maximum-relevancy)选择众多特征中的最优特征子集,具体包括水体指数、灰度共生矩阵GLCM(Grey Level Concurrence Matrix)信息熵、形状特征中长宽比,构建知识规则集,提取水体。所选的水体指数中包括由Mcfeeters在1996年提出的归一化水体指数NDWI、徐涵秋[12]提出的改进的归一化水体指数MNDWI及混合水体指数[13](CIWI),其中NDWI是利用绿光波段与近红外波段水体与非水体的波谱差异提取水体信息,MNDWI是针对土壤、建筑物在绿光波段和近红外波段波谱特征与水体几乎一致,易与水体造成混淆的问题提出的基于近中红外(MIR)波段与绿光波段组合提取水体的方法,使水体识别精度得到进一步改善,但是仍有部分城镇信息混合在水体中,同时对于高分1号影像,缺乏参与计算的近中红外波段,存在一定的局限性;而混合水体指数则是在分析NDWI与MNDWI优缺点和各波段光谱特征的基础上,用近红外波段与近红外波段均值的比值构造一个无量纲参数NIR,再将其与归一化植被指数NDVI求和,增强水体与其他地物的差异,同时也能运用于高分一号影像中,计算公式如下:

    \(CIWI=\frac{NIR-R}{NIR+R}+\frac{NIR}{{NIR}_{mean}}\) (1)

    式中CIWI为混合水体指数,NIR为遥感影像中的近红外波段,NIRmean 为遥感影像中的近红外波段像素均值,R为遥感影像中的红光波段。在进行特征优选过程中发现这3种特征具有较强相关性,为提高计算效率,选取其中对水体信息提取贡献最大的CIWI指数进行分类,具体步骤包括:首先利用CIWI提取出大致水体范围。此范围中除了水体信息,还包含部分云层、山体阴影信息。再通过调节长宽比特征阈值,选取长宽比阈值剔除山体阴影信息。通过调节信息熵阈值,提取出云层信息,结合前后时期的影像信息人工判读云层覆盖范围的地表土地利用类型。最后对提取出的水体信息进行碎斑去除等后处理,整理出水体分布产品,结合验证点对最后分类结果进行精度评价。

    2 数据样本描述

    数据以年份命名,包括5个年份的海南岛水体分布矢量图。在ArcGIS软件中打开由面向对象规则集分类提取出的结果文件,对图斑进行显示和颜色填充,得到2013–2017年的水体分布图(图3)。


    (a)

    (b)

    (c)

    (d)

    (e)

    图3 2013–2017年海南岛水体分布图(a)2013年海南岛水体分布 (b)2014年海南岛水体分布(c)2015年海南岛水体分布 (d)2016年海南岛水体分布(e)2017年海南岛水体分布


    3 数据质量控制和评估

    3.1 数据质量定性评估

    为保证数据质量,在进行水体提取都是云量较低的数据,同时对于其中存在的部分云覆盖的地区则是通过临近日期无云影像中所表现的地物类型采用人工判读的方式进行信息填补,减少云覆盖对水体分布的影响;而在季节对水体影响方面,则是考虑到海南岛分为明显的旱雨两季,为避免季节降水变化对水体分布产生影响,选用的数据均为每年5–10月的雨季影像,提取的是雨季的水体分布,一定程度上减少了季节降水差异对水体分布的影响。

    数据提取结果在空间分布上,水体信息呈辐射状分布,东多西少,与海南岛中东部丘陵山地迎风坡多雨,西部地区滨海山地背风少雨这一特征相符;同时数据集在数据的形态上,兼顾了整体信息与细节信息,不仅覆盖了大范围河流湖泊等信息,还包括如坑塘等分布零散的水体信息;由于影像空间分辨率较高,地物细节表现较明显,如一些桥梁、河道周边植被等信息与水体的区分造成了水体分布的分段分布(图4),但总体水体特征表现较好。


    (a)

    (b)

    图4 数据集局部细节示意图(a)坑塘、河道周边植被在遥感影像中的显示(左)及对应信息的提取结果显示(右)(b)桥梁信息在遥感影像中的显示(左)及对应信息的提取结果显示(右)


    在数据属性上,2013–2017年间雨季水体面积信息表现出与降水量信息的相关性,这符合海南省水资源变化受降水量变化影响大这一特点。具体表现在5年中2013年水体面积最大,其降雨量均高于其他年份,达到2393.7 mm,比多年平均降水量高36.9%,属于丰水年;2015年水体面积最小,其降水量为1403.5 mm,低于其他年份,同时比平均年份低19.8%,属于枯水年;其他3个年份水体面积也体现出与降水量的正相关关系,总体体现出数据集的合理性。

    3.2 数据质量定量评估

    利用ArcGIS软件中Create Random Point工具,在研究区域范围随机生成300个验证点(图5),结合不同时期的Google earth影像数据与部分高分1号PMS传感器2 m空间分辨率影像数据确定验证点的属性值,与分类结果构建误差矩阵进行精度评价,如表1–5。混淆矩阵中用户精度是指从分类结果中任取一个随机样本,其所具有的类型与地面实际类型相同的条件概率。生产精度指分类中某一类别正确分类的像元数占这一类别所有像元数的比例。总体精度为所有样本中被正确分类的样本比例。Kappa系数则用于反映整体的分类精度,系数越接近1,分类质量越好。


    图5 验证样本点分布图


    表1 2013年海南岛水体分类精度验证混淆矩阵

    水体 非水体 总计 生产精度
    水体 142 16 158 89.87%
    非水体 7 135 142 95.07%
    总计 149 151 300
    用户精度 95.3% 89.40%
    总体精度:92.33%;Kappa系数:84.67%


    表2 2014年海南岛水体分类精度验证混淆矩阵

    水体 非水体 总计 生产精度
    水体 133 8 141 94.33%
    非水体 13 146 159 91.82%
    总计 146 154 300
    用户精度 91.09% 94.81%
    总体精度93.00%:;Kappa系数:85.98%


    表3 2015年海南岛水体分类精度验证混淆矩阵

    水体 非水体 总计 生产精度
    水体 125 22 147 85.03%
    非水体 7 146 153 95.42%
    总计 132 168 300
    用户精度 94.70% 86.90%
    总体精度:90.33%;Kappa系数:80.61%


    表4 2016年海南岛水体分类精度验证混淆矩阵

    水体 非水体 总计 生产精度
    水体 138 12 150 92.00%
    非水体 5 145 150 96.67%
    总计 143 157 300
    用户精度 96.50% 92.36%
    总体精度:94.33%;Kappa系数:88.66%


    表5 2017年海南岛水体分类精度验证混淆矩阵

    水体 非水体 总计 生产精度
    水体 139 10 149 93.28%
    非水体 4 147 151 97.35%
    总计 143 157 300
    用户精度 97.20% 93.63%
    总体精度:95.33%;Kappa系数:90.66%


    2013–2017年总体分类结果精度都较高,Kappa系数均大于0.8,其中2017年分类精度最高,Kappa系数为90.66%;2013年和2014年精度略低于2016年和2017年,与验证样本点的属性部分以近年土地利用属性为依据,与2013年和2014年真实地物属性存在差异,造成的验证误差有关;2015年精度最低,非水体误分为水体的情况较多,主要是由于2015年部分影像中云量较高,云与云层阴影易误分为水体,导致水体提取的生产者精度偏低,但就总体而言,分类效果都较好,漏提率、误提率较低,均能达到水体分布产品制图要求。

    4 数据使用方法和建议

    本数据集是基于中高空间分辨率遥感数据提取得出的5个年份的水体分布数据产品,可比较好地识别小面积湖泊、河流等水域,且分类精度较高,可为水资源时空分布研究提供数据支持,为区域水质水安全等方面的研究提供基础底图,同时可以服务于水资源变化和环境变化研究。

    致 谢

    感谢地理空间数据云(http://www.gscloud.cn/)提供Landsat 8 OLI数据、GDEM DEM 30 m空间分辨率数字高程数据,中国资源卫星应用中心(http://www.cresda.com/CN/)提供高分1号数据。

    参考文献

    1. QIAO X J, HE B Y, ZHANG W, et al. Modis-based retrieval and change analysis of suspended sediment concentration in middle Yangtze river[J]. Resources & Environment in the Yangtze Basin, 2013.
    2. LUO S, HU H X, CHENG S P, et al. A primary study on species diversity of water birds and its pelationship to water environment at lake Jinyinhu,Wuhan[J]. Resources & Environment in the Yangtze Basin, 2010, 19(6): 671-677.
    3. CHAUMETTE P. Changes in land surface water dynamics since the 1990s and relation to population pressure[J]. Geophysical Research Letters, 2012, 39(8): 85-93.
    4. 李洪波. 海南国际旅游岛建设与水资源保护和发展战略[J]. 新东方, 2012 (3): 18-22.
    5. ALDERMAN K, TURNER L R, TONG S. Floods and human health: a systematic review[J]. Environment International, 2012, 47(16): 37-47.
    6. PIERDICCA N, PULVIRENTI L, CHINI M, et al. Observing floods from space: Experience gained from COSMO-SkyMed observations[J]. Acta Astronautica, 2013, 84(84): 122-133.
    7. FENG M, SEXTON J O, CHANNAN S, et al. A global, high-resolution (30-m) inland water body dataset for 2000: first results of a topographic–spectral classification algorithm[J]. International Journal of Digital Earth, 2015, 9(2): 1-21.
    8. 廖安平, 陈利军, 陈军, 等. 全球陆表水体高分辨率遥感制图[J]. 中国科学: 地球科学, 2014(8): 1634-1645.
    9. 赵英时. 遥感应用分析原理与方法[M]. 北京: 科学出版社, 2013.
    10. Markham B, Storey J, Morfitt R. Landsat-8 Sensor Characterization and Calibration[J]. Remote Sensing, 2015, 7(3):2279-2282.
    11. Peng Y, He G, Zhang Z, et al. Study on atmospheric correction approach of Landsat-8 imageries based on 6S model and lookup table[J]. Journal of Applied Remote Sensing, 2016, 10(4):045006.
    12. 徐涵秋. 利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J]. 遥感学报, 2005, 9(5): 589-595.
    13. 凌成星, 张怀清, 林辉. 利用混合水体指数模型(CIWI)提取滨海湿地水体的信息[J]. 长江流域资源与环境, 2010, 19(2): 152-156.

    数据引用格式

    许芬, 孟庆岩, 张琳琳. 2013–2017年海南岛陆域水体遥感提取数据集[DB/OL]. Science Data Bank, 2018. (2018-12-15). DOI: 10.11922/sciencedb.673.