主题一:细粒度语义分割赛道



(1)赛道背景

遥感图像语义分割竞赛即利用遥感图像中各类地物光谱信息和空间信息进行分析, 将图像中具有语义信息的各个像元分别赋予语义类别标签。 本项竞赛以包含典型土地利用分类的光学遥感图像为处理对象, 参赛队伍使用主办方提供的遥感图像进行土地利用类型语义分割处理, 主办方依据评分标准对检测识别结果进行综合评价。

(2)赛道任务

细粒度语义分割赛道依据现有的遥感地物分类要求, 结合现有的地物分类实际需求,参照地理国情监测、 “三调”等既有地物分类标准,依据遥感地物“所见即所得”原则, 设计地物要素分类体系,共涉及一级大类8种,二级子类52种,详情见表1。

表1:地物要素分类说明
一级分类 二级分类 参考说明
种植土地 水田 综合考虑农情信息,水田主要为水稻。
种植土地 旱地 旱地与水田相比,通常丘陵平原地区的旱地地块较水田田块大, 在机械化水平较高的地区旱地地块一般呈长条状。 山区半山区由于地形原因常常不规则,种植作物种类较多,色调多样。
种植土地 果园 指被人工种植的果树覆盖的连片区域。果树主要是指能生产人类食用果实的木本或多年生草本植物。
种植土地 茶园 指被人工种植的茶树覆盖的连片区域。
种植土地 桑园 指被人工种植的桑树覆盖的连片区域。
种植土地 橡胶园 指被人工种植的橡胶树覆盖的连片区域。
种植土地 苗圃 指被人工繁殖、培育的苗木成片覆盖的地表。
种植土地 花圃 指以生产草本花卉为目的,由人工繁殖、培育的草本花卉成片覆盖的地表。
种植土地 其他经济苗木 指被人工种植的其他多年生藤本经济作物覆盖的连片区域。
林草覆盖 乔木林 由具有高大明显主干的非攀缘性多年生木本植物为主体(乔木树冠覆盖面积占65%以上) 构成的片林或林带,高度一般大于5米。
林草覆盖 灌木林 由生长低矮的多年生灌木型木本植物为主体 (灌木树冠覆盖面积占木本植物总覆盖面积65%以上) 构成的植被,覆盖度大于30%,高度一般低于5米。
林草覆盖 乔灌混合林 由乔木和灌木交替生长混合覆盖但两者林冠覆盖面积各自都不超过65%(含), 且树木总体覆盖度大于30%的地表。
林草覆盖 竹林 全部由各类竹子组成的纯林或仅混生少量针阔叶树种的植被类型。
林草覆盖 疏林 指由各类林木组成但覆盖度较低,郁闭度在0.1~0.2的林地。
林草覆盖 绿化林地 城镇等人口集中居住范围内的街巷、零星地块、 街心花园以及道路隔离绿化带等范围内人工种植的 绿化树木覆盖形成的小面积片状或带状区域(不包括楼顶种植的树木)。 仅适用于城镇等人口集中居住范围内的街巷、零星地块、 街心花园以及道路隔离绿化带等范围内为绿化环境而种植的树木形成的小面积林地, 不包括公园内大片的长期自然生长林地。
林草覆盖 人工幼林 以造林为目的,人工种植不久、处于初长阶段、树木矮小、枝叶稀少且树冠覆盖度低于20%的未成林。
林草覆盖 稀疏灌草丛 在荒漠或植被稀疏地区丘团状生长的低矮灌木或灌草丛,成群分布,但平均覆盖度低于30%、大于10%的地表。
林草覆盖 天然草地 以天然生长或半人工培育的草本植物为主覆盖的地表。 一般未经改良或经过不破坏天然植被条件下的改良,用于放牧或割草, 包括以牧为主的树木覆盖度在10%以下的疏林草地和灌丛草地。
林草覆盖 人工草地 通过耕翻、完全破坏、清除原有天然植被后,人为播种、 栽培建植的以草本植物为主体的人工植被及其生长的土地, 包含人工栽植林木覆盖度小于10%的人工疏灌丛群落或疏林群落及其生长的土地。 包括饲用为主要目的的人工牧草地和特殊用途如改善环境的绿化草地。
房屋建筑 多层及以上房屋建筑区 层高在4层或以上,或楼高10米以上,或在高分辨率遥感影像上有明显阴影的房屋建筑为主的区域。
房屋建筑 低矮房屋建筑区 层高在1-3层、或楼高10米以下、或在高分辨率遥感影像上无明显阴影的房屋建筑为主的区域。
房屋建筑 废弃房屋建筑区 人口整体迁移、无人居住、废弃的农村地区连片房屋建筑区。
房屋建筑 多层及以上独立房屋建筑 层高在4层及以上、或楼高10米以上的独立房屋建筑。
房屋建筑 低矮独立房屋建筑 层高在3层及以下、或楼高10米以下的独立房屋建筑。
铁路与道路 铁路 铁路指被火车行车轨道及路基覆盖的地表。
铁路与道路 公路 连接城市间的道路,又称城际公路,包括国道、省道、县道、乡道、 专用公路以及公路之间的连接道。专用公路包括但不限于林区公路、 厂矿道路、边境巡逻道路等供专业车辆通行有专门用途的道路。
构筑物 硬化地表 使用水泥、沥青、砖石、夯土等材料连片露天铺设的地表, 或由于人类社会经济活动经常性碾压、踩踏形成的裸露地表。 包括人工长期堆积的各种矿物、尾矿、弃渣、垃圾、沙土、岩屑等(人工堆积物)覆盖的地表等。
构筑物 水工设施 为消除水害和开发利用水资源而修建的工程设施。
构筑物 城墙 古代城墙,包括长城和城市古城墙。
构筑物 温室、大棚 用来栽培植物或用于养殖的能透光和保温(或加温)的设施, 农业大棚为具有一定规模、排列紧密整齐,条状浅蓝绿色或白色窄形。
构筑物 固化池 用建筑材料修建的具有规则几何形态(多呈方形或圆形)的露天池沼覆盖的地表。 包括游泳池、污水处理池、晒盐池及其他类型固化池。
构筑物 工业设施 露天安置的大型工业设备设施包括采油、炼油、储油、炼钢、发电、输电等设施。
构筑物 沙障 为消减风速、固定流动或半流动沙丘,用柴草、秸秆、粘土、树枝、板条、卵石等物料在沙面上连片建构的障蔽物。
构筑物 其他构筑物 其他未分类的人工构筑物。
人工堆掘地 露天采掘场 露天开采对原始地表破坏后长期出露形成的地表, 如露天采掘煤矿、铁矿、铜矿、稀土、石料、沙石以及取土等活动人工形成的裸露地表。
人工堆掘地 堆放物 人工长期堆积的各种矿物、尾矿、弃渣、垃圾、沙土、岩屑等(人工堆积物)覆盖的地表。
人工堆掘地 建筑工地 自然地表被破坏,正在进行土木建筑工程施工的场地区域,城镇中的房屋拆迁待建区域也算。
人工堆掘地 其他人工堆掘地 未分类的其他人工堆掘地。
荒漠与裸露地 盐碱地表 指表层裸露物以盐碱为主的地表。
荒漠与裸露地 泥土地表 指表层裸露物以泥质或裸土为主的地表。
荒漠与裸露地 沙质地表 指表层裸露物以沙质为主的地表,包括沙漠、沙滩等。
荒漠与裸露地 砾石地表 指表层裸露物以块状砾石为主的地表。
荒漠与裸露地 岩石地表 指表层裸露物以基岩为主的地表。
水域 河渠 带状或线状水域。
水域 水面 湖盆及其承纳的水体、海面等水表面。
水域 冰川与常年积雪 常年被冰雪覆盖的地表。包括粒雪原和冰川的范围。
背景 背景 没有人工标注的区域。

依据所述地物要素分类标准与星载遥感影像处理实际需求, 以多种地物要素的高分光学遥感图像的像素级分类为目标,设计赛题如下:

a. 初赛:算法在地物要素按一级大类(9类)分类的能力。进阶考察算法地物要素分类的准确性;

b. 复赛:算法在地物要素按二级子类(47类)分类的能力, 考察算法分类的准确性、测试数据尺寸变化的适应性和可复现性;

c. 决赛:算法在地物要素按二级子类(47类)分类的能力。 进阶考察现场答辩评议,嵌入式环境的适应性(模型复杂度及效率),算法分类的准确性,支持统一的接口调用;

(3)数据简介

(1)来源:数据为0.8米-2米分辨率的遥感图像, 由武汉大学测绘遥感信息工程国家重点实验室和武汉大学遥感信息工程学院联合相关单位合作采集、 标注、构建;

(2)规模:总体6万+遥感影像语义分割样本数据;

(3)用途:土地利用动态监测,矿产资源开发状况和地质灾害的调查与监测; 生态环境监管调查与评价,水环境监测与评估,空气环境监测与评价;耕地数量与质量调查。

(4)数据说明

a.原始影像: 影像格式为tif,包含R、G、B、NIR四个波段, 初赛训练集影像尺寸为512*512像素,仅采用R、G、B三个波段; 测试集影像尺寸为512*512像素,复赛/决赛采用四个波段。

b.标签数据:标签格式为单通道的png,每个像素的标签值由一个数字表示, 使用‘uint8’数据类型存储,一级类别共分为9类,一级类别如表3所示:

初赛类别 标注数字
背景 0
种植土地 1
林草覆盖 2
房屋建筑 3
铁路与道路 4
构筑物 5
人工堆掘地 6
荒漠与裸露地 7
水域 8

二级类别共分为47类,二级类别如表4所示:

复赛类别 标注数字 复赛类别 标注数字
背景 0 公路 24
旱地 1 铁路 25
果园 2 硬化地表 26
茶园 3 水工设施 27
桑园 4 城墙 28
橡胶园 5 温室、大棚 29
苗圃 6 固化池 30
花圃 7 工业设施 31
其他经济苗木 8 沙障 32
乔木林 9 其他构筑物 33
灌木林 10 露天采掘场 34
乔灌混合林 11 堆放物 35
竹林 12 建筑工地 36
疏林 13 其他人工堆掘地 37
绿化林地 14 盐碱地表 38
人工幼林 15 泥土地表 39
稀疏灌草丛 16 沙质地表 40
天然草地 17 砾石地表 41
人工草地 18 岩石地表 42
多层及以上房屋建筑区 19 河渠 43
低矮房屋建筑区 20 水面 44
废弃房屋建筑区 21 冰川与常年积雪 45
多层及以上独立房屋建筑 22 水田 46
低矮独立房屋建筑 23
(5)提交要求
初赛:

提交zip格式压缩包,可解压缩出名称为results的文件夹, results文件夹中包括和测试集预测图片同名的.png文件, 如预测图片中包含a.tif, 则预测结果中必须有对应预测结果a.png, 其中a.png的数据格式和提供的训练集的标注文件保持一致。

复赛:具体细则将于初赛结束后提供。
(6)提交示例
初赛:

示例:

results.zip

——results

————1.png

————2.png

……

复赛:具体细则将于初赛结束后提供。
(7)评测标准

初赛和复赛使用国际通用指标加权交并比FWIoU, 根据每个类出现的频率为其设置权重,具体计算公式为:

其中,N为类别数量,Sij代表真值类别为i的像素被分为第j类的个数。

注意

1、评审说明
- 初赛排行榜使用初赛测试集进行分数判别,初赛阶段前将发布相应测试集;
- 主观评审规则将由组委会统一发布;
- 决赛加分项:基于昇腾的算法模型,决赛成绩可加分(细则待复赛结束后公布)。

2、本次比赛不允许选手自主使用外部数据集和预训练模型(ImageNet除外) 和对数据集进行人为标注修改等,仅允许使用开源ImageNet预训练模型。

3、数据使用规则:测试集只允许用于推理流程 (推理流程的定义:输入为测试集数据, 经过携带参数的模型计算,得出推理结果的过程),不允许使用伪标签等操作。