土地出让结果公告数据(含所属省市区县与经纬度)

我们根据上一个版本的土地出让结果公告数据,为方便大家做研究,最近我们又对这份数据做了全面的清洗和更新,目前最新数据已更新至 2025年12月31日。
这次更新主要针对行政区划不统一和坐标解析的问题进行了深度优化,具体更新内容如下:
1. 行政区划标准化(统一至2021年)
由于原始数据跨度年份较长,早期的行政区划代码和名称与现在存在差异。为了方便大家直接匹配使用,我将所有地块的省、市、县及其对应的代码,全部统一标准化到了 2021年 的行政区划标准。
由于原始数据跨度年份较长,早期的行政区划代码和名称与现在存在差异。为了方便大家直接匹配使用,我将所有地块的省、市、县及其对应的代码,全部统一标准化到了 2021年 的行政区划标准。
2. 经纬度解析与坐标系转换
- 坐标解析:通过高德和百度地图的地理编码接口,重新解析了地块的经纬度,并显著提升了非结构化地址的解析准确率。
- 坐标转换:接口原始获取的是 GCJ02 坐标系,我已经全部转换为 WGS84 坐标系,大家拿到手可以直接在GIS软件或学术论文中使用。
3. 新增地理空间校验变量
为了进一步确保数据的准确性,我利用解析出的经纬度坐标,结合 2021年行政区划地理矢量数据 进行了空间计算与匹配。因此,现在的数据集中包含了两组省市区县变量供大家交叉验证:
为了进一步确保数据的准确性,我利用解析出的经纬度坐标,结合 2021年行政区划地理矢量数据 进行了空间计算与匹配。因此,现在的数据集中包含了两组省市区县变量供大家交叉验证:
- 第一组:基于网站原始“行政区”字段拆分并标准化得到(省、市、县及对应代码)。
- 第二组:基于经纬度空间落图反推得到(省_经纬度解析、市_经纬度解析、县_经纬度解析及对应代码)。
几点使用注意事项:
- 关于数据量:土地市场网会动态增删部分成交公告,因此本数据集的样本量可能与网站实时显示的数量存在细微差异。
- 关于地址精度:由于原始公告中的地块地址大多描述模糊且非结构化(如缺少具体省市前缀),虽然本次更新已大幅优化解析逻辑,但经纬度仍可能存在少量偏差,建议在使用空间数据时结合两组行政区划变量进行交叉核对。
- 关于年份:数据中的“年份”变量均是根据合同签订日期提取生成的。
4. 数据指标:(以2025年为例)
1.年份、2.供地全局唯一标志符、3.省、4.省代码、5.市、6.市代码、7.县、8.县代码、9.行政区划代码、10.编号、11.电子监管号、12.项目名称、13.行业分类、14.土地级别、15.宗地编号、16.土地坐落、17.供地方式、18.供地面积_公顷、19.土地用途、20.出让年限、21.成交价格_万元、22.投资强度_万元每公顷、23.建筑面积_公顷、24.最大建筑密度_百分比、25.最小容积率、26.最大容积率、27.最小绿化率_百分比、28.最大建筑高度_米、29.批准文号、30.批准机关、31.土地使用权人、32.最小建筑密度_百分比、33.最大绿化率_百分比、34.最小建筑高度_米、35.项目序号、36.土地来源、37.约定交地时间、38.约定动工时间、39.约定竣工时间、40.实际交地时间、41.实际动工时间、42.实际交割时间、43.合同签订日期、44.批准日期、45.纬度、46.经度、47.省_经纬度解析、48.省代码_经纬度解析、49.市_经纬度解析、50.市代码_经纬度解析、51.县_经纬度解析、52.县代码_经纬度解析。


