空间统计学:快速理解反距离加权法(IDW)

浪浪山猪 2024-06-16 11:01:03 阅读 77

空间插值

说到反距离加权法,首先我们要先了解空间插值的概念

对于一个平面,我们并不能获取所有区域的精确信息,所以一般情况下,我们通过采样的方式只获取部分点的信息。然后通过空间插值,计算出一个区域所有的数据

d791a7191d254d26b72f4fd2ddf7c43a.png

左图我采样了部分点的高程数据,右图我通过这部分高程数据,通过空间插值计算出所有区域的数据。

具体插值原理是什么呢,见下图

73d23302c11746c0aa4851c3b5bbcded.png

 9和10是数据已知的点,那么我通过两点的数据,结合它们之间的距离,我就可以估算出红点的具体数据。

对于空间上的点来说,未知值的点与样本点之间的距离决定了其最终值的估计。

那么具体他是怎么结合距离数据和本身的值计算位置数据的呢?常用的插值方法包括反距离加权法(IDW)、克里金(Kriging)等。那么本篇文章就是讲解其中之一的反距离加权法。

反距离加权法(IDW)

反距离加权法(Inverse Distance Weighting, IDW)是一种常见的空间插值方法,常用于将已知分散的样点数据插值为连续的地表或地下场景。下面是反距离加权法的简要步骤:

确定待插值位置和已知样点位置。根据待插值位置与已知样点的欧几里得距离(或其他距离指标),计算每个样点的权重,一般权重与距离的倒数成正比。使用每个样点的权重对其函数值进行加权平均,得到插值结果。

下面详细解释这三个步骤:

1. 确定待插值位置和已知样点位置

首先我们需要确定待插值位置的坐标和范围,以及已知样点的坐标和数值。

2. 计算权重

对于每个待插值位置,我们需要计算它与所有已知样点的距离,并将距离转化为权重。一般来说,样点与待插值位置之间的欧几里得距离越小,样点对插值结果的影响就越大,因此权重与距离成反比,可使用以下公式计算:

19978f4216684084828008426447332f.png

其中 wi​ 是第 i 个样点的权重,di​ 是该样点与待插值位置的距离,p 是一个可调参数,一般取值为 2 (欧几里得距离)或 3 (曼哈顿距离),也可以通过交叉验证等方法来确定最优的 p 值。 

3. 加权平均求解

计算出每个已知样点的权重后,我们可以将它们的函数值进行加权平均,得到待插值位置的函数值。具体地,设已知样点的个数为 N,第 i 个样点的坐标为 (xi​,yi​),权重为 wi​,函数值为 zi​,则待插值位置的函数值z(x,y) 可以通过以下公式计算:

e5f69fd28fea4e69965721bf799f7642.png

 其中分子为各样点函数值乘以对应权重的总和,分母为权重之和,它们的比值即为插值结果。

反距离加权法的优缺点

反距离加权法的主要优点是简单易用,而且在样点分布相对均匀的情况下效果较好。它也有一些缺点,例如插值结果表现出的锯齿状特征、函数值抖动等问题。为解决这些问题,通常需要采用其他空间插值方法,例如径向基函数插值(Radial Basis Function, RBF)、克里金插值等。

代码实现

使用 Python 的 Matplotlib 库生成反距离加权法(IDW)插值示意图

import numpy as npimport matplotlib.pyplot as pltfrom scipy.interpolate import Rbf# 构造样点数据np.random.seed(0)x = np.random.rand(20) * 10 - 5y = np.random.rand(20) * 10 - 5z = np.sin(np.sqrt(x**2 + y**2))xi, yi = np.meshgrid(np.linspace(-5, 5, 50), np.linspace(-5, 5, 50))# 计算插值结果rbf = Rbf(x, y, z, function='inverse')zi = rbf(xi, yi)# 绘制示意图plt.imshow(zi, cmap='rainbow', extent=(-5, 5, -5, 5))plt.colorbar()plt.scatter(x, y, c=z, cmap='rainbow', edgecolors='black', linewidths=1)plt.title('Inverse Distance Weighting Interpolation')plt.xlabel('X')plt.ylabel('Y')plt.show()

 解释代码:

第一部分:

当我们使用反距离加权法对二维数据进行插值时,需要确定已知样点的位置和对应数值,以及待插值位置的坐标。内容包括通过numpy库生成20个随机的二维坐标点,并在这些点上计算对应的函数值。在x轴和y轴上各取50个均匀分布的点,形成二维网格,作为插值结果的横纵坐标。

第二部分:

利用scipy库中的Rbf函数进行插值,并指定插值函数为inverse distance weighting(IDW)。

第三部分:

将插值结果用彩虹色表现出来,并添加颜色条、散点图等元素,以便更好地展示

结果

13fbbaf2f35a4acb921fc70a8e97f75b.png

其中:

圆点表示已知样点,每个样点都有一个数值。彩色网格表示未知区域,我们需要计算这些位置的数值。网格上的每个颜色块表示对应位置的插值结果,颜色越深表示对应位置的数值越大。

通过反距离加权法,可以计算未知区域内每个网格点的数值。以左上角网格点为例,其数值可通过对已知样点进行加权平均得到,权重与样点间的距离成反比,距离越近的样点权重越大。最终得到的插值结果可用于制图、分析等用途。

在该图中,我们可以观察到:

插值结果整体呈现出类似于圆形的形状,与样点分布的形状有关。在样点位置附近,插值结果的颜色更深,数值更大;而在远离样点的位置,插值结果的颜色较浅,数值较小。样点之间的插值结果呈现出类似于“锯齿状”的形态,在实际应用过程中需要注意。

总的来说,反距离加权法是一种简单而有效的空间插值方法,适用于各种数据类型和应用领域。



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。