【问题标题】:R: Bilinear interpolation to fill gaps in RR:双线性插值以填补 R 中的空白
【发布时间】:2018-06-16 23:23:15
【问题描述】:

我有一个网格,其中包含要使用插值填充的间隙 (NA)。我的网格显示 x 和 y 维度的自相关,所以我想尝试双线性插值。我发现的大多数解决方案都集中在“上采样”(为了增加样本数量/网格大小而进行插值),但我不想/不需要更改网格大小。我只想使用插值填充 NA。其他潜在的解决方案do not seem to handle NAs for the input grid of values (the 'z matrix'),或者是neighborhood-based solutions,而不是双线性插值,或者只是have no answer

我发现使用 raster 包,我可以输入一个包含 NA 的网格(作为光栅),并使用“resample”命令输出相同大小的网格。然而,结果看起来像最近邻插值而不是双线性插值。

我是否遗漏了一些东西,例如有一种方法可以使用光栅包进行双线性插值?或者有没有更好的方法来做双线性插值来填充 NA?

library(raster)

# raster containing gap
r <- raster(nrow=10, ncol=10)
r[] <- 1:ncell(r)
r[25] <- NA

# The s raster is the same size as the r raster
s <- raster(nrow=10, ncol=10)
s <- resample(r, s, method='bilinear')
plot(r)
plot(s)
s[25]
s[35]
# s[25] appears to have been filled with neighbor s[35]

更新

Akima 包似乎是上述光栅方法的一个有前途的替代方案,但如果输入值网格(Z 矩阵)中有 NA,我会遇到麻烦。这是一个与上面示例平行的示例来演示。 (同样,我正在插入一个与原始大小相同的网格)。

library(akima)

# Use bilinear interpolation (no NAs in input)
rmat<-matrix(seq(1,100,1), nrow = 10, ncol = 10, byrow = T)
x <- seq(1,10,1)
y <- seq(1,10,1)
smat <- bilinear.grid(x, y, rmat, nx = 10, ny = 10) # works
plot(raster(rmat), main = "original")
plot(raster(smat$z), main = "interpolated")

# Try using bilinear interpolation but with an NA
rmat<-matrix(seq(1,100,1), nrow = 10, ncol = 10, byrow = T)
rmat[3,5] <- NA
x <- seq(1,10,1)
y <- seq(1,10,1)
smat <- bilinear.grid(x, y, rmat, nx = 10, ny = 10) # Error about NAs

更新2

@Robert Hijmans 提出了一个很好的问题,即为什么不在 raster 包中的 focus() 命令中使用移动窗口平均值。原因是我想尝试双线性插值,我不认为移动窗口平均值总是给出与双线性插值相同的答案。但是,这在我发布的示例中并不清楚(在该示例中移动窗口和双线性插值 do 给出了相同的答案),因此我将在下面的新示例中进行演示。请注意,对于下面的示例 (here is a handy calculator for tests),双线性插值解应为 8。

library(raster)
r <- raster(nrow=10, ncol=10)

# Different grid values than earlier examples
values(r) <- c(rep(1:5, 4), rep(4:8, 4), rep(1:5, 4), rep(4:8, 4), rep(1:5, 4))
r[25] <- NA
plot(r)

# See what the mean of the moving window produces
f <- focal(r, w=matrix(1,nrow=3, ncol=3), fun=mean, NAonly=TRUE, na.rm=TRUE) 
f[25] # Moving window gives 5 but bilinear interp gives 8

# Note that this seems to be how the moving window works with equal weights
window_test <- c(r[14:16], r[24:26], r[34:36])
 mean(window_test, na.rm = T)

我在这里遗漏了什么吗?或许焦点()的权重参数有一些巧妙的方法可以产生双线性插值解决方案?

【问题讨论】:

  • 我没有关注你的链接,但你检查过akima 包吗?
  • @BenBolker 是的,akima 包似乎很有希望用于双线性插值,但我在填补空白方面没有成功。我用代码更新了我的问题来演示这个挑战。

标签: r interpolation geospatial


【解决方案1】:

让我们使用等距的单元格来避免因单元格大小随 lon/lat 数据而变化的差异

library(raster)
r <- raster(nrow=10, ncol=10, crs='+proj=utm +zone=1 +datum=WGS84', xmn=0, xmx=1, ymn=0, ymx=1)

对于这个例子,你可以使用focal

values(r) <- 1:ncell(r)
r[25] <- NA
f <- focal(r, w=matrix(1,nrow=3, ncol=3), fun=mean, NAonly=TRUE, na.rm=TRUE) 

我看到您忽略了“基于邻域的解决方案而不是双线性插值”。但问题是为什么。在这种情况下,您可能需要基于邻域的解决方案。

更新。再说一次,如果单元格不是近似正方形,双线性将是更可取的。

values(r) <- c(rep(1:5, 4), rep(4:8, 4), rep(1:5, 4), rep(4:8, 4), rep(1:5, 4))
r[25] <- NA

双线性插值的问题通常使用 4 个连续的单元格,但在这种情况下,如果您想要单元格中心的值,则适当的单元格将是单元格本身的值,因为到该单元格的距离是零,因此这就是插值结束的地方。例如,对于单元格 23

extract(r, xyFromCell(r, 23))
#6
extract(r, xyFromCell(r, 23), method='bilinear')
#[1] 6

在这种情况下,焦点单元格为 NA,因此您将获得焦点单元格和另外 3 个单元格的平均值。问题是哪三个?这是任意的,但要使其工作,NA 单元必须获得一个值。 raster 算法将 NA 单元格下方的值分配给该单元格(此处也是 8)。我认为这可以很好地处理边缘的 NA 值(例如陆地/海洋),但在这种情况下可能不是。 ` 提取(r,xyFromCell(r,25)) #不适用 提取(r,xyFromCell(r,25),方法='双线性') #[1] 8

这也是resample 所提供的

resample(r, r)[25]
# 8

这也是在线计算器的建议吗?

这对微小的变化非常敏感

extract(r, xyFromCell(r, 25)+0.0001, method='bilinear')
#[1] 4.998997

在这种情况下,我真正想要的是 rook-neighbors 的平均值

mean(r[adjacent(r, 25, pairs=FALSE)])
[1] 6

或者,更一般地说,局部反距离加权平均值。你可以计算 通过使用焦点设置权重矩阵

# compute weights matrix
a <- sort(adjacent(r, 25, 8, pairs=F, include=TRUE))
axy <- xyFromCell(r, a)
d <- pointDistance(axy, xyFromCell(r, 25), lonlat=F)
w <- matrix(d, 3, 3)
w[2,2] <- 0
w <- w / sum(w)

# A simpler approach could be: 
# w <- matrix(c(0,.25,0,.25,0,.25,0,.25,0), 3, 3)


foc <- focal(r, w, na.rm=TRUE, NAonly=TRUE)
foc[25]

在这个例子中这很好;但如果焦点区域中有多个 NA 值(因为权重之和不再为 1),则将不正确。我们可以通过计算权重之和来纠正这一点

x <- as.integer(r/r)
sum_weights <- focal(x, w, na.rm=TRUE, NAonly=TRUE)

fw <- foc/sum_weights
done <- cover(r, fw)
done[25]

【讨论】:

  • 好问题,我在问题中添加了第二个更新,并举例说明了我为什么不考虑基于邻域的解决方案。新示例更类似于我的真实数据。也许有一些聪明的东西可以用焦点()中的权重参数来完成,我还没有想到。
  • 我已经扩展了我的答案
猜你喜欢
  • 2019-09-30
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-07-31
  • 2015-08-19
  • 2021-07-24
  • 1970-01-01
相关资源
最近更新 更多