【问题标题】:Why does InterpolatedUnivariateSpline return nan values为什么 InterpolatedUnivariateSpline 返回 nan 值
【发布时间】:2015-05-20 03:23:12
【问题描述】:

我有一些数据,yx,我想使用三次样条以更精细的分辨率进行插值 xx

这是我的数据集:

import numpy as np
print np.version.version
import scipy
print scipy.version.version   

1.9.2
0.15.1

x = np.array([0.5372973, 0.5382103, 0.5392305, 0.5402197, 0.5412042, 0.54221, 0.543209,
              0.5442277, 0.5442277, 0.5452125, 0.546217, 0.5472153, 0.5482086,
              0.5492241, 0.5502117, 0.5512249, 0.5522136, 0.5532056, 0.5532056,
              0.5542281, 0.5552039, 0.5562125, 0.5567836])
y = np.array([0.01, 0.03108, 0.08981, 0.18362, 0.32167, 0.50941, 0.72415, 0.90698,
              0.9071, 0.97955, 0.99802, 1., 0.97863, 0.9323, 0.85344, 0.72936,
              0.56413, 0.36997, 0.36957, 0.17623, 0.05922, 0.0163, 0.01, ])

xx = np.array([0.5372981, 0.5374106, 0.5375231, 0.5376356, 0.5377481, 0.5378606,
               0.5379731, 0.5380856, 0.5381981, 0.5383106, 0.5384231, 0.5385356,
               0.5386481, 0.5387606, 0.5388731, 0.5389856, 0.5390981, 0.5392106,
               0.5393231, 0.5394356, 0.5395481, 0.5396606, 0.5397731, 0.5398856,
               0.5399981, 0.5401106, 0.5402231, 0.5403356, 0.5404481, 0.5405606,
               0.5406731, 0.5407856, 0.5408981, 0.5410106, 0.5411231, 0.5412356,
               0.5413481, 0.5414606, 0.5415731, 0.5416856, 0.5417981, 0.5419106,
               0.5420231, 0.5421356, 0.5422481, 0.5423606, 0.5424731, 0.5425856,
               0.5426981, 0.5428106, 0.5429231, 0.5430356, 0.5431481, 0.5432606,
               0.5433731, 0.5434856, 0.5435981, 0.5437106, 0.5438231, 0.5439356,
               0.5440481, 0.5441606, 0.5442731, 0.5443856, 0.5444981, 0.5446106,
               0.5447231, 0.5448356, 0.5449481, 0.5450606, 0.5451731, 0.5452856,
               0.5453981, 0.5455106, 0.5456231, 0.5457356, 0.5458481, 0.5459606,
               0.5460731, 0.5461856, 0.5462981, 0.5464106, 0.5465231, 0.5466356,
               0.5467481, 0.5468606, 0.5469731, 0.5470856, 0.5471981, 0.5473106,
               0.5474231, 0.5475356, 0.5476481, 0.5477606, 0.5478731, 0.5479856,
               0.5480981, 0.5482106, 0.5483231, 0.5484356, 0.5485481, 0.5486606,
               0.5487731, 0.5488856, 0.5489981, 0.5491106, 0.5492231, 0.5493356,
               0.5494481, 0.5495606, 0.5496731, 0.5497856, 0.5498981, 0.5500106,
               0.5501231, 0.5502356, 0.5503481, 0.5504606, 0.5505731, 0.5506856,
               0.5507981, 0.5509106, 0.5510231, 0.5511356, 0.5512481, 0.5513606,
               0.5514731, 0.5515856, 0.5516981, 0.5518106, 0.5519231, 0.5520356,
               0.5521481, 0.5522606, 0.5523731, 0.5524856, 0.5525981, 0.5527106,
               0.5528231, 0.5529356, 0.5530481, 0.5531606, 0.5532731, 0.5533856,
               0.5534981, 0.5536106, 0.5537231, 0.5538356, 0.5539481, 0.5540606,
               0.5541731, 0.5542856, 0.5543981, 0.5545106, 0.5546231, 0.5547356,
               0.5548481, 0.5549606, 0.5550731, 0.5551856, 0.5552981, 0.5554106,
               0.5555231, 0.5556356, 0.5557481, 0.5558606, 0.5559731, 0.5560856,
               0.5561981, 0.5563106, 0.5564231, 0.5565356, 0.5566481, 0.5567606])

我正在尝试使用 scipy InterpolatedUnivariateSpline 方法进行拟合,用三阶样条线 k=3 进行插值,并外推为零 ext='zeros'

import scipy.interpolate as interp
yspline = interp.InterpolatedUnivariateSpline(x,y, k=3, ext='zeros')
yvals = yspline(xx)

import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(x, y, 'ko', label='Values')
ax.plot(xx, yvals, 'b-.', lw=2, label='Spline')
plt.xlim([min(x), max(x)])

但是,正如您在这张图片中看到的,我的样条线返回 NaN 值 :( 有原因吗?我很确定我的 x 值都在增加,所以我很难理解为什么会这样。我有许多其他数据集我正在使用这种方法进行拟合,并且它只在这组特定的数据上失败。

非常感谢任何帮助。 感谢您的阅读。

编辑!

解决方案是我有重复的 x 值,但 y 值不同!

【问题讨论】:

  • 嗨@jakebrinkmann,你能写下你自己的答案并接受它吗,因为现在你根据自己的编辑接受了错误的答案!部分。

标签: python scipy cubic-spline


【解决方案1】:

对于这种插值,您应该使用scipy.interpolate.interp1dkind='cubic' 参数(参见related SO question

我还没有找到可以在实践中使用InterpolatedUnivariateSpline 的用例(或者我可能只是不明白它的用途)。我得到了你的代码,

所以插值有效,但显示出极强的振荡,使其无法使用,这通常是我过去使用这种插值方法得到的结果。使用低阶样条(例如k=1)效果更好,但您会失去三次插值的优势。

【讨论】:

  • 但是,我的数据y 范围是[0,1]。这种振荡在 1E10 的量级上,所以我可以通过点之间的线性插值得到更好的结果......我的数据集是问题吗,也许这个数据太稀疏了?
  • 正如我所说,这是我对 InterpolatedUnivariateSpline 或相应的 2D 插值器的一般经验。有人可以证实这一点吗?即使数据稀疏,一般插值器函数也不应该返回+-1e13 范围内的振荡,除非我遗漏了什么。
  • 嗯,我用这个数据尝试了 IDL 编程语言:IDL> yvals = spline(x, y, xx) % Program caused arithmetic error: Floating divide by 0 % Program caused arithmetic error: Floating illegal operand 并得到了-NaN 结果......它一定是数据集
  • 实际上,数据的唯一挑战是您有 2 个点具有相同的 x 值但不同的 y,这似乎是三阶插值器 @987654335 的问题@和interp1d
  • 是的,删除我重复的 x 值解决了问题!我想很难推导出一个 X 值相同但 Y 值不同的函数。谢谢楼主
【解决方案2】:

我也遇到了InterpolatedUnivariateSpline 返回 NaN 值的问题。但在我的情况下,原因不是x 数组中存在重复,而是因为x 中的值递减,而docs 声明值“必须递增 "。
因此,在这种情况下,必须提供相反的 xy 而不是原始的:x[::-1]y[::-1]

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-05-10
    • 2013-08-06
    • 1970-01-01
    • 2010-11-28
    • 1970-01-01
    • 1970-01-01
    • 2021-06-25
    • 2020-01-07
    相关资源
    最近更新 更多