我的矩阵数学比“相当生疏”还要糟糕,但我有一些想法可能会有所帮助。
总体而言,与转换离散点相比,转换图像的信息要多得多。您可能希望研究变换图像的眼睛部分,而不是变换瞳孔点。
无论如何,这是我的想法:
方法一:简单的透视变换
This answer 描述了如何在 Python Imaging Library 中执行透视变换,使用 numpy 计算变换的系数。
将其调整为对点而不是图像进行操作可能很容易(谷歌建议 scipy 具有一些类似于 PIL.Image.transform 的功能,这可能更适用)。如果做不到这一点,您可以将点渲染到二进制图像上,作为黑色背景上的白色像素,然后转换该图像并将点读回。
但是,对于透视变换,您仍然需要一种方法来确定您要变换的平面 pa 的坐标。只需在眼睛周围拟合一个矩形,您就可能获得合理的结果。为此,我可能会旋转您的图形,使其与 X 轴平行,方法是在眼睛的末端之间构建一条线,然后从 0° 旋转该线的角度。然后我会记录边界框,然后将两者都旋转回来。您的飞机将如下所示:
此时,您也许可以提取眼睛主要轮廓的角度,并相应地捏紧您的边界矩形。不过,简单的透视变换可能会被证明是不可靠的。
方法 2:更好的视角转换
给定一组起点和一组终点,几乎可以肯定有一种方法可以从中计算透视变换系数,即使数字大于 4。您可以跳过边界框并假设将每个点转换为它在理想形状上的对应物,然后根据它计算系数。不要问我怎么做,不过,我不知道:P
方法 3:基本拉伸
如果您的“目标形状”与您要转换的形状具有相同数量的点,您可以模拟许多图像编辑程序的拉伸功能。 Photoshop 有一些工具可以让你在形状上拉点来移动它们,拉伸里面的内容。如果您可以重现此行为,您只需将起始形状上的每个点移动到目标形状上的相应点,从而拉伸图像。这可能是最可靠的方法,只需拉伸图像以适合目标形状,然后从新图像中拉出瞳孔。
所有这些方法的问题在于,正常的透视变换永远不会很准确,因为眼睛是弯曲的,而不是扁平的。您不能真正用平面近似眼睛的表面并期望完全准确。即使拉伸(方法 3)也会受到照片角度的影响;它会偏向眼睛的可见侧,并使其看起来好像眼睛向左(他们的右侧)看远比它看的多。 如果照片的角度恒定且已知,您或许可以自行修正。否则,我看不到解决这个障碍的简单方法。
我对高级数学知之甚少,但希望我的想法对您有所帮助。
FWIW,眼动追踪已经得到很好的研究,并且有几篇详尽的论文,例如this one