谷歌地图编码折线算法格式背后的设计决策是什么？答案

【问题标题】：What are the design decisions behind Google Maps encoded polyline algorithm format?谷歌地图编码折线算法格式背后的设计决策是什么？
【发布时间】：2021-06-08 14:28:46
【问题描述】：

一些 Google 地图产品具有折线的概念，就基础数据而言，折线基本上只是一系列 lat/lng 点，例如可能在地图上绘制的一条线中体现出来。 Google 地图开发人员库使用编码的折线格式，该格式生成一个 ASCII 字符串，表示组成折线的点。然后通常使用 Google 库的内置函数或由第三方编写的实现解码算法的函数对这种编码格式进行解码。

折线点的编码算法在Encoded Polyline Algorithm Format 文档中描述。没有描述的是以这种方式实现算法的基本原理，以及每个单独步骤的重要性。我很想知道以这种方式实现算法的想法/目的是否在任何地方公开描述。两个示例问题：

某些步骤是否会对压缩产生可量化的影响？这种影响如何随着点之间的增量而变化？
使用 ASCII 63 对值求和是否是某种兼容性破解？

但一般来说，算法的描述会解释为什么该算法是按照它的方式实现的。

【问题讨论】：

Mark McClure 曾经进行过很好的讨论。该服务器现在似乎已关闭snapshot on the wayback machine
也会感兴趣。我发现这些代码 cmets 很有用：stackoverflow.com/a/13890455/194609

标签： algorithm google-maps google-polyline

【解决方案1】：

更新：来自 James Snook 的 This blog post 也具有“有效的 ascii”范围参数，并且可以从逻辑上读取我想知道的其他步骤。例如。存储前的左移，将负位作为第一位。

我找到了一些解释，不确定是否一切都 100% 正确。

一个双精度值存储在多个 5 位块中，0x20（二进制“0010 0000”）用于指示下一个 5 位条目属于当前双精度。
0x1f（二进制'0001 1111'）用作位掩码以丢弃其他位
我希望使用 5 位，因为 lat 或 lon 的增量在此范围内。因此，对于很多示例（但尚未验证），每个双精度值平均只占用 5 位。
现在，通过假设附近的双精度值非常接近并且创建的差值接近 0 来完成压缩，因此结果适合几个字节。然后这个结果以动态方式存储：存储 5 位，如果值更长，则用 0x20 标记并存储接下来的 5 位，依此类推。所以我想如果你尝试 6 或 4 位，你可以调整压缩，但我认为 5 是一个实际合理的选择。
现在关于魔术 63，这是 0x3f 和二进制 0011 1111。我不确定他们为什么要添加它。我认为添加 63 会给出一些“更好”的 asci 字符（例如，在 XML 或 URL 中允许），因为我们跳过例如62 是 > 但 63 是 ? 真的更好吗？至少第一个 ascii 字符是不可显示的，必须避免。请注意，如果使用 64，则将使用 ascii char 127 获取最大值 31 (31+64+32)，并且此 char 未在 html4 中定义。还是因为有符号字符从 -128 变为 127，我们需要将负数存储为正数，从而添加最大可能的负数？
仅供我参考：here 是一个使用 Apache 许可证的官方 Java 实现的链接

【讨论】：

使用 64 位编码的原因是能够将值作为纯文本发送。显然，除了 63 之外，还有许多其他值适用于此。然而，就一个非常低的工作解决方案而言，63 似乎是一个相当不错的添加值。它避免使用引号和分号。人们会怀疑避免'？本来是理想的。很难在 ascii 表中为 64 个字符选择更好的范围。 wikipedia 建议对于许多 64 位编码，通常选择更复杂的映射。
official Java implementation with Apache License的链接返回404。你能更新一下吗？