如何防止跟踪 URL 中的敏感数据？答案

【问题标题】：How to prevent tracking sensitive data in URLs?如何防止跟踪 URL 中的敏感数据？
【发布时间】：2020-05-25 18:11:45
【问题描述】：

我的单页应用 (SPA) 中的某些 URL 包含敏感信息，例如访问令牌、用户信息等。

例子：

/callback#access_token=HBVYTU2Rugv3gUbvgIUY
/?email=username@example.com

我看到hotjar 允许抑制跟踪数据中的 DOM 元素和图像。是否可以在 URL 中隐藏参数或至少禁用某些页面的跟踪？

【问题讨论】：

您是否考虑过使用 AJAX 将这些数据放入请求标头中？
您是否尝试通过 cookie 访问该数据？

标签： javascript single-page-application sensitive-data hotjar

【解决方案1】：

如果您控制脚本的页面和顺序，您可以从 url 读取数据，然后在其他任何内容到达之前将其删除。

proofOfConcept.html

<script id="firstThingToLoad.js">
    console.log(window.location.href);
    const keyRegex = /key=[^&]*/;
    const key = window.location.href.match(keyRegex);
    console.log("I have key", key);

    const href = window.location.href.replace(keyRegex, "");
    history.replaceState({}, "", href);
</script>

<script id="someSnoopyCode.js">
    console.log("I'm snooping: ", window.location.href);
</script>

<body>
    <a href="/?key=secret">Link to private</a>
</body>

当然Link to private 不应该按原样存在。此外，这确实会破坏刷新和大多数导航，尽管有一些方法可以捕捉和保存它。

【讨论】：

【解决方案2】：

在我看来，假设跟踪脚本将尝试访问 window.location.href 或类似的东西以获取它们将存储的当前 url 是合理的。

因此，一个可能的解决方案是创建一个动态范围，该范围具有不同的 window.location.href 值（过滤掉所有敏感信息）

它可能是这样工作的：

// get the tracker script as a string, so you can eval it in a dynamic scope

let trackerScript = 'console.log("Tracked url:", window.location.href)';

// now lets lock it up
function trackerJail(){
  let window = {
    location: {
      // put your filtered url here
      href: "not so fast mr.bond"
    }
  }
  
  eval(String(trackerScript))
}

trackerJail()

如果跟踪 sn-p 被包装在一个函数中，则可以通过覆盖它的原型来为其创建动态范围而无需运行eval。但我不确定你是否可以指望跟踪脚本被包装在一个可以修改的简洁函数中。

此外，脚本可能会尝试通过多种方式访问 URL，因此请确保覆盖所有出口

【讨论】：

(Unaffiliated) 让我想起了 figmas 沙盒系统：figma.com/blog/how-we-built-the-figma-plugin-system

【解决方案3】：

既然您说它是您的 SPA，您可以通过从 GET 请求（在 URL 中包含参数）切换到 POST requests 来解决问题。我不知道 hotjar，但如果你告诉跟踪服务只分析 URL，那将是一个值得考虑的选项。

另一个经常使用的选项是obfuscate URL 中的参数，例如Best way to obfuscate an e-mail address on a website? 但是，对于敏感数据，这绝不是一个真正安全的解决方案，因为解密步骤太容易了，特别是如果您的中间人已经将所有请求发送到您的 SPA。

编辑。我刚刚在Hotjar allows RegEx 中找到。假设您可以输入要排除的 URL 部分的正则表达式。一般语法/foo/bar/意味着foo应该替换为bar，在我们的例子中，我们想删除给定的sn-p，这就是为什么它是/foo//。

对于给定的访问令牌，正则表达式为

/callback#access_token=[a-zA-Z0-9]{15}//

分别用于 URL 的电子邮件部分

/\?email=(?:[a-z0-9!#$%&'*+/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+/=?^_`{|}~-]+)*|"(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21\x23-\x5b\x5d-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])*")@(?:(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?\.)+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?|\[(?:(?:(2(5[0-5]|[0-4][0-9])|1[0-9][0-9]|[1-9]?[0-9]))\.){3}(?:(2(5[0-5]|[0-4][0-9])|1[0-9][0-9]|[1-9]?[0-9])|[a-z0-9-]*[a-z0-9]:(?:[\x01-\x08\x0b\x0c\x0e-\x1f\x21-\x5a\x53-\x7f]|\\[\x01-\x09\x0b\x0c\x0e-\x7f])+)\])//

第二个 RegEx 部分取自 How to validate an email address using a regular expression?

【讨论】：

这是来自 3-rd 方服务的回调 URL。我无法改变它。从 URL 获得这个令牌，有人可以登录到应用程序。
我现在看到了这个问题。您可以使用其他跟踪服务吗？
@TarasHupalo 我刚刚有了另一个想法来解决您的问题。