【问题标题】:Creating filters for Google Analytics to remove spam为 Google Analytics 创建过滤器以删除垃圾邮件
【发布时间】:2015-05-12 08:43:00
【问题描述】:

我已成功地从 Google Analytics(分析)中过滤掉来自某些垃圾网站的点击。这是一场持续的战斗,因为新网站不断涌现并污染了我的获取/推荐结果。

目前,GA 过滤器使用以下匹配来阻止以下所有网站出现在数据中:

.*(best\-seo\-solution|semalt|buttons\-for\-website|social\-buttons|best\-seo\-offer|Get\-Free\-Traffic\-Now|buttons\-for\-your\-website|free\-share\-buttons)\.com.*

我自己添加了其中的大部分并且它可以工作,但是我现在需要创建一个允许我输入不是标准something.com 模式的 URL 的模式。例如:

site4.free-share-buttons.com
site5.free-share-buttons.com

所以在这些情况下,结束总是相同的,但开始可以是可变的。

buy-cheap-online.info

在这种情况下,它以 .info 结尾

www.event-tracking.com

这个使用www. 而其他人没有

http://webmaster-traffic.com

这个也有http://

最重要的是,过滤器模式最多只能是 255 个字符(但我可以有多个过滤器模式),所以我需要对其进行分段。

如何创建一个针对以上所有 URL 的正则表达式过滤器模式?

【问题讨论】:

  • 我认为您忘记了问题的问题部分。你的问题到底是什么?

标签: regex google-analytics


【解决方案1】:

Google Analytics 允许创建正则表达式,而无需转义所有特殊字符,当表达式很简单时。因此,您可以编写不带反斜杠的表达式 \.* 您甚至可以删除 .com 和括号,因为这些名称已经非常具体了

best-seo-solution|semalt|buttons-for-website|social-buttons|best-seo-offer|Get-Free-Traffic-Now|buttons-for-your-website|free-share-buttons|event-tracking|buy-cheap.info

如果您碰巧有一个具有通用名称的垃圾邮件,只需为这种特定情况添加全名|commonname.net

您可以继续操作,直到达到 255 个字符,然后再添加第二个过滤器。这会起作用,但 它有 3 个缺点

  • 首先有 1 或 2 个每周新的垃圾邮件发送者

  • 添加它时的第二秒您已经有一些点击量

  • 第三个,这是一种新行为,一些垃圾邮件现在通过直接访问与推荐一起出现,此过滤器不会阻止这种情况。

为防止这种情况发生,我建议您使用有效的主机名过滤器,此过滤器将只允许使用您的一个主机名的命中,并且将排除所有幽灵垃圾邮件 因为他们使用假主机名或未设置。

您可以在此处找到有关垃圾引荐来源网址和有效主机名过滤器的更多信息

https://stackoverflow.com/a/28354319/3197362

http://www.ohow.co/things-you-must-know-about-spam-in-google-analytics/

【讨论】:

  • 谢谢。我已经添加了 .htaccess 来阻止一些引荐来源垃圾邮件,但我听说现在的垃圾邮件机器人通常甚至不会访问您的网站,因此它们永远不会被 .htaccess 过滤掉。我只是在寻找一种尽可能多地阻止的解决方案(通过 .htaccess 和过滤器)
  • 是的,你是对的,事实上,大多数最新的垃圾邮件无法使用 .htaccess 来阻止。如果您关注第二个链接,则会有更多关于此的信息。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2014-09-17
  • 2012-04-23
  • 1970-01-01
  • 2011-04-21
  • 1970-01-01
  • 1970-01-01
  • 2019-09-19
相关资源
最近更新 更多