【问题标题】:Detecting if something exists and then automating process检测是否存在某些东西,然后自动化过程
【发布时间】:2013-10-04 08:39:17
【问题描述】:

我想知道是否可以用 PHP 编写一个脚本,该脚本将通过一个非常大的数据集(1 亿+)来尝试在数据集中找到特定的字符串?

如果可行的话,它是否是一种在数据集中识别关键字的有效形式?

如果有更好的方法来处理这么大的数据集来尝试检测字符串,我全神贯注

【问题讨论】:

  • 编程一切皆有可能。
  • 这是一个有趣的问题,但范围很广,可能很快就会被关闭。能否详细说明一下约束、文件类型、数据库连接等?
  • 是的,Sébastien,Google 代表要求我尝试寻找检测和自动化违反 Google 广告词政策的方法。例如,如果有人将受版权保护的内容放在他们的谷歌广告内容中。现在据我所知,谷歌使用 BigTable 作为他们的数据库,所以我认为所有数据都在这个数据库中。如果您有更好的方法,而不是像我说的那样使用脚本!

标签: php automation detection bigtable


【解决方案1】:

正如 Jari 所说,编程一切皆有可能。

我通过 Hadoop、MapReduce 等处理大数据。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2014-05-12
    • 2012-03-12
    • 2012-06-04
    • 2017-02-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-09-27
    相关资源
    最近更新 更多