【发布时间】:2013-10-04 08:39:17
【问题描述】:
我想知道是否可以用 PHP 编写一个脚本,该脚本将通过一个非常大的数据集(1 亿+)来尝试在数据集中找到特定的字符串?
如果可行的话,它是否是一种在数据集中识别关键字的有效形式?
如果有更好的方法来处理这么大的数据集来尝试检测字符串,我全神贯注
【问题讨论】:
-
编程一切皆有可能。
-
这是一个有趣的问题,但范围很广,可能很快就会被关闭。能否详细说明一下约束、文件类型、数据库连接等?
-
是的,Sébastien,Google 代表要求我尝试寻找检测和自动化违反 Google 广告词政策的方法。例如,如果有人将受版权保护的内容放在他们的谷歌广告内容中。现在据我所知,谷歌使用 BigTable 作为他们的数据库,所以我认为所有数据都在这个数据库中。如果您有更好的方法,而不是像我说的那样使用脚本!
标签: php automation detection bigtable