将 URL 结构与 Anemone 匹配答案

【问题标题】：Matching URL structures with Anemone将 URL 结构与 Anemone 匹配
【发布时间】：2013-09-04 10:02:15
【问题描述】：

现在，我正在对 Anemone 执行以下操作：

Anemone.crawl("http://www.findbrowsenodes.com/", :delay => 3) do |anemone|
  anemone.on_every_page do | page |

但我想做

Anemone.crawl("http://www.findbrowsenodes.com/", :delay => 3) do |anemone|
   anemone.on_pages_like() do | page |

而不是只从这样的 URL 抓取：

有什么想法吗？

【问题讨论】：

【解决方案1】：

你可以使用这样的正则表达式

/http:\/\/www.findbrowsenodes.com\/us\/.+\/[\d]*/

【讨论】：

感谢它的工作！但只有一件事，一开始它包含这个 URL：http://www.findbrowsenodes.com/us/p/what-are-browse-nodes 如何修改正则表达式以避免这种情况？