【发布时间】:2012-06-12 10:07:06
【问题描述】:
我正在使用 Yahoo Pipes 构建一个抓取工具,它可以通过 xPath 抓取我们公司的微型网站,并生成一个 RSS 提要,然后我可以将其嵌入到主网站中。
到目前为止,我已经从页面上抓取了职位名称和位置,但我无法将项目链接到微型网站。
到目前为止,这是我的管道:http://pipes.yahoo.com/pipes/pipe.info?_id=2bb5b8fedd0064b64d0e8861e3fc8fd5
我想我需要从每个节点中提取 href 链接,然后应用正则表达式,但我真的无法理解它。
代码中的链接如下所示:www2.jobs.badenochandclark.ch/JavaScript:OpenAssignment('a960c93a-11fe-4751-bc27-83a48429c3ba',%20'/Jobs/Details/a960c93a-11fe-4751- bc27-83a48429c3ba');
但我正在努力生成一个基本上可以做到这一点的正则表达式:
www2.jobs.badenochandclark.ch/JavaScript:OpenAssignment('a960c93a-11fe-4751-bc27-83a48429c3ba',%20'/Jobs/Details/a960c93a-11fe-4751-bc27-83a48429c3ba');
所以我被困在如何提取链接以及如何将其构建到管道上。任何朝着正确方向的帮助或轻推将不胜感激。
【问题讨论】:
标签: regex rss web-scraping yahoo-pipes