【问题标题】:regex for all characters on yahoo pipes雅虎管道上所有字符的正则表达式
【发布时间】:2009-11-16 14:03:02
【问题描述】:

我有一个明显简单的管道正则表达式查询 - 我需要从它的 (<img>) 标记中截断每个项目。我认为将字符串正则表达式 <img[.]* 替换为空白字段的循环会处理它,但无济于事。

显然我在这里遗漏了一些基本的东西 - 有人可以指出吗?

目前的项目是这样的:

sample text title 
<a rel="nofollow" target="_blank" href="http://example.com"><img border="0" src="http://example.com/image.png" alt="Yes" width="20" height="23"/></a> 
<a.... (a bunch of irrelevant hyperlinks I don't need)...

基本上我只想要标题文本和超链接,这就是我砍掉其余部分的原因

做得更好,因为我在这里真正要做的就是通过在进一步操作之前将其削减来使项目字符串更易于管理 - 任何人都知道是否可以从页面中的某个链接中提取一个 href(在这种情况下第一个)在雅虎管道中使用正则表达式?我已经看到this SO q 的正则表达式答案,但我不确定如何使用它将 url 映射到 Pipes 模块中的项目属性?

【问题讨论】:

  • ...问题是否缺少一些细节?
  • 卢瑟福,我们需要更多背景信息;能否请您发布一些数据?
  • 从你提供的信息中我唯一能猜到的是[.] 寻找一个只包含点字符的字符类。您的意思可能是:.* 而不是 [.]*
  • 嗯,我想,一定是离题了。是通配符参考。会更新
  • 是的,. 是任何字符的通配符,除了 [] 内部定义了一组要查找的字符。

标签: regex pipe yahoo-pipes


【解决方案1】:

您需要删除带有正则表达式管道的行返回并将内容或描述字段上的模式 [\r\n] 替换为空文本以使其成为单行文本,然后您可以使用 .* 通配符这将运行到行尾。

http://www.yemkay.com/2008/06/30/common-problems-faced-in-yahoo-pipes/

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多