【发布时间】:2013-04-09 20:19:33
【问题描述】:
我的目的是从网页获取电子邮件地址。我有页面源。我正在逐行阅读页面源代码。现在我想从我正在阅读的当前行中获取电子邮件地址。当前行可能有也可能没有电子邮件。我看到了很多正则表达式的例子。但其中大多数是用于验证电子邮件地址。我想从未验证的页面源获取电子邮件地址。它应该像http://emailx.discoveryvip.com/ 一样工作
一些示例输入行是:
1)<p>Send details to <a href="mailto:%72%65%62%65%6b%61%68@%68%61%63%6b%73%75%72%66%65%72.%63%6f%6d">neeraj@yopmail.com</a></p>
2)<p>Interested should send details directly to <a href="http://www.abcdef.com/abcdef/">www.abcdef.com/abcdef/</a>. Should you have any questions, please email <a href="mailto:%6a%6f%62%73@%72%65%6c%61%79.%65%64%75">neeraj@yopmail.com</a>.
3)Note :- Send your queries at neeraj@yopmail.com for more details call Mr. neeraj 012345678901.
我想从示例 1,2 和 3 中获取 neeraj@yopmail.com。 我正在使用java并且我不擅长rexexp。帮我。
【问题讨论】:
-
你查看谷歌关于“java regex email”的说法了吗?
-
查看emailx.discoveryvip.com的页面来源。他们已经给出了提取电子邮件的方法。但我想要一个java版本
-
你试过什么? Stack Overflow 是一个问答网站,而不是“为我工作”网站。向我们展示您有什么,以便我们帮助您解决具体问题。
-
@Vitaly 是的。相关的是stackoverflow.com/questions/2250820/…。但它不起作用。
-
@Neeraj,既然您已经知道如何验证电子邮件,您可以再进一步,捕获匹配的组,组中的数据正是您想要的。