【发布时间】:2016-07-11 14:31:41
【问题描述】:
通常我使用来自网络浏览器的元素来添加来自网络浏览器的字符串或标签。这次我使用 webclient 来下载文档文本,如图所示;
Dim sourceString As String = New System.Net.WebClient().DownloadString("hats,com")
所以基本上我下载了一个网站的文档,现在这个文档有一堆以相同单词开头的网站,在这种情况下> https,如下所示。
"x" "https://hats.com/xxx", "x"
所以我试图获取以 (https://hats.com/xxx) 开头的所有单词(在本例中为链接)并将它们添加到列表框中。
所以第一个索引将是第一个以 url 开头的匹配/单词,第二个索引将是找到的第二个以相同开头的 url。
【问题讨论】:
-
给我们看一些代码...
-
我可以将 webclient 下载到文本框,从那里我不知道该怎么做,这就是我问的原因。我可以通过 .startswith 或 .contains 进行第一个单词搜索,但我不知道将从第一个字符串匹配 = 第一个索引中以相同字符串开头的“所有”获取到列表框中。第二个匹配字符串=第二个索引。
-
HtmlAgilityPack(可从 Nuget 获得)可能有助于您以与 Webbrowser 控件类似的方式(但不完全相同)导航 HTML 代码
-
我真的不想涉及其他内容,只是想用我下载的文本保持简单,因为它最容易做到,只是获取包含开头的单词(链接) https,无论如何都要研究htmlagility,但如果它更简单,会有所帮助。谢谢
-
恕我直言,不使用正确的工具来完成这项工作是愚蠢的;但如果你想坚持下去;如果您有可靠的方法来确定链接的结束,您可以将
String.IndexOf与String.Substring结合使用
标签: vb.net