【发布时间】:2019-09-08 07:02:12
【问题描述】:
我有在 C# .NET Core 2 中使用 HTML Agility 包实现的网页抓取代码。
我们将大部分服务器移植到 node.js。唯一剩下的部分是这个网络抓取位。我目前正在尝试使用 Cheerio/jQuery 来复制它,但我对 jQuery 语法不太熟悉。
什么相当于
DocumentNode.Descendants("table")
.LastOrDefault(t => t.InnerHtml.Contains("<td align=\"center\">Match</td>"))
我试过了:
$('table > tbody > tr > td > table > tbody')
但这仍然给了我很多东西。我基本上想抓住表格的行。我想要的表应该包含那个 td 字段。
谢谢!
编辑:
我没有添加 html,而是粘贴了 URL。这样我们就可以检查元素。我基本上想获取Team Schedule 表,这样我就可以解析角色并获取它们的Status、Match、Match Date 以及该表的其余列。
https://www.ustanorcal.com/teaminfo.asp?id=82607
我之前使用Descendants("table").LastOrDefault() 在上面的帖子中添加的 sn-p 能够做到这一点,但我不知道如何用 jQuery 做到这一点。
【问题讨论】:
-
您正在使用什么minimal reproducible example html,您希望使用选择器检索哪些元素?
-
听起来你想要:$('td[align="center"]')。请注意,这只是 css,所以如果您需要熟悉它,可以参考大量文档。
-
我在上面添加了一个示例。这不会抓住我所有满足这一点的
td元素吗?我想要这张桌子和它的所有行。很抱歉之前没有粘贴示例。
标签: jquery node.js web-scraping html-agility-pack cheerio