【问题标题】:Can't get the certain item using selector无法使用选择器获取特定项目
【发布时间】:2017-08-20 21:59:40
【问题描述】:

我怎样才能从以下链接中的可用元素中使用 css 选择器只获取文章而不获取其他内容。我想在我用 python 编写的解析器中使用这个选择器。

我试过了:

div.user-review p

使用上面的选择器我也得到了其他我不想要的东西。我只想要这篇文章。

这里是指向包含文章的元素的链接: "https://www.dropbox.com/s/readzjpl0bca3zr/Elements.txt?dl=0"

【问题讨论】:

  • 什么是“获取文章”?

标签: web-scraping css-selectors lxml


【解决方案1】:

试试下面的 CSS 选择器,如果它没有获取所需的输出,请告诉我:

div.user-review p.lnhgt ~p

【讨论】:

  • 感谢您的友好回复。它抛出以下错误:'不支持或无效的 CSS 选择器:“%s”'% token)ValueError:不支持或无效的 CSS 选择器:“~p”
  • 但是“div.user-review p.lnhgt”确实如此。我从你那里得到了洞察力。顺便说一句,很想知道“~p”是什么意思,先生?
  • ~node 表示general sibling selector~p 应该匹配 p.lnhgt 的所有以下兄弟段落
猜你喜欢
  • 1970-01-01
  • 2018-09-08
  • 1970-01-01
  • 1970-01-01
  • 2020-01-28
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多