【问题标题】:Format text extracted from HTML从 HTML 中提取的格式文本
【发布时间】:2017-12-14 11:09:35
【问题描述】:

我用一行从这个 HTML 中获取文本:

<label class="product_title"> 
  "TEXT 1" 
  <br> 
  "TEXT2" 
</label>

我的代码是:

title = amazon.find_element_by_css_selector(
  'div > div > label').get_attribute('innerText')

当前输出:

TEXT
TEXT1

期望的输出:

TEXT TEXT1

问题

如何获得我想要的输出?

【问题讨论】:

标签: python-3.x selenium


【解决方案1】:

您可以用空格替换换行符,如下所示:

title = amazon.find_element_by_css_selector('div > div > label').get_attribute('innerText').replace("\n", " ")

【讨论】:

  • 很高兴听到 :)
猜你喜欢
  • 2015-11-13
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-10-31
  • 1970-01-01
  • 2016-03-26
  • 2010-09-15
  • 1970-01-01
相关资源
最近更新 更多