【问题标题】:How does split and strip function work together in python?python中split和strip函数如何协同工作?
【发布时间】:2014-09-29 08:03:51
【问题描述】:
headers = table.by_tag('th') 
labels = [str(t.content).split('(')[0].strip() for t in headers[3:-1]]

我知道split()strip() 是什么意思。但是split('(')[0] 是什么意思? headers 是表格中的内容。

【问题讨论】:

  • split() 返回一个列表,因此它为您提供第一个值(第一个子字符串,直到第一个 ( 符号)
  • @user3322273 str(t.content) 返回这些:Jerry Brown (D), Meg Whitman(D)

标签: python-2.7 ipython-notebook scientific-computing


【解决方案1】:

例如。 HTML 是..

<table>
  <tr><th>Jerry Brown (D)</th><th>Meg Whitman(D)</th></tr>
  <tr><td>1</td><td>4</td></tr>
  <tr><td>2</td><td>1</td></tr>
  <tr><td>3</td><td>2</td></tr>
</table>

BeautifulSoup 可以提取标题

结果是一个包含在下面的列表

["&lt;th&gt;Jerry Brown (D)&lt;/th&gt;", "&lt;th&gt;Meg Whitman(D)&lt;/th&gt;"]

所以t.contentJerry Brown (D)Meg Whitman(D)

"Jerry Brown (D)".split('(') = ["Jerry Brown ", "D)"]
"Meg Whitman(D)".split('(') = ["Meg Whitman", "D)"]
["Jerry Brown ", "D)"][0] = "Jerry Brown "
["Meg Whitman", "D)"][0] = "Meg Whitman"

和 strip() 可以删除字符串两边的空格,所以...

标签表示["Jerry Brown","Meg Whitman"]

【讨论】:

    最近更新 更多