【发布时间】:2020-02-12 18:41:06
【问题描述】:
这个对我来说比较棘手。我正在尝试从 python 中的 google 表格中提取嵌入的表格。
这里是link
我不拥有这张表,但它是公开的。
到目前为止,这是我的代码,当我输出标题时,它向我显示“”。任何帮助将不胜感激。最终目标是将此表转换为 pandas DF。谢谢大家
import lxml.html as lh
import pandas as pd
url = 'https://docs.google.com/spreadsheets/u/0/d/e/2PACX-1vQ--HR_GTaiv2dxaVwIwWYzY2fXTSJJN0dugyQe_QJnZEpKm7bu5o7eh6javLIk2zj0qtnvjJPOyvu2/pubhtml/sheet?headers=false&gid=1503072727'
page = requests.get(url)
doc = lh.fromstring(page.content)
tr_elements = doc.xpath('//tr')
col = []
i = 0
for t in tr_elements[0]:
i +=1
name = t.text_content()
print('%d:"%s"'%(i,name))
col.append((name,[]))
【问题讨论】:
标签: python google-sheets scrape