【问题标题】:Convert HTML Table to Pandas Data Frame in Python在 Python 中将 HTML 表转换为 Pandas 数据框
【发布时间】:2019-07-10 09:47:11
【问题描述】:

在这里,我试图从 Python 代码中指定的网站中提取表格。我能够获得 HTML 表,而且我无法使用 Python 转换为数据框。这是代码

# import libraries
import requests
from bs4 import BeautifulSoup

# specify url
url = 'http://my-trade.in/'

# request html
page = requests.get(url)

# Parse html using BeautifulSoup, you can use a different parser like lxml if present
soup = BeautifulSoup(page.content, 'html.parser')

tbl =soup.find("table",{"id":"MainContent_dataGridView1"})

【问题讨论】:

    标签: html python-3.x dataframe web-scraping beautifulsoup


    【解决方案1】:

    你可以只使用 pandas read_html 函数,并记住将你得到的 html 转换为字符串,否则你会得到一些解析错误。

    import requests
    from bs4 import BeautifulSoup
    import pandas as pd
    
    url = 'http://my-trade.in/'
    page = requests.get(url)
    
    soup = BeautifulSoup(page.content, 'html.parser')
    
    tbl = soup.find("table",{"id":"MainContent_dataGridView1"})
    
    data_frame = pd.read_html(str(tbl))[0]
    

    【讨论】:

    • 上面的代码工作正常,我正在寻找为每一列编写一个 for 循环,然后进一步绑定它。我通常在 R 中编码,请原谅我是 python 新手。
    猜你喜欢
    • 2019-07-11
    • 1970-01-01
    • 2013-04-07
    • 1970-01-01
    • 2014-08-19
    • 2021-09-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多