【发布时间】:2020-04-20 17:01:56
【问题描述】:
我想提取https://www.nseindia.com/market-data/exchange-traded-funds-etf的URL数据。此 URL 将数据提取到表格股票市场数据中。从列开始
Symbol
Underlying Assets
Open
High
Low
...
...
52W H
52W L
Today
我的目标是将这些数据放入 Pandas Dataframe 中,包括标题
我写了以下代码
import requests
import json
import pandas as pd
from datetime import datetime
from datetime import timedelta
pd.options.display.float_format = '{:20,.2f}'.format
pd.set_option('display.max_colwidth', None)
import numpy as np
from bs4 import BeautifulSoup
url="https://www.nseindia.com/market-data/exchange-traded-funds-etf"
headers = { "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36 OPR/67.0.3575.137"}
r=requests.get(url, headers=headers)
r.status_code
# df1=pd.DataFrame().from_records(r['data'])
但我不知道如何继续,对于来自同一网站的另一个链接,我使用了以下代码
rl="https://nseindia.com/api/equity-stockIndices?index=SECURITIES%20IN%20F%26O"
headers = { "Accept-Encoding":"gzip, deflate","Accept-Language":"en-US,en;q=0.9",
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36 OPR/65.0.3467.78"}
r=requests.get(url, headers=headers).json()
df1=pd.DataFrame().from_records(r['data'])
但 requests.get(url, headers=headers).json() 不适用于此 URL。你能帮我把数据导入Dataframe吗?
谢谢
【问题讨论】:
-
您没有具体说明您的问题。您在获取数据或解析数据时遇到问题吗?
-
不知道如何将各种js脚本生成的表格数据导入Dataframe。希望我很清楚
标签: python python-3.x pandas web-scraping