【发布时间】:2020-08-16 10:46:26
【问题描述】:
SymbolTime (NY)Message FAMI08/14/20, 19:59:52大宗交易。出价时。 (NYSEArca) KTOV08/14/20, 19:59:31大宗交易。应询。
上面的信息是我正在解析的。
我遇到了两个问题。一个是我不能将整行信息作为一个组打印,它是单独打印的。
第二个;我无法打印 href 元素。该程序将打印第一个 href,然后代码中断。我这是我的代码;
def function_time():
global url, scan_type, name
response = session.get(url)
response = session.get
soup = bs(response.text, 'html.parser')
data = soup.findAll()
page = requests.get(url)
doc = lh.fromstring(page.content)
#Parse data that are stored between <tr>..</tr> of HTML
tr_elements = doc.xpath('//tr')
tr_elements = doc.xpath('//tr')
#Create empty list
col=[]
i=0
for t in tr_elements[1]:
name=t.text_content()
#link = t.find('a').get('href')
#print(link) #finds first then breaks
print (Fore.GREEN+name)
col.append((name,[]))
time.sleep(1)
function_time()
当前打印为
FAMI
08/14/2020
Block Trade
我想把它打印成;
FAMI 08/14/2020 Block Trade ,并修复 href 函数(当前由于没有 get 函数错误而结束,尽管打印了第一个。)
我仍在学习中,在研究时不知道如何表达我的问题。提前致谢!
【问题讨论】:
标签: python for-loop parsing html-table