【发布时间】:2019-12-06 04:39:41
【问题描述】:
如何使用 python 中的美丽汤从以下 wiki 页面的前两个表中提取 Alpha-3 代码?
https://en.wikipedia.org/wiki/List_of_territorial_entities_where_English_is_an_official_language
from bs4 import BeautifulSoup as bs
import requests
import pandas as pd
r = requests.get('https://en.wikipedia.org/wiki/List_of_territorial_entities_where_English_is_an_official_language')
soup = bs(r.content, 'lxml')
table = soup.find_all('table', class_='wikitable')[0]
output_rows = []
for table_row in table.findAll('tr'):
columns = table_row.findAll('td')
output_row = []
for column in columns:
output_row.append(column.text)
output_rows.append(output_row)
output_rows[1][2].rstrip('\n')
output_rows[2][2].rstrip('\n')
output_rows[3][2].rstrip('\n')
output_rows[4][2].rstrip('\n')
【问题讨论】:
-
请出示您目前编写的代码。
-
你的预期输出是什么
-
我只想要一个数组中的所有 Alpha-3 代码
标签: python-3.x web-scraping beautifulsoup