【发布时间】:2017-08-09 09:12:41
【问题描述】:
<tr class="even">
<td><strong><a href='../eagleweb/viewDoc.jsp?node=DOC186S8881'>DEED<br/>
2016002023</a></strong></td>
<td><a href='../eagleweb/viewDoc.jsp?node=DOC186S8881'><b> Recording Date: </b>01/12/2016 08:05:17 AM <b>Book Page: </b> <table cellspacing=0 width="100%"><tr><td width="50%" valign="top"><b>Grantor:</b> ARELLANO ISAIAS</td><td width="50%" valign="top"><b>Grantee:</b> ARELLANO ISAIAS, ARELLANO ALICIA</td></tr></table>
<b>Number Pages:</b> 3<br></a></td>
<td></td>
<td></td></tr>
我是 python 和抓取的新手,请帮助我如何从这个表中抓取数据。 对于登录,请转到公共登录,然后输入到和从日期。
数据模型:数据模型具有按此特定顺序和大小写的列:“record_date”、“doc_number”、“doc_type”、“role”、“name”、“apn”、“transfer_amount”、“county”、和“状态”。 “角色”列将是“Grantor”或“Grantee”,具体取决于名称的分配位置。如果授权人和受让人有多个名称,请为每个名称换行,并复制记录日期、文档编号、文档类型、角色和 apn。
https://crarecords.sonomacounty.ca.gov/recorder/eagleweb/docSearchResults.jsp?searchId=0
【问题讨论】:
-
我想提取这些东西。数据模型:数据模型具有按此特定顺序和大小写的列:“record_date”、“doc_number”、“doc_type”、“role”、“name”、“apn”、“transfer_amount”、“county”和“state” ”。 “角色”列将是“Grantor”或“Grantee”,具体取决于名称的分配位置。如果授予人和受让人有多个名称,请为每个名称换行并复制记录日期、文档编号、文档类型、角色和 apn。如果您对如何构建 csv 结果有疑问,请咨询我。
-
这看起来像是一个需要凭据的安全网站,我只能访问
You must be logged in to access the requested page。您可以将 html 表复制到您的问题中吗? -
好的,等我截图
-
我粘贴了代码
标签: python html python-3.x web-scraping beautifulsoup