【发布时间】:2020-08-13 22:08:59
【问题描述】:
我在推特上请求查找特定时期的推文。之后我开始向下滚动页面到最后一个推特。接下来我正在保存此页面的 html 代码(右键单击 -> 另存为...)。此 html 文件中仅显示最新的推文。如何将所有推文保存为html格式?
【问题讨论】:
我在推特上请求查找特定时期的推文。之后我开始向下滚动页面到最后一个推特。接下来我正在保存此页面的 html 代码(右键单击 -> 另存为...)。此 html 文件中仅显示最新的推文。如何将所有推文保存为html格式?
【问题讨论】:
Twitter 可能会动态地从其 html 代码中添加/删除。很可能它使用无限滚动和看似无穷无尽的页面。使用浏览器时,您只能看到所有推文的“快照”,并且永远无法保存所有推文。我可以通过使用浏览器的检查器然后滚动来证明或检查这一点。我从未尝试过,但在代码检查器中,您可以看到添加/删除或隐藏的内容。 Javascript 负责你所看到的以及你可以保存的内容。
使用 Firefox Ctrl+Shift+C,我发现 HTML 代码标记为 'aria-label="Timeline: Your Home Timeline" '。在它下面,您可以找到可见的推文。当您滚动时,您只会看到可以保存在文件中的那些。这里只有 11 条推文。当您滚动时,会添加和删除一个数字,但只有一个减少的数字可用。
查看所有推文的唯一方法是当 Twitter 允许您访问他们的推文数据库时,可能是通过程序员界面,但仍然会有太多无法保存所有推文。
【讨论】: