【发布时间】:2017-07-22 15:59:51
【问题描述】:
我正在尝试从一般进行网络抓取的有经验的人那里获取更多信息,我正在使用 Python 库进行网络抓取。同时,我注意到有些人在使用简单的 Bash,并使用诸如 wget, curl, sed, grep, awk 之类的命令进行网页抓取。
这些命令在脚本编写中似乎比使用 Python 库进行网络抓取要干净得多。
您对此有何看法?您是否看到使用 python 库而不是我没有得到的 Bash 优势?或者甚至使用 Python 和 Bash 来完成网页抓取?
【问题讨论】:
-
嗯,这是编码风格的问题。一般来说,如果您可以将 Python 库用于特定任务,请通过 Bash 命令使用它。
-
是的,运行一个程序而不是许多程序有一个巨大的优势。
-
好吧,python 需要这些库。不像你可以直接使用python。
标签: python bash curl sed web-scraping