【发布时间】:2013-09-06 17:05:28
【问题描述】:
我需要将此网页中的所有项目链接(URL)放入一个由中断分隔的文本文件中(换句话说,像这样的列表:“项目#1”“项目#2”等。
http://dota-trade.com/equipment?order=name 是网页,如果您向下滚动,它会继续滚动到大约 500-1000 个项目。
我必须使用什么编程语言或者我将如何做到这一点。我也有使用 imacros 的经验。
【问题讨论】:
-
应该可以使用 C#、Python 和 Ruby。不过,Javascript 会很棘手。如果您要问,一般有多少种编程语言可以做到这一点,这里就不一一列举了。
-
您认为最简单的语言是什么?我添加 javascript 的唯一原因是因为我熟悉使用 imacros,并且我可以使用 EVAL 命令在其中获取 javascript。也许有人会知道如何通过 imacros 做到这一点。
-
从上面提到的三个中,我会推荐Python。或者让我们这样说:您已经学习了哪些编程语言?
-
我做了一个 Python 初学者教程,但是很短。就是这样。你觉得在 python 中使用 lxml 来做到这一点怎么样?
-
我对使用 Python 处理 HTML 的了解不够,而且我也不确定在没有任何额外库的情况下是否需要额外的库。合乎逻辑的方法:阅读有关如何使用 Python 访问和编辑 .txt 文件的信息。了解如何使用 Python 访问 Web 内容。查找有关处理 HTML 并将其存储在 .txt 文件中的教程。
标签: c# javascript python ruby imacros