【发布时间】:2014-05-14 06:24:02
【问题描述】:
我对 Python 还很陌生,所以我希望有人可以帮助我根据文本文件中的信息生成唯一 URL 列表。
示例:我有一个基本 URL,www.website.com/users/,以及一个包含用户名“frank”、“rachel”、“james”等的 txt 文件。我想用这些信息创建 URL ,并将其保存为 txt 文件,如下所示:
www.website.com/users/frank
www.website.com/users/rachel
www.website.com/users/james
etc.
我对数字做了类似的事情,例如
www.website.com/1
www.website.com/2
etc.
我为数字解决方案编写的代码粘贴在下面,以防它作为起点有所帮助。
import time
htmlTxt=""
pageNum=0
x="http://forum.com/eforum/forumdisplay.php?fid=13&page="
y=x+str(pageNum)
file = open("URLs.txt", "wb")
while True:
try:
time.sleep(0.001) # do something here
file.write(x +str(pageNum)+"\n")
pageNum+=1
except KeyboardInterrupt:
print '\nPausing... (Hit ENTER to continue, type quit to exit.)'
try:
response = raw_input()
if response == 'quit':
break
print 'Resuming...'
except KeyboardInterrupt:
print 'Resuming...'
continue
file.close()
(我在上面的例子中使用'time'的原因是因为我不知道如何让它停在某个数字,所以我只是让它运行了几秒钟并删除了超出的URL “最大”数。)
提前致谢!
【问题讨论】:
-
你能简化你的问题吗?
www.website.com每次在预期输出中都是同一个站点吗?它从何而来?名称列表是什么样的?文件中每行一个?
标签: python url python-2.7