【发布时间】:2020-09-25 22:35:48
【问题描述】:
考虑 assets/logdata.txt 中的标准网络日志文件。该文件记录了用户在访问网页时所做的访问(就像这个!)。日志的每一行都有以下几项:
- 主机(例如,
'146.204.224.152') - 用户名(例如,
'feest6811'注意:有时用户名会丢失!在这种情况下,请使用“-”作为用户名的值。) - 发出请求的时间(例如,
'21/Jun/2019:15:45:24 -0700') - post 请求类型(例如,
'POST /incentivize HTTP/1.1'注意:并非所有内容都是 POST!)
您的任务是将其转换为字典列表,其中每个字典如下所示:
example_dict = {"host":"146.204.224.152",
"user_name":"feest6811",
"time":"21/Jun/2019:15:45:24 -0700",
"request":"POST /incentivize HTTP/1.1"}
这是txt数据文件的样本。
我写了这几行代码:
import re
def logs():
with open("assets/logdata.txt", "r") as file:
logdata = file.read()
#print(logdata)
pattern="""
(?P<host>.*)
(-\s)
(?P<user_name>\w*)
(\s)
([POST]*)
(?P<time>\w*)
"""
for item in re.finditer(pattern,logdata,re.VERBOSE):
print(item.groupdict())
return(item)
logs()
它帮助我完成了"host" 和"user_name",但是我无法继续完成其余的要求。有人可以帮忙吗?
【问题讨论】: