【发布时间】:2021-08-26 21:49:34
【问题描述】:
我有一个 txt.fil(服务器日志),只想从中提取某些字段并将其写入 csv:
Date=2021-01-04 23:45:47.131 interaction=basic id=12333 personalid=11117 tisract=jinx fabrics=xyz session_id=adsflkixx endpoint=tool/tac/product/case
基本上有几百万行这样的
我怎样才能只从 txt 文件中提取日期、id 和端点,并将其转换为 dict,然后再转换为数据框?
名称重复值不断变化,所以我想将名称保留为标题,将值保留为数据行。
【问题讨论】:
-
使用正则表达式或 grok - pypi.org/project/pygrok