【发布时间】:2017-09-18 10:20:58
【问题描述】:
我有来自here 的莎士比亚的全部作品数据,我想在词嵌入算法中使用这些数据来创建模型。该模型的要求是整个文本只提供单个空格,并且不存在其他类型的空格。我该如何执行此操作?我找到了如何为单个字符串执行此操作,但它不适用于文本文件。
我的尝试(我对python不是很了解):
with open(file_path, 'r') as data:
for line in data:
cleanedline = line.strip('\n')
cleanline 在打印时没有删除\n,所以我没有将它们写回文件中。
【问题讨论】:
-
所以,所有换行符和其他空格都应该用一个空格替换?
-
是的,它的glove 型号
标签: python parsing formatting text-parsing