【发布时间】:2020-07-21 06:42:49
【问题描述】:
我有两个带有一些数据的大文本文件 file_1.txt 和 file_2.txt。我想将这些文件中的数据写入单个文件output.txt,格式如下:
file_1.txt数据:
header info 1
header info 2
.
.
.
header info n
file_2.txt数据:
body info 1
body info 2
.
.
.
body info n
output.txt数据:
header info 1
header info 2
.
.
.
header info n
body info 1
body info 2
.
.
.
body info n
使用 pyspark 或任何其他 python 模块最快的方法是什么?
编辑:
我使用的是 Windows 10
【问题讨论】:
-
cat file_1.txt file_2.txt > output.txt -
在 Linux 上你可以做
cat file1.txt file2.txt > output.txt。至于我使用 pyspark 将一个文件附加到另一个文件过于复杂。 -
谢谢大家,但我使用的是 Windows 10
-
然后在 powershell 中
type file_1.txt file_2.txt > output.txt -
联合是最好的选择,只要确保你的列名相同
标签: python python-3.x pyspark