在熊猫读取csv中保存跳过行答案

【问题标题】：Save skip rows in pandas read csv在熊猫读取csv中保存跳过行
【发布时间】：2018-11-09 19:25:03
【问题描述】：

我有一个 skip rows 列表（比如 [1,5,10] --> 行号），当我将它传递给 pandas read_csv 时，它会忽略那些行。但是，我需要将这些跳过的行保存在不同的文本文件中。

我浏览了 pandas read_csv 文档和其他几篇文章，但不知道如何将其保存到文本文件中。

例子：

输入文件：

a,b,c
# Some Junk to Skip 1
4,5,6
# Some junk to skip 2
9,20,9
2,3,4
5,6,7

代码：

skiprows = [1,3]
df = pandas.read_csv(file, skip_rows = skiprows)

现在输出.txt：

# Some junk to skip 1
# Some junk to skip 2

提前致谢！

【问题讨论】：

行是 cmets 还是会扰乱 csv 文件的读取？
@ScottBoston，是的，它按预期工作，但我需要这个跳过行存储在另一个文件中

标签： python python-3.x pandas numpy dataframe

【解决方案1】：

def write_skiprows(infile, skiprows, outfile='skiprows.csv')
    maxrow = max(skiprows)
    with open(infile, 'r') as f, open(outfile, 'w') as o:
        for i, line in enumerate(f):
            if i in skiprows:
                o.write(line)
            if i == maxrow:
                return

【讨论】：

【解决方案2】：

试试这个，

df=pd.read_csv('input.csv')
skiprows=[1,3,6]
df,df_skiprow=df.drop(skiprows),df.iloc[skiprows]
#df_skiprow.to_csv('skiprows.csv',index=False)

输入：

输出： df

df_skiprow

解释：

读取整个文件。
按 df 和 skiprow 分割文件
转换成单独的 csv 文件。

【讨论】：