【问题标题】:How to remove few columns from every row of a dataset in python?如何从python中数据集的每一行中删除几列?
【发布时间】:2019-11-05 06:26:04
【问题描述】:

通过最初删除几列垃圾数据,在短时间内处理文件(包含 18-20 列数据)。

我们正在接收一个文件,其中包含如下所示的数据:

'apple', 'guava', 'papaya', 'grapes', 'kashmir', '', 'xadjkladihad'
'apple', 'guava-red', 'papaya', 'grapes', 'himachal', '',  'dsdhks'
.....
.....

我们不需要的大部分垃圾数据现在也正在处理中,我们希望从中删除一些列,以便在短时间内完成对包含数据的文件的处理。

desired = [fruit for fruit in fruits if len(fruit) > 1]

目前的代码正在多次处理地点、类型等的所有垃圾数据。我想要的是,通过最初删除垃圾来处理所有数据。

【问题讨论】:

  • 您的应用程序中的“垃圾”是什么?
  • 文件中的垃圾数据。这对我们来说很正常。我们必须删除它。

标签: list python-3.6


【解决方案1】:

好吧!如果你仔细观察上面的代码和需求,工作就会变得简单一些。

假设我们有数千行和 15 列,我们想从末尾删除几列。

desired_fruits = [fruit[0:12] for fruit in fruits[:] if len(fruit) > 1]

这里我们对最后两列进行切片,即第 14 列和第 15 列,fruits[:] 是水果列表的唯一副本。

在这里你可以玩一下列的数字,其中 0 是第一列,12 是第十三列。

【讨论】:

  • 这肯定会解决我的问题,需要从处理中切出几列垃圾数据。
猜你喜欢
  • 2021-03-24
  • 2016-11-01
  • 1970-01-01
  • 1970-01-01
  • 2021-11-30
  • 2017-07-10
  • 2020-02-16
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多