【发布时间】:2019-05-14 07:44:15
【问题描述】:
我有一个包含各种列的 pandas 数据框,其中一个是我使用 split 命令拆分为列表的字符串:
import Pandas as pd
csvRead = pd.read_csv('../data/Data.csv')
df = pd.DataFrame(csvRead)
df['split_string'] = df['string'].str.split(r'[ ]')
idx = 0
for i in df['split_string']:
df['split_string_counts'][idf] = len(i)
i += 1
现在我想对 for 语句进行矢量化处理,因为 Pandas.Series pacakge 中没有标准命令可以计算 split 命令给出的列表的元素数。数据帧 df 有超过 200 万个条目,因此 for 非常低效。
【问题讨论】:
-
欢迎来到 StackOverflow。请花时间阅读how to provide a great pandas example 上的这篇文章以及如何提供minimal, complete, and verifiable example 并相应地修改您的问题。 how to ask a good question 上的这些提示也可能有用。
-
向我们展示一个数据框