【发布时间】:2021-08-12 07:28:01
【问题描述】:
我想从 pandas 数据框列中获取字符串的前半部分,其中长度逐行变化。我四处搜索并找到了questions like this,但解决方案都集中在分隔符和正则表达式上。我没有分隔符 - 我只想要字符串的前半部分,不管它有多长。
我可以指定我想要的字符串长度:
import pandas as pd
eggs = pd.DataFrame({"id": [0, 1, 2, 3],
"text": ["eggs and spam", "green eggs and spam", "eggs and spam2", "green eggs"]})
eggs["half_length"] = eggs.text.str.len() // 2
然后我想做一些事情,比如eggs["truncated_text"] = eggs["text"].str[:eggs.half_length]。还是首先定义此列是错误的方式?有人可以帮忙吗?
【问题讨论】:
-
你对前半部分的定义是什么,包括在计数中吗?如果你有三个词,你会如何定义一半?