【发布时间】:2020-11-02 10:48:56
【问题描述】:
我目前正在运行健全性检查以验证 id 是否与所需格式匹配。我想为不符合所需标准格式的项目过滤我的数据框。 在这种情况下:
- 前两个必须是字母
- 总长度应为 16 个字符
我想找到任何不符合上述条件的项目。
>>> data = [['US-T-2018-08-110','Forward'],['EU-U-2001-04-019','Backward'],['EU-U-2017-05-178','Still'], ['N/A','Up'],['DE-T-1999-08-8512','Down']]
>>> df = pd.DataFrame(data, columns = ['project_id', 'name'])
>>> df
project_id name
US-T-2018-08-110 Forward
EU-U-2001-04-019 Backward
EU-U-2017-05-178 Still
N/A Up
DE-T-1999-08-8512 Down
应该导致:
project_id name
N/A Up
DE-T-1999-08-8512 Down
此外,有没有办法在不循环的情况下实现这一点?
【问题讨论】:
-
总长度到底是多少?没有一个字符串有 14 个字符
-
@DaniMesejo 嘿抱歉,忘记包含第一个字母 - 长度应为 16 - 已更正
标签: python python-3.x pandas numpy lambda