【发布时间】:2019-09-24 23:45:55
【问题描述】:
我是 Python 和 Jupyter Notebook 的新手,目前正在学习本教程:https://www.dataquest.io/blog/jupyter-notebook-tutorial/。到目前为止,我已经导入了 pandas 库和其他一些东西,并且我制作了一个数据框“df”,它只是一个包含公司利润和收入数据的 CSV 文件。我无法理解教程的以下行:
non_numberic_profits = df.profit.str.contains('[^0-9.-]')
我理解本教程的重点:识别所有利润变量包含字符串而不是数字的公司。但我不明白 [^0-9.-] 的意义以及上述函数的实际工作原理。
我的完整代码如下。谢谢。
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style="darkgrid")
df = pd.read_csv('fortune500.csv')
df.columns = ['year', 'rank', 'company', 'revenue', 'profit']
non_numberic_profits = df.profit.str.contains('[^0-9.-]')
df.loc[non_numberic_profits].head()
【问题讨论】:
标签: python string pandas jupyter