【发布时间】:2021-10-02 06:14:35
【问题描述】:
我有一个清单
top = ['GME', 'MVIS', 'TSLA', 'AMC']
我有一个数据集
discussion = pd.read_csv('discussion_thread_data.csv')
dt | text
2021-03-19 20:59:49+06 | I only need GME to hit 20 eod to make up
2021-03-19 20:59:51+06 | lads why is my account covered in more red
2021-05-21 15:54:27+06 | Oh my god, we might have 2 green days in a row
2021-05-21 15:56:06+06 | Why are people so hype about a 4% TSLA move
所以我想将数据框分成单独的数据框,其中每个数据框将包含文本列中列表中每个股票代码的出现。 这是我尝试过的
check = discussion[discussion['text'].map(lambda txt: any(tag in txt for tag in top))]
我得到了正确的输出,现在我想用列表中的特定代码绘制行的每个出现 我希望我的 x 轴是日期,y 轴是代码。换句话说,我想要 4 个单独的图表,每个图表都是单独的代码。
感谢任何帮助
【问题讨论】:
-
不清楚聚合发生是什么意思,您可以按股票代码和应用列表分组。类似 df.groupby('ticker')['date'].apply(list)