【发布时间】:2020-09-01 15:24:57
【问题描述】:
我有一个复杂的抓取数据框,如下所示:
就上下文而言,PDF 中的原始数据如下所示:
数据帧信息:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 26 entries, 0 to 25
Data columns (total 5 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 0 26 non-null object
1 1 26 non-null object
2 2 26 non-null object
3 3 26 non-null object
4 4 26 non-null object
dtypes: object(5)
memory usage: 1.1+ KB
我希望数据如下图所示。在1 (Transaction Type) 列中带有S 或P 的每一行都应将0 (Asset) 列连接在一起,直到下一个S 或P 出现在1 列中:
我该怎么做?
【问题讨论】:
标签: python pandas dataframe web-scraping pdf-scraping