【发布时间】:2021-08-28 06:04:39
【问题描述】:
我正在尝试创建一个交易和产品组矩阵,但我有一个非常大的交易数据(超过 10,000,000 行)和大约 100 个产品组。当我尝试使用此代码创建数据透视表时
df.pivot(index='transaction_id', columns='product_group', values='ratings')
返回values错误“Unstacked DataFrame is too big,导致int32溢出”
除了减少数据大小之外,还有什么办法解决这个问题吗?
谢谢!
【问题讨论】:
标签: python pandas pivot sparse-matrix recommendation-engine