【发布时间】:2026-01-13 14:30:01
【问题描述】:
test = {'ngrp' : ['Manhattan', '*lyn', 'Queens', 'Staten Island', 'Bronx']}
test = pd.DataFrame(test)
dummy = pd.get_dummies(test['ngrp'], drop_first = True)
这给了我:
*lyn Manhattan Queens Staten Island
0 0 1 0 0
1 1 0 0 0
2 0 0 1 0
3 0 0 0 1
4 0 0 0 0
我将 Bronx 作为我的参考水平(因为那会被丢弃),我如何更改它以指定曼哈顿应该是我的参考水平?我的预期输出是
*lyn Queens Staten Island Bronx
0 0 0 0 0
1 1 0 0 0
2 0 1 0 0
3 0 0 1 0
4 0 0 0 1
【问题讨论】:
-
“参考水平”是什么意思,预期的输出是什么?
标签: python pandas dataframe dummy-variable