【发布时间】:2017-09-22 01:33:22
【问题描述】:
我有一个包含 200,000 行的 csv 文件。我已将其加载到数据框中,并希望通过以下脚本使用 faker 对其进行匿名化:
for i in range(MasterDE1.FirstName.size):
MasterDE1.loc[(MasterDE1["Gender__pc"] == 'Female'), ['FirstName','LastName']] = fake.first_name_female(),fake.last_name_female()
MasterDE1.loc[(MasterDE1["Gender__pc"] == 'Male'), ['FirstName','LastName']] = fake.first_name_male(),fake.last_name_male()
MasterDE1.loc[(MasterDE1["Gender__pc"] == 'Unknown'), ['FirstName','LastName']] = fake.first_name(),fake.last_name()
MasterDE1['Name'] = MasterDE1['FirstName'] + ' ' + MasterDE1['LastName']
MasterDE1['EmailAddress'] = 'smithandthunder' + str(i+1) + '@gmail.com'
它从过去 20 分钟开始运行(我不认为内核已经死了)。
【问题讨论】:
-
不要介意负面点,但会感谢 cmets,以便我可以改进未来的问题
标签: python python-3.x pandas jupyter-notebook faker