【发布时间】:2021-08-18 00:38:50
【问题描述】:
我正在寻找一种将保存在我的 csv 文件行中的 URL 编码为 utf8 的方法,但直到现在才找到合适的库来执行此操作, 这个想法将是一个从 csv 行读取然后编码为 utf8 以将其放入其他文件或新列的库,
任何人都有想法吗?
添加一个例子:
我有一个文件,其中包含一列详细信息:
包含一些文本,我需要在传递一个 url 但编码为 utf 之后。
就像一行是:
Créez, testez et déployez des applications sur Oracle Cloud — 免费。 Inscrivez-vous une fois et accédez à deux offres gratuites。
这一行的预期结果是:
Cr%C3%A9ez%2C%20testez%20et%20d%C3%A9ployez%20des%20applications%20sur%20Oracle%20Cloud%20%E2%80%94%20gratuitement.%20Inscrivez-vous%20une%20fois% 20et%20acc%C3%A9dez%20%C3%A0%20deux%20offres%20gratuites。
这只是我的 csv 文件中的一行示例,我需要将其应用于所有行,
好吧,我找到了一个解决方案及其工作,但不是那么正确:
import pandas as pd
from urllib.parse import quote
data = pd.read_csv("file_decoded.csv",error_bad_lines=False)
def title_parse(details):
details = quote(details)
return details
data['details']= data.details.apply(title_parse)
data.to_csv('file_encoded.csv')
这个函数的问题是文本被编码但它确实将它作为 ascci 代码库,我不知道如何解释它
【问题讨论】:
-
你能分享一个你的 csv 数据的例子吗?你希望它是怎样的?您要达到的目标不是很清楚。
-
我只是编辑我的问题,您可以在我的第一个请求中找到详细信息