【问题标题】:encode csv lines in csv file to utf8将 csv 文件中的 csv 行编码为 utf8
【发布时间】:2021-08-18 00:38:50
【问题描述】:

我正在寻找一种将保存在我的 csv 文件行中的 URL 编码为 utf8 的方法,但直到现在才找到合适的库来执行此操作, 这个想法将是一个从 csv 行读取然后编码为 utf8 以将其放入其他文件或新列的库,

任何人都有想法吗?

添加一个例子:

我有一个文件,其中包含一列详细信息:

包含一些文本,我需要在传递一个 url 但编码为 utf 之后。

就像一行是:

Créez, testez et déployez des applications sur Oracle Cloud — 免费。 Inscrivez-vous une fois et accédez à deux offres gratuites。

这一行的预期结果是:

Cr%C3%A9e​​z%2C%20testez%20et%20d%C3%A9ployez%20des%20applications%20sur%20Oracle%20Cloud%20%E2%80%94%20gratuitement.%20Inscrivez-vous%20une%20fois% 20et%20acc%C3%A9dez%20%C3%A0%20deux%20offres%20gratuites。

这只是我的 csv 文件中的一行示例,我需要将其应用于所有行,

好吧,我找到了一个解决方案及其工作,但不是那么正确:

import pandas as pd
from urllib.parse import quote

data = pd.read_csv("file_decoded.csv",error_bad_lines=False)


def title_parse(details):
    details = quote(details)
    return details


data['details']= data.details.apply(title_parse)
data.to_csv('file_encoded.csv')

这个函数的问题是文本被编码但它确实将它作为 ascci 代码库,我不知道如何解释它

【问题讨论】:

  • 你能分享一个你的 csv 数据的例子吗?你希望它是怎样的?您要达到的目标不是很清楚。
  • 我只是编辑我的问题,您可以在我的第一个请求中找到详细信息

标签: python csv utf-8


【解决方案1】:
import pandas as pd
data = pd.read_csv("filename.csv")
data.to_csv("filename_new.csv", encoding="utf-8")

【讨论】:

  • 这一项将 url 编码为 utf8,如下例所示:urlencoded = Freddie%20tentent%20de%20l'aider%20%C3%A0%20le%20chercher.%20Spencer%20retrouve%20des% 20tickets%20du%20Funk%20E%20Fester's%20et%20d%C3%A9cide%20de%20remporter%20le%20plus%20gros%20lot%2C%20Murray%2C%20le%20dauphin%20magique...
猜你喜欢
  • 2015-07-04
  • 1970-01-01
  • 2019-05-18
  • 1970-01-01
  • 1970-01-01
  • 2017-06-02
  • 2016-12-08
  • 2023-04-05
  • 1970-01-01
相关资源
最近更新 更多