使用正则表达式编码时出错[重复]

【问题标题】：Error with encoding with regular expression [duplicate]使用正则表达式编码时出错[重复]
【发布时间】：2026-02-02 11:00:01
【问题描述】：

我正在使用 scrapy 和 django。在清理数据时我使用这个：

html = re.sub(r'(™|®|©|&trade;|&reg;|&copy;|&#8482;|&#174;|&#169;)', '',html, flags=re.IGNORECASE)

在普通的 python shell 中运行是可以的。然而，每次我尝试用scrapy crawl运行它时，我都会收到这个错误：

SyntaxError: 文件中的非 ASCII 字符 '\xe2' /一些文件/ 在第 105 行，但没有声明编码；看 http://www.python.org/peps/pep-0263.html了解详情

谁能帮帮我。谢谢！

【问题讨论】：

您是否尝试将搜索字符串提取出来并明确声明为 unicode 字符串？ mystring=u'regexp|regexp' 并在子字符串匹配中使用它？

标签： python regex django scrapy

【解决方案1】：

我通过以下方式在我的文件中声明了编码：

#!/usr/bin/python
# -*- coding: utf-8 -*-

确保将它们放在文件的第一行。这似乎解决了我的问题。

谢谢大家！

【讨论】：

重要：这只是为代码设置编码，而不是为您读取的文件设置编码。

猜你喜欢

编译正则表达式时操作脚本错误 2026-01-27
Visual Studio 使用正则表达式查找无重复项 2026-02-08
草莓 Perl 正则表达式，Windows 7 [重复] 2026-02-07
在elisp中通过`re-search-forward`使用正则表达式[重复] 2026-02-13
使用Python的正则表达式中的数字模式搜索[重复] 2026-02-06
使用正则表达式获取错误数据 2026-01-05
Python正则表达式返回不正确的组[重复] 2026-01-08
在 asp.NET 正则表达式验证控件中重用表达式 2012-05-23
在 Sweave 表达式中查找 R 代码的正则表达式 2026-02-06

相关资源

JavaScript正则表达式迷你书 v1.1 pdf版下载 2023-02-23
正则表达式必知必会中文 PDF版 [7.64M]下载 2023-02-24
C#字符串和正则表达式参考手册 pdf版下载 2023-01-27
java多线程反射泛型及正则表达式学习笔记和源码下载 2023-10-05
Python正则表达式全套笔记v0.3 中文PDF版(含Python3.10官方文档)下载 2023-04-13

最近更新更多

热门标签

Java Python linux javascript C# Mysql Docker 算法前端 SpringBoot Redis Vue spring .net 设计模式 .net core c++ kubernetes 数据库机器学习大数据数据结构微服务 js 人工智能 Go Android 面试程序员 JVM 云原生后端 ASP.net core 深度学习 CSS k8s git golang PHP devops Nginx Django React mybatis 架构多线程 Spring Boot 云计算 LeetCode 分布式