【问题标题】:mod_rewrite rules aren't workingmod_rewrite 规则不起作用
【发布时间】:2012-06-16 21:36:17
【问题描述】:

我已经联系了我的虚拟主机,但他们的帮助不大,所以我来到了这里的天才。

我无法通过 .htaccess 文件重写我网站上的任何 URL。

我只有一个 .htaccess 文件,它位于我的主目录的根目录中。这是那个文件:

RewriteEngine On

RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME} !-f

# The support guys thought it was in issue with the L flag below, so I commented out my original implementation and used their supplied one

#RewriteCond %{HTTP_HOST} ^www.mythofechelon.co.uk$ [NC]
#RewriteRule ^(.*)$ http://mythofechelon.co.uk/$1 [R=301,L]

RewriteCond %{HTTP_HOST} ^www\.(([a-z0-9_]+\.)?mythofechelon\.co.uk)$ [NC]
RewriteRule .? http://%1%{REQUEST_URI} [R=301,L]


RewriteRule ^/$ /main/pages/index.php?home
RewriteRule ^/home(.*)?$ /main/pages/index.php?home
RewriteRule ^/404(.*)?$ /main/pages/index.php?404

#I will eventually change the following commands to link to the rewritten URLs when this all eventually works
DirectoryIndex /main/pages/index.php?home
ErrorDocument 404 /main/pages/index.php?404

AddType application/x-shockwave-flash swf

Options All -Indexes

#Protect .htaccess
<files .htaccess>
    order allow,deny
    deny from all
</files>

<Files *.reg>
    ForceType application/pdf
    Header set Content-Disposition attachment
</Files>

#Block bots
<limit GET POST HEAD>
    Order Allow,Deny
    Allow from all
    Deny from env=bad_bot
</limit>

RewriteRule ^.* - [F,L]
RewriteCond %{HTTP_USER_AGENT} ^Anarchie [OR]
RewriteCond %{HTTP_USER_AGENT} ^ASPSeek [OR]
RewriteCond %{HTTP_USER_AGENT} ^attach [OR]
RewriteCond %{HTTP_USER_AGENT} ^autoemailspider [OR]
RewriteCond %{HTTP_USER_AGENT} ^BlackWidow [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Bot\ mailto:craftbot@yahoo.com [OR] 
RewriteCond %{HTTP_USER_AGENT} ^ChinaClaw [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Custo [OR] 
RewriteCond %{HTTP_USER_AGENT} ^DISCo [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Download\ Demon [OR] 
RewriteCond %{HTTP_USER_AGENT} ^eCatch [OR] 
RewriteCond %{HTTP_USER_AGENT} ^EirGrabber [OR] 
RewriteCond %{HTTP_USER_AGENT} ^EmailSiphon [OR] 
RewriteCond %{HTTP_USER_AGENT} ^EmailWolf [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Express\ WebPictures [OR] 
RewriteCond %{HTTP_USER_AGENT} ^ExtractorPro [OR] 
RewriteCond %{HTTP_USER_AGENT} ^EyeNetIE [OR] 
RewriteCond %{HTTP_USER_AGENT} ^FlashGet [OR] 
RewriteCond %{HTTP_USER_AGENT} ^GetRight [OR] 
RewriteCond %{HTTP_USER_AGENT} ^GetWeb! [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Go!Zilla [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Go-Ahead-Got-It [OR] 
RewriteCond %{HTTP_USER_AGENT} ^GrabNet [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Grafula [OR] 
RewriteCond %{HTTP_USER_AGENT} ^HMView [OR] 
RewriteCond %{HTTP_USER_AGENT} HTTrack [NC,OR] 
RewriteCond %{HTTP_USER_AGENT} ^Image\ Stripper [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Image\ Sucker [OR] 
RewriteCond %{HTTP_USER_AGENT} Indy\ Library [NC,OR] 
RewriteCond %{HTTP_USER_AGENT} ^InterGET [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Internet\ Ninja [OR] 
RewriteCond %{HTTP_USER_AGENT} ^JetCar [OR] 
RewriteCond %{HTTP_USER_AGENT} ^JOC\ Web\ Spider [OR] 
RewriteCond %{HTTP_USER_AGENT} ^larbin [OR] 
RewriteCond %{HTTP_USER_AGENT} ^LeechFTP [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Mass\ Downloader [OR] 
RewriteCond %{HTTP_USER_AGENT} ^MIDown\ tool [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Mister\ PiX [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Navroad [OR] 
RewriteCond %{HTTP_USER_AGENT} ^NearSite [OR] 
RewriteCond %{HTTP_USER_AGENT} ^NetAnts [OR] 
RewriteCond %{HTTP_USER_AGENT} ^NetSpider [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Net\ Vampire [OR] 
RewriteCond %{HTTP_USER_AGENT} ^NetZIP [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Octopus [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Offline\ Explorer [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Offline\ Navigator [OR] 
RewriteCond %{HTTP_USER_AGENT} ^PageGrabber [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Papa\ Foto [OR] 
RewriteCond %{HTTP_USER_AGENT} ^pavuk [OR] 
RewriteCond %{HTTP_USER_AGENT} ^pcBrowser [OR] 
RewriteCond %{HTTP_USER_AGENT} ^RealDownload [OR] 
RewriteCond %{HTTP_USER_AGENT} ^ReGet [OR] 
RewriteCond %{HTTP_USER_AGENT} ^SiteSnagger [OR] 
RewriteCond %{HTTP_USER_AGENT} ^SmartDownload [OR] 
RewriteCond %{HTTP_USER_AGENT} ^SuperBot [OR] 
RewriteCond %{HTTP_USER_AGENT} ^SuperHTTP [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Surfbot [OR] 
RewriteCond %{HTTP_USER_AGENT} ^tAkeOut [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Teleport\ Pro [OR] 
RewriteCond %{HTTP_USER_AGENT} ^VoidEYE [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Web\ Image\ Collector [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Web\ Sucker [OR] 
RewriteCond %{HTTP_USER_AGENT} ^WebAuto [OR] 
RewriteCond %{HTTP_USER_AGENT} ^WebCopier [OR] 
RewriteCond %{HTTP_USER_AGENT} ^WebFetch [OR] 
RewriteCond %{HTTP_USER_AGENT} ^WebGo\ IS [OR] 
RewriteCond %{HTTP_USER_AGENT} ^WebLeacher [OR] 
RewriteCond %{HTTP_USER_AGENT} ^WebReaper [OR] 
RewriteCond %{HTTP_USER_AGENT} ^WebSauger [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Website\ eXtractor [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Website\ Quester [OR] 
RewriteCond %{HTTP_USER_AGENT} ^WebStripper [OR] 
RewriteCond %{HTTP_USER_AGENT} ^WebWhacker [OR] 
RewriteCond %{HTTP_USER_AGENT} ^WebZIP [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Wget [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Widow [OR] 
RewriteCond %{HTTP_USER_AGENT} ^WWWOFFLE [OR] 
RewriteCond %{HTTP_USER_AGENT} ^Xaldon\ WebSpider [OR]
RewriteCond %{HTTP_USER_AGENT} ^Xenu [OR]
RewriteCond %{HTTP_USER_AGENT} ^Zeus.*Webster [OR]
RewriteCond %{HTTP_USER_AGENT} ^Zeus 

SetEnvIfNoCase user-Agent ^FrontPage [NC,OR]
SetEnvIfNoCase user-Agent ^Java.* [NC,OR]
SetEnvIfNoCase user-Agent ^Microsoft.URL [NC,OR]
SetEnvIfNoCase user-Agent ^MSFrontPage [NC,OR]
SetEnvIfNoCase user-Agent ^Offline.Explorer [NC,OR]
SetEnvIfNoCase user-Agent ^[Ww]eb[Bb]andit [NC,OR]
SetEnvIfNoCase user-Agent ^Zeus [NC]

(伙计,你们需要更改它,这样您就不必手动缩进每一行。)

我已独立确认:

  • DirectoryIndex 命令正常工作,DirectoryIndex /main/pages/index.php 工作正常。
  • ErrorDocument 404 命令显然有效。
  • 使用 PHP 变量链接到文件有效,因为 DirectoryIndexErrorDocument 404 命令的当前实现有效。
  • 这不是任何文件保护或机器人阻止命令的问题。
  • “www”不是问题。删除命令,因为我已经注释掉并完全删除了它们的所有尝试实现,但仍然存在相同的问题。

问题似乎完全在于RewriteRule 命令。 RewriteEngine 已启用,至少在 .htaccess 和 mod_rewrite 几天前工作,在我重新启动我的网站之前。

我认为这可能是因为 RewriteRules 没有 RewriteConds,但这些确切的命令几天前就可以工作了。

【问题讨论】:

  • RewriteRule ^.* - [F,L] 停止 all 重写并给出 403,这就是您想要的...您可以使用 {} 键缩进文本块:P
  • 我会说可能,但我认为这最初被注释掉了。在我需要工作的RewriteRule 命令之后?哦,谢谢{} 的提示!我的天,这一直很烦人。 :L

标签: apache .htaccess mod-rewrite


【解决方案1】:

在您上面发布的 .htaccess 中,没有立即遵循这些规则的 RewriteRule:

RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME} !-f

因此它们将与下一个未注释的规则相结合,这些规则执行重定向但未定义应处理这些请求的文件:

RewriteCond %{HTTP_HOST} ^www\.(([a-z0-9_]+\.)?mythofechelon\.co.uk)$ [NC]
RewriteRule .? http://%1%{REQUEST_URI} [R=301,L]

你会想要这样的:

# Strip www. from domain name 
RewriteCond %{HTTP_HOST} ^www\.(.+)$ [NC]
RewriteRule ^(.*)$ http://%1/$1 [R=301,L]

# Send requests for non-existent files and directories to index.php
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule ^home/(.*)$ /main/pages/index.php?$1 [L]

规则的顺序对于 mod_rewrite 是必不可少的。文件中出现问题的另一个示例是您尝试阻止不良机器人的部分。 RewriteRule 必须在 RewriteCond 规则之后。此外,您的限制部分实际上并没有做任何事情,因为关于机器人的规则都没有真正设置环境变量。

实际上还有另一个指令可以专门用于查看用户代理和设置环境变量:BrowserMatchBrowserMatchNoCase - http://httpd.apache.org/docs/2.2/mod/mod_setenvif.html#browsermatchnocase

我会用这样的东西替换坏机器人的行:

BrowserMatchNoCase Anarchie bad_bot

然后将您的限制部分移到 BrowserMatchNoCase 条目下方 - 否则可能尚未设置环境变量。

此外,mod_rewrite 标志对 SetEnvIfNoCase 条目无效。

更新

要处理 404,您可以添加以下内容:

RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule ^!home/(.*)$ /main/pages/index.php?404 [L]

或者(这是我的建议)您可以将主页更改为 .*,然后更新您的 php 脚本以在适当的时候发送 404。

【讨论】:

  • 谢谢。这已经解决了这个问题。但是,RewriteRule ^(.*)$ /main/pages/index.php?$1 [L] 似乎以ErrorDocument 404 的方式运行,但将“错误 URL”附加到index.php?。我不希望这种情况发生。我只希望“/home”可用作重写的 URL(现在),其他所有内容都发送到“/404”。有没有办法做到这一点?是的,支持技术人员给了我一个新的机器人拦截系统,它的功能就像你建议的那样。还是谢谢。
  • 我已经编辑了我的帖子来解决这些问题。您只需要调整 RewriteRule 并保持 ErrorDocument 不变。
  • 我猜 ErrorDocument 优先于 RewriteRules 。查看我的最新更新。
  • 我重新查看了您的 cmets 和答案,然后又查看了我的旧的、正在工作的 .htaccess,我现在已经自己弄清楚了。我现在该怎么办?我想为您提供帮助并引导我思考解决方案的正确答案,但它实际上不是“正确答案”。那么,我应该发布自己的解决方案并给出正确答案吗?
  • 这真的取决于你,但在我看来,如果我的回答导致解决方案,那么接受它是正确的。您还可以发布带有其他详细信息/信息的另一个答案。你的电话..
猜你喜欢
  • 2017-12-27
  • 1970-01-01
  • 1970-01-01
  • 2012-04-02
  • 2015-02-26
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多