【问题标题】:MediaWiki/Wikipedia URL sanitization regexMediaWiki/Wikipedia URL 清理正则表达式
【发布时间】:2014-04-16 16:24:23
【问题描述】:

当您在 MediaWiki/Wikipedia 中创建页面时,标题会被清理并用作 URL 路径的一部分。例如。 “Lorem Ipsum”变为“Lorem_Ipsum”。

您知道哪个 regex 用于清理吗?我可以看到它也接受扩展字符(如 ü)。

【问题讨论】:

  • 你为什么认为它是一个正则表达式?

标签: mediawiki wikipedia sanitization


【解决方案1】:

这取决于你的 wiki 的设置,但基本上:

  • 空格替换为 _(在 MediaWiki 世界中它们被视为平等)
  • 非 ascii 字符被转义
  • 第一个字符变成大写(这可以被覆盖)
  • 正斜杠可以被视为页面/子页面的分隔符,具体取决于每个命名空间设置。

还有一些限制,例如标题不能以冒号开头。有关完整列表,请参阅 https://www.mediawiki.org/wiki/Manual:Page_title

【讨论】:

猜你喜欢
  • 2010-11-27
  • 1970-01-01
  • 2021-07-29
  • 1970-01-01
  • 1970-01-01
  • 2010-10-31
  • 2018-10-13
相关资源
最近更新 更多