PHP从URL（正则表达式）获取Twitter用户名[重复]答案

【问题标题】：PHP Get Twitter username from URL (Regex) [duplicate]PHP从URL（正则表达式）获取Twitter用户名[重复]
【发布时间】：2021-03-04 14:53:07
【问题描述】：

我希望能够从 URL 中提取 Twitter 用户名。

我发现这个正则表达式很有帮助。

  if (preg_match("/^https?:\/\/(www\.)?twitter\.com\/(#!\/)?(?<name>[^\/]+)(\/\w+)*$/", $url, $regs)) {
    return $regs['name'];
  }

twitter URL 包含查询参数时似乎不起作用。

例如 = https://twitter.com/jack?lang=en 返回jack?lang=en

知道如何改进正则表达式来防止这种情况发生吗？

【问题讨论】：

【解决方案1】：

preg_match('/https?:\/\/twitter\.com\/(?<name>[^\?]+)\??.*/', 'https://twitter.com/jack?lang=en', $m);
var_dump(trim($m['name']));

$path = parse_url('https://twitter.com/jack?lang=en',PHP_URL_PATH);
var_dump(str_replace('/','', $path));

string(4) "jack"

【讨论】：

你能添加一个关于https?:\/\/twitter\.com\/(?<name>[^\?]+)?\??.*模式的解释吗？这部分(?<name>[^\?]+)? 是可选的。这也是可选的 \?? 并且此 .* 匹配任何字符 0+ 次。因此，https://twitter.com/ 之后的所有内容都是可选的，.* 将匹配整行。
我好像迷路了。我修复了正则表达式。名称部分，当然不是可选的。查询问号是可选的，在它之后也是可选的。所以正则表达式的意思是：scheme、host，然后都是直到问号是名称，然后是字面意思“？”在“？”之后可能不存在任何符号（或没有符号）