【问题标题】:c++ Url Parser using boost regex matchc ++ Url Parser使用boost正则表达式匹配
【发布时间】:2011-04-07 04:22:08
【问题描述】:

如何使用 boost regex 解析 c++ 中的 url 就像我有一个网址

http://www.google.co.in/search?h=test&q=examaple

我需要拆分base url www.google.com然后查询路径search?h=test&q=examaple

【问题讨论】:

    标签: c++ url boost boost-regex


    【解决方案1】:

    你确定你需要正则表达式吗?

    #include <iostream>
    #include <algorithm>
    
    int main()
    {
      using namespace std;
      string x = "http://www.google.co.in/search/search/?h=test&q=examaple";
    
      size_t sp = x.find_first_of( '/', 7 /* skip http:// part */ );
      if ( sp != string::npos ) {
            string base_url( x.begin()+7, x.begin()+sp );
            cout << base_url << endl;
            sp = x.find_last_of( '/' );
            if ( sp != string::npos ) {
                    string query( x.begin()+sp+1, x.end() );
                    cout << query << endl;
            }
      }
    
      return 0;
    }
    

    正则表达式版本:

    string input_string = "http://www.google.co.in/search/search/?h=test&q=examaple";
    boost::regex exrp( "^(?:http://)?([^/]+)(?:/?.*/?)/(.*)$" );
    boost::match_results<string::const_iterator> what;
    if( regex_search( input_string, what, exrp ) ) {
        std::string base_url( what[1].first, what[1].second );
        std::string query( what[2].first, what[2].second );
    }
    

    【讨论】:

    • 我需要一个 url 的基础你的代码失败了这个 url http://www.google.co.in/search/search/?h=test&amp;q=examaple
    • @rajesh,修复并添加了正则表达式版本。
    • 为什么要转义该正则表达式中的斜杠?你不需要,没有它们也能工作
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-02-19
    • 2015-09-14
    相关资源
    最近更新 更多