虽然已经有一个公认的答案,但我想展示一个超简单直接的解决方案。用 C++17 测试。以及完整的运行源码。
由于我们谈论的是最多 7 个组,我们可以简单地将它们全部列出并“或”它们。这可能是很多文本和复杂的 DFA。但它应该可以工作。
找到匹配后,我们定义一个向量并将所有数据/组放入其中并显示所需的结果。这很简单:
请看:
#include <iostream>
#include <string>
#include <iterator>
#include <vector>
#include <regex>
std::vector<std::string> test{
"X::Y",
"X:X::Y",
"X:X::Y:Y",
"X:X:X::Y:Y",
"X::Y:Y:Y:Y:Y",
"X:X:X:X:X::Y:Y",
"X:X:X:X:X:X::Y:Y"
};
const std::regex re1{ R"((((X:){1,1}(:Y){1,6})|((X:){1,2}(:Y){1,5})|((X:){1,3}(:Y){1,4})|((X:){1,4}(:Y){1,3})|((X:){1,5}(:Y){1,2})|((X:){1,6}(:Y){1,1})))" };
const std::regex re2{ R"(((X:)|(:Y)))" };
int main() {
std::smatch sm;
// Go through all test strings
for (const std::string s : test) {
// Look for a match
if (std::regex_match(s, sm, re1)) {
// Show succes message
std::cout << "Match found for --> " << s << "\n";
// Get all data (groups) into a vector
std::vector<std::string> data{ std::sregex_token_iterator(s.begin(), s.end(),re2,1), std::sregex_token_iterator() };
// Show desired groups
if (data.size() >= 6) {
std::cout << "Group 1: '" << data[0] << "' Group 6: '" << data[5] << "'\n";
}
}
else {
std::cout << "**** NO match found for --> " << s << "\n";
}
}
return 0;
}