【问题标题】:How can I use polymorphic attributes with boost::spirit::qi parsers?如何在 boost::spirit::qi 解析器中使用多态属性?
【发布时间】:2014-06-11 13:23:10
【问题描述】:

我希望我的基于 boost::spirit 的解析器能够解析文件,将解析后的规则转换为不同的类型,并发出一个包含它找到的所有匹配项的向量。作为属性发出的所有类型都应该从基类型继承,例如:

#include <boost/spirit/include/qi.hpp>
#include <boost/fusion/adapt_struct.hpp>
#include <boost/shared_ptr.hpp>
#include <boost/foreach.hpp>

struct CommandBase
{
   virtual void commandAction()
   {
     std::cout << "This is a base command. You should never see this!" << std::endl;
     //Boost::spirit seems to get mad if I make this purely virtual. Clearly I'm doing it wrong.
   }
};

struct CommandTypeA : public CommandBase
{
   int valueA;
   int valueB;
   virtual void commandAction()
   {
      std::cout << "CommandType A! ValueA: " << valueA << " ValueB: " << valueB << std::endl;
   }

};

struct CommandTypeB : public CommandBase
{
   double valueA;
   std::vector<char> valueB;
   virtual void commandAction()
   {
      std::cout << "CommandType B! valueA: " << valueA << " string: " << std::string(valueB.begin(), valueB.end()) << std::endl;
   }
};
struct CommandTypeC : public CommandBase
{
  //Represents a sort of "subroutine" type where multiple commands can be grouped together
  std::vector<char> labelName;
  std::vector<boost::shared_ptr<CommandBase> > commands;
  virtual void commandAction()
  {
      std::cout << "Subroutine: " << std::string(labelName.start(), labelName.end())
                << " has " << commands.size() << " commands:" << std::endl;
      BOOST_FOREACH(boost::shared_ptr<CommandBase> c, commands)
      {
           c->commandAction();
      }          
  }
};

现在,我的尝试解析器代码:

namespace ascii = boost::spirit::ascii;
namespace qi = boost::spirit::qi;
using qi::lit_;

BOOST_FUSION_ADAPT_STRUCT(
   CommandTypeA,
   (int, valueA)
   (int, valueB)
)

BOOST_FUSION_ADAPT_STRUCT(
   CommandTypeB,
   (double, valueA)
   (std::vector<char>, valueB)
)

BOOST_FUSION_ADAPT_STRUCT(
   CommandTypeC,
   (std::vector<char>, labelName)
   (std::vector<boost::shared_ptr<CommandBase> >, commands)
)

template<typename Iterator, typename Skipper = ascii::space_type>
struct CommandParser : qi::grammar<Iterator, std::vector<boost::shared_ptr<CommandBase> >(), Skipper>
{
   public:
   CommandParser() : CommandParser()::base_type(commands)
   {
      CommandARule = qi::int_ >> qi::int_ >> lit("CMD_A");
      CommandBRule = qi::int_ >> +(qi::char_) >> lit("CMD_B");
      CommandCRule = qi::char_(':') >> lexeme[+(qi::char_ - ';' - ascii::space) >> +ascii::space] >> commands >> qi::char_(';');

      commands = +(CommandARule | CommandBRule | CommandCRule);
   }
   protected:
   qi::rule<Iterator, boost::shared_ptr<CommandTypeA>, Skipper> CommandARule;
   qi::rule<Iterator, boost::shared_ptr<CommandTypeB>, Skipper> CommandBRule;
   qi::rule<Iterator, boost::shared_ptr<CommandTypeC>, Skipper> CommandCRule;
   qi::rule<Iterator, std::vector<boost::shared_ptr<CommandBase> >, Skipper> commands;

};


std::vector<boost::shared_ptr<CommandBase> > commandList;
bool success = qi::phrase_parse(StartIterator, EndIterator, CommandParser, ascii::space, commandList);

BOOST_FOREACH(boost::shared_ptr<CommandBase> c, commandList)
{
    c->commandAction();
}

现在,这段代码肯定不会编译,但我希望它能理解我正在尝试做的事情的要点。

主要的问题是 qi::rules 似乎想要发出实际的结构,而不是对它的引用。

我的问题是:

是否可以像我尝试的那样强制 qi::rule 发出多态兼容的引用(如果是,如何),这是我尝试完成的最佳方法(即表示已解析命令及其参数的可执行对象列表)?

【问题讨论】:

  • 您知道即使解析器公开了std::vector&lt;char&gt;,您也可以使用std::string?它是内置属性转换之一

标签: c++ boost polymorphism boost-spirit boost-spirit-qi


【解决方案1】:

Spirit 对编译时多态性更友好

typedef variant<Command1, Command2, Command3> Command;

但是,假设你真的想做老式的多态性事情......

然而,在解析过程中即时更新多态对象是一种可靠的方法

  • 语义操作使您的解析器臃肿
  • 在语法规则中回溯时造成大量内存泄漏
  • 使解析速度非常慢(因为您正在进行各种动态分配)。
  • 最糟糕的是,即使您实际上没有将属性引用传递到顶级parse API,这些都不会被优化掉。 (通常,所有属性处理“神奇地”在编译时蒸发,这对于输入格式验证非常有用)

因此,您需要为基本命令类或派生类的对象创建一个持有者。使持有者满足RuleOfZero,通过类型擦除得到实际值。

(除了解决“意外”复杂性和限制内存回收之外,这种抽象的一个好处是您仍然可以选择静态处理存储,因此可以节省 [大量] 堆分配时间。)

我会看看你的示例,看看我能否快速演示一下。

这就是我对“持有人”类的意思(将虚拟析构函数添加到CommandBase!):

struct CommandHolder
{
    template <typename Command> CommandHolder(Command cmd) 
        : storage(new concrete_store<Command>{ std::move(cmd) }) { }

    operator CommandBase&() { return storage->get(); }
  private:
    struct base_store {
        virtual ~base_store() {}; 
        virtual CommandBase& get() = 0;
    };
    template <typename T> struct concrete_store : base_store {
        concrete_store(T v) : wrapped(std::move(v)) { }
        virtual CommandBase& get() { return wrapped; }
      private:
        T wrapped; 
    };

    boost::shared_ptr<base_store> storage;
};

如您所见,我在这里选择了unique_ptr 来简化所有权语义(variant 可以避免一些分配开销作为以后的优化)。我无法让unique_ptr 与 Spirit 一起工作,因为 Spirit 根本无法感知移动。 (Spirit X3 会)。

我们可以基于这个持有者轻松实现一个类型擦除 AnyCommand

struct AnyCommand : CommandBase
{
    template <typename Command> AnyCommand(Command cmd) 
        : holder(std::move(cmd)) { }

    virtual void commandAction() override { 
        static_cast<CommandBase&>(holder).commandAction();
    }
  private:
    CommandHolder holder;
};

因此,现在您可以将任何命令“分配”给 AnyCommand,并通过持有者“多态地”使用它,即使持有者和 AnyCommand 具有完美的值语义。

这个示例语法可以:

CommandParser() : CommandParser::base_type(commands)
{
    using namespace qi;
    CommandARule = int_    >> int_           >> "CMD_A";
    CommandBRule = double_ >> lexeme[+(char_ - space)] >> "CMD_B";
    CommandCRule = ':' >> lexeme [+graph - ';'] >> commands >> ';';

    command  = CommandARule | CommandBRule | CommandCRule;
    commands = +command;
}

规则定义为:

qi::rule<Iterator, CommandTypeA(),            Skipper> CommandARule;
qi::rule<Iterator, CommandTypeB(),            Skipper> CommandBRule;
qi::rule<Iterator, CommandTypeC(),            Skipper> CommandCRule;
qi::rule<Iterator, AnyCommand(),              Skipper> command;
qi::rule<Iterator, std::vector<AnyCommand>(), Skipper> commands;

这是价值语义和运行时多态性的完美结合 :)

主要测试

int main()
{
    std::string const input =
        ":group             \n"
        "     3.14  π CMD_B \n"
        "     -42  42 CMD_A \n"
        "     -inf -∞ CMD_B \n"
        "     +inf +∞ CMD_B \n"
        ";                  \n"
        "99 0 CMD_A";

    auto f(begin(input)), l(end(input));

    std::vector<AnyCommand> commandList;
    CommandParser<std::string::const_iterator> p;
    bool success = qi::phrase_parse(f, l, p, qi::space, commandList);

    if (success) {
        BOOST_FOREACH(AnyCommand& c, commandList) {
            c.commandAction();
        }
    } else {
        std::cout << "Parsing failed\n";
    }

    if (f!=l) {
        std::cout << "Remaining unparsed input '" << std::string(f,l) << "'\n";
    }
}

打印:

Subroutine: group has 4 commands:
CommandType B! valueA: 3.14 string: π
CommandType A! ValueA: -42 ValueB: 42
CommandType B! valueA: -inf string: -∞
CommandType B! valueA: inf string: +∞
CommandType A! ValueA: 99 ValueB: 0

全部查看Live On Coliru

【讨论】:

  • 既然您认为带有 boost::variant 的编译时多态性是一种更好的方法,您能否详细说明一下?
  • 呵呵呵呵。我想many many answers 之一会这样做:) 我有兴趣稍后提出一个编译时(Spirit)与运行时多态(域模型)桥接解决方案,只是为了看看它是否可以工作。
  • @stix 我已经用一个示例更新了答案,该示例使用持有者来管理实际命令的分配/生命周期,同时为语法公开纯值语义:查看它 @ 987654324@
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2011-01-26
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多