【问题标题】:Is there a way to define "alternate" string terminators (in addition to the null terminator, \0)有没有办法定义“备用”字符串终止符(除了空终止符,\0)
【发布时间】:2013-01-16 19:26:06
【问题描述】:

我不一定想这样做,但我很好奇。在 C/C++ 中有没有办法定义字符串终止符 other 而不是空终止符?比如,能不能这样写,

char* str = "123456|ABCDEF";

char* foo = str;
char* bar = strstr(str, "|") + 1;

// do something here to define '|' as a terminator

std::cout << foo << std::endl;
std::cout << bar << std::endl;

// undo pipe-as-terminator definition

并获得输出,

123456
ABCDEF

?

如果不可能,那么是否有任何方法来获取指向缓​​冲区部分的指针,分配/复制内存,以及修改缓冲区,|s 覆盖为\0s?

【问题讨论】:

  • 不。虽然在某些情况下它可能很好,但零/空/无/任何东西的概念已经深深植根于任何地方的逻辑中,无法改变。
  • std::cout &lt;&lt; bar &lt;&lt; std::endl; 不会是 UB,因为它没有终止?
  • @LuchianGrigore:大声笑...如果您阅读标题,则不是这样:除了空终止符
  • @DavidRodríguez-dribeas 不,我没有。

标签: c++ c string performance null-terminated


【解决方案1】:

您可以编写一个包含指向子字符串的指针和大小的字符串引用包装器,然后使用write 而不是operator&lt;&lt;

// Sketch
struct StringRef {
    const char* start;
    std::size_t length;
    // add code to initialize the object out of the substring
};
std::ostream& operator<<(std::ostream& o, const StringRef& s) {
   return o.write(s.start,s.length);
}

【讨论】:

    【解决方案2】:

    我不认为你可以,因为这条规则是在编译器内部硬构建的。事实上,编译器在您声明的每个字符串常量的末尾都包含了 null-trminator,方法是使用程序集 '.asciz' 指令。所以除非你修改gcc的源代码,我认为你不能。我真的不知道其他编译器,例如 MSVC。对于 Clang,我不知道是否有办法这样做,这需要调查。作为替代方案,您可以通过艰难的方式来执行此操作,并将每个字符串文字键入为 const char message[] = { 'H','e','l','l','o','','!','|' };

    但我想指出,如果编译器施加这种限制,那是有充分理由的。例如,想象一个您从用户那里获取输入文本的程序。如果用户输入'|'怎么办在他的文字中?选择空字符的原因是用户无法输入此字符(因为它不是可打印字符集的一部分,而且我不知道任何键盘包括“空”键. 至少,你应该取另一个字符作为空终止符,但不要取一个容易输入的字符。

    否则,我对操作系统开发感兴趣,人们喜欢重新发明轮子,我已经看到有人尝试使用另一种技术:为每个字符串加上长度前缀,允许在字符串中嵌入空字符,以及提供恒定时间的 strlen() 操作。此外,C#/.NET 字符串是以长度为前缀和以空值结尾的,尽管我并不真正看到它的兴趣......

    在我更精确之前,我想知道您使用的是哪个编译器,以及您在编程方面的“水平”(只是不想告诉您您不会理解的事情)x)

    干杯,抽象

    【讨论】:

    • 从历史上看,终端拥有@ 键的情况并不少见;在这样的终端上,control-@ 通常会发送一个 NUL 字节。尽管 NUL 字节被多种行缓冲逻辑忽略,但并非所有设备都忽略它们。例如,如果启用了纸带打孔器,NUL 字节将导致它将纸张前进一行而不打任何孔(顺便说一下,DEL 由打孔的一行表示,通常也会被忽略) .如果在磁带上打孔时出错,解决方法是备份磁带一行,然后在上面键入 DEL 字符。
    猜你喜欢
    • 1970-01-01
    • 2021-11-28
    • 1970-01-01
    • 2011-06-04
    • 1970-01-01
    • 2019-08-27
    • 2021-10-16
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多