【问题标题】:Converting an IPV6 string to uint16_t array in C++在 C++ 中将 IPV6 字符串转换为 uint16_t 数组
【发布时间】:2020-07-30 22:15:09
【问题描述】:

我有一个 IPV6 字符串作为下面的示例:

"0001:0002:0003:0004:0005:0006:0007:0008"

我正在尝试找到最简洁的方法将其转换为包含 1 - 8 的 8 个值的 uint16_t 数组。

我不能使用 inet_pton()

我可以创建自己的解析函数,但是我试图让 sscanf 如下工作,但没有成功。任何帮助,将不胜感激。 编辑:值将始终在字符串中以十六进制格式表示。

char *pString        = "0001:0002:0003:0004:0005:0006:0007:0008";
uint16_t* uintValues = new uint16_t[8]{};
sscanf(pString,"%s%04x:", uintValues );

【问题讨论】:

  • 您自己的解析函数将是最简单的解决方案。特别是因为::ffff:192.168.0.1 是一个有效的 IPV6 地址。试图从现有的 C 或 C++ 库函数中拼凑出一些东西,并实施适当的错误检查,这只是一个痛苦的世界,更多的问题发布到 stackoverflow.com。做你自己的解析。如果某件事必须做对,你必须自己做。
  • @SamVarshavchik 我忘了添加,所有的值都将表示为十六进制
  • 没问题,现在试试你的 scanf 方法,为 Google 的名称服务器之一使用 IPv6 地址,例如“2001:4860:4802:34::a”。
  • @SamVarshavchik:这仍然相当容易。数一下丢失的:,你应该有7个。2001:4860:4802:34::a有5个。所以插入两个:0:0:0得到2001:4860:4802:34: 0:0:0 :a。解析这个。
  • @ArminMontigny 哦,真的吗?并且“新”存在于 C 代码中,对吗?

标签: c++ c string scanf uint16


【解决方案1】:

我不会给你答案,而是自己写解析器的代码:


1/ 不区分大小写

IPv6 地址的一个示例是:。 2001:0db8:85a3:0000:0000:8a2e:0370:7334 十六进制数字不区分大小写,但 IETF 建议使用小写字母。八个 4 位组的完整表示可以通过多种技术简化,消除部分表示。


2/ 前导零

组中的前导零可以省略,但每个组必须保留至少一个十六进制数字。[1]因此,示例地址可以写成:

2001:db8:85a3:0:0:8a2e:370:7334

3/ 1 到多个连续的 0 组

一个或多个仅包含零的连续组可以使用两个连续冒号 (::) 替换为一个空组。。替换只能在地址中应用一次,因为多次出现会产生模棱两可的表示。因此,示例地址可以进一步简化:

2001:db8:85a3::8a2e:370:7334

奖励:两个特殊情况。

减少了 localhost(环回)地址 0:0:0:0:0:0:0:1 和 IPv6 未指定地址 0:0:0:0:0:0:0:0分别到 ::1 和 ::。

Etc.

享受!!

【讨论】:

  • 谢谢,但是如何编写代码解析器并不是我想要的。这当然是一个可能的解决方案,但我希望使用已经存在的东西。 sscanf 不应该工作吗?
【解决方案2】:

您的要求说您不能使用inet_pton,但您可以复制(BSD 许可)implementation from FreeBSD

/* int
 * inet_pton6(src, dst)
 *  convert presentation level address to network order binary form.
 * return:
 *  1 if `src' is a valid [RFC1884 2.2] address, else 0.
 * notice:
 *  (1) does not touch `dst' unless it's returning 1.
 *  (2) :: in a full address is silently ignored.
 * credit:
 *  inspired by Mark Andrews.
 * author:
 *  Paul Vixie, 1996.
 */
static int
inet_pton6(const char *src, u_char *dst)
{
    static const char xdigits_l[] = "0123456789abcdef",
              xdigits_u[] = "0123456789ABCDEF";
#define NS_IN6ADDRSZ    16
#define NS_INT16SZ  2
    u_char tmp[NS_IN6ADDRSZ], *tp, *endp, *colonp;
    const char *xdigits, *curtok;
    int ch, seen_xdigits;
    u_int val;

    memset((tp = tmp), '\0', NS_IN6ADDRSZ);
    endp = tp + NS_IN6ADDRSZ;
    colonp = NULL;
    /* Leading :: requires some special handling. */
    if (*src == ':')
        if (*++src != ':')
            return (0);
    curtok = src;
    seen_xdigits = 0;
    val = 0;
    while ((ch = *src++) != '\0') {
        const char *pch;

        if ((pch = strchr((xdigits = xdigits_l), ch)) == NULL)
            pch = strchr((xdigits = xdigits_u), ch);
        if (pch != NULL) {
            val <<= 4;
            val |= (pch - xdigits);
            if (++seen_xdigits > 4)
                return (0);
            continue;
        }
        if (ch == ':') {
            curtok = src;
            if (!seen_xdigits) {
                if (colonp)
                    return (0);
                colonp = tp;
                continue;
            } else if (*src == '\0') {
                return (0);
            }
            if (tp + NS_INT16SZ > endp)
                return (0);
            *tp++ = (u_char) (val >> 8) & 0xff;
            *tp++ = (u_char) val & 0xff;
            seen_xdigits = 0;
            val = 0;
            continue;
        }
        if (ch == '.' && ((tp + NS_INADDRSZ) <= endp) &&
            inet_pton4(curtok, tp) > 0) {
            tp += NS_INADDRSZ;
            seen_xdigits = 0;
            break;  /*%< '\\0' was seen by inet_pton4(). */
        }
        return (0);
    }
    if (seen_xdigits) {
        if (tp + NS_INT16SZ > endp)
            return (0);
        *tp++ = (u_char) (val >> 8) & 0xff;
        *tp++ = (u_char) val & 0xff;
    }
    if (colonp != NULL) {
        /*
         * Since some memmove()'s erroneously fail to handle
         * overlapping regions, we'll do the shift by hand.
         */
        const int n = tp - colonp;
        int i;

        if (tp == endp)
            return (0);
        for (i = 1; i <= n; i++) {
            endp[- i] = colonp[n - i];
            colonp[n - i] = 0;
        }
        tp = endp;
    }
    if (tp != endp)
        return (0);
    memcpy(dst, tmp, NS_IN6ADDRSZ);
    return (1);
}

【讨论】:

【解决方案3】:
istringstream in("0001:0002:0003:0004:0005:0006:0007:0008");
uint16_t out[8];
char colon;
in >> hex >> out[0] >> colon >> out[1] >> colon >> out[2] >> colon >> out[3] >> colon >> out[4] >> colon >> out[5] >> colon >> out[6] >> colon >> out[7];

根本没有错误检查,这可能是也可能不是问题。

【讨论】:

  • 好的,现在尝试解析 "::ffff:192.168.0.1",这是一个有效的 IPv6 地址。
  • @SamVarshavchik 显然,如果这是一种可能性,那么我的代码将无法正常工作。
  • 它不能与“2001:4860:4802:32::a”一起使用,它是 Google 的 IPv6 名称服务器之一。
  • @SamVarshavchik OP已经澄清了他们的情况,'所有值都将表示为十六进制',所以我会让答案保持不变。
  • 当然你可以忍受,只要你能解释它最终将如何解析一个全十六进制的有效 IPv6 地址,例如“2001:4860:4802:32::a”。从中解析出实际的、正确的 IPv6 地址将是一个非常好的额外奖励。
猜你喜欢
  • 2021-11-16
  • 1970-01-01
  • 1970-01-01
  • 2021-05-09
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多