【问题标题】:How to find a substring skipping N chars如何找到跳过N个字符的子字符串
【发布时间】:2019-08-19 02:35:51
【问题描述】:

如何获取从某个位置/某个偏移开始的字符串中的子字符串的索引,例如:

package main

import (
    "fmt"
    "strings"
)

func main() {
    string := "something.value=something=end"
    index1 := strings.Index(string, "value=")
    fmt.Println(index1) // prints 10
    // index2 = ... How do I get the position of the second =, 25?
}

PHP 中的类似偏移量int strpos ( string $haystack , mixed $needle [, int $offset = 0 ] )

【问题讨论】:

  • 只需对字符串进行子切片。
  • 也许this 会有所帮助,但我真的不知道您的预期结果是什么。你想知道每个=在字符串中的位置吗?

标签: string go


【解决方案1】:

strings 包没有提供这样的功能,但实际上很少需要它。通常strings.Split() 函数用于轻松地将字符串拆分为标记/部分。

但如果你确实需要它:你可以简单地slice 一个string,这是高效的(不复制,结果与原始string 值共享内存)。

因此,您正在寻找的功能看起来像这样:

func Index(s, substr string, offset int) int {
    if len(s) < offset {
        return -1
    }
    if idx := strings.Index(s[offset:], substr); idx >= 0 {
        return offset + idx
    }
    return -1
}

使用示例:

s := "something.value=something=end"
index1 := strings.Index(s, "value=")
fmt.Println(index1) // prints 10

index2 := Index(s, "=", index1+len("value="))
fmt.Println(index2) // prints 25

输出(在Go Playground上试试):

10
25

请注意,在对字符串进行切片时,您必须传递给我们的Index() 函数的offset 是字节索引,而不是rune(字符)索引。只要您有小于128 代码点的字符,它们就相等,但除此之外,字节索引将大于rune 索引,因为这些代码点映射到 UTF-8 编码中的多个字节(这是 Go 存储的方式内存中的字符串)。 strings.Index() 返回字节索引,len(s) 也返回字节长度,因此该示例将正确处理所有字符串。

您使用strings.Split() 的原始任务可能如下所示:

s := "something.value=something=end"
parts := strings.Split(s, "=")
fmt.Println(parts)

哪些输出(在Go Playground 上试试):

[something.value something end]

您要“解析”出的值在parts[1] 中。

【讨论】:

    【解决方案2】:

    获取一段带有 utf-8 字符的字符串可能会产生损坏的字符串,因为您需要将其转换为符文

    []rune(videoHtml)[0:index]

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-05-11
      • 2020-11-16
      • 1970-01-01
      • 1970-01-01
      • 2021-12-01
      • 1970-01-01
      • 1970-01-01
      • 2020-12-01
      相关资源
      最近更新 更多