【问题标题】:Regex split on comma that isn't preceded by a specific word正则表达式拆分逗号前面没有特定单词
【发布时间】:2021-11-22 11:43:27
【问题描述】:

我有一个 CSV 字符串,我想用逗号分隔,但前提是逗号前面没有特定单词字符串中的其他位置

以下是输入示例。

1,2,3,Test Message,JSON={ "book": { "title": "Hello, there, world" } }

在上述情况下,单词 'JSON=' 之后的任何逗号都不应导致字符串拆分,因此我希望进行以下拆分。

1
2
3
Test Message
JSON={ "book": { "title": "Hello, there, world" } }

理想情况下,我想使用Regex.Split 来拆分字符串,我认为我需要在后面使用否定的外观,但我不确定实现这一点所需的语法。

任何帮助将不胜感激。

【问题讨论】:

  • 假设停用词部分位于末尾,然后拆分前面部分,则可能更容易匹配停用词的部分。
  • 在一般情况下,CSV 解析需要对带引号的字符串进行状态处理。你不能只扔Split(),甚至不能使用正则表达式Split()
  • 另请注意,虽然此数据是有效的 CSV,但它不是 JSON 的有效 CSV 编码。正确的 CSV 解析将消耗在输出中不留任何引号供 JSON 解析器查找。

标签: c# regex split


【解决方案1】:

您可以使用下面的正则表达式来解析提到的 CSV 中的 JSON here

C#代码-

var csvContent = "1,2,3,Test Message,JSON={ \"book\": { \"title\": \"Hello, there, world\" } }";
var split = Regex.Split(csvContent, ",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)");

JS 演示 -

const csv = '1,2,3,Test Message,JSON={ "book": { "title": "Hello, there, world" } }';

console.log(csv.split(/,(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)/));

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2023-02-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-03-26
    相关资源
    最近更新 更多