【问题标题】:Parsing INI files in Powershell using regex使用正则表达式在 Powershell 中解析 INI 文件
【发布时间】:2019-09-09 23:45:08
【问题描述】:

我正在尝试改进原始解决方案 (INI file parsing in PowerShell),以便我可以解析一个带有条目的 INI 文件,如下例所示。

[proxy]
; IP address and port number
  server = 192.168.0.253
  port = 8080 
  logfile=session.log ; log session 

[user]
; default username and settings
name=J. Doe ;name
address="377 Sunrise Way;Santa Monica;CA" ; address

[program files]
root="C:\Program Files\Windows  " ; path name
path="C:\Program Files\Windows;%windir" ; path name
;
[program]
root=C:\Program Files\Windows ; path name
  path=C:\Program Files\Windows;%windir ; path name

我正在使用以下 powershell 代码填充嵌套哈希表(如果这是正确的描述),其中包含每个部分的名称/值对。

我在处理以注释结尾的第一部分或第二部分中包含空格的值没有问题,但是当我尝试混合引用字符串和 cmets 时出现问题。

鉴于一个字符串以双引号开头和结尾,我认为应该可以获得我想要的结果,但我显然在某处遗漏了一些东西(我对此有点陌生)。

function Parse-INI-File() {
  Param ([parameter()][string]$_file = '')

  # Don't prompt to continue if '-Debug' is specified.
  If ($DebugPreference -eq "Inquire") {$DebugPreference = "Continue"}

  $_settings=@{}
  switch -Regex -file $_file {
    '(?:^ ?\[\s*(?<section>[^\s]+[^#;\r\n\[\]]+)\s*\])' {
      $_section = $Matches.section.trim()
      $_settings[$_section] = @{}
    }
    '(?:^\s*?(?<name>[^\[\]\r\n=#;]+))(?: ?=\s*"?(?<value>[^;#\\\r\n]*(?:\\.[^"#\\\r\n]*)*))' {
      $_name, $_value = $Matches.name.trim(), $matches.value.trim()
      $_settings[$_section][$_name] = $_value
      Write-Debug "/$_section/ /$_name//$_value/" # Debug
    }
  }
  $_settings
}

$_file='./ini-example.ini'
$_output=Parse-INI-File -Debug ($_file)

我希望解析示例 ini 文件以生成以下名称/值对:

DEBUG: /proxy/ /server//192.168.0.253/
DEBUG: /proxy/ /port//8080/
DEBUG: /proxy/ /logfile//session.log/
DEBUG: /user/ /name//J. Doe/
DEBUG: /user/ /address//377 Sunrise Way;Santa Monica;CA/
DEBUG: /program files/ /root//C:\Program Files\Windows/
DEBUG: /program files/ /path//C:\Program Files\Windows;%windir/
DEBUG: /program/ /root//C:\Program Files\Windows/
DEBUG: /program/ /path//C:\Program Files\Windows/

我不介意引用的字符串是否包含原始引号。

谢谢。

2019 年 9 月 10 日更新 - 我尝试了 psini 模块中的 Get-IniContent 函数,但它不会忽略行尾的 cmets。

PS C:\> $_output = Get-IniContent (".\ini-example.ini")
PS C:\> $_output["program files"]

Name                           Value
----                           -----
root                           "C:\Program Files\Windows  "' ; path name
path                           "C:\Program Files\Windows;;%windir" ; path name
Comment1                       ;


PS C:\> 

【问题讨论】:

  • 您可能想要使用 Powershell 库中的 PSIni 模块。

标签: regex powershell


【解决方案1】:

认为我已经解决了,可能有更好的解决方案,但我通过对引用字符串使用单独的正则表达式解决了这个问题 - 这使逻辑有点复杂,但似乎可靠地解决了问题。

function Parse-INI-File() {
  Param ([parameter()][string]$_file = '')

  # Don't prompt to continue if '-Debug' is specified.
  If ($DebugPreference -eq "Inquire") {$DebugPreference = "Continue"}

  $_settings=@{}
  switch -Regex -file $_file {
    '(?:^ ?\[\s*(?<section>[^\s]+[^\r\n\[\]]+)\s*\])' {
      $_section = $Matches.section.trim()
      $_settings[$_section] = @{}
      #Write-Debug "1/$_section/" # Debug
    }
    '(?:^\s*?(?<name>[^\[\]\r\n]+))(?: ?=\s*(?<value>[^";#\\\r\n]*(?:\\.[^";#\\\r\n]*)*))' {
      If ($matches.value -ne '' ) {
        $_name, $_value = $Matches.name.trim(), $matches.value.trim()
        $_settings[$_section][$_name] = $_value
        Write-Debug "2/$_section//$_name//$_value/" # Debug
      }
    }
    '(?:^\s*?(?<name>[^\[\]\r\n]+))(?: ?=\s*(?<value>\"+[^\"\r\n]*\")*)' {
      #If ($matches.value -ne $null ) {
      If (-not [string]::IsNullOrEmpty($matches.value)) {
        $_name, $_value = $Matches.name.trim(), $matches.value.trim()
        $_settings[$_section][$_name] = $_value
        Write-Debug "3/$_section//$_name//$_value/" # Debug
      }
    }
  }
  $_settings
}

这似乎产生了我期望的结果

PS C:\> $_output = Parse-INI-File -Debug (".\ini-example.ini")
DEBUG: 2/proxy//server//192.168.0.253/
DEBUG: 2/proxy//port//8080/
DEBUG: 2/proxy//logfile//session.log/
DEBUG: 2/user//name//J. Doe/
DEBUG: 3/user//address//"377 Sunrise Way;Santa Monica;CA"/
DEBUG: 3/program files//root//"C:\Program Files\Windows  "/
DEBUG: 3/program files//path//"C:\Program Files\Windows;%windir"/
DEBUG: 2/program//root//C:\Program Files\Windows/
DEBUG: 2/program//path//C:\Program Files\Windows/

PS C:\> $_output["user"]

Name                           Value                                                                                                                                       
----                           -----                                                                                                                                       
name                           J. Doe                                                                                                                                      
address                        "377 Sunrise Way;Santa Monica;CA"                                                                                                           

PS C:\> 

请注意,如果一个部分中有多个具有相同名称的值,则只返回最后一个值(尝试解析 system.ini 以了解我的意思)

【讨论】:

    猜你喜欢
    • 2021-04-08
    • 2012-01-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-10-02
    • 2011-04-24
    相关资源
    最近更新 更多