【问题标题】:Why am I getting gibberish when outputting to a text file from powershell?为什么从 powershell 输出到文本文件时会出现乱码?
【发布时间】:2019-04-07 04:52:57
【问题描述】:

我正在尝试将目录中的所有文件名输出到文件中。看起来很简单,但将来我会根据文件名创建有用的信息并输出到另一个系统的文件中。

当我将信息输出到文件时,当我在记事本中打开时,它显示为乱码。输出到屏幕看起来不错。

这是我的代码:

$files = Get-ChildItem "s:\centmobile\rates\currentrates\forupload\"
$outfile = "s:\centmobile\rates\currentrates\test.txt" 
"New File"|Out-File $outfile -Encoding ascii

foreach ($f in $files){
Get-Content $f.FullName  | Add-Content $outfile -Encoding Ascii
Write-Output $f.FullName
}

屏幕输出看起来不错:

PS C:\Windows\System32\WindowsPowerShell\v1.0> S:\CentMobile\Software\Dev\cre8hdrinfo.ps1
S:\centmobile\rates\currentrates\forupload\2019406BICS_BC_Rates_ForUpload.xlsx
S:\centmobile\rates\currentrates\forupload\2019406BICS_FC_Rates_ForUpload.xlsx

文件输出看起来不太好..

New File
PK     ! –~íGq  %   [Content_Types].xml ¢(                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  ¬”ËNÃ0E÷HüCä-Jܲ@5í‚Ç
A%ʘxÒXqlËã–öU(4BÍ&–ã™{O&3žÌ6NÖàQY“³q6b  ˜ÂJe–9û\¼¤÷,Á ŒÚÈÙͦ×W“ÅÖ&”m0gUîs,*hfÖ¡“ÒúFÚú%w¢¨ÅøíhtÇk˜†VƒM'OPŠ•Éó†^ïH<hdÉã.°õÊ™pN«B"åk#¹¤{‡Œ2cVÊá
a0ÞéОüm°Ï{§Òx%!™ÞDC|£ù·õõ—µuv^¤ƒÒ–¥*@ÚbÕP2t„Ä
 4:‹kÖeÜgüc0ò¸Œi¿/
÷p ý0o„~U¦F~ºšèT»*PÏË)¢L!†­º¢hŸs%<Èài\8Õ>ÇAÍ<÷Ö!µ‡ÿWá0·mvêH|PpœÜ®   8:Ò•pqÙÛÎ2d‡7—Üô  ÿÿ PK     ! µU0#ô   L   _rels/.rels ¢(                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  ¬’MOÃ0†ïHü‡È÷ÕÝBKwAH»!T~€Iܵ£$Ý¿'TƒG½~üÊÛÝ<êÈ!öâ4¬‹;#¶w­†—úqu*&r–Fq¬áÄvÕõÕö™GJy(v½*«¸¨¡KÉß#FÓñD±Ï.W   ¥†=™ZÆMYÞbø®ÕBSí­†°·7 ê“Ï›×–¦é
?ˆ9LìÒ™ÈsbgÙ®|Èl!õùUSh9i°bžr:"y_dlÀóD›¿ý|-NœÈR"4ø2ÏGÇ% õZ´4ñËyÄ7    ëÈðÉ‚‹¨Þ  ÿÿ PK     ! …ë —  †     xl/workbook.xml¬Umo›:þ~¥ýÆýLÁ¼ƒ’LI ÝJÛT¥]÷¥Òä€S¬æÓ¤ªößwlBš.ÕÔu‹ˆß?çœç&vu¥ÝÞQÖLutféirVÐævª¹ÊŒP×:›W¬!Sýtú‡Ù»&[ÆïÖŒÝi ÐtS½¢M³ËKRã¤•
ã50ä·f×r‚‹®$DÔ•i[–oÖ˜6ú€ó×`°Í†æ$ay_“F œTX ý®¤m7¢ÕùkàjÌïúÖÈYÝÄšVT<(P]«óøü¶a¯+0{‡<mÇáñá,hìñ&X:¹ª¦9gÛˆ3€6Ò'ö#ËDè™v§>x’krrOe¬¸ÿFVþËCÖ£!–ÒJÎ{#šwàfë³É†Väz®†Ûö3®e¤*]«p'Ò‚
RLõ †lKžMð¾]ô´‚U¹¶§›³ƒœ/¸V
...

【问题讨论】:

  • 如果这是一个愚蠢的问题,请原谅我,但是您确定文件夹 s:\centmobile\rates\currentrates\forupload 中的所有文件都是 ASCII 编码的吗?
  • 第一个文件显然是一个 .zip 文件Most of the signatures end with the short integer 0x4b50, which is stored in little-endian ordering. Viewed as an ASCII string this reads "PK", the initials of the inventor Phil Katz. Thus, when a ZIP file is viewed in a text editor the first two bytes of the file are usually "PK"

标签: powershell output


【解决方案1】:

您的屏幕输出和文件看起来非常不同的原因是您根本没有将相同的内容输出到屏幕和文件。

与:

Get-Content $f.FullName  | Add-Content $outfile -Encoding Ascii

正如命令所暗示的,你正在获取每个文件的内容并输出到$outfile。

同时:

>Write-Output $f.FullName

您只是将文件名列表输出到屏幕。

正如您的问题所说,这是您所追求的文件名,只需更改:

Get-Content $f.FullName  | Add-Content $outfile -Encoding Ascii

到:

$f.FullName  | Add-Content $outfile -Encoding Ascii

它应该输出与文件相同的内容。

在这里检查/排除故障的一个好方法是在以下情况下删除所有内容:

Get-Content $f.FullName

并查看输出,它看起来与文件非常相似,并提示您那里有问题。

【讨论】:

  • @queue 通常,ASCII 字符集不完全支持运行 PowerShell 的系统上的文件名。使用 Unicode 编码(例如 UTF-8)并将元数据传递给文件的阅读器。
【解决方案2】:

Get-Content cmdlet 返回字符串或字节(strings 在您的情况下)。您得到的乱码来自将xlsx 文件中的二进制 值解释为Ascii 字符串(unsolvable mojibake 案例)。

资源(必读,不完整):

来自fileformatcommons.com

xlsx 文件实际上是变相的 zip 文件……
xlsx 文件字符编码/字符集是二进制

来自.ZIP File Format Specification

本地文件头签名(4字节)0x04034b50

来自维基百科的Zip (file format)

大部分签名以短整数0x4b50结尾,即 以小端序存储。被视为一个 ASCII 字符串,它读取 “PK”,发明者Phil Katz的首字母。因此,当 ZIP 文件 在文本编辑器中查看文件的前两个字节通常是 “PK”。

【讨论】:

    猜你喜欢
    • 2012-09-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-11-11
    • 1970-01-01
    • 1970-01-01
    • 2020-07-02
    • 1970-01-01
    相关资源
    最近更新 更多