【问题标题】:Determine cell formats (date, currency, custom etc.) in xlsx using OpenXml使用 OpenXml 确定 xlsx 中的单元格格式(日期、货币、自定义等)
【发布时间】:2018-11-14 12:32:50
【问题描述】:

我正在使用 OpenXml 解析来自 xlsx 文件的文本。

按预期提取简单的文本和数字,但任何具有单元格格式的内容(例如 datecurrencycustomformat)都不会按照 Excel 中显示的文本进行提取。如果我可以轻松识别代码中的单元格格式然后采取相关操作,这将不是问题,但我无法在任何地方找到它!

Example.xlsx 文件有:


单元格 A1 - 日期格式 *14/03/2001

在单元格 A1 中输入文本“14/11/2018”显示为“14/11/2018”

局部变量:

c.CellValue = "43418"
c.CellValue.InnerText = "43418"
c.前缀 = "x"
c.StyleIndex = "2"
c.DataType 无
c.CellFormula 无

必填值 = '14/11/2018'


单元格 A2 - 货币格式(符号 £,2 位小数)

在单元格 A2 中输入文本“2000”显示为“£2,000.00”

局部变量:

c.CellValue = "2000"
c.CellValue.InnerText = "2000"
c.前缀 = "x"
c.StyleIndex = "3"
c.DataType 无
c.CellFormula 无

必填值 = '£2,000.00'


单元格 A3 - 自定义格式“ABC-”@

在单元格 A3 中输入文本“P-100”显示为“ABC-P-100”

局部变量:

OpenXml Cell.CellValue = "P-100"
OpenXml Cell.CellValue.InnerText = "P-100"
OpenXml Cell.Prefix = "x"
OpenXml Cell.StyleIndex = "1"
OpenXml Cell.DataType = "s"
c.CellFormula 无

必填值 = 'ABC-P-1000'


这是我的代码:

Public Shared Sub parseXLS(strFileName As String, sbTxtFromFile As StringBuilder)
    Call fncParseXLSXorXLSM(strFileName, sbTxtFromFile)
End Sub

Public Shared Function fncParseXLSXorXLSM(strFileName As String, sbTxtFromFile As StringBuilder) As StringBuilder

        sbTxtFromFile.Length = 0
        Dim intFirst As Integer = 1

        Try
            Using spreadsheetDocument__1 As SpreadsheetDocument = SpreadsheetDocument.Open(strFileName, False)
                Dim workbookPart As WorkbookPart = spreadsheetDocument__1.WorkbookPart
                Dim sharedStringItemsArray As SharedStringItem() = workbookPart.SharedStringTablePart.SharedStringTable.Elements(Of SharedStringItem)().ToArray()
                Dim sheets As DocumentFormat.OpenXml.Spreadsheet.Sheets = spreadsheetDocument__1.WorkbookPart.Workbook.Sheets

                ' For each sheet, display the sheet information.
                For Each sheet As DocumentFormat.OpenXml.OpenXmlElement In sheets
                    For Each attr As DocumentFormat.OpenXml.OpenXmlAttribute In sheet.GetAttributes()
                        Debug.Print("{0}: {1}", attr.LocalName, attr.Value)
                        If attr.LocalName = "name" Then
                            sbTxtFromFile.Append(attr.Value)
                        End If
                    Next

                Next

                For Each worksheetPart As WorksheetPart In workbookPart.WorksheetParts
                    Dim reader As OpenXmlReader = OpenXmlReader.Create(worksheetPart)
                    While reader.Read()
                        If reader.ElementType Is GetType(Cell) Then
                            Do
                                Dim c As Cell = DirectCast(reader.LoadCurrentElement(), Cell)

                                If c.DataType IsNot Nothing AndAlso c.DataType.Value.ToString = "SharedString" Then
                                    Dim ssi As SharedStringItem = sharedStringItemsArray(Integer.Parse(c.CellValue.InnerText))

                                    If Not ssi.Text Is Nothing Then
                                        If Not ssi.Text.Text Is Nothing Then
                                            If intFirst = 1 Then
                                                sbTxtFromFile.Append(ssi.Text.Text)
                                                intFirst = 2
                                            Else
                                                sbTxtFromFile.Append(Environment.NewLine & ssi.Text.Text)
                                            End If
                                        End If
                                    Else
                                        If Not ssi.InnerText Is Nothing Then
                                            If intFirst = 1 Then
                                                sbTxtFromFile.Append(ssi.InnerText)
                                                intFirst = 2
                                            Else
                                                sbTxtFromFile.Append(Environment.NewLine & ssi.InnerText)
                                            End If
                                        End If
                                    End If
                                Else
                                    If Not c.CellValue Is Nothing Then
                                        If intFirst = 1 Then
                                            sbTxtFromFile.Append(c.CellValue.InnerText)
                                            intFirst = 2
                                        Else
                                            sbTxtFromFile.Append(Environment.NewLine & c.CellValue.InnerText)
                                        End If
                                    End If
                                End If
                            Loop While reader.ReadNextSibling()
                        End If
                        If sbTxtFromFile.Length > 0 Then
                            sbTxtFromFile.Append(Environment.NewLine)
                        End If
                    End While
                Next

            End Using

        Catch ex As Exception
            If ex.Message Like "The process cannot access the file '*" Then 'File in use
                sbTxtFromFile.Append("|11readonly11|")
            ElseIf ex.Message Like "Could not find*" Then 'File in use
                sbTxtFromFile.Append("|11notfound11|")
            Else
                sbTxtFromFile.Append("|11cannotread11|")
            End If
        End Try

        Return sbTxtFromFile

    End Function

有什么想法吗?

【问题讨论】:

标签: excel format openxml


【解决方案1】:

您可以根据StyleIndex 属性读取单元格样式,这将帮助您确定应用于单元格的格式。

使用以下方法作为示例,并根据您的需要解决:

Private Shared Sub ReadCellFormat(cell As Cell, stylesheet As Stylesheet)
    If cell.StyleIndex.HasValue Then
        Debug.Print("Style found for the cell:")
        If stylesheet.CellFormats.Count.Value > cell.StyleIndex.Value Then
            Dim format As CellFormat = stylesheet.CellFormats.ElementAt(cell.StyleIndex.Value)
            If format.NumberFormatId.HasValue AndAlso format.NumberFormatId.Value > 0 Then
                Dim numberFormat As NumberingFormat = stylesheet.NumberingFormats.Single(Function(x As NumberingFormat) x.NumberFormatId.Value = format.NumberFormatId.Value)
                Debug.Print($"Format code: {numberFormat.FormatCode}")
            End If
        End If
    End If
End Sub

P.S:这个方法只是读取给定单元格的数字格式。

【讨论】:

  • 感谢您的回复迪彭。正如您在上面的示例中所看到的,我已经知道 StyleIndex 的值,但它只是一个没有意义的数字。我需要的是实际值和前缀,而不仅仅是数字格式。
  • @GoodJuJu actual values 是什么意思?您的意思是应用格式/前缀后的计算值吗?
  • 理想情况下,我想要计算值,在应用前缀后,它出现在 excel 中。如果我不能得到那个,我想返回一些告诉我单元格格式是什么的东西,例如日期、货币、自定义等。
  • @GoodJuJu 我认为不可能得到计算值。但是,您可以根据NumberFormatId 属性确定单元格格式。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2023-03-28
  • 1970-01-01
相关资源
最近更新 更多