【问题标题】:exporting database of html to excel将html数据库导出到excel
【发布时间】:2012-05-17 14:19:06
【问题描述】:

我有一个包含产品描述的数据库。我需要为翻译服务导出描述/产品名称。问题是描述以html格式存储在数据库中。

当我将数据导出到 excel 时,单元格中也包含所有 html 语法。

有什么办法可以删除语法吗?我在想可能在导出时不一定在 excel 中。

我也可以将所有单元格数据复制到一个常规的 html 文件中,然后在我的浏览器中打开它并复制粘贴,但这不会保留单元格结构。

有什么想法吗?

【问题讨论】:

  • HTML 的范围有多大,它是一组有限的标签吗?你能简单地找到/替换标签吗?
  • 您可以使用哪些语言?您可以访问 HTML 解析器吗?如果只是 SQL,您使用的是什么 DBMS?可以在 Excel 中使用 VBA 脚本吗?
  • 很多 HTML 中有很多样式。我可以使用查找和替换一堆,但仍然会有完全不同的 css/样式。我正在使用 PHPmyadmin。
  • ehh...我很懒惰,没有仔细看。大部分都可以通过查找和替换取出。如果有大量的样式等,将来仍然可能会很有趣。

标签: sql excel


【解决方案1】:

如果您可以将其保存为 html 文件,您应该可以使用 Excel 的内置功能。在 Excel 2007 及更高版本中,转到数据选项卡,然后选择“来自 Web”。

在出现的浏览器窗口中,将其指向 html 文件 C:\yourfile.html

它应该打开包含所有格式等的文件,并且如果数据是表格格式,您应该可以单击黄色框将其导入。

【讨论】:

    【解决方案2】:

    这可能对您有用(添加对“Microsoft HTML 对象库”的引用)

     Function HtmlToText(html As String) As String
    
        Static el As New MSHTML.HTMLDocument
        Static div As Object
    
        If div Is Nothing Then
            Set el = New MSHTML.HTMLDocument
            Set div = el.createElement("div")
            el.appendChild div
            Debug.Print "created"
        End If
    
    
        div.innerHTML = html
        HtmlToText = div.innerText
    
    End Function
    

    【讨论】:

      【解决方案3】:
      猜你喜欢
      • 2015-08-05
      • 2020-02-18
      • 1970-01-01
      • 2023-03-27
      • 1970-01-01
      • 2020-05-15
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多