【问题标题】:How to convert RTF to Markdown on the UNIX/OSX command line similar to pandoc如何在类似于 pandoc 的 UNIX/OSX 命令行上将 RTF 转换为 Markdown
【发布时间】:2015-08-07 12:21:45
【问题描述】:

如何在 UNIX/OSX 下使用命令行工具将 RTF(例如从标准输入)转换为 Markdown。

我正在寻找类似pandoc 的东西。但是pandoc 本身不允许将 RTF 作为 input 格式。 :-( 所以,我很乐意使用与pandoc 类似的工具或指向pandoc 的外部RTF 阅读器的指针。

【问题讨论】:

    标签: macos unix converter markdown rtf


    【解决方案1】:

    同时使用Tedpandoc,您应该可以做到这一点:

    Ted --saveTo text.rtf text.html
    pandoc --from=html --to=markdown --out=text.md < text.html
    

    【讨论】:

    • rtl 转换为 html 也可以使用 Apple 的命令 textutil 轻松完成(参见 man textutil) 看看 (stackoverflow.com/questions/1043768/…)
    • @HeinrichGiesen Ups,没有看到您的评论!是的,这也是我发现的:在 OSX 上 textutil 是要走的路!
    • 这听起来像是 OS X 的最佳答案;你的问题说你正在寻找一个跨平台的解决方案,所以我没有考虑它。很高兴你发现了一些东西。
    • Ted 2.23 deb pkg 无法在 Debian 8.11 上安装,甚至无法通过 dpkg 命令安装。
    • @pimgeek 使用源码
    【解决方案2】:

    在 Mac OSX 上,我可以使用预装的 textutil 命令进行 RTF 到 HTML 的转换,然后通过 pandoc 转换为 markdown。因此,从标准输入获取 RTF 并将降价写入标准输出的命令行如下所示:

    textutil -stdin -convert html  -stdout | pandoc --from=html --to=markdown
    

    【讨论】:

    • 根据我的经验,这非常有效。 textutil 不保留我的格式和链接,HTML 中充斥着无用的类。
    • @zool 你可以通过关闭一些 Pandoc 扩展来避免(或至少显着减少“类垃圾”。我关闭了native_divsnative_spansfenced_divsheader_attributesauto_identifiersinline_code_attributeslink_attributesraw_attribute.HTH,狮子座
    • 我试过这个脚本。剪贴板中的链接全部被剥离。
    • @Martin 当前版本的 pandoc 似乎支持 RTF 作为输入格式。也许尝试一下。它应该更好地保留链接。如果有效,请在此处发布作为答案。
    • 我认为问题不在于 pandoc,而在于 textutil。我找到了一个有效的script(稍作改动)。 if encoded=`osascript -e 'the clipboard as «class HTML»'` 2&gt;/dev/null; \ then echo $encoded \ | perl -ne 'print chr foreach unpack("C*",pack("H*",substr($_,11,-3)))' \ | pandoc --wrap=none -f HTML -t markdown; else pbpaste; fi。作为主持人,我不明白代码。也许&lt;&lt;class HTML&gt;&gt; 会有所作为。我改成RTF,链接被绊倒了。
    【解决方案3】:

    Pandoc 现在支持 RTF 作为输入格式,因此您可以使用:

    cat file.rtf | pandoc --from=rtf --to=markdown
    

    【讨论】:

    • 很高兴知道,当然现在是最好的方法。谢谢。
    猜你喜欢
    • 2012-09-29
    • 2018-07-27
    • 2021-07-15
    • 2015-12-07
    • 2014-11-07
    • 1970-01-01
    • 2013-04-07
    • 1970-01-01
    • 2021-11-24
    相关资源
    最近更新 更多