2013-04-27 82 views
13

我希望能够采取现有的HTML代码段并将其转换为降价。为了这个目的 我已经试过pandoc:如何在保留非标记HTML标记的同时将HTML转换为Markdown?

pandoc test.html -o test.md 

这里的test.html是这样的:

Hello 

<!-- more --> 

and some more text 

<h2>some heading</h2>  

结果是这样的:

Hello and some more text 

some heading 
------------ 

因此,它不仅转换在降价中有直接意义的标签。它还删除了我想保留为HTML的标签(例如,HTML注释,iframe标签等)。

  • 如何将HTML转换为markdown,以便将任何在markdown中没有等效功能的标记保留为原始HTML?
  • 更一般我怎么能有在如何HTML以降价转换完成控制?

特别,我很感兴趣的命令行程序的选项。例如,可能有可供应给pandoc的选项。

+2

有趣,我有完全相反的问题。它保持divs,而我没有要求它 – Sebas 2017-03-10 11:34:45

回答

17

更多的搜索后,我读到的thread on table parsing--parse-raw选项。

添加--parse-raw选项似乎不剥离非降价相当于HTML标签。

pandoc test.html -o test.md --parse-raw