pandoc及下載和安裝pandoc是什么pandoc是一個軟件,是一個能把千奇百怪的文檔格式互相轉(zhuǎn)換的神器,是一把文檔轉(zhuǎn)換的瑞士軍刀(swiss-army knife)。不多說,放一張其官網(wǎng)(http://www.)的圖,一圖勝千言,感受一下: 下載pandoc下面以下載Windows下的pandoc為例: 安裝pandoc下載pandoc安裝包之后,像安裝普通軟件一樣點開安裝就可以了。安裝完成之后,打開cmd命令行,輸入pandoc -v ,如果正常顯示出類似下面的信息就表明安裝成功,如果未成功,可能需要配置環(huán)境變量,把安裝的路徑C:\Users\Frank\AppData\Local\Pandoc\加入環(huán)境變量: C:\Users\Administrator.PC-20170728DWIF>pandoc -v
pandoc 2.2
Compiled with pandoc-types 1.17.4.2, texmath 0.10.1.2, skylighting 0.7.0.2
Default user data directory: C:\Users\Administrator.PC-20170728DWIF\AppData\Roaming\pandoc
Web: http://
This is free software; see the source for copying conditions.
There is no warranty, not even for merchantability or fitness
for a particular purpose.
配置bat批處理文件: 創(chuàng)建文本文件,寫入一行代碼pandoc -s test.md -o test.docx ,命名為md2doc.bat; 此批處理文件將調(diào)用pandoc將test.md轉(zhuǎn)換為test.docx; 將需要轉(zhuǎn)換的md文件與bat文件放在同一文件夾下; 點擊md2doc.bat,閃爍cmd黑窗口,然后出現(xiàn)docx文件,轉(zhuǎn)換成功。 需要轉(zhuǎn)換的md文檔與bat批處理文件放入同一文件夾下; 雙擊md2doc.bat ,轉(zhuǎn)換;
走過的一些路,趟過的一些坑下面是使用pandoc把markdown(以下簡稱md)文件轉(zhuǎn)為PDF所遇到的一系列的坑。 嘗試過的不合適的方案下面涉及的轉(zhuǎn)換方法可以參見pandoc的使用文檔(http://www./MANUAL.html),這里不再敘述細節(jié)。 直接使用pandoc把md轉(zhuǎn)為PDF。問題:報錯,原因是電腦沒有安裝Latex解析引擎。 裝好了MiKTex這樣一個Latex解析引擎之后,再轉(zhuǎn),又失敗了,原因是不支持中文字體(md文件中有中文字體)。 指定字體為宋體后再轉(zhuǎn),雖然成功轉(zhuǎn)為了PDF文件,但是文件的字體、行間距、排版等樣式都比較丑陋,不滿意。 在網(wǎng)上又搜了搜,再加上指定Latex模板文件轉(zhuǎn),雖然能夠調(diào)整一些參數(shù)了,但一方面模板文件猶如天書般難懂,另一方面很多格式還是不能精細調(diào)整。 變換一下思路,采取迂回戰(zhàn)術,按照md->HTML->PDF 的路徑轉(zhuǎn)。于是先把md轉(zhuǎn)為HTML,HTML的樣式倒是挺美觀,然后在瀏覽器中使用瀏覽器的打印功能把HTML轉(zhuǎn)為PDF。然而還是存在文檔格式不能精細調(diào)整的問題。 發(fā)現(xiàn)轉(zhuǎn)HTML的時候可以指定css樣式文件,在css樣式文件中可以配置標題、正文、段落的精細格式。奈何這種方法和Latex模板文件的缺點類似,投入/產(chǎn)出比過高,遂放棄。
一個不太合適的方案在網(wǎng)上搜的時候,發(fā)現(xiàn)有一個Python三方庫叫pypandoc (文檔:https:///project/pypandoc/),核心方法叫pypandoc.convert_file ,支持一大堆參數(shù)。還是考慮到投入/產(chǎn)出比,我只是想安靜地轉(zhuǎn)一下md到PDF,并不想開發(fā)一個很吊的文件轉(zhuǎn)換工具,所以暫時沒必要去研究這個三方庫的API,以后有需要再研究吧。 最終采取的解決方案最終轉(zhuǎn)換到另一種思路來,依然采用迂回戰(zhàn)術,不過是按照:md->docx->PDF ,一試,發(fā)現(xiàn)這種方式很靠譜,主要是因為:一是md轉(zhuǎn)為docx很簡單,只需pandoc的一條命令就搞定,不需要額外裝其他的軟件;二是轉(zhuǎn)為docx文檔后,還可以在其中手動精細調(diào)整字體、字號、段落之類的格式,直到自己滿意為止。最后用Word也可以完美地把docx轉(zhuǎn)為PDF。 而且在生成的docx文檔中手工調(diào)完精細格式之后,還可以把docx文檔的格式模板導出成dot文檔模板文件保存,后面再生成docx文檔時不需要再一個個手工調(diào)格式了,只需把這個dot模板文件中的樣式全部導入即可(怎么導入可以到網(wǎng)上搜)。 md轉(zhuǎn)為docx文檔的pandoc命令類似于這樣:
pandoc text.md -o text.docx 這種方案最為優(yōu)雅,遂采用之。 腳本封裝,支持批量轉(zhuǎn)換pandoc text.md -o text.docx && pause
@echo off
:: 遍歷當前文件夾下的所有后綴名為md的文件
for /f %%a in ('dir /b *.md') do (
:: 執(zhí)行pandoc命令,把每個md文件都轉(zhuǎn)為docx文件,docx文件的文件名為:md文件名.md.docx
pandoc %%a -o %%a.docx
)
pause
假設當前文件夾下有3個md文件test1.md、test2.md、test3.md,他們的內(nèi)容都為: # 一級標題1
## 二級標題1
* 列表項1
* 列表項2
## 二級標題2
正文1-1
# 一級標題2
正文2-1
# 一級標題3
表格1:
姓名|年齡|性別
---|---|---
張三|30|男
李四|28|男
王五|29|男
雙擊執(zhí)行convert.bat 后,生成了3個docx文件: 打開test1.md.docx ,發(fā)現(xiàn)整體格式還不錯,并且還支持md的表格語法: 小結(jié)參考:https://www.jianshu.com/p/52cbee87a45a
|