大家好哇 https:///spaces/beihai/PDF-Table-Extractor 使用方法準(zhǔn)備一個(gè)PDF(暫不支持掃描版) 頁面中上傳PDF,也不支持過大的200M以上的文件,如果太大,大家可以先去壓縮一下,我記得adobe官網(wǎng)有就類似小工具。 上傳完成后,選擇表格所在PDF的頁碼,等待片刻就會(huì)出現(xiàn)“提起完成,點(diǎn)擊下載” 下載Excel,格式還需要微調(diào),不過比直接復(fù)制出來的要好很多了,能節(jié)省一些時(shí)間。 目前這個(gè)工具我還在完善,比如直接抽取PDF中所有表格,敬請(qǐng)期待。 實(shí)現(xiàn)方法周末再公布吧,其實(shí)經(jīng)常看我文章的同學(xué)應(yīng)該都很熟悉了吧。之前在騰訊的這個(gè)算法,我搬到了網(wǎng)上,隨便玩!一文中有介紹。 本文代碼能在huggingface看到,其實(shí)也是剛剛調(diào)試好,覺得有用,期待三連。 |
|