No1. 自動化辦公:PDF轉WORD和圖片
肝病梁韜
微博知名健康博主;丁香園最具影響力醫生;丁香醫生問答評審專家;四川消化微創學會委員;IP:肝病梁韜(粉絲52+W);五星好評4千+;癌癥防治、抗衰老、胃腸鏡、醫學、幽門螺旋桿菌。合作V:
發表于
收錄于合集#人工智能10個
在辦公的時候,我們經常會遇到。要PDF轉wordword打開pdf自動轉換怎么取消word打開pdf自動轉換怎么取消,或者直接轉成圖片。PDF一般自帶轉這兩個格式的工具。不過,費用不低。現在,找到兩個的代碼,實現一鍵轉格式,可以省不少錢。
PDF轉WORD
from pdf2docx import Converter
pdf_file_path = 'C:/Users/46685/Desktop/關于的可行性分析?-?8.0.pdf'
docx_file_path ='C:/Users/46685/Desktop/關于的可行性分析?-?8.0.docx'
converter = Converter(pdf_file_path)
converter.convert(docx_file_path)
converter.close()
PDF轉圖片
import os
import fitz
for filename in filenames:
full_path = os.path.join(base_path, filename) # 拼接,得到PDF文件的絕對路徑
print(full_path)
doc = fitz.open(full_path) # 打開一個PDF文件,doc為Document類型,是一個包含每一頁PDF文件的列表
rotate = int(0) # 設置圖片的旋轉角度
zoom_x = 2.0 # 設置圖片相對于PDF文件在X軸上的縮放比例
zoom_y = 2.0 # 設置圖片相對于PDF文件在Y軸上的縮放比例
trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)
print("%s開始轉換..." % filename)
if doc.pageCount > 1: # 獲取PDF的頁數
for pg in range(doc.pageCount):
page = doc[pg] # 獲得第pg頁
pm = page.getPixmap(matrix=trans, alpha=False) # 將其轉化為光柵文件(位數)
new_full_name = filename.split(".")[0] # 保證輸出的文件名不變
pm.writeImage(OUT_PATH+"%s%s.jpg" % (new_full_name, pg)) # 將其輸入為相應的圖片格式,可以為位圖,也可以為矢量圖
# 我本來想輸出為jpg文件,但是在網頁中都是png格式(即調用writePNG),再轉換成別的圖像文件前,最好查一下是否支持
else:
page = doc[0]
pm = page.getPixmap(matrix=trans, alpha=False)
new_full_name = filename.split(".")[0]
pm.writeImage(OUT_PATH+"%s.jpg" % new_full_name)
print("%s轉換完成!" % filename)