python实行读取pdf方法文书档案

python实行读取pdf方法文书档案

一、 筹备处事 安置对应的库 pip install pdfminer3k pip install pdfminer.six 二、局部变量的含意 PDFDocument(pdf文书档案东西) PDFPageInterpreter(证明器) PDFParser(pdf文书档案领会器) PDFResourceManager(资源处置器) PDFPageAggregator(会合器) LAParams(参数领会器) 代码示例 #!/usr/bin/env python # -*- coding:utf-8 -*- # datetime:2021/3/17 12:12 # software: PyCharm # version: python 3.9.2 def changePdfToText(filePath): """ 领会pdf 文本,生存到同名txt文献中 param: filePath: 须要读取的pdf文书档案的目次 introduced module: from pdfminer.pdfpage import...