技术 • 2024年6月25日 03:37

PDF页面分割为png图片

将指定的PDF文件逐页拆解成PNG格式的图片并保存到指定的文件夹中。

#PDF拆解，一页一张png图片
import fitz  # 导入 fitz 模块，需要pip install PyMuPDF
import os


# 定义输入 PDF 文件的路径和输出文件夹的路径
input_pdf_path = 'SJTS.pdf'
output_folder = 'output_images'

# 检查输出文件夹是否存在，如果不存在则创建它
if not os.path.exists(output_folder):
    os.makedirs(output_folder)

# 打开 PDF 文件
with fitz.open(input_pdf_path) as doc:
    # 获取 PDF 文件中的页数
    
    num_pages = len(doc)

    # 迭代 PDF 文件中的每一页
    for page_num in range(num_pages):
        # 获取当前页
        page = doc[page_num]

        # 根据页数生成输出图片的文件名
        output_filename = f'{output_folder}/page_{page_num + 1}.png'

         # 将当前页转换为图像
        image = page.get_pixmap(dpi=300)
        
         # 保存图像为图片文件
        image.save(output_filename)

print(f'PDF文件拆解完成，图片已保存在{output_folder}文件夹中。')

这段代码的主要功能是将指定的PDF文件逐页拆解成PNG格式的图片并保存到指定的文件夹中。

ChaoFanOnline

PDF页面分割为png图片

关于未来网站形式的思考

开发一款ai驱动的去中心化的图片管理系统的构想

机器学习笔记--机器学习概述

关于前端如何编排api请求顺序的思考

crewAI实践（包含memory的启用）--AiRusumeGenerator

Categories

Tags