2025-06-17 11:13 湖北
背景介绍
✅ **高精度解析各类文档:** PP-StructureV3 能够精准解析多种场景、版式的文档图像和PDF文件,将其转换为包含文本、表格、图像和阅读顺序信息的Markdown和JSON文件。在OmniDocBench基准测试中,PP-StructureV3表现出色,优于众多开源和闭源方案。
📰 **专精能力全面提升:** 除了高精度,PP-StructureV3还具备印章识别、图表解析、含公式/图片的表格识别、竖排文本解析、中文公式、化学方程式及复杂表格识别等专精能力,满足了AI应用在不同场景下的需求。
📖 **阅读顺序恢复能力增强:** 针对复杂布局文档,PP-StructureV3自研了全新的阅读顺序恢复解决方案,有效处理报纸、杂志、试卷等复杂文档。其阅读顺序恢复能力远超其他文档解析方案,保证了文档信息的准确呈现。
⚙️ **精细化模型组合策略:** PP-StructureV3采用精细化的模型组合策略,通过高效协调不同模型的输入输出,实现高精度文档解析。该方案包含文档预处理、版面区域分析、文字识别、表格识别、公式识别、图表解析等多个模块,并对关键模块进行了细致优化。
2025-06-17 11:13 湖北
背景介绍
效果速览
文档解析效果速览
论文<<<左右滑动查看更多图片<<<财报<<<左右滑动查看更多图片<<<杂志<<<左右滑动查看更多图片<<<<<<左右滑动查看更多图片<<<
中文公式/化学方程式<<<左右滑动查看更多图片<<<
竖版文字
含公式/图像表格
试卷
<<<左右滑动查看更多图片<<<
竖版文本
Python API预测方式如下:# 支持传入URL、图片路径、文件夹路径、PDF文件、PDF文件夹路径等
paddleocr pp_structurev3 -i pp_structure_v3_demo.png
经过预测后,会通过save_to_json()和save_to_markdown()方法将文档图像的结构化JSON结果和Markdown结果保存在save_path中。服务化部署PaddleX提供了PaddleOCR的服务化部署能力,可以通过PaddleX快速完成PP-StructureV3的服务启动。CLI 一键启动服务:from paddleocr import PPStructureV3
pipeline = PPStructureV3()
output = pipeline.predict("./pp_structure_v3_demo.png")
for res in output:
res.print() ## 打印预测的结构化输出
res.save_to_json(save_path="output") ## 保存当前图像的结构化json结果
res.save_to_markdown(save_path="output") ## 保存当前图像的markdown格式的结果
服务启动后,客户端通过少量代码即可调用服务。paddlex --install serving
paddlex --serve --pipeline PP-StrcutureV3
关于 PP-StrutureV3 的其他介绍,详见 PaddleOCR 官方文档:方案介绍:使用教程:https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/pipeline_usage/PP-StructureV3.html精彩课程预告为了帮助您迅速且深入地了解PP-StructureV3全流程解决方案,百度研发工程师将于 6月19日(周四)19:00 为您深度解析本次技术升级。此外,我们还将开设针对PP-StructureV3的产业场景实战营,手把手带您体验PP-StructureV3的调试和部署。机会难得,立即扫描下方二维码预约吧!import base64
import requests
import pathlib
API_URL = "http://localhost:8080/layout-parsing" # 服务URL
image_path = "./pp_structure_v3_demo.png"
# 对本地图像进行Base64编码
with open(image_path, "rb") as file:
image_bytes = file.read()
image_data = base64.b64encode(image_bytes).decode("ascii")
payload = {
"file": image_data, # Base64编码的文件内容或者文件URL
"fileType": 1, # 文件类型,1表示图像文件
}
# 调用API
response = requests.post(API_URL, json=payload)
# 处理接口返回数据
assert response.status_code == 200
result = response.json()["result"]
print (result)
AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。
鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑