V2EX 07月12日 11:43
[开源软件] PDF 解析工具,大模型开发神器
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

MinerU Web 是一款基于 AI 技术的现代化文档智能处理平台,提供文档解析、信息提取和智能分析功能。该项目采用前后端分离架构,并结合容器化技术,旨在为用户提供高效、可靠的文档处理解决方案。它支持多种文档格式,采用异步处理机制,并具备安全可靠的特性。用户可以通过Docker Compose快速部署,并拥有友好的界面进行文档管理和预览。

🚀 MinerU Web 基于 FastAPI 和 Vue 3 构建,采用前后端分离架构,旨在提供卓越的性能和用户体验,并支持多种硬件架构,包括 x86_64 和 ARM64。

🤖 该平台的核心是 AI 驱动,集成了先进的 AI 模型,实现智能文档解析和信息提取,同时支持 PDF、Word、Excel 等多种文档格式的处理。

🔄 为了提高效率,MinerU Web 采用异步任务队列,支持大规模文档并发处理,并提供完善的权限控制和数据加密机制,确保安全可靠。

🐳 项目提供完整的 Docker 支持,用户可以使用 Docker Compose 一键部署,简化部署流程。同时,项目结构清晰,包括后端、前端、模型文件等,方便开发者理解和维护。

🛠️ 技术栈包括 FastAPI、Redis、MinIO、SQLite 等后端技术,以及 Vue 3、Element Plus、TypeScript、Vite 等前端技术,为用户提供全面的功能支持。

项目地址

https://github.com/lpdswing/mineru-web

MinerU Web

🌟 项目简介

MinerU Web 是一个现代化的文档智能处理平台,基于先进的 AI 技术,提供文档解析、信息提取和智能分析功能。本项目采用前后端分离架构,结合容器化技术,为用户提供高效、可靠的文档处理解决方案。

✨ 核心特性

🛠️ 技术栈

后端

前端

🚀 快速开始

前置准备

    下载模型文件:
# 克隆项目git clone https://github.com/lpdswing/mineru-web.gitcd mineru-web# 下载模型文件# 更新为 2.0 模型python download_models.py modelscope或python download_models.py huggingface
    配置 MinIO 地址:
# 复制环境变量模板cp .env.example .env# 编辑 .env 文件,修改 MinIO 地址MINIO_ENDPOINT=your-minio-address:9000
    配置 mineru.json
# 复制 mineru 配置文件模板cp mineru.example.json mineru.json# 修改 endpoint    "bucket_info": {        "mds": [            "minioadmin",            "minioadmin",            "http://your-minio-address:9000"        ]    },

使用 Docker Compose 部署

# 启动服务docker-compose up -d# 参考以下网址安装 mchttps://min.io/docs/minio/linux/reference/minio-mc.html# 添加 minio 的 aliasmc alias set local http://localhost:9000 minioadmin minioadmin# 设置 mds 桶为 publicmc anonymous set download local/mds

界面展示

首页 - 展示系统概览和快速操作

文件管理 - 支持多种文档格式的上传和管理

文档预览 - 智能解析和展示文档内容

文件上次 - 批量上传

本地开发环境

# 启动本地开发环境docker-compose -f docker-compose.local.yml up -d

📦 项目结构

mineru-web/├── backend/           # 后端服务│   ├── app/          # 应用代码│   ├── tests/        # 测试用例│   └── Dockerfile    # 后端 Docker 配置├── frontend/         # 前端应用│   ├── src/         # 源代码│   ├── public/      # 静态资源│   └── Dockerfile   # 前端 Docker 配置├── models/          # AI 模型文件├── magic-pdf.json   # 模型配置文件├── docker-compose.yml           # 生产环境配置├── docker-compose.local.yml     # 开发环境配置└── README.md        # 项目文档

🔧 配置说明

环境变量

端口说明

🤝 贡献指南

我们欢迎各种形式的贡献,包括但不限于:

📄 开源协议

本项目采用 AGPL-3.0 协议开源,详情请参见 LICENSE 文件。

📝 更新日志

[2.0.0] - 2025-07-07

🌟 致谢


📈 Star 趋势

<picture> <source media="(prefers-color-scheme: dark)" srcset="https://api.star-history.com/svg?repos=lpdswing/mineru-web&type=Timeline&theme=dark" /> <source media="(prefers-color-scheme: light)" srcset="https://api.star-history.com/svg?repos=lpdswing/mineru-web&type=Timeline" /> </picture>

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MinerU Web 文档智能处理 AI FastAPI Vue 3
相关文章