V2EX 07月12日 09:40
[开源软件] PDF 解析工具,大模型开发神器
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

MinerU Web是一个基于AI技术的现代化文档智能处理平台,提供文档解析、信息提取和智能分析功能。采用前后端分离架构和容器化技术,支持多种文档格式,具备高性能、安全可靠的特性。项目整合FastAPI、Vue 3、Redis、MinIO等技术栈,提供Docker支持,方便部署。用户可以通过该平台高效处理文档,提取关键信息,并进行智能分析。

🚀 **核心功能**:MinerU Web的核心功能包括文档解析、信息提取和智能分析。它支持PDF、Word、Excel等多种文档格式,并采用异步处理机制,以提高处理效率。

💻 **技术栈**:该项目采用前后端分离架构,后端基于FastAPI构建,前端使用Vue 3。后端还使用了Redis、MinIO、SQLite和Docker等技术。前端使用Element Plus、TypeScript和Vite。

🐳 **部署方式**:MinerU Web提供Docker支持,方便用户进行容器化部署。项目提供了docker-compose.yml和docker-compose.local.yml文件,分别用于生产环境和开发环境的部署。

⚙️ **快速开始**:用户可以通过克隆项目、下载模型文件、配置MinIO地址和配置文件,然后使用Docker Compose启动服务。项目提供了详细的配置说明和快速开始指南。

项目地址

https://github.com/lpdswing/mineru-web

MinerU Web

🌟 项目简介

MinerU Web 是一个现代化的文档智能处理平台,基于先进的 AI 技术,提供文档解析、信息提取和智能分析功能。本项目采用前后端分离架构,结合容器化技术,为用户提供高效、可靠的文档处理解决方案。

✨ 核心特性

🛠️ 技术栈

后端

前端

🚀 快速开始

前置准备

    下载模型文件:
# 克隆项目git clone https://github.com/lpdswing/mineru-web.gitcd mineru-web# 下载模型文件# 更新为 2.0 模型python download_models.py modelscope或python download_models.py huggingface
    配置 MinIO 地址:
# 复制环境变量模板cp .env.example .env# 编辑 .env 文件,修改 MinIO 地址MINIO_ENDPOINT=your-minio-address:9000
    配置 mineru.json
# 复制 mineru 配置文件模板cp mineru.example.json mineru.json# 修改 endpoint    "bucket_info": {        "mds": [            "minioadmin",            "minioadmin",            "http://your-minio-address:9000"        ]    },

使用 Docker Compose 部署

# 启动服务docker-compose up -d# 参考以下网址安装 mchttps://min.io/docs/minio/linux/reference/minio-mc.html# 添加 minio 的 aliasmc alias set local http://localhost:9000 minioadmin minioadmin# 设置 mds 桶为 publicmc anonymous set download local/mds

界面展示

首页 - 展示系统概览和快速操作

文件管理 - 支持多种文档格式的上传和管理

文档预览 - 智能解析和展示文档内容

文件上次 - 批量上传

本地开发环境

# 启动本地开发环境docker-compose -f docker-compose.local.yml up -d

📦 项目结构

mineru-web/├── backend/           # 后端服务│   ├── app/          # 应用代码│   ├── tests/        # 测试用例│   └── Dockerfile    # 后端 Docker 配置├── frontend/         # 前端应用│   ├── src/         # 源代码│   ├── public/      # 静态资源│   └── Dockerfile   # 前端 Docker 配置├── models/          # AI 模型文件├── magic-pdf.json   # 模型配置文件├── docker-compose.yml           # 生产环境配置├── docker-compose.local.yml     # 开发环境配置└── README.md        # 项目文档

🔧 配置说明

环境变量

端口说明

🤝 贡献指南

我们欢迎各种形式的贡献,包括但不限于:

📄 开源协议

本项目采用 AGPL-3.0 协议开源,详情请参见 LICENSE 文件。

📝 更新日志

[2.0.0] - 2025-07-07

🌟 致谢


📈 Star 趋势

<picture> <source media="(prefers-color-scheme: dark)" srcset="https://api.star-history.com/svg?repos=lpdswing/mineru-web&type=Timeline&theme=dark" /> <source media="(prefers-color-scheme: light)" srcset="https://api.star-history.com/svg?repos=lpdswing/mineru-web&type=Timeline" /> </picture>

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MinerU Web 文档处理 AI FastAPI Vue 3
相关文章