从AI助手到个性化数字分身：WeClone & Second Me打造本地化、私有化的个性化AI代理系统

1.WeClone

随着大语言模型（LLM）和语音合成技术的快速发展，个性化AI代理的实现变得愈发可行。近期，一个名为 WeClone 的开源项目引起了开发者社区的关注。该项目旨在通过用户的微信聊天记录，训练出一个高度个性化的对话模型，从而实现“数字版的你”，在一定程度上探索“数字永生”的可能性。

具体功能：

支持从微信导出聊天记录，并自动处理成问答格式基于LoRA方法、微调Qwen2.5-7B等模型，让LLM说话更像你还能克隆语音，基于0.5B模型重现你的语气语调（配套子项目：WeClone-audio）可部署到微信/QQ/飞书/企微等多平台，实现聊天式交互

项目链接：github.com/xming521/We…

WeClone 的核心流程包括数据采集、预处理、模型微调与部署应用四大模块。首先，项目支持从微信导出的原始聊天记录中提取结构化数据，并自动转换为问答对（QA Pair）格式，便于后续监督式微调使用。这一过程采用了正则表达式匹配与时序分析技术，确保上下文逻辑的连贯性。

在模型层面，WeClone 采用基于 LoRA（Low-Rank Adaptation）的参数高效微调方法，在 Qwen2.5-7B 等大语言模型基础上进行适配。LoRA 能够显著降低训练成本与资源消耗，使得用户仅需少量高质量对话样本即可实现较好的拟人效果。此外，项目配套子模块 WeClone-audio 基于轻量级 Tacotron 或 WavLM 模型，利用约 0.5B 参数规模的语音克隆网络，重现用户的语气语调，进一步增强数字分身的真实感。

硬件要求

项目默认使用Qwen2.5-7B-Instruct模型，LoRA方法对sft阶段微调，大约需要16GB显存。也可以使用LLaMA Factory支持的其他模型和方法。

需要显存的估算值：

方法	精度	7B	14B	30B	70B	`x`B
Full (`bf16` or `fp16`)	32	120GB	240GB	600GB	1200GB	`18x`GB
Full (`pure_bf16`)	16	60GB	120GB	300GB	600GB	`8x`GB
Freeze/LoRA/GaLore/APOLLO/BAdam	16	16GB	32GB	64GB	160GB	`2x`GB
QLoRA	8	10GB	20GB	40GB	80GB	`x`GB
QLoRA	4	6GB	12GB	24GB	48GB	`x/2`GB
QLoRA	2	4GB	8GB	16GB	24GB	`x/4`GB

训练完成后，WeClone 支持将模型部署至多个即时通讯平台，如微信、QQ、飞书、企业微信等，实现跨平台的自然语言交互体验。部署方式包括本地服务端 API 接口、Docker 容器化部署以及轻量级 SDK 集成，满足不同场景下的需求。

对于开发者而言，WeClone 提供了完整的工程文档与实践指南，涵盖环境搭建（Python + PyTorch）、数据清洗、LoRA 微调配置、FlashAttention 加速优化、单卡/多卡分布式训练等关键技术细节。项目兼容主流深度学习框架，并针对 NVIDIA GPU 进行了性能优化，推荐使用 A100/H100 显卡以获得更好的训练效率。

需要注意的是`：

模型表现受限于数据质量与模型容量

Windows 兼容性建议

版本迭代频繁

隐私与合规风险

1.1 环境搭建

cuda安装(已安装可跳过)：LLaMA Factory

建议使用 uv，这是一个非常快速的 Python 环境管理器。安装uv后，您可以使用以下命令创建一个新的Python环境并安装依赖项，注意这不包含音频克隆功能的依赖：

git clone https://github.com/xming521/WeClone.gitcd WeCloneuv venv .venv --python=3.10source .venv/bin/activateuv pip install --group main -e .

使用以下命令测试CUDA环境是否正确配置并可被PyTorch识别，Mac不需要：

python -c "import torch; print('CUDA是否可用:', torch.cuda.is_available());"

（可选）安装FlashAttention，加速训练和推理：uv pip install flash-attn --no-build-isolation

[!NOTE]训练以及推理相关配置统一在文件settings.json

1.2 数据预处理

请使用PyWxDump提取微信聊天记录。可以先将手机的聊天记录迁移（备份）到电脑，数据量更多一些。下载软件并解密数据库后，点击聊天备份，导出类型为CSV，可以导出多个联系人或群聊，然后将导出的位于wxdump_tmp/export 的 csv 文件夹放在./dataset目录即可，也就是不同人聊天记录的文件夹一起放在 ./dataset/csv。

blocked_words

make_dataset_args

python weclone/data/qa_generator.py

single_combine_time_window

qa_match_time_window

PyWxDump是一款用于获取账号信息(昵称/账号/手机/邮箱/数据库密钥)、解密数据库、查看聊天记录、备份导出聊天记录为html的工

核心功能

基址偏移

扩展功能

（1）通过 web 查看聊天记录（2）支持导出聊天记录为 html、csv, 备份微信聊天记录（3）远程查看微信聊天记录（必须网络可达，例如局域网）

文档类

（1）提供数据库部分字段说明（2）提供 CE 获取基址偏移方法（3）提供 MAC 数据库解密方法

其他功能

pywxdumpmini

1.3 模型训练

模型下载

git lfs installgit clone https://www.modelscope.cn/Qwen/Qwen2.5-7B-Instruct.git

配置参数并微调模型

settings.json

model_name_or_path

template

per_device_train_batch_size

gradient_accumulation_steps

lora_rank

lora_dropout

单卡训练

python weclone/train/train_sft.py

settings.json

deepspeed

uv pip install deepspeeddeepspeed --num_gpus=使用显卡数量 weclone/train/train_sft.py

1.4 推理

infer_args

python weclone/eval/web_demo.py

使用接口进行推理

python weclone/server/api_service.py

使用常见聊天问题测试

有些答案比较抽象，主要原因是训练数据没有覆盖，可以通过ＲＡＧ来解决。测试结果在test_result-my.txt。

python weclone/server/api_service.pypython weclone/eval/test_model.py

1.5 微调效果

使用Qwen2.5-14B-Instruct模型，大概3万条处理后的有效数据，loss降到了3.5左右的效果。

1.5 部署

部署到聊天机器人

AstrBot 是易上手的多平台 LLM 聊天机器人及开发框架 ✨ 平台支持 QQ、QQ频道、Telegram、微信、企微、飞书。

使用步骤：

python weclone/server/api_service.py

http://172.17.0.1:8005/v1）

/tool off all

[!IMPORTANT]检查api_service的日志，尽量保证大模型服务请求的参数和微调时一致，tool插件能力都关掉。

配置自定义的模型参数

1.8 问题解决

LLaMA-Factory| FAQs | 常见问题

2.Second-Me

Second Me 是一个开源AI身份系统，旨在为用户创建完全私有的个性化AI代理。它不仅仅是一个AI助手，而是一个能够代表用户真实自我的数字分身。通过本地训练和部署，Second Me 确保用户的数据完全由自己掌控，避免了传统AI系统中数据被大公司掌控的风险。

Second Me 的核心目标是保护用户的独特身份，同时为用户提供一种全新的方式在AI时代中表达自我。它支持全球互联，允许用户的AI代理与其他AI代理进行协作，形成一个去中心化的AI网络。这种设计不仅保护了用户的隐私，还为用户提供了更多的智能扩展可能性。

项目官网：www.secondme.io/

github仓库：github.com/mindverse/S…

论文：AI-native Memory 2.0: Second Me AI-native Memory: A Pathway from LLMs Towards AGI

教程：secondme.gitbook.io/secondme/tu…

Second Me的主要功能

个性化身份创建

多角色适应

ChatMode

Bridge Mode

隐私保护

智能记忆管理

Second Me的技术原理

L0(短期交互记忆)

L1(自然语言记忆层)

L2(AI原生记忆层)

个性化对齐架构(Me-alignment)

去中心化网络

自动化训练管道

多智能体框架

链式推理

2.1 安装 Second Me 服务

1. 克隆仓库

git clone git@github.com:Mindverse/Second-Me.gitcd Second-Me

2. 设置环境

使用 make 命令（需要 Xcode 命令行工具）：

make setup

或者直接使用脚本：

./scripts/setup.sh

3. 启动服务

使用 make 命令：

make start

或者直接使用脚本：

./scripts/start.sh

2.2 启动 Second Me 平台

完成 make start 命令后，打开浏览器并访问 http://localhost:3000，即可进入 Second Me 平台。接下来，我们将逐步完成创建自己的 AI 自我：

1. 定义你的身份

在创建 Second Me 之前，你需要定义自己的身份。这是 Second Me 的核心基础：

在左侧边栏导航至 Create Second Me > Define Your Identity。

配置你的身份信息：

Second Me 名称：为你的 Second Me 起一个名字。

简短个人描述：描述你的风格、驱动力和独特之处。

Second Me 邮箱：填写一个邮箱地址，用于联系你的 Second Me。

确认无误后点击保存。

点击 下一步：上传记忆，继续创建过程。

提示：上传的信息越多样化，Second Me 对你的理解就越准确。

2. 上传你的记忆

下一步是通过上传个人数据来让 Second Me 更了解你：

导航至 Create Second Me > Upload Your Memory。

选择适合的方式上传数据：

文本：直接在页面中输入文字。

文件：上传单个文件。

文件夹：上传整个文件夹，系统会自动整理。

（未来支持连接应用程序和可穿戴设备！）

完成上传后，点击 下一步：训练。

提示： * 上传反映你思维模式、写作风格和知识领域的多样化内容。 * 避免上传过多文件，以免影响训练效率。

3. 训练 Second Me

最后一步是训练 Second Me，使其具备你的个性和能力：

导航至 Create Second Me > Train Second Me。

配置训练设置：

数据合成支持模型：选择记忆处理方式。

训练基础模型：选择适合你计算机性能的模型。

点击 开始训练，等待训练完成。

提示： * 选择适合你计算机性能的模型。 * 训练时间取决于上传数据的数量和复杂性，保持页面打开并耐心等待。

2.3 如何与 Second Me 交互

聊天模式

聊天模式允许你直接与 Second Me 进行交互：

导航至 Playground > Chat with Second Me。

输入消息并按 Enter，即可开始对话。

使用右侧的设置调整聊天体验：

记忆检索：控制记忆在对话中的作用。

系统提示：定义 Second Me 的行为模式。

温度值：调整创造性（0 = 精确，1 = 创意）。

点击 清除聊天，可以重新开始对话。

提示：通过调整设置，让 Second Me 适应不同场景需求。

角色扮演应用

角色扮演应用允许你为 Second Me 创建特定角色，用于不同场景：

导航至 Second Me Apps > Roleplay Apps。

浏览现有角色扮演应用，选择感兴趣的预设角色。

创建自定义角色：

点击右上角的 创建角色扮演应用 按钮。

为角色命名并描述其超能力。

调整角色风格以匹配你的需求。

点击保存。

网络应用

网络应用支持你加入全球 Second Me 网络或创建协作空间：

导航至 Second Me Apps > Network Apps。

加入全球网络：

点击 加入 AI 网络。

启用 注册到网络，让其他用户发现你的 Second Me。

创建协作空间：

点击右上角的 创建新空间 按钮。

输入空间名称和任务描述。

邀请团队成员并点击 创建空间。

项目链接：

github.com/xming521/We…

github.com/mindverse/S…