在 Hacknews 上有一个讨论很火,就是大家都用小参数的语言模型做什么,有没有什么好的使用案例。我把这些案例整理汇总了一下,大约有六类:(1)文本分类与信息提取、(2)办公与生产力辅助、(3)对话/消息处理与辅助回复、(4)网页/应用集成与自动化、(5)娱乐、创作与游戏、(6)模型部署、技术瓶颈与思考。注:常见的“小模型”通常指参数量约0.5B~3B(如Gemma 2 2B、Llama 2/3.x 3B、Qwen 2.5 1.5B等),或者更小/更简单的场景专用模型。1. 文本分类与信息提取医学文献筛选(Excel Add-In)有人(比如楼中提到的 Girlfriend Excel Add-In 项目)使用了 Gemma 2 2B 模型在 Excel 里给几千篇论文的标题和摘要做二元分类。例如判断“如果该论文研究糖尿病神经病变和中风,则标记为‘Include’,否则标记为‘Exclude’”。用户只需在 Excel 中写一行公式(如 =PROMPT(A1:B1, "…")),再往下拖拽几千行即可批量处理,无需手动逐篇审阅。医院母婴求助短信识别(政府热线)Hacker News 或论坛内容的自动汇总与分组工作/招聘信息的抓取与分类OCR + 结构化解析2. 办公与生产力辅助自动生成或优化 Git 提交信息Excel/表格公式自动完成用于过滤、审核或重命名本地日志/摘要生成代码辅助/小脚本生成3. 对话/消息处理与辅助回复自动回复垃圾短信对话匿名化/去敏处理实时会议或广播的分析聊天机器人本地部署4. 网页/应用集成与自动化Cookie 横幅检测与广告屏蔽浏览器扩展与前端 WebGPU/WebAssembly自动检测或跳过赞助内容封装成后端服务5. 娱乐、创作与游戏故事/小说/对话生成游戏 NPC 对话自动生成音乐/播放列表娱乐性聊天/角色扮演6. 模型部署、技术瓶颈与思考准确率和评估小模型的优点隐私:可离线部署,敏感数据留在本地,不必调用外部 API。速度/成本可控:不依赖云 GPU,尤其在 CPU 性能较好的本地电脑上也能接受速度。专用场景适配:在小数据集或单一任务上微调,往往能媲美大模型通用能力。局限与注意点上下文窗口有限:部分小模型上下文很短,对于长文档处理有难度,需要分块/分段或 RAG。不擅长深层逻辑:对严格逻辑/日期时间推算等,常会出错。中文/多语言能力差异:许多小模型在英语数据上训练得更多,处理其他语言的性能有限,需要自行微调或找多语版本。更多人想法社区对“小模型”(在数亿到几亿或低至几千万参数量级)非常感兴趣,尤其是在特定领域的分类、提取、翻译、重命名等场景,表现足以满足需求又便于离线/本地运行。隐私和成本是最大的驱动力:本地运行可避免数据外泄,也能降低(或避免)云 API 费用。此外在游戏、聊天娱乐、文本变体生成等个人或小型项目中,小模型也能充分发挥创意。但若需更强的推理、可靠回答、强多语言适配,往往还需大模型或者更精心微调。整体而言,“小而专”的思路越来越受欢迎:与其求一个通用大模型,不如在本地用小模型+领域数据完成高性价比的AI应用。相关讨论链接:https://news.ycombinator.com/item?id=42784365