V2EX 20小时前
[酷工作] 本地语音识别模块验证任务 · 招标说明书 v1.0
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

该项目旨在验证一款教学听说训练系统核心模块的本地语音识别能力。任务要求在iOS端本地实现整句英文的准确识别,并支持至少5000条句子的批量处理,响应时间需在1秒以内。通过技术验证,项目方希望评估开发者构建可复用任务执行结构的能力,并为后续长期合作筛选语音模块主开发人员。最终交付物包括可运行的IPA包、基础代码结构说明和说明文档,预算为1200元人民币,开发时间为2-3天。

🗣️ 项目核心目标是验证本地语音识别的准确性与效率。项目要求在iOS端实现整句英文的本地语音识别,并满足实时性需求,即单轮识别响应时间需≤1秒,以支持上百遍的重复训练。

📲 技术实现需基于iOS原生App,可使用Swift或Objective-C进行开发。语音模型可以选择Apple Speech、WhisperKit或Vosk等本地可部署模型。同时,系统需要支持导入5000句英文原句数据,并具备结构化识别处理能力。

✅ 验收标准包括在真实iPhone上测试批量加载句子、多次切换朗读句子、判断正确/错误识别率以及连续执行测试。最终提交的成果包括可运行的IPA包、基础代码结构说明和详细的说明文档,以确保项目的可验证性和可复用性。

本地语音识别模块验证任务 · 招标说明书 v1.0

一、项目背景
本项目为一套正在开发的教学听说训练系统的核心模块验证任务。
我们高度依赖“整句级别”的语音朗读识别能力,并要求该能力全部运行在 iOS 手机端本地,不得调用外部云端 API ,以支撑未来上百遍重复训练的需求。
二、本轮任务目的
通过一次付费技术验证任务,验证以下要点:
- 本地语音识别是否可准确识别整句英文;
- 系统是否能支持至少 5000 条句子的批量任务;
- 响应速度是否满足实时训练需求(≤1 秒);
- 系统是否能构建可复用的任务执行结构。
通过验证者,我们将优先考虑长期签约为语音模块主开发人员。
三、开发要求
平台要求:iOS 原生 App ( Swift 或 Objective-C )
语音模型:使用 Apple Speech / WhisperKit / Vosk 任一本地可部署模型
数据集支持:支持导入 5000 句英文原句数据,具备结构化识别处理能力
识别机制:用户朗读一句,系统判断是否朗读正确(支持模糊容错)
响应速度:单轮识别响应时间 ≤ 1 秒
验证内容:
- 开发者提交 IPA 包,验证者将在真实 iPhone 上测试:
- 批量加载句子
- 多次切换朗读句子
- 判断正确/错误识别率
- 连续执行几十轮测试
输出结构样例:
{
"sentence_id": "s_0019",
"expected": "She burst into tears.",
"user_result": "She burst into the tears.",
"match_score": 0.94,
"is_passed": true
}
四、交付标准
- 可运行 App 包:一个可直接在 iOS 安装运行的 IPA 测试包
- 基础代码结构说明:简要说明模型加载方式、任务执行结构、是否可扩展
- 说明文档:用于解释如何加载句子、如何调用识别接口、如何运行
五、预算与时间
预算:¥1200 (包干,支持支付宝/微信)
开发时间:2 ~ 3 天(建议开发者在 48 小时内完成)
后续说明:若通过验证,将进入长期语音系统模块外包候选名单
联系方式:v: aiplatform_x

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

语音识别 iOS 本地 Swift 外包
相关文章