原创 SiliconCloud 2024-12-03 17:56 北京
感谢开发者朋友提出需求与意见,我们在认真考虑、加速解决。
近期,硅基流动SiliconCloud平台更新主要体现在六大方面,包括:上线图片生成、视频生成、语言、代码模型共6款;支持Lora微调,并可通过API直接调用;支持语音系列API自定义预置音色;支持绑定邮箱、换绑手机、修改昵称头像,安全登录等;若干模型下线;SiliconCloud在欧路词典/欧路翻译插件、Milvus、Cherry Studio中的应用案例。
模型上新
只要是开发者喜欢的大模型,硅基流动团队会第一时间在SiliconCloud上线,免去开发者的部署门槛与成本,只需在开发应用时轻松调用API。
更重要的是,平台上的大模型都会经过硅基流动团队推理优化,响应速度极快且价格亲民。开发者还可在SiliconCloud自由对比体验各类大模型,为你的生成式AI应用选择最佳实践。
1. 图片生成模型
上线推理加速版Stable Diffusion 3.5 Large Turbo(价格为¥0.0032/ M px / Steps),只需4个步骤就能生成高质量的图像,且具有出色的提示遵循能力,生图速度比Stable Diffusion 3.5 Large更快。这种快速生图能力使其成为需要快速图像生成的应用场景的理想选择。
在线体验
https://cloud.siliconflow.cn/playground/image/17885302601
2. 视频生成模型
上线视频生成模型LTX-Video,能够在832*480分辨率下生成24 FPS的高质量视频,视频生成速度极快。
3. 语言&代码模型
上线推理加速版语言模型QwQ-32B-Preview、Qwen2.5-72B-Instruct-128K、Hunyuan-A52B-Instruct以及代码专项模型Qwen2.5-Coder-32B-Instruct。
QwQ-32B-Preview在数学能力(AIME、Math-500)上的表现超过OpenAI o1-preview,且会在回答时给出详细的思考过程;
Qwen2.5-72B-Instruct-128K在编码和数学等领域具有显著改进的能力,提供了多语言支持,覆盖超过29种语言,包括中文、英文等。模型在指令跟随、理解结构化数据以及生成结构化输出(尤其是JSON)方面都有显著提升。
Qwen2.5-Coder-32B-Instruct是目前SOTA的开源代码模型,展现出强大且全面的代码能力,同时具备良好的通用和数学能力;
Hunyuan-A52B-Instruct是开源领域最大的MoE模型,在CMMLU、MMLU、CEval、MATH等多学科综合评测集以及中英文NLP任务、代码和数学等9大维度全面领先,超过Llama3.1、Mixtral等一流的开源大模型。
平台功能
1. 支持微调
支持对Qwen/Qwen2.5-72B-Instruct、Qwen/Qwen2.5-7B-Instruct模型在线LoRA微调,并可通过API免部署直接调用微调模型。现在,只需简单调整一些参数,你就可以在几分钟内就微调一个专属LLM。
2. 支持对比语言模型输出效果
3. 财务总览更新
合并充值、充值记录相关功能。
4. 新增用户个人中心
支持绑定邮箱、换绑手机、修改昵称头像等。
5. 邮箱登录方式更新
由原先的“邮箱账户 + 密码”方式更新为“邮箱账户 + 验证码”方式。
API特性
语音系列API支持上传 / 查询 / 删除 用户自定义参考音频(自定义预置音色)。
模型下线
为了提供更稳定、高质量、可持续的模型服务,以下模型已下线。
deepseek-ai/DeepSeek-Coder-V2-Instruct
meta-llama/Meta-Llama-3-70B-Instruct
meta-llama/Meta-Llama-3-8B-Instruct
Qwen/Qwen2-57B-A14B-Instruct
Pro/internlm/internlm2_5-7b-chat
Pro/meta-llama/Meta-Llama-3-8B-Instruct
Pro/THUDM/chatglm3-6b
Pro/01-ai/Yi-1.5-9B-Chat-16K
Pro/01-ai/Yi-1.5-6B-Chat
场景与应用案例
1. SiliconCloud x 欧路词典/欧路翻译插件
欧路词典为3000万用户提供了全面的翻译、同传、写作批改和对话功能,并支持iOS、Android、Windows、macOS、Linux等多个平台,还曾屡次荣登多个国家地区的苹果商店首页推荐,获得了数万条平均4.8分的真实好评。
欧路翻译浏览器插件则为用户提供了包括AI问答、鼠标划词搜索、逐段对照翻译和PDF文献翻译功能。
2. SiliconCloud x Milvus向量数据库
在RAG流水线中,Milvus 这样的高性能向量数据库在检索最相关数据方面起着至关重要的作用,能帮助LLM生成上下文相关且信息充分的回应。
3. SiliconCloud x Cherry Studio桌面客户端
Cherry Studio是一款支持多模型服务的桌面客户端,内置了超过30个行业的智能助手,旨在帮助用户在多种场景下提升工作效率。它兼容Windows、Mac和Linux系统,无需复杂设置即可使用。
更多案例详情参见文档:https://docs.siliconflow.cn/usercases/awesome-user-cases
近期更新
• SiliconCloud上线Fish Audio
• SiliconCloud上线QwQ-32B-Preview
• SiliconCloud上线Qwen2.5-Coder-32B
• 让3000万用户享受大模型语言学习服务
• SiliconCloud上线视频生成模型LTX-Video
• SD3.5上线ControlNet三件套,BizyAir同步支持
让超级产品开发者实现“Token自由”
邀好友用SiliconCloud,狂送2000万Token/人
即刻体验QwQ-32B-Preview
siliconflow.cn/zh-cn/siliconcloud
扫码加入用户交流群