IT之家 2024年08月27日
智谱 AI 宣布 GLM-4-Flash 大模型免费开放:支持中文、英语、日语、韩语等 26 种语言
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

智谱 AI 宣布 GLM-4-Flash 大模型免费开放,适用于多种任务,具备多种功能,通过多种方法提升推理速度和降低成本,在预训练方面也有创新。

🎈GLM-4-Flash 大模型适用于简单垂直、低成本且需快速响应的任务,生成速度达 72.14 token/s,约 115 字符/s,具有多轮对话、网页浏览、函数调用和长文本推理等功能,支持 26 种语言。

💡该模型在推理层面采用自适应权重量化、多种并行化方式、批处理策略及投机采样等方法,实现延迟降低与速度提升,提高并发量和吞吐量,显著降低推理成本,从而得以免费推出。

🌟在预训练方面,引入大语言模型进行数据筛选,获得 10T 高质量多语言数据,是 ChatGLM3 - 6B 模型的 3 倍以上,同时采用 FP8 技术进行预训练,提高训练效率和计算量。

IT之家 8 月 27 日消息,智谱 AI 今日宣布,GLM-4-Flash 大模型免费开放,通过智谱 AI 大模型开放平台调用。

GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务,生成速度能达到 72.14 token/s,约等于 115 字符/s

GLM-4-Flash 具备多轮对话、网页浏览、Function Call(函数调用)和长文本推理(支持最大 128K 上下文)等功能,同时支持包括中文、英语、日语、韩语、德语等在内的 26 种语言

官方表示,通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法,在推理层面实现模型的延迟降低与速度提升,更大并发量和吞吐量不仅提升了效率,而且让推理成本显著降低,从而免费推出。

在预训练方面,官方引入了大语言模型进入数据筛选流程,获得 10T 高质量多语言数据,数据量是 ChatGLM3-6B 模型的 3 倍以上;同时采用了 FP8 技术进行预训练,提高了训练效率和计算量。

IT之家附相关链接如下:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

智谱 AI GLM - 4 - Flash 大模型 免费开放 预训练
相关文章