智谱 AI 宣布 GLM-4-Flash 大模型免费开放

动点科技 2024年08月27日

智谱 AI 今日宣布，其 GLM-4-Flash 大模型现已免费开放，用户可通过智谱 AI 大模型开放平台进行调用。GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务，生成速度高达 72.14 token/s，约等于 115 字符/s。该模型具备多轮对话、网页浏览、Function Call 和长文本推理等功能，并支持 26 种语言，包括中文、英语、日语、韩语、德语等。通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法，智谱 AI 在推理层面实现了模型延迟降低与速度提升，更大并发量和吞吐量不仅提升了效率，而且让推理成本显著降低，最终实现免费推出。

🚀 **免费开放，应用广泛**: 智谱 AI 发布的 GLM-4-Flash 大模型现已免费开放，用户可通过智谱 AI 大模型开放平台进行调用。该模型适用于完成简单垂直、低成本、需要快速响应的任务，例如简单的问答、文本摘要、翻译等。

⚡️ **速度惊人，效率提升**: GLM-4-Flash 的生成速度高达 72.14 token/s，约等于 115 字符/s，这意味着用户可以快速获得模型的响应结果，提升工作效率。

🌐 **多功能支持，语言丰富**: GLM-4-Flash 具备多轮对话、网页浏览、Function Call 和长文本推理等功能，并支持 26 种语言，包括中文、英语、日语、韩语、德语等，为用户提供更便捷的多语言处理能力。

💰 **成本降低，惠及大众**: 通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法，智谱 AI 在推理层面实现了模型延迟降低与速度提升，更大并发量和吞吐量不仅提升了效率，而且让推理成本显著降低，最终实现免费推出，让更多用户能够享受到大模型带来的便利。

🧠 **长文本推理，突破限制**: GLM-4-Flash 支持最大 128K 上下文，这意味着它可以处理更长的文本内容，突破了传统模型在处理长文本方面的限制，为用户提供更强大的信息处理能力。

据悉，智谱 AI 今日宣布，GLM-4-Flash 大模型免费开放，通过智谱 AI 大模型开放平台调用。

据介绍，GLM-4-Flash 适用于完成简单垂直、低成本、需要快速响应的任务，生成速度能达到 72.14 token/s，约等于 115 字符/s。

GLM-4-Flash 具备多轮对话、网页浏览、Function Call（函数调用）和长文本推理（支持最大 128K 上下文）等功能，同时支持包括中文、英语、日语、韩语、德语等在内的 26 种语言。

官方表示，通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法，在推理层面实现模型的延迟降低与速度提升，更大并发量和吞吐量不仅提升了效率，而且让推理成本显著降低，从而免费推出。

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签