GitHub 热门项目：GLM-4

GitHub 项目：GLM-4 仓库地址：https://github.com/zai-org/GLM-4 星级：7069 | 作者：zai-org 项目描述：GLM-4系列：开放式多语言多模式聊天LM | 开源多语言多模态对话模型 =================================================== 自述文件内容： # GLM-4-0414 型号系列 ? 加入我们的Discord、X和微信（中文）

?本次发布的开源模型可以在Z.ai免费体验；如需GLM商业模型服务，请访问bigmodel.cn。

请阅读[中文](README_zh.md) ## 项目更新 - ? **新闻**：``2025/07/02```：我们正在发布 [GLM-4.1V-9B-Thinking](https://huggingface.co/collections/THUDM/glm-41v-thinking-6862bbfc44593a8601c2578d) 系列 VLM，请查看 [此 github] repo](https://github.com/THUDM/GLM-4.1V-Thinking) 获取更多信息。 - **新闻**：``2025/04/14```：我们正在发布 [GLM-4-32B-0414](https://huggingface.co/collections/THUDM/glm-4-0414-67f3cbcb34dd9d252707cb2e) 系列模型，扩展到 32B 参数，包括具有对话、推理和反思功能的模型。 - **新闻**：``2024/06/18``：我们已经发布了我们的[技术报告](https://arxiv.org/pdf/2406.12793)，请随时查看。 - **新闻**：``2024/06/05``：我们发布了`GLM-4-9B`系列开源模型。详细信息可以在[此处](README_20240605.md)找到。 ## 型号介绍 GLM 家族迎来新成员，**GLM-4-32B-0414** 系列型号，拥有 320 亿个参数。其性能可与OpenAI的GPT系列和DeepSeek的V3/R1系列相媲美。它还支持非常人性化的本地部署功能。 GLM-4-32B-Base-0414在15T高质量数据上进行了预训练，其中包括大量推理型合成数据。这为后续强化学习扩展奠定了基础。在训练后阶段，我们对对话场景采用人类偏好对齐。此外，利用拒绝采样和强化学习等技术，我们增强了模型在指令跟踪、工程代码和函数调用方面的性能，从而增强了代理任务所需的原子能力。 GLM-4-32B-0414在工程代码、Artifact生成、函数调用、基于搜索的问答、报告生成等方面取得了良好的效果。特别是，在代码生成或特定问答任务等多项基准测试中，GLM-4-32B-Base-0414 实现了与 GPT-4o 和 DeepSeek-V3-0324 (671B) 等较大模型相当的性能。 **GLM-Z1-32B-0414**是一款具有深度思考能力的推理模型。它是基于 GLM-4-32B-0414 通过冷启动、扩展强化学习以及数学、代码和逻辑等任务的进一步训练而开发的。与基础模型相比，GLM-Z1-32B-0414 显着提高了数学能力和解决复杂任务的能力。在训练过程中，我们还引入了基于成对排名反馈的通用强化学习，这增强了模型的 g

订阅66必读