GitHub 热门项目:GLM-4

2026-05-28 1 阅读 GitHub Trending
GitHub 项目:GLM-4 仓库地址:https://github.com/zai-org/GLM-4 星级:7069 | 作者:zai-org 项目描述:GLM-4系列:开放式多语言多模式聊天LM | 开源多语言多模态对话模型 =================================================== 自述文件内容: # GLM-4-0414 型号系列 ? 加入我们的DiscordX微信(中文)

?本次发布的开源模型可以在Z.ai免费体验;如需GLM商业模型服务,请访问bigmodel.cn

请阅读[中文](README_zh.md) ## 项目更新 - ? **新闻**:``2025/07/02```:我们正在发布 [GLM-4.1V-9B-Thinking](https://huggingface.co/collections/THUDM/glm-41v-thinking-6862bbfc44593a8601c2578d) 系列 VLM,请查看 [此 github] repo](https://github.com/THUDM/GLM-4.1V-Thinking) 获取更多信息。 - **新闻**:``2025/04/14```:我们正在发布 [GLM-4-32B-0414](https://huggingface.co/collections/THUDM/glm-4-0414-67f3cbcb34dd9d252707cb2e) 系列模型,扩展到 32B 参数,包括具有对话、推理和反思功能的模型。 - **新闻**:``2024/06/18``:我们已经发布了我们的[技术报告](https://arxiv.org/pdf/2406.12793),请随时查看。 - **新闻**:``2024/06/05``:我们发布了`GLM-4-9B`系列开源模型。详细信息可以在[此处](README_20240605.md)找到。 ## 型号介绍 GLM 家族迎来新成员,**GLM-4-32B-0414** 系列型号,拥有 320 亿个参数。其性能可与OpenAI的GPT系列和DeepSeek的V3/R1系列相媲美。它还支持非常人性化的本地部署功能。 GLM-4-32B-Base-0414在15T高质量数据上进行了预训练,其中包括大量推理型合成数据。这为后续强化学习扩展奠定了基础。在训练后阶段,我们对对话场景采用人类偏好对齐。此外,利用拒绝采样和强化学习等技术,我们增强了模型在指令跟踪、工程代码和函数调用方面的性能,从而增强了代理任务所需的原子能力。 GLM-4-32B-0414在工程代码、Artifact生成、函数调用、基于搜索的问答、报告生成等方面取得了良好的效果。特别是,在代码生成或特定问答任务等多项基准测试中,GLM-4-32B-Base-0414 实现了与 GPT-4o 和 DeepSeek-V3-0324 (671B) 等较大模型相当的性能。 **GLM-Z1-32B-0414**是一款具有深度思考能力的推理模型。它是基于 GLM-4-32B-0414 通过冷启动、扩展强化学习以及数学、代码和逻辑等任务的进一步训练而开发的。与基础模型相比,GLM-Z1-32B-0414 显着提高了数学能力和解决复杂任务的能力。在训练过程中,我们还引入了基于成对排名反馈的通用强化学习,这增强了模型的 g