🚀开源编程新王诞生,对标Claude Sonnet 4.5?实测GLM-4.7:Coding和Agentic能力直逼Gemini 3和Claude 4.5
昨天凌晨,智谱AI悄悄放了个大招——发布了最新的开源大模型GLM-4.7。
说”悄悄”是因为这年头新模型实在太多,大家早就审美疲劳了。但这款模型有点不一样,358B参数的MoE架构,关键是MIT开源协议——这意味着你拿去商用都没问题。
光看参数和协议没意思,模型好不好用,还得实测才知道。我花了几个小时把这款模型从简单到复杂折腾了一遍,下面跟大家聊聊真实的使用感受。
🚀本篇笔记所对应的视频:
- 👉👉👉 通过哔哩哔哩观看
- 👉👉👉 通过YouTube观看
- 👉👉👉 Subagents视频
- 👉👉👉 Gemini CLI视频
- 👉👉👉 Context Engineering视频
- 👉👉👉 SuperClaude视频
- 👉👉👉 Claudia视频
- 👉👉👉 Task Master视频
- 👉👉👉 Zen MCP编程视频
- 👉👉👉 Augment编程视频
- 👉👉👉 Serena MCP视频
- 👉👉👉 我的开源项目
- 👉👉👉 请我喝咖啡
- 👉👉👉 我的微信:stoeng
- 👉👉👉 承接大模型微调、RAG、AI智能体、AI相关应用开发等项目。
🔥AI智能体相关视频
先说说官方给的成绩单
在看实测之前,简单过一下官方公布的基准测试数据。
数学竞赛这一项,GLM-4.7拿了95.7分,直接超过了GPT-5.1。代码能力方面,超过了DeepSeek 3.2和Claude Sonnet 4.5。科学推理、复杂推理这几个维度,基本都是同样的结果——比DeepSeek 3.2强,跟Claude Sonnet 4.5打得有来有回,部分指标还有明显优势。
当然,基准测试这东西,大家心里都清楚,参考价值有限。真正好不好用,还是得拉出来遛遛。
第一轮:前端能力试水
一句话生成太阳系动画
先从简单的开始。我在官方网页版输入了一句话:”用SVG生成模拟太阳系的动画”。
结果确实让我有点意外。它不仅画出了八大行星围绕太阳公转的动画,而且动画相当流畅。放大之后能看到行星的运行轨迹,月球绕着地球转,土星还带着光环。
就这么简单的一句提示词,能出这个效果,前端基础能力是过关的。
冒泡排序可视化
接下来加点难度。我让它创建一个冒泡算法的动画演示,要求画面里有12颗大小不同的小行星,还有一艘指挥舰来执行排序操作。
这个任务其实挺考验综合能力的——算法理解、前端实现、动画设计、交互逻辑,缺一不可。
最终效果:点击开始后,指挥舰会在小行星上方移动,发现左侧的小行星比右侧大,就执行交换。整个过程有状态提示,显示”正在比较”或”正在交换”,运行全程没有报错。
到这里,基本的前端+算法能力算是验证通过了。
3D恐龙狩猎游戏
然后是真正的硬菜——让它从零开发一个3D风格的恐龙狩猎游戏。
要求挺复杂的:玩家操控一辆装有机枪的皮卡车,用鼠标瞄准射击恐龙,键盘控制车辆移动。场景要有侏罗纪风格,原始森林、高大植物、岩石、河流、火山,还要有雾气效果。
坦白讲,发出这个提示词的时候,我没抱太大期望。这种需求涉及3D图形渲染、物理碰撞检测、AI行为系统、多模态交互,一般的模型做出来要么跑不起来,要么就是一堆报错。
结果出乎意料——游戏真的能玩。皮卡车可以用键盘控制移动,鼠标瞄准射击。远处会刷新恐龙,小型恐龙两三枪就倒,大型恐龙要多打几枪。开枪后恐龙还会逃跑,打死后尸体会消失。远处能看到山脉和雾气效果,游戏结束后会显示得分。
能一次跑通这么复杂的游戏项目,说明它对大规模代码组织和系统性工程实现的能力确实不弱。
数学推导动画
接着测试了数学能力。让它创建一个演示圆面积公式推导过程的交互动画。
这个任务的难点在于把抽象的数学概念变成直观的视觉呈现。需要理解极限思想,还要把圆切割、重排成近似长方形的过程用动画展示出来。
最终效果很不错。可以设置切割数量,比如切成64份,然后看着这64个扇形被分开、重组成一个近似的长方形,高是半径r,底边是πr。下面还有文字解释切割原理、重排原理、极限思想,公式推导一目了然。
这种把复杂概念可视化的能力,在教育场景下应该挺有价值的。
PPT自动生成
最后试了一下让它根据网页内容自动生成PPT。给了一个GLM-4.7的官方介绍链接,让它直接做成演示文稿。
生成的PPT有模型介绍、核心特性、基准测试数据、三大思考模式、使用方法、产品优势等内容,还自动配了代码截图和数据图表。
作为一键生成的初稿,效果算是及格线以上,拿来稍作修改就能用。
第二轮:Claude Code接入测试
前端能力测完了,接下来试试在Claude Code中调用这款模型,测试它的工具调用能力和复杂编程能力。
配置方法
接入方式很简单,三条命令搞定:设置Base URL、API Key、模型ID。海外用户可以通过z.ai平台获取API,国内用户用BigModel平台。
启动Claude Code后,模型ID显示为GLM-4.7,说明接入成功。
浏览器自动化测试
这部分使用了谷歌官方的Chrome DevTools MCP来测试浏览器自动化能力。
任务是:访问我的博客,点击进入前三篇文章,提取内容,然后改写成适合发X(原Twitter)的短文案。
整个过程看着它自动打开浏览器,点击第一篇博客、返回首页、点击第二篇、返回、点击第三篇,然后提取内容进行改写。最终输出了三篇带emoji表情和标签的X Post,运行速度也挺快。
工具调用能力没问题。
终极测试:iOS原生APP开发
压轴的是一个难度拉满的任务——开发一款iOS原生背单词APP。
要求支持iOS 17+、Swift 5.9、SwiftUI、SwiftData、Swift Charts等技术栈。功能包括:首页展示学习进度、单词卡片支持正反面3D翻转动画、练习测试模块、学习进度统计图表、设置模块等。
先用Xcode初始化一个空项目,然后在Claude Code中执行init命令生成CLAUDE.md文件,让它理解项目结构。接着进入计划模式,粘贴完整需求,让它制定开发计划并执行。
等了大概十多分钟,它完成了开发。然后我又让它把显示语言改成中文。
在Xcode中运行,编译成功。测试结果:可以滑动卡片切换单词,点击翻转查看中文释义,点击”已掌握”后自动切换下一个单词,有每日目标显示,练习和进度模块也能正常使用。
唯一没实现的是设置功能,不过让它继续补充应该问题不大。
能在十几分钟内完成一个功能相对完整的iOS原生应用,这个复杂编程能力确实有点东西。
几个值得关注的特性
除了实测体验,GLM-4.7还有几个设计上的亮点值得一提:
三种思考模式。Interleaved Thinking是在每次响应和工具调用前先思考;Preserved Thinking是在多轮对话中保留之前的思考过程,不用每次从头推导;Turn-level Thinking是支持按轮次控制是否启用思考,简单问题关掉思考降低延迟,复杂任务打开提高准确性。
这种设计对长链路、多步骤的Agent任务应该挺有帮助,能减少信息丢失和前后不一致的问题。
上下文和输出限制。200K的上下文窗口,128K的最大输出长度,做复杂项目的时候不太容易撑爆。
开源友好。权重在HuggingFace和ModelScope都能下载,支持vLLM和SGLang本地部署,MIT协议商用无压力。
总结
折腾了一圈下来,说说我的真实感受:
GLM-4.7的前端能力确实不错,从简单的SVG动画到复杂的3D游戏都能一次跑通,代码组织能力和工程实现能力在开源模型里算是第一梯队。工具调用稳定,iOS原生开发也能应付,综合编程能力比上一代有明显提升。
作为一款MIT协议的开源模型,能做到这个水平,对开发者来说是个好消息。毕竟有竞争才有进步,开源生态越卷,大家的选择就越多。
想试试的可以去z.ai(海外)或BigModel平台(国内)体验网页版,也可以在Claude Code里通过API调用。本地部署的话,HuggingFace上有权重可以下载。
API注册:
国内:
https://bigmodel.cn/usercenter/proj-mgmt/apikeys
海外:
https://z.ai/manage-apikey/apikey-list
🚀Claude Code配置
export ANTHROPIC_BASE_URL="https://open.bigmodel.cn/api/anthropic"
export ANTHROPIC_AUTH_TOKEN="你的 API key"
export ANTHROPIC_MODEL="glm-4.7-coding-preview"
export API_TIMEOUT_MS="3000000"
claude
svg
用svg生成模拟太阳系的动画
ppt生成
将这篇关于模型的介绍做成ppt:https://huggingface.co/zai-org/GLM-4.7
冒泡排序
用最适合的前端技术创建一个可运行的动画程序:
* 画面中有 12 颗不同大小、颜色各异的**小行星**,以及 1 艘更大的**指挥舰**。
* 小行星随机排列在一条水平线上。
* 指挥舰使用**冒泡排序算法**对小行星按大小进行排序(从左到右由小到大)。
* 排序过程要通过动画可视化,小行星之间的交换应有移动效果。
* 画面风格简洁、流畅、具有太空感。
公式推导
创建一个交互式HTML页面,通过扇形切割重排法演示圆面积公式 S=πr² 的推导过程:
【页面布局】
- 左侧:圆形/扇形动画区域(主画布)
- 右侧:控制面板和数学推导展示
- 底部:原理说明文字
【动画阶段】
1. 初始状态:显示一个完整的彩色圆
2. 切割阶段:圆被等分成n个扇形,扇形之间出现间隙
3. 分离阶段:扇形向外扩散分离
4. 重排阶段:扇形交错排列——奇数位置扇形尖端朝上,偶数位置扇形尖端朝下(倒置)
5. 拼合阶段:扇形水平靠拢,形成近似平行四边形
6. 最终状态:标注底边=πr、高=r,显示面积=πr²
【交互控制】
- 滑块:切割份数n(范围4-64,步长2,仅限偶数)
- 滑块:圆的半径r(范围50-150像素)
- 滑块:动画速度(慢/中/快)
- 按钮「播放动画」:按顺序播放完整的切割→重排→拼合过程
- 按钮「自动演示」:份数从4开始自动递增到64,展示收敛过程
- 按钮「重置」:恢复初始圆形状态
- 下拉菜单:选择当前查看的阶段(圆形/切割/重排/拼合)
【实时数学显示】
- 当前份数:n = ?
- 每个扇形圆心角:θ = 360°/n
- 底边长度:显示计算过程,n个扇形的弧长之和 = 周长/2 = πr
- 高度:= 半径 = r
- 近似面积:底×高 = πr × r = πr²
- 精确面积:πr²(计算值)
- 形状误差:当前形状与标准矩形的差异百分比(n越大越接近0)
【视觉设计】
- 深色渐变背景(深蓝到深紫)
- 扇形使用彩虹渐变色(每个扇形颜色随角度变化:红→橙→黄→绿→青→蓝→紫)
- 扇形带轻微描边和阴影,有立体感
- 动画过渡平滑(使用缓动函数)
- 重排后的图形下方显示标注线:底边标注"πr",高度标注"r"
- 圆形状态时标注半径r和圆心
- 关键公式用高亮颜色显示
【说明文字】
页面底部展示三张信息卡片:
1. 「切割原理」:将圆等分成n个扇形,每个扇形近似等腰三角形
2. 「重排原理」:交错排列后,弧边相互咬合,形成近似矩形
3. 「极限思想」:当n→∞时,图形无限接近矩形,面积精确等于πr²
【技术要求】
- 纯HTML/CSS/JavaScript实现,单文件
- 使用Canvas绑制图形和动画
- 动画帧率流畅(requestAnimationFrame)
- 响应式布局,适配不同屏幕
- 现代化UI风格,参考数学可视化工具的设计
侏罗纪游戏
请使用HTML5 Canvas和JavaScript创建一个3D风格的恐龙狩猎游戏,具体要求如下:
游戏核心机制:
1. 玩家驾驶一辆装备有机枪的皮卡车,在侏罗纪时代的环境中追逐恐龙
2. 使用鼠标瞄准,点击射击机枪
3. 恐龙有不同的身体部位,击中头部或心脏等要害部位可造成致命伤害
4. 恐龙被击杀后会倒地,玩家获得分数
5. 皮卡车可以通过键盘WASD或方向键控制移动
视觉呈现要求:
* 背景:侏罗纪时代的原始森林,包含高大的蕨类植物、苏铁、松柏等植物
* 地形:起伏的土地,有岩石、河流、火山景观
* 天空:呈现远古时代的氛围,可以有翼龙飞过
* 恐龙种类:至少包含3种不同的恐龙(如三角龙、迅猛龙、腕龙),每种有不同的移动速度和血量
* 光影效果:模拟阳光透过树林的效果
游戏元素:
* 皮卡车模型:越野风格,车顶安装有可旋转的机枪
* 准星系统:屏幕中央有瞄准十字线
* 血量系统:恐龙有血条显示
* 击中反馈:子弹击中时有视觉效果(血液飞溅效果)
* 音效提示:射击声、恐龙吼叫声、车辆引擎声
技术实现建议:
* 使用Three.js或纯Canvas 2D实现
* 实现基础的物理碰撞检测
* 恐龙AI:随机移动模式,被攻击后会加速逃跑
* 计分系统和游戏时间显示
* 响应式设计,适配不同屏幕尺寸
请创建一个完整可运行的HTML文件,包含所有必要的JavaScript代码和样式。
iOS原生背单词
## iOS背单词应用 - LingoLearn
### 技术栈
iOS 17+ / Swift 5.9 / SwiftUI / SwiftData / Swift Charts
### 功能详情
#### 1. 首页
- 环形进度条显示今日学习进度(已学/目标)
- 火焰图标 + 连续打卡天数
- 待复习单词数量角标提醒
- 快捷按钮:开始学习、快速复习、随机测试
#### 2. 单词学习
- 卡片正面:英文单词 + 音标
- 卡片背面:中文释义 + 例句
- 点击卡片触发3D翻转动画
- 右滑标记"认识",左滑标记"不认识",上滑收藏
- 滑动时卡片倾斜 + 颜色渐变反馈
- 点击喇叭图标播放发音(系统TTS)
- 每组学习结束显示本轮统计弹窗
- 基于SM-2算法自动安排复习计划
#### 3. 练习测试
- 三种题型可选:选择题 / 填空题 / 听力题
- 选择题:显示单词,四选一选中文释义
- 填空题:显示中文,键盘输入英文单词
- 听力题:播放发音,四选一选正确单词
- 顶部倒计时进度条(可设置每题时间)
- 答对绿色对勾动画,答错红色抖动动画
- 练习结束页:正确率、用时、错题列表可回顾
#### 4. 学习进度
- 折线图展示近7天/30天学习单词数
- 日历热力图显示学习频率(类似GitHub贡献图)
- 饼图显示词汇掌握度分布(新学/学习中/已掌握)
- 成就徽章墙:首次学习、连续7天、掌握100词等
- 解锁成就时弹出庆祝动画
#### 5. 设置
- 每日学习目标(滑块选择10-100个)
- 学习提醒开关 + 时间选择器
- 音效开关 / 震动反馈开关
- 自动播放发音开关
- 外观:跟随系统 / 浅色 / 深色
- 重置学习进度(二次确认)
### 设计要求
- 主色调:蓝色#0EA5E9,辅助色:青绿#14B8A6
- 适配Light/Dark Mode
- 所有交互配合触觉反馈
- 完善的空状态、加载态、错误态处理
### 交付物
- 完整Xcode项目
- 预置500+单词数据(含CET4/CET6分类)
- README运行说明
Comments