按分类浏览

AIAgents 52
LLMs 39
Fine-Tuning 10
LLM 9
Vision 4
RAG 4
AI-Agents 2
Tutorial 1

AIAgents

🚀程序员福音！学习新框架从此不用看文档？Skill Seeker让Claude成为你的技术导师，CrewAI、AutoGen、LangGraph随便上，自动生成完整项目代码，告别学习曲线陡峭的噩梦！不用再啃文档了！这个工具让 Claude 秒懂任何技术框架

2 minute read

说实话，最近 Anthropic 推出的 Claude Skills 功能真的很香。作为一个天天和 AI 打交道的开发者，我发现一个很有意思的现象：Claude 这个 AI 助手本身很聪明，但它对一些新出的框架、工具、甚至是小众的开源项目，理解得并不够深入。

🚀彻底改写浏览器自动化！ChatGPT Atlas浏览器深度评测：Agent模式自动操作网页太疯狂！从论文分析到网购下单到自动发博文，看完你会卸载Chrome！

less than 1 minute read

今天凌晨，OpenAI又给我们带来了一个大惊喜——推出了全新的AI浏览器ChatGPT Atlas。说实话，当我第一次打开这个浏览器的时候，心里只有一个想法：这才是我们一直想要的”智能”浏览器啊！

🚀保姆级教程！🚀谷歌Chrome DevTools MCP彻底颠覆AI浏览器自动化！让Cursor、Claude Codex CLI秒变浏览器控制神器，真正实现浏览器自动化，让AI为你打工！

2 minute read

让 AI 真正在浏览器里“看见与验证”：Chrome DevTools MCP 全面解析。过去两年，AI 编码助手的“聪明程度”突飞猛进，但一个根本性短板始终没被补上：它们大多看不到真实运行时。写前端、调接口、改性能，最后还是要你亲自打开浏览器、按步骤复现、开 DevTools 找证据。Chrome DevToo...

🚀保姆级教程！GitHub Copilot CLI横空出世，支持MCP扩展+自动PR创建，让AI编程效率提升1000%，开发者必看！开发完整应用实战演示！支持GPT-5和Claude Sonnet 4

3 minute read

GitHub Copilot CLI：开发者的终极生产力神器来了！还记得第一次使用 GitHub Copilot 时的惊艳感受吗？那种在编辑器里输入注释，AI 就能自动生成代码的神奇体验，让无数开发者惊呼”未来已来”。而现在，GitHub 再次给我们带来惊喜——GitHub Copilot CLI 正式发布公开预...

🚀Claude in Xcode超越Claude Code颠覆Apple移动端开发！三分钟实现原生开发iOS App！Claude Sonnet 4深度集成Xcode，实时代码生成+智能调试，效率倍增

1 minute read

Claude 终于登陆 Xcode！iOS 开发者的生产力要被点满了！进入2025年以来，几乎每隔一段时间，就会有新的工具让开发者们眼前一亮。前阵子，很多人还在用 Claude Code 在 VS Code、Cursor 里玩转智能辅助开发，而现在，Anthropic 正式把 Claude 带进了苹果的 Xcod...

🚀GPT‑5-Codex深度测评！支持Cursor！连续编程7小时不掉线，5分钟开发完整应用，彻底颠覆传统编程方式！终端命令行+IDE+云端三端通用！GitHub PR一键审查修复，效率暴涨1000%

1 minute read

今天凌晨 OpenAI 发布了最新模型 GPT‑5‑Codex。它不仅是 GPT‑5 的“编程特化版”，更像是一个能和你并肩作战的 AI 编程伙伴——无论是在终端、IDE、网页，甚至手机上，都能随时帮你写代码、改代码、审代码。

🚀Google Stitch颠覆传统UI设计！10秒生成专业级UI！快速生成产品原型！小白也能开发精美UI。支持无缝导入Figma！ Stitch保姆级教程：从想法到APP大师级界面效果堪比专业团队

less than 1 minute read

最近为大家分享了很多AI编程相关的开源项目和工作流，但我发现很多朋友都遇到了同一个问题：APP的功能逻辑想得很清楚，却卡在了UI设计这一关。

🚀Claude Code PM 彻底颠覆传统编程开发！轻松实现并行开发！支持Spec-driven规范驱动开发！让GitHub Issues秒变独立分支的神器！开发效率提升300%!支持头脑风暴生成PRD文档

2 minute read

🚀颠覆Vibe Coding！超越Kiro！支持Cursor！Claude Code Spec Workflow为Claude Code完美复现Kiro的Spec-Driven规范驱动开发！效率倍增！

3 minute read

在当前的软件工程领域，如何将大型语言模型（LLM）高效、规范地集成到开发生命周期中，已成为一个重要的研究方向。claude-code-spec-workflow 是一个在GitHub上开源的项目（已获得1.7k Star），它为此提供了一套颇具创新性的解决方案。该项目旨在通过自动化的工作流，将针对Claude等先...

🚀突破性创新！Claude Code新增Output Styles功能彻底颠覆编程方式，实现Claude Code与Gemini CLI双AI协作，代码质量倍增！Learning模式支持编写代码边学习

7 minute read

Output styles 是 Claude Code 中的一种机制，用来控制模型生成内容的“表达方式和结构模板”。它不会改变 Claude 的核心能力或工具权限，而是通过预设的写作框架影响输出。例如你可以让 Claude 以解释型风格生成详细分析，以教学型风格输出循序渐进的步骤，或自定义成“PRD 模板...

🚀Cursor CLI+GPT-5保姆级教程+编程能力测评！Cursor CLI零成本免费使用GPT-5！Claude Code的劲敌来了！从安装到实战演示，轻松开发AI智能体，颠覆传统开发效率翻倍！

4 minute read

就在 2025 年 8 月 7 日，人工智能迎来了又一个里程碑：OpenAI 正式发布 GPT-5，同时 Cursor 推出全新的 CLI（命令行界面）体验。这一次，它们将如何帮你搞定写作、编码、生产力三合一？ Cursor CLI 是一个强大的命令行工具，让您可以直接在终端中与AI助手交互来编写、审查和修改代码...

🚀🚀颠覆性创新！Stagehand革命性AI浏览器自动化框架！支持TypeScript+Python+云端部署！比Browser-Use更快更精准！代码精准控制+自然语言决策效率提升10倍！保姆级教程！

2 minute read

当传统浏览器自动化框架频频崩溃，基于AI驱动的Browser-Use又过于难以掌控时，一个名为Stagehand的项目悄然改变了游戏规则。 🚀本篇笔记所对应的视频： 👉👉👉 通过哔哩哔哩观看 👉👉👉 通过YouTube观看 👉👉👉 Browser-Use 👉👉👉 Co...

🚀彻底颠覆传统开发！Claude Code再添利器！BMad-Method多智能体协作框架轻松打造敏捷AI驱动开发工作流！自动生成PRD文档、架构设计！支持Cursor、Cline、windsurf等

1 minute read

BMad Method是一个革命性的AI代理框架，专为提供”敏捷AI驱动开发”（Agentic Agile Driven Development）而设计，其核心理念是”突破性敏捷 AI 驱动开发方法”。这不仅仅是一个软件开发工具，而是一个可以扩展到任何领域的通用AI代理系统。

🚀Claude Code重磅推出Sub agents功能！轻松实现任务专业化和模块化！三分钟完美复现Kiro工作流，规范驱动开发时代正式到来！从Vibe Coding到spec-driven软件开发！

14 minute read

Anthropic公司在其Claude Code平台上推出了一项创新功能——Sub Agents（子智能体）。这一功能标志着AI助手从通用型向专业化的重要转变，为开发者提供了更精细、更高效的任务执行解决方案。

🚀彻底改写Claude Code编程方式！从提示词工程到上下文工程！AI编程能力提升百倍！从需求分析到代码生成全自动化！保姆级实战教程！支持Windows！零基础用Claude Code开发AI智能体

4 minute read

Context Engineering是一种为AI编程助手提供全面上下文信息的工程化方法，远超传统的提示工程。它不仅仅是优化提示词的措辞，而是构建一个完整的上下文系统，包括项目规则、代码示例、文档引用、验证流程等。

🚀当Cursor和Claude code拥有了记忆！编程能力倍增！Graphiti MCP Server让AI编程助手实现持久超强记忆！时序感知知识图谱让AI实时学习！支持neo4j

4 minute read

Graphiti 的 MCP Server 是一个实验性的 Model Context Protocol 服务，旨在为支持 MCP 协议的 AI 助手（如 Claude Desktop、Cursor 等）提供结构化的知识图谱接口。它能够将用户的自然语言输入、消息和 JSON 数据存储为“episode”，自动抽取...

🚀 SuperClaude让Claude Code编程能力暴增300%！小白秒变顶尖程序员！19个专业命令+9大预定义角色，零编程经验也能开发复杂项目，完全碾压Cursor等AI编程工具！颠覆传统编程

2 minute read

SuperClaude是一个专门为Claude Code设计的综合配置框架，旨在将Claude Code转变为一个专业的AI开发助手。它通过结构化的配置文件和专业化的工作流程，极大地增强了Claude Code的开发能力。

🚀Claudia让你丢掉Cursor告别命令行！Claude Code终于有GUI了！专为Claude Code打造最强可视化界面保姆级教程！可视化项目管理、智能体创建、记忆文件配置，AI编程如此简单

3 minute read

Claudia是一款基于Tauri 2构建的桌面应用程序，为Claude Code提供了直观美观的图形界面管理体验。它充当Claude Code的命令中心，在命令行工具与可视化体验之间架起桥梁，让AI辅助开发变得更加直观高效。

🚀保姆级教程！Augment Code企业级AI编程智能体！200k token超长上下窗口让AI真正理解你的项目！超越传统AI编程助手的革命性功能，实时代码感知、全局补全、智能记忆，让AI成为你的专属开发伙伴

less than 1 minute read

在软件开发领域，AI正在重新定义我们的工作方式。今天，让我们深入了解一个备受瞩目的AI编程助手——Augment Code，看看它如何为开发团队带来革命性的变化。

🚀保姆级教程！Google震撼发布Gemini CLI！100万TOKEN超长上下文远超Claude Code，支持MCP Server扩展，开发者的终极AI！Context7+Task Master轻松开发AI智能体

4 minute read

Google最近推出了Gemini CLI，这是一个基于Gemini 1.5 Pro模型的开源命令行界面工具，将人工智能直接引入开发者的终端环境。这一创新工具代表了开发者生产力的重大进步，将传统命令行从刚性的命令执行器转变为智能的对话伙伴。

🚀Cursor+Serena最佳组合告别AI编程工具短板！支持Claude Code、windsurf、Cline！让AI编程不再是简单读取代码而是智能分析依赖关系，让复杂开源项目二次开发效率提升十倍

1 minute read

还在手动搜索代码定义？还在为跨文件重构愁白了头？还在对着AI聊天框一遍遍地复制粘贴代码片段？

🚀告别Cursor的限制！Augment编程神器震撼登场：200K超长上下文+全自动代码生成，结合Context7轻松开发游戏！支持万行代码分析+自动bug修复+跨文件依赖识别，三分钟自动开发复杂项目

1 minute read

在当今快速发展的软件开发领域，开发者们面临着前所未有的挑战：代码库日益复杂，框架和库更新频繁，文档版本繁多。传统的开发工具已经无法满足现代开发者的需求。今天，我们要介绍两个革命性的工具——Augment和Context7，它们的结合将为开发者带来前所未有的编程体验。

🚀颠覆传统编程！Claude Code+Zen MCP实现多AI协作开发！效率提升20倍！Claude+Gemini 2.5+O3打造专业编程开发团队自动调用最适合的AI进行编码，开发效率提升20倍！

3 minute read

在AI开发领域，我们经常面临这样的挑战：Claude虽然强大，但有时需要多种AI的协作才能完成复杂任务。今天要介绍的Zen MCP，正是为了解决这个问题而生的革命性工具。它通过Model Context Protocol (MCP)协议，让Claude能够与Gemini、O3等多个AI模型无缝协作，实现真正的AI...

🚀端脑云平台DeepSeek R1模型API+AutoGen轻松打造PRD生成智能体工作流

less than 1 minute read

AutoGen是一个用于构建可扩展多智能体AI系统的事件驱动编程框架，特别适用于商业流程中的确定性和动态智能体工作流。下面的代码专门针对软件开发项目的前期规划阶段，通过RoundRobinGroupChat团队配置实现三个专业智能体的协作：PRD文档撰写专家、项目任务管理专家和质量审核专家按轮询方式依次工作。整...

🚀颠覆传统编程！Cursor 1.0+Claude Task Master+Gemini 2.5 Pro 0605开发效率提升10倍！从产品需求文档生成到子任务分解到自动单元测试到全自动开发复杂项目！Claude Task Master让编程开发从未如此简单

4 minute read

导语：还在为复杂的项目管理而头疼？还在为频繁的需求变更而焦虑？一个革命性的AI驱动开发工具横空出世，彻底改变传统编程工作流！

🚀震撼发布！谷歌开源Gemini Fullstack LangGraph企业级AI智能体系统+深度搜索神器，告别ChatGPT付费订阅，AI研究员级别的智能分析，支持中文回答，完整部署教程一键搞定%

less than 1 minute read

在AI技术日新月异的今天，如何构建一个既智能又可靠的研究助手，一直是开发者们关注的焦点。最近，谷歌开源了一个令人振奋的项目——Gemini Fullstack LangGraph Quickstart，这个项目展示了如何利用Gemini 2.5模型和LangGraph框架构建一个功能强大的全栈AI研究代理。

🚀Kilo Code横空出世：完美融合Cline和Roo Code所有优势，彻底解决卡死bug，支持5种智能模式，20美金免费额度，自动触发上下文压缩、智能任务分解、实时代码解释，编程效率提升300%

less than 1 minute read

还在为繁琐的代码调试而熬夜吗？还在为重复的编程任务而感到枯燥吗？今天要给大家安利一款超级强大的开源AI编程助手——Kilo Code！🎯

🚀Cursor+Claude Code+Claude 4终极组合！仅用10分钟为开源项目Magentic-UI完美集成JWT用户认证系统，编程效率提升300%，告别传统开发模式！小白也能轻松开发商业项目

less than 1 minute read

终端里的AI编程神器来了！Claude Code让你体验”思维级”编程速度！还在为复杂的代码调试而头疼？还在为重构老项目而犯愁？如果我告诉你，现在有一个AI工具能在几秒钟内理解你的整个代码库，并且能像真正的编程伙伴一样帮你写代码、修bug、跑测试，你会不会觉得这像是科幻小说？

🚀 微软重磅开源Magentic-UI！彻底改写AI智能体交互方式，开创人类与AI Agents协作的新时代，让AI成为你的超级助手，而不是替代者！超越Manus! 支持浏览器调用+文件操作+代码生成！从部署到测评保姆级教程小白也能3分钟拥有自己的智能体！

2 minute read

AI助手的新时代已经到来！想象一下，你只需要说一句话，AI就能帮你在淘宝上货比三家、在携程上预订机票、在招聘网站上投递简历，甚至完成复杂的数据分析和报告生成。但与其他”黑盒”AI不同的是，这个AI会把每一步操作都透明地展示给你，重要决策前还会征求你的意见。

🚀谷歌Jules彻底颠覆传统AI编程！超越OpenAI Codex和Manus与Coze！Jules深度实测，完美GitHub集成，自动代码分析与重构，从复杂项目到功能增强一步到位，小白也能轻松编程

less than 1 minute read

在刚刚结束的Google I/O 2025开发者大会上，谷歌正式宣布其革命性AI编程助手Jules进入全球公测阶段，这一消息在开发者社区引起了巨大轰动。这不再是简单的代码补全工具，而是一位真正能理解你意图并独立完成任务的AI助手。 👉👉👉 点击使用Jules

🚀Windsurf研发SWE-1大模型编程能力超越DeepSeek V3！开发者福音！SWE-1系列模型独家评测：不限次数免费使用，从项目分析到MCP服务器开发的全流程实战教程，让小白也能轻松开发软件

less than 1 minute read

软件工程新纪元：Windsurf推出全球首款全流程AI编程模型SWE-1！在AI编码工具激烈角逐的战场，Windsurf用一记重拳改写了游戏规则。5月15日发布的Wave 9更新中，这个原名为Codeium的硅谷新锐亮出了颠覆行业的”王炸”–全球首个专为软件工程全流程设计的AI模型家族SWE-1。这套系统不仅重新...

🚀颠覆传统AI智能体！AutoGen革命性创新GraphFlow技术！让AI团队自动协作！5分钟实现实现智能体工作流自动化！AutoGen GraphFlow保姆级实战教程！支持Qwen3与ollama

3 minute read

在AI智能体领域，微软的AutoGen团队近期推出了一项引人注目的新特性–GraphFlow。这一创新组件为AI多代理系统带来了高度灵活且并发友好的工作流编排能力，极大提升了团队协作的效率和可控性。

🚀AutoGen重大更新！新增McpWorkbench完美支持MCP Server！支持将Agent和Team封装为工具！开启模块化智能体编程！实战教程：从零开始构建旅游规划智能体和进销存智能客服系统

5 minute read

在AutoGen框架中，”Agent and Team as Tools”是一项创新功能，它允许将现有的智能体(Agent)和团队(Team)作为工具供其他智能体调用。根据我搜索到的信息，这一功能具有显著的优势和应用场景。

🔥超越cursor！Cline+Context7 MCP文档搜索功能高级用法！自定义指令+.clinerules轻松开启vibe coding！零代码构建AutoGen智能体与Next.js应用

3 minute read

Context7是由Upstash团队开发的一个平台，旨在为大型语言模型(LLMs)、AI代码编辑器和开发者提供最新的、特定版本的文档。它能直接从官方文档中提取真实、可用的代码片段，按版本过滤，并准备好供Cursor、Claude或任何LLM使用。

🚀OpenAI首发轻量级AI编程智能体-OpenAI Codex CLI，编程能力能否超越cursor？Codex编程智能体实战，打破编程瓶颈，自动化开发，轻松构建3D城市模拟与任务管理系统的实战教程

1 minute read

OpenAI近日正式发布了Codex CLI，这是一款开源的AI编程助手，专为开发者在本地终端环境中高效编写、修改和运行代码而设计。Codex CLI不仅集成了OpenAI最新的推理模型，还能直接操作本地文件与命令行，实现更智能、更自动化的开发体验。

🚀颠覆传统智能体！ADK谷歌最强AI智能体发布！支持MCP与ollama！Agent Development Kit详细教程！超越AutoGen和LangChain!轻松打造多智能体系统！自带UI界面！- 完整教程

5 minute read

在人工智能领域，单一功能模型逐渐让位于更复杂的多智能体系统。这些系统通过多个智能体协同工作，能够完成复杂任务。然而，多智能体系统的开发往往面临诸多挑战。为了解决这一问题，Google在Google Cloud NEXT 2025大会上推出了一款全新的开源框架——Agent Development Kit (ADK...

🚀颠覆MCP！Open WebUI新技术mcpo横空出世！支持ollama！轻松支持各种MCP Server！Cline+Claude3.7轻松开发论文检索MCP Server！本地部署mcpo！- 完整教程

2 minute read

Open WebUI 的 MCPo 项目：将 MCP 工具无缝集成到 OpenAPI 的创新解决方案!

🚀超越cursor！Roo Code+Gemini 2.5 Pro为OpenAI Agents SDK开发工作流UI！轻松拖动组件即可搭建工作流！小白也能化身软件工程师！超越dify和langflow

5 minute read

Roo Code 是一款集成于 VS Code 的 AI 编程助手，能显著提高开发效率。它支持多种大模型，自动生成高质量代码，提供智能补全、实时错误检测与调试辅助，从而大大缩短开发周期。其命令行交互和自动化测试功能使得复杂任务简单易行，同时免费额度充足、生成速度快，减少了因频繁调用接口带来的成本和延迟。此外，Ro...

🚀Cursor降低智商！WindSurf零代码开发MCP Server！五分钟轻松实现LightRAG+MCP为Claude和AutoGen挂载知识库！增强Claude和AutoGen的知识库检索能力

8 minute read

随着人工智能技术的不断突破，编程工具正迎来前所未有的变革。由 Codeium 团队推出的 WindSurf，以全新的 AI Flow 范式和多工具协同能力，正逐步超越备受关注的 Cursor，成为开发者提高工作效率的利器。

🚀AutoGen Studio零代码创建AI智能体工作流！三分钟从入门到精通！支持工具调用与多agents协作！微软最强开源可视化AI Agents框架！轻松打造旅游规划智能体工作流！轻松解决复杂任务

less than 1 minute read

近日，微软研究团队正式推出了全新的 AutoGen Studio，这是一款基于 AutoGen 框架打造的低代码（no-code）开发平台，旨在帮助开发者和研究人员快速原型设计、调试和评估多智能体工作流。AutoGen Studio 通过直观的拖拽式用户界面和声明式（JSON）配置，使构建复杂的 AI 多智能体系...

🚀实战详解MCP，从入门到开发！小白也能看懂！MCP推动AI智能体大爆发！Cline+Claude3.7打造论文搜索MCP Server！集成到AutoGen+smolagents智能体框架！AGI到来

1 minute read

MCP（Model Context Protocol）是一个开源协议，旨在简化AI模型与外部数据源、工具和系统的连接，从而对AI智能体开发产生了深远的影响。它提供了一个标准化的方法，使得AI智能体能够更轻松地访问和利用各种资源，从而提升其功能性和开发效率。以下是从MCP对AI智能体开发影响力的角度进行的详细介绍：

🚀OpenAI全新Agents SDK发布吊打Manus！三分钟构建电商客服AI智能体！支持任务交接！颠覆传统AI智能体，开启AI智能体新时代，小白也能轻松打造自己的AI Agents，支持ollama

4 minute read

OpenAI全新Agents SDK和Responses API强势出击，助力开发者实现多智能体无缝协作，推动各领域实现数字化转型革命。

🚀3分钟复刻Manus智能体！AutoGen+MCP Server+Cline构建最强AI智能体，支持ollama！轻松实现网络搜索+文件操作的AI Agent！不花一分钱也能拥有强大AI智能体！#ai

3 minute read

3分钟复刻Manus智能体！AutoGen+MCP Server+Cline构建最强AI智能体，支持ollama！轻松实现网络搜索+文件操作的AI Agent！不花一分钱也能拥有强大AI智能体

🚀用MCP为AutoGen开挂接入各种工具和框架！Cline零代码开发MCP Server实现接入LangFlow进行文档问答

9 minute read

AutoGen v0.4引入了对Model Context Protocol (MCP) server的支持，这是一项重要的新功能，为AI代理提供了更强大和灵活的工具使用能力。

🚀零成本复刻Deep Research！超越OpenAI Deep Research+DeepSeek R1！三分钟快速部署node-DeepResearch最强AI agent，由Jina AI打造！

3 minute read

Jina AI 开发的 node-DeepResearch 是一个开源自动化研究工具，旨在通过搜索、阅读网页和推理，直到找到问题的答案。该项目适用于自动化信息检索和智能问答任务，结合了搜索引擎和大语言模型（LLM）来提高研究效率。

🚀取代ChatGPT Operator！支持DeepSeek！Browser Use最强浏览器自动化框架，支持Roo Code轻松实现MCP Server集成Claude桌面版

1 minute read

Browser-use是一款开源的基于AI的智能浏览器自动化工具，而且这款开源项目分为命令行版本和web UI版本，并且支持deepseek、gpt-4o在内的开源和闭源模型。我们可以使用这款开源项目轻松实现浏览器自动化操作，执行订机票、浏览网页、点击链接、提取信息，甚至填写表单、订机票等复杂操作。用户可以...

微软最强AI智能体AutoGen史诗级更新！原生支持Magentic-One和Swarm与Teams！引领AI智能体元年！支持ollama本地部署！小白也能轻松掌握AI框架保姆级教程，超详细上手指南

8 minute read

AutoGen 是一个用于构建代理 AI 应用程序的开源框架，允许开发者创建可以自主行动或与人类协作的多代理 AI 系统。AutoGen 0.4.2 是一个重要的更新版本，它在代理工作流程中提高了代码质量、稳健性、通用性和可扩展性。新的异步、事件驱动的架构使 AutoGen 更具可扩展性和稳健性，从而支持更广泛的...

告别Token消耗！用Roo Cline开发项目专属MCP Server，让AI编程不再烧钱，Claude app化身编程IDE，一次配置永久省钱！最强编程AI智能体！Roo Cline超越Cline

1 minute read

Cline 和 Roo Cline 都是基于 Visual Studio Code 的 AI 编程插件，能够通过自然语言指令与开发者交互，辅助完成代码编写、测试、调试等任务。Cline 由 Cline Bot Inc. 开发，而 Roo Cline 则是 RooVetGit 基于 Cline 3.1 进行 For...

告别Cursor和WindSurf！最强AI编程插件Cline3.1重磅升级：智能版本管理+任务跟踪系统，让你的代码管理更高效，一键修复Bug，从项目分析到代码优化，打造完美跨平台应用的终极指南

less than 1 minute read

最强AI编程插件Cline今天发布了最新版本Cline3.1。新增了更加智能的版本管理与任务跟踪等功能。这是的cline更加强大了！前些时间Cline 3.0版本新增了自动审批功能，而且还支持全新的差异化(diff)编辑功能，只输出需要替换的内容而不是整个文件,提高编速度和可靠性。今天Cline 3.1引入了“检...

smolagents颠覆传统AI智能体！ollama本地部署Hugging Face开源全新AI智能体！重新定义AI智能体开发！从入门到精通只需10分钟

6 minute read

HuggingFace于2024年12月31日发布了一款全新的AI代理框架SmolAgents，这是一个极简但功能强大的AI Agents库，可以让开发者用最少的代码快速构建智能代理系统。该框架的核心逻辑仅用约1000行代码就实现了完整的代理功能，极大地简化了AI代理的开发流程。

ScrapeGraphAI开启智能数据抓取新时代！用AI重塑数据提取方式！ScrapeGraphAI+LangChain+LangGraph打造最强文章采集和写作AI智能体！让内容创作更简单

7 minute read

传统的网页抓取工具严重依赖于预定义的规则和模式，一旦目标网站的结构发生变化，就需要手动更新代码，耗时费力。而 ScrapeGraphAI 则另辟蹊径，它利用 LLMs 的强大理解能力，让用户只需用自然语言描述所需数据，剩下的复杂工作全部交给 AI 完成！

Claude颠覆性创新！MCP模型上下文协议！轻松为Claude加入搜索引擎、网页抓取、Text to SQL、文件管理、GitHub操作等功能！Model Context Protocol为AI开挂

1 minute read

人工智能公司Anthropic推出了模型上下文协议（Model Context Protocol，简称MCP），旨在为AI助手与外部数据源之间建立安全、标准化的连接。MCP作为开放协议，允许开发者在AI工具与各种数据源（如文件系统、数据库、API等）之间创建双向连接，提升AI系统的互操作性和功能扩展性。

LLMs

🚀DeepSeek又放大招！这个OCR模型让文档识别效率倍增！本地部署+客观实测DeepSeek-OCR！OCR识别准确率97%，支持100+语言，每天处理3300万页文档的开源大模型！

5 minute read

如果你经常需要处理大量文档，或者正在为AI模型的长文本处理能力发愁，那么这篇文章你一定要看完。DeepSeek最近发布的OCR模型，可能会彻底改变我们处理文档的方式。

🚀程序员必看让AI编程100%可控！从1到N的开发神器OpenSpec规范驱动开发完整实战指南！支持Cursor、Claude Code、Codex！比SpecKit更强大！三分钟实现iOS项目迭代

6 minute read

你有没有遇到过这种情况？满怀期待地让AI助手写代码，结果它理解错了需求，写了一堆你不想要的功能；或者你想让它改个小地方，结果它把整个文件都改乱了；又或者几轮对话后，AI完全忘了你最初想要什么，代码越改越偏…

🚀震撼发布！Claude Code插件系统来了！一行命令打包整套工作流，团队协作效率提升10倍，从此告别复杂配置，这个功能太强大了！

4 minute read

还在为团队开发规范不统一而头疼？还在手动配置各种复杂的开发环境？Claude Code最新版本带来的插件系统，可能会彻底改变你的工作方式。

🚀这才是AI编程的正确姿势：Spec Kit 实战！7条命令跑通规格驱动开发+强制 TDD，从需求到代码全自动！支持 Claude Code、Cursor、Codex

3 minute read

做过项目的都懂：代码永远跑在文档前面，PRD 写得再漂亮，落到实现又是另一回事；改需求时，设计、代码、测试全要跟着手工同步，慢、易错、沟通成本高。Spec Kit 提出的 SDD（Spec-Driven Development，规格驱动开发），就是把这套逻辑彻底反过来：让“规格=一等公民”，代码只是规格的表达。他...

🚀【保姆级教程】GLM-4.6 接入 Claude Code：200K 长上下文 + Agentic Coding，开发者福音！编程能力大幅提升！

1 minute read

近两年大模型的迭代节奏越来越快，但真正能把“推理 + 工具使用 + 编程”三件事同时做扎实的，并不多。GLM-4.6 就是奔着这个目标来的：它在长上下文、复杂任务分解、工具调用与代码生成上做了系统化加强，旨在更贴近真实开发与自动化代理（Agent）的落地场景。

🚀Claude Sonnet 4.5+Claude Code 2.0彻底解决过度编码顽疾，编程能力实现质的飞跃！全方位真实评测：从SVG生成到原生iOS APP开发到AI智能体开发，编码能力大幅提升

1 minute read

9 月 29 日，Anthropic 发布了全新的 Claude Sonnet 4.5，并同步推出更自主、更贴近真实开发流程的 Claude Code 2.0。如果把去年的迭代理解为“把助手放到键盘边”，今年的升级就是“让助手坐上工位”：它不仅写代码、修 Bug、跑命令，更重要的是能够在较长时间跨度内保持目标感与...

🚀视觉能力倍增！Qwen3-VL史诗级更新！多维度客观测评Qwen3-VL-235B-A22B-Instruct！OCR精准识别模糊扫描件、繁体古籍轻松提取、9分钟视频内容精准分析、目标人物精准定位！

1 minute read

你有没有那种感觉：当下最前沿的 AI 模型，每隔几个月就会叫人“目不暇接”？没错，这一次要给大家介绍的，就是 Qwen 系列里又一颗耀眼的新星 —— Qwen3-VL（235B A22B Instruct 版本）。它既擅长“看得清”（视觉理解），也擅长“说得溜”（文本理解/生成），被官方称为 Qwen 系列迄今为...

🚀本地部署+全面测评！阿里最强全模态大模型Qwen3-Omni史诗级更新！OCR能力、音频识别、视频理解无所不能！Qwen3-Omni-30B-A3B-Instruct支持语音输出！

1 minute read

01｜Qwen3-Omni是什么，为何值得关注？

🚀AI视觉新突破！GLM-4.5V多模态AI神器全面测评！长视频理解能力倍增，轻松实现监控视频查找目标人物！OCR能力倍增，识别手写处方、模糊PDF扫描件无压力！106B参数MoE架构超越GPT-4o

4 minute read

最近AI圈又有大动作了！智谱AI推出了全新的GLM-4.5V视觉语言模型，说实话，看完技术文档后我有点兴奋——这家伙可能真的要改变我们和AI交互的方式。

🚀OpenAI重磅开源gpt-oss系列模型！本地部署+客观深度测评！开源模型中的王者gpt-oss-120B和gpt-oss-20B！从幻觉测试到代码生成，从逻辑推理到文档分析，全面碾压现有开源模型

4 minute read

重磅！OpenAI终于开源了，GPT-OSS来了！

🚀重磅开源！本地部署1.7B参数超强OCR大模型dots.ocr！超越GPT-4o和olmOCR！结构化精准提取复杂PDF扫描件！完美识别中英文文档、模糊扫描件与复杂表格！文档解析准确率接近100%！

1 minute read

dots.ocr是小红书团队开源的一个多语言文档解析神器。它能干什么呢？给它一张包含文字、表格、公式的复杂文档图片，它就能准确地告诉你每个元素在哪里、是什么类型、里面写的什么内容，甚至还能保持人类阅读的逻辑顺序。

🚀本地部署最强开源OCR大模型OCRFlux-3B！3090显卡即可运行！3B小参数模型企业级OCR准确率惊人超越olmOCR！3分钟部署OCRFlux，一条命令将PDF转Markdown，准确率惊人！

1 minute read

OCRFlux是一款革命性的开源OCR工具，基于3B参数的多模态大语言模型构建，在文档识别准确率上实现了突破性进展。在权威测试中，OCRFlux达到了惊人的96.7%准确率，大幅超越了参数量更大的7B模型olmOCR（87.2%）和MonkeyOCR（78.0%），充分证明了其技术架构的先进性。

🚀只有3B参数开源OCR大模型！MonkeyOCR媲美MinerU+Gemini 2.5 Pro +Qwen2.5-VL+olmOCR！真实测评+保姆级部署教程！三分钟打造自己的PDF扫描件OCR项目

2 minute read

MonkeyOCR是一个基于Structure-Recognition-Relation (SRR)三元组范式的轻量级文档解析模型，由华中科技大学和金山办公联合开发。该模型专门用于文档解析任务，能够处理中英文文档。

🚀客观深度测评DeepSeek-R1-0528！DeepSeek最新模型在逻辑推理、代码生成、游戏开发等7大维度的表现如何？6850亿参数模型能否挑战商业AI的霸主地位？#deepseek #ai

3 minute read

2025年5月28日，备受瞩目的中国人工智能初创公司DeepSeek，悄然在开源平台Hugging Face上线了其旗舰推理模型R1的最新升级版——DeepSeek-R1-0528。这一更新虽被官方称为“小幅试验性升级”，却在全球AI社区引发了巨大关注。本文将为您深度解读DeepSeek-R1-0528的核心优势...

Anthropic震撼发布！全球最强Claude 4编程能力全方位测评：macOS原生应用开发、iOS app开发、AutoGen智能体开发、SwiftUI界面设计、Transformer模型实现、物理场景模拟，无所不能

less than 1 minute read

今天凌晨Anthropic公司正式发布了其最新力作——Claude 4模型家族，这一重磅消息瞬间在科技圈引起了轰动。作为AI助手领域的颠覆性产品，Claude 4不仅延续了前代产品的优秀基因，更在智能化、实用性和安全性方面实现了质的飞跃。

🚀阿里巴巴颠覆视频创作领域！全新Wan2.1-VACE视频生成大模型震撼发布，保姆级教程手把手教你本地与Colab双平台部署，轻松生成电影级AI大片！Wan2.1-VACE-1.3B参数做出惊艳效果

less than 1 minute read

在AI视觉生成领域，通义万相Wan2.1-VACE-14B的发布无疑是一场技术革命。作为当前业界功能最全面、创新性极强的开源视频生成与编辑模型，它不仅刷新了视频AI模型的能力上限，更以一站式、全能型的特性，极大地拓展了创作者的想象空间。

🚀支持视觉大模型的开源PDF解析+OCR工具！Docling本地配置从入门到精通保姆级教程！支持LM Studio+InternVL3-9B与Gemini2.5 Pro轻松识别解析模糊PDF扫描文件

5 minute read

在AI浪潮席卷全球的今天，企业和个人都在追问：如何让手头海量的PDF、Word、Excel、网页和图片文档真正变成AI可以理解和利用的知识？答案正悄然诞生–Docling，这款由IBM Research团队主导、开源社区热捧的文档处理神器，正以惊人的速度重塑“文档到AI”的数据通道。

🚀OCR能力倍增！n8n+Gemini 2.5 pro 0506三分钟打造全自动OCR工作流！保姆级教程搭建企业级OCR识别工作流！高难度扫描件实测Gemini2.5！不懂编程也能搭建自己的自动化工作流

less than 1 minute read

突破极限：Gemini 2.5 Pro Preview 05-06与n8n强强联合，打造顶级OCR自动化解决方案！

🚀unsloth微调Qwen3大模型保姆级视频教程！从数据处理到LoRA微调Qwen3-14B到4比特量化并且用LM Studio运行！零代码基础也能完成的LoRA高效微调全过程详解！小白也能轻松入门

9 minute read

unsloth微调Qwen3模型提供显著优势：训练速度提高2倍，VRAM使用减少70%，支持8倍长的上下文。Qwen3-30B-A3B仅需17.5GB VRAM即可运行。unsloth的Dynamic 2.0量化技术保证了高精度，同时支持原生128K上下文长度。Qwen3模型具有思考模式和非思考模式，适用于不同复...

🚀AI颠覆数学领域！客观测评6710亿参数开源大模型DeepSeek-Prover-V2-671B！专攻形式化定理证明，彻底改变研究者探索数学真理的方式！代数、几何、微积分样样精通！AI取代数学家教！

1 minute read

2025年4月底，AI领域迎来了一位重量级新成员–DeepSeek-Prover-V2-671B。这款由DeepSeek团队研发的超大规模开源AI模型，以6710亿参数的惊人体量和专注于自动化数学证明的定位，迅速在科技圈引发热议。它的发布不仅刷新了开源AI模型的规模纪录，也为AI在数学、逻辑推理等高难度领域的应用...

🚀企业级最强开源大模型Qwen3震撼发布！本地部署+全面客观测评！Qwen3-235B-A22B+Qwen3-32B+Qwen3-14B谁是王者？ollama+LM Studio+vLLM本地部署

5 minute read

今天凌晨阿里巴巴正式发布了Qwen3系列大语言模型，标志着阿里在开源AI领域迈出了重要一步。Qwen3不仅在多项权威基准测试中超越了OpenAI的o1和DeepSeek R1等国际主流开源模型，还在模型架构、推理能力、多语言支持等方面实现了全面升级。

🚀挑战Gemini 2.5！最强开源企业级OCR大模型InternVL3！本地部署教程+实战测评全纪录，轻松搞定潦草手写汉字、模糊PDF扫描件、模糊复杂表格，效果炸裂超过人眼！支持Open WebUI

2 minute read

近日，一个重量级的开源多模态大语言模型（MLLM）新星横空出世。由上海人工智能实验室、商汤科技研究院等多家机构联合开发的InternVL3模型，以其卓越的性能和创新的架构设计，正在重新定义开源多模态模型的发展边界。

🚀多维度测评OpenAI最新GPT-4.1模型！百万token上下文窗口！编程能力和指令遵循能力大幅提升！Cline+GPT-4.1十分钟零代码开发macOS原生应用！只消耗0.5刀！更低成本更强效果

1 minute read

OpenAI推出GPT-4.1系列模型：性能全面突破，百万Token上下文时代来临。OpenAI于北京时间4月15日凌晨正式发布GPT-4.1系列模型，包含标准版GPT-4.1、轻量版GPT-4.1 mini和超高效版GPT-4.1 nano三款产品。这一系列在编码能力、指令遵循和长文本处理等核心指标上实现跨越式...

🚀Llama 4系列模型发布！多角度测评Meta多模态大模型！10M超长上下文对中文能力的支持真的强吗？是否适合企业项目？Llama 4 Scout+Meta Llama 4 Maverick令人失望

3 minute read

Meta今天发布了其革命性的Llama 4系列模型，这标志着人工智能领域的一次重要飞跃。这些模型不仅在架构设计上取得了显著突破，还为多模态处理和企业级应用带来了全新可能性。

🚀Gemini 2.5 Pro震撼发布！OCR能力碾压一切AI大模型！全方位客观测评：轻松识别手写汉字，准确提取复杂表格，准确率百分百！超越o3-mini与gpt4.5和Qwen2.5-VL-32B！

less than 1 minute read

谷歌DeepMind昨天发布了全新大模型Gemini 2.5 Pro，这款被称为“思考型”模型的AI不仅在数学、科学和代码生成等各项基准测试中表现卓越，更以超长上下文和原生多模态能力引领了智能模型的新潮流。从LMArena排行榜上以40分优势横扫竞争对手，到在SWE-Bench Verified测试中获得63.8...

🚀DeepSeek 6850亿参数开源大模型！DeepSeek-V3-0324全方位测评！编程能力、文档分析、复杂推理能力、Text-to-SQL能力！Cline+DeepSeek轻松开发城市模拟游戏

2 minute read

昨天晚上DeepSeek推出其最新模型DeepSeek-V3-0324，这一小版本更新不仅在模型参数上有所提升，更在开源协议上做出了重大调整，为开发者带来了更大的自由度和便利性。

🚀24B参数模型碾压gpt4o-mini！推理速度超快！vLLM本地部署Mistral-Small 3.1+全方位测试多模态大模型！超越Gemma3.1，最适合企业项目的大模型！中文OCR能力也不弱

6 minute read

Mistral AI 最新推出的 Mistral Small 3.1 模型无疑是近期科技界的一大亮点。这款由法国 AI 实验室 Mistral AI 开发的开源多模态模型，以其卓越的性能和灵活性，为开发者、企业和研究人员带来了全新的可能性。凭借 24B 参数、对文本与图像的处理能力，以及在多个关键指标上的突破，M...

🚀多方位客观测评谷歌最新多模态大模型Gemma 3 27B！综合能力是否被高估？从text to SQL能力到编程能力到逻辑推理能力到多模态ORC识别中文能力！是否适合企业项目？

2 minute read

在人工智能领域的激烈竞争中，谷歌再次展现了其技术实力。2025年3月12日，谷歌宣布推出最新一代开源AI模型Gemma 3，其中27B参数版本在单GPU性能方面表现尤为出色。这一重大突破不仅展示了谷歌在AI领域的持续创新，也为开发者和企业提供了更强大、更灵活的AI工具。

🚀本地部署最强OCR大模型olmOCR！支持结构化精准提取复杂PDF文件内容！完美识别中英文文档、模糊扫描件与复杂表格！本地部署与实际测试全过程！医疗法律行业必备！轻松应对企业级PDF批量转换需求！

3 minute read

allenai/olmocr是由Allen人工智能研究所(AI2)开发的一个开源工具包,旨在高效地将PDF和其他文档转换为结构化的纯文本,同时保持自然阅读顺序。以下是该项目的主要特点和功能:

🚀Anthropic最强AI震撼发布！Claude 3.7 Sonnet多方位测评！Extended模式下的思考能力完全超乎想象！从编程到物理模拟到贝叶斯推理，看AI如何用深度思考模式解决复杂问题！

less than 1 minute read

Claude 3.7 Sonnet 是由 Anthropic 推出的最新型混合推理模型，这是该公司迄今为止最先进的模型，也是市场上首个将普通语言处理和推理能力集成到一个模型中的产品。以下是 Claude 3.7 Sonnet 的主要特点和优势：

🚀本地部署谷歌PaliGemma 2 mix视觉大模型！轻松识别图像！支持标记物体位置！支持ORC提取文字内容！支持自然语言问答、文档理解、视觉问答！5分钟带你掌握本地部署全流程！附全部代码与注释说明

2 minute read

PaliGemma 2 mix是Google最新发布的视觉语言模型(VLM),是PaliGemma 2系列的一个重要组成部分。这个模型在多种视觉语言任务上进行了微调,可以直接用于多种应用场景。

🚀本地部署OmniParser v2.0与pyautogui真正实现自动化点击！支持macOS、Windows与Linux！轻松实现自动化操作电脑！从服务端部署到客户端开发，从接口设计到自动化控制全流程

4 minute read

OmniParser V2.0是微软开发的一款先进开源AI工具，旨在将图形用户界面（GUI）截图转换为结构化数据。这一功能增强了大型语言模型（LLMs）与屏幕上视觉元素的互动，能够实现更加智能的自动化和用户辅助。

🚀vLLM本地部署Qwen2.5-VL多模态大模型！70亿参数即可打造监控视频目标查找项目！轻松实现监控视频自动找人！RTX A6000显卡部署Qwen2.5-VL-7B-Instruct模型实战教程

7 minute read

Qwen2.5-VL是阿里云开发的最新多模态大型语言模型，它在视觉理解、文档处理和多模态交互方面表现出色。在视觉理解方面，Qwen2.5-VL能够准确识别图像和视频中的物体、场景和关系，并进行描述。在文档处理方面，它擅长提取和分析各种类型的文档信息，包括文字、表格和图片。Qwen2.5-VL还支持自然的多模态交互...

🚀谷歌重磅发布Gemini 2.0 Pro！多模态能力大幅提升，训练数据质量高，编程能力强！多维度测评轻松识别手写汉字、提取模糊扫描内容，Roo Code+Gemini 2.0 Pro编程能力大幅提升

3 minute read

Gemini 2.0 Pro Experimental 是 Google 在 2025 年 2 月 5 日推出的最新实验性 AI 模型，作为 Gemini 2.0 系列的重要组成部分。该模型在编码能力、复杂提示处理及世界知识理解方面展现了当前最先进的性能，现通过 Gemini Advanced 订阅（每月 19....

🚀超越gpt-4o-mini！最适合企业的24B参数大模型Mistral Small 3！部署Mistral-Small-24B-Instruct-2501 替代deepseek！支持Roo Code!

3 minute read

Mistral-Small-24B-Instruct-2501 是 Mistral AI 开发的指令遵循语言模型。它拥有 240 亿个参数，并针对遵循指令和生成高质量文本进行了专门训练。尽管名为 “Small”，但它在各种任务中展现出强大的性能，堪比甚至超越一些规模更大的模型。

🚀重磅首发！本地部署+真实测评阿里开源视觉大模型Qwen2.5-VL-7B-Instruct和Qwen2.5-VL-72B！轻松识别提取发票！全方位测评见证AI视觉理解能力的质的飞跃，图像识别不再是难题

1 minute read

2025年1月，阿里巴巴通义千问团队发布了全新的视觉语言模型——Qwen2.5-VL-7B-Instruct，作为Qwen2.5-VL系列的一员，标志着视觉语言理解领域的一次重要突破。这一中型参数模型，凭借其卓越的性能和多样化的功能，迅速吸引了业界的广泛关注。

🚀阿里千问系列最强大模型-Qwen2.5-Max震撼发布！在线测评+API调用！Cline编程+AutoGen智能体！轻松实现任务计划AI Agents！官方基准测试得分超越DeepSeek v3！

4 minute read

通义千问Qwen 2.5-Max是阿里云研发的一款超大规模语言模型，它采用了MoE（专家混合）架构。这意味着它内部有多个“专家”网络，每个专家负责处理不同类型的任务，从而提高效率和性能。

🚀DeepSeek发布开源多模态大模型Janus-Pro-7B！本地部署+Colab部署！支持图像识别和图像生成！基准测试得分超越OpenAI的DALL·E 3 + Stable Diffusion

less than 1 minute read

Janus-Pro-7B 是由 DeepSeek 开发的多模态 AI 模型，它在理解和生成方面取得了显著的进步。这意味着它不仅可以处理文本，还可以处理图像等其他模态的信息。

Llama-3.3–70B震撼登场！70b参数128k上下文性能接近gpt4！最强开源大模型，支持简体中文和繁体中文！Cline+Aider实现全自动编程！AutoGen实现最强AI智能体！

3 minute read

Meta于2024年12月6日正式发布了新一代开源大型语言模型Llama 3.3。该模型在仅有700亿参数的情况下，实现了与此前4050亿参数模型相当的性能，标志着自然语言处理领域的重大突破。

Fine-Tuning

🚀微调DeepSeek-R1-Distill-Llama-8B打造SQL语言转自然语言大模型！小白也能十分钟打造自己的推理大模型！unsloth+Colab轻松上手

4 minute read

DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型，经过深度蒸馏（distillation）处理，旨在提高推理效率和精度。通过蒸馏技术，模型在保持较高性能的同时，减少了计算资源的消耗，特别适合在资源受限的环境中应用。该模型经过优化，可用于多种自然语言处理任...