🚀AutoGen重大更新!新增McpWorkbench完美支持MCP Server!支持将Agent和Team封装为工具!开启模块化智能体编程!实战教程:从零开始构建旅游规划智能体和进销存智能客服系统
在AutoGen框架中,”Agent and Team as Tools”是一项创新功能,它允许将现有的智能体(Agent)和团队(Team)作为工具供其他智能体调用。根据我搜索到的信息,这一功能具有显著的优势和应用场景。
在AutoGen框架中,”Agent and Team as Tools”是一项创新功能,它允许将现有的智能体(Agent)和团队(Team)作为工具供其他智能体调用。根据我搜索到的信息,这一功能具有显著的优势和应用场景。
Context7是由Upstash团队开发的一个平台,旨在为大型语言模型(LLMs)、AI代码编辑器和开发者提供最新的、特定版本的文档。它能直接从官方文档中提取真实、可用的代码片段,按版本过滤,并准备好供Cursor、Claude或任何LLM使用。
OpenAI近日正式发布了Codex CLI,这是一款开源的AI编程助手,专为开发者在本地终端环境中高效编写、修改和运行代码而设计。Codex CLI不仅集成了OpenAI最新的推理模型,还能直接操作本地文件与命令行,实现更智能、更自动化的开发体验。
在人工智能领域,单一功能模型逐渐让位于更复杂的多智能体系统。这些系统通过多个智能体协同工作,能够完成复杂任务。然而,多智能体系统的开发往往面临诸多挑战。为了解决这一问题,Google在Google Cloud NEXT 2025大会上推出了一款全新的开源框架——Agent Development Kit (ADK...
Open WebUI 的 MCPo 项目:将 MCP 工具无缝集成到 OpenAPI 的创新解决方案!
Roo Code 是一款集成于 VS Code 的 AI 编程助手,能显著提高开发效率。它支持多种大模型,自动生成高质量代码,提供智能补全、实时错误检测与调试辅助,从而大大缩短开发周期。其命令行交互和自动化测试功能使得复杂任务简单易行,同时免费额度充足、生成速度快,减少了因频繁调用接口带来的成本和延迟。此外,Ro...
随着人工智能技术的不断突破,编程工具正迎来前所未有的变革。由 Codeium 团队推出的 WindSurf,以全新的 AI Flow 范式和多工具协同能力,正逐步超越备受关注的 Cursor,成为开发者提高工作效率的利器。
近日,微软研究团队正式推出了全新的 AutoGen Studio,这是一款基于 AutoGen 框架打造的低代码(no-code)开发平台,旨在帮助开发者和研究人员快速原型设计、调试和评估多智能体工作流。AutoGen Studio 通过直观的拖拽式用户界面和声明式(JSON)配置,使构建复杂的 AI 多智能体系...
MCP(Model Context Protocol)是一个开源协议,旨在简化AI模型与外部数据源、工具和系统的连接,从而对AI智能体开发产生了深远的影响。它提供了一个标准化的方法,使得AI智能体能够更轻松地访问和利用各种资源,从而提升其功能性和开发效率。以下是从MCP对AI智能体开发影响力的角度进行的详细介绍:
OpenAI全新Agents SDK和Responses API强势出击,助力开发者实现多智能体无缝协作,推动各领域实现数字化转型革命。
3分钟复刻Manus智能体!AutoGen+MCP Server+Cline构建最强AI智能体,支持ollama!轻松实现网络搜索+文件操作的AI Agent!不花一分钱也能拥有强大AI智能体
AutoGen v0.4引入了对Model Context Protocol (MCP) server的支持,这是一项重要的新功能,为AI代理提供了更强大和灵活的工具使用能力。
Jina AI 开发的 node-DeepResearch 是一个开源自动化研究工具,旨在通过搜索、阅读网页和推理,直到找到问题的答案。该项目适用于自动化信息检索和智能问答任务,结合了搜索引擎和大语言模型(LLM)来提高研究效率。
Browser-use是一款开源的基于AI的智能浏览器自动化工具, 而且这款开源项目分为命令行版本和web UI版本,并且支持deepseek、gpt-4o在内的开源和闭源模型。 我们可以使用这款开源项目轻松实现浏览器自动化操作,执行订机票、浏览网页、点击链接、提取信息,甚至填写表单、订机票等复杂操作。 用户可以...
AutoGen 是一个用于构建代理 AI 应用程序的开源框架,允许开发者创建可以自主行动或与人类协作的多代理 AI 系统。AutoGen 0.4.2 是一个重要的更新版本,它在代理工作流程中提高了代码质量、稳健性、通用性和可扩展性。新的异步、事件驱动的架构使 AutoGen 更具可扩展性和稳健性,从而支持更广泛的...
Cline 和 Roo Cline 都是基于 Visual Studio Code 的 AI 编程插件,能够通过自然语言指令与开发者交互,辅助完成代码编写、测试、调试等任务。Cline 由 Cline Bot Inc. 开发,而 Roo Cline 则是 RooVetGit 基于 Cline 3.1 进行 For...
最强AI编程插件Cline今天发布了最新版本Cline3.1。新增了更加智能的版本管理与任务跟踪等功能。这是的cline更加强大了!前些时间Cline 3.0版本新增了自动审批功能,而且还支持全新的差异化(diff)编辑功能,只输出需要替换的内容而不是整个文件,提高编速度和可靠性。今天Cline 3.1引入了“检...
HuggingFace于2024年12月31日发布了一款全新的AI代理框架SmolAgents,这是一个极简但功能强大的AI Agents库,可以让开发者用最少的代码快速构建智能代理系统。该框架的核心逻辑仅用约1000行代码就实现了完整的代理功能,极大地简化了AI代理的开发流程。
传统的网页抓取工具严重依赖于预定义的规则和模式,一旦目标网站的结构发生变化,就需要手动更新代码,耗时费力。而 ScrapeGraphAI 则另辟蹊径,它利用 LLMs 的强大理解能力,让用户只需用自然语言描述所需数据,剩下的复杂工作全部交给 AI 完成!
人工智能公司Anthropic推出了模型上下文协议(Model Context Protocol,简称MCP),旨在为AI助手与外部数据源之间建立安全、标准化的连接。MCP作为开放协议,允许开发者在AI工具与各种数据源(如文件系统、数据库、API等)之间创建双向连接,提升AI系统的互操作性和功能扩展性。
今天凌晨阿里巴巴正式发布了Qwen3系列大语言模型,标志着阿里在开源AI领域迈出了重要一步。Qwen3不仅在多项权威基准测试中超越了OpenAI的o1和DeepSeek R1等国际主流开源模型,还在模型架构、推理能力、多语言支持等方面实现了全面升级。
近日,一个重量级的开源多模态大语言模型(MLLM)新星横空出世。由上海人工智能实验室、商汤科技研究院等多家机构联合开发的InternVL3模型,以其卓越的性能和创新的架构设计,正在重新定义开源多模态模型的发展边界。
OpenAI推出GPT-4.1系列模型:性能全面突破,百万Token上下文时代来临。OpenAI于北京时间4月15日凌晨正式发布GPT-4.1系列模型,包含标准版GPT-4.1、轻量版GPT-4.1 mini和超高效版GPT-4.1 nano三款产品。这一系列在编码能力、指令遵循和长文本处理等核心指标上实现跨越式...
Meta今天发布了其革命性的Llama 4系列模型,这标志着人工智能领域的一次重要飞跃。这些模型不仅在架构设计上取得了显著突破,还为多模态处理和企业级应用带来了全新可能性。
谷歌DeepMind昨天发布了全新大模型Gemini 2.5 Pro,这款被称为“思考型”模型的AI不仅在数学、科学和代码生成等各项基准测试中表现卓越,更以超长上下文和原生多模态能力引领了智能模型的新潮流。从LMArena排行榜上以40分优势横扫竞争对手,到在SWE-Bench Verified测试中获得63.8...
昨天晚上DeepSeek推出其最新模型DeepSeek-V3-0324,这一小版本更新不仅在模型参数上有所提升,更在开源协议上做出了重大调整,为开发者带来了更大的自由度和便利性。
Mistral AI 最新推出的 Mistral Small 3.1 模型无疑是近期科技界的一大亮点。这款由法国 AI 实验室 Mistral AI 开发的开源多模态模型,以其卓越的性能和灵活性,为开发者、企业和研究人员带来了全新的可能性。凭借 24B 参数、对文本与图像的处理能力,以及在多个关键指标上的突破,M...
在人工智能领域的激烈竞争中,谷歌再次展现了其技术实力。2025年3月12日,谷歌宣布推出最新一代开源AI模型Gemma 3,其中27B参数版本在单GPU性能方面表现尤为出色。这一重大突破不仅展示了谷歌在AI领域的持续创新,也为开发者和企业提供了更强大、更灵活的AI工具。
allenai/olmocr是由Allen人工智能研究所(AI2)开发的一个开源工具包,旨在高效地将PDF和其他文档转换为结构化的纯文本,同时保持自然阅读顺序。以下是该项目的主要特点和功能:
Claude 3.7 Sonnet 是由 Anthropic 推出的最新型混合推理模型,这是该公司迄今为止最先进的模型,也是市场上首个将普通语言处理和推理能力集成到一个模型中的产品。以下是 Claude 3.7 Sonnet 的主要特点和优势:
PaliGemma 2 mix是Google最新发布的视觉语言模型(VLM),是PaliGemma 2系列的一个重要组成部分。这个模型在多种视觉语言任务上进行了微调,可以直接用于多种应用场景。
OmniParser V2.0是微软开发的一款先进开源AI工具,旨在将图形用户界面(GUI)截图转换为结构化数据。这一功能增强了大型语言模型(LLMs)与屏幕上视觉元素的互动,能够实现更加智能的自动化和用户辅助。
Qwen2.5-VL是阿里云开发的最新多模态大型语言模型,它在视觉理解、文档处理和多模态交互方面表现出色。在视觉理解方面,Qwen2.5-VL能够准确识别图像和视频中的物体、场景和关系,并进行描述。在文档处理方面,它擅长提取和分析各种类型的文档信息,包括文字、表格和图片。Qwen2.5-VL还支持自然的多模态交互...
Gemini 2.0 Pro Experimental 是 Google 在 2025 年 2 月 5 日推出的最新实验性 AI 模型,作为 Gemini 2.0 系列的重要组成部分。该模型在编码能力、复杂提示处理及世界知识理解方面展现了当前最先进的性能,现通过 Gemini Advanced 订阅(每月 19....
Mistral-Small-24B-Instruct-2501 是 Mistral AI 开发的指令遵循语言模型。它拥有 240 亿个参数,并针对遵循指令和生成高质量文本进行了专门训练。尽管名为 “Small”,但它在各种任务中展现出强大的性能,堪比甚至超越一些规模更大的模型。
2025年1月,阿里巴巴通义千问团队发布了全新的视觉语言模型——Qwen2.5-VL-7B-Instruct,作为Qwen2.5-VL系列的一员,标志着视觉语言理解领域的一次重要突破。这一中型参数模型,凭借其卓越的性能和多样化的功能,迅速吸引了业界的广泛关注。
通义千问Qwen 2.5-Max是阿里云研发的一款超大规模语言模型,它采用了MoE(专家混合)架构。这意味着它内部有多个“专家”网络,每个专家负责处理不同类型的任务,从而提高效率和性能。
Janus-Pro-7B 是由 DeepSeek 开发的多模态 AI 模型,它在理解和生成方面取得了显著的进步。这意味着它不仅可以处理文本,还可以处理图像等其他模态的信息。
Meta于2024年12月6日正式发布了新一代开源大型语言模型Llama 3.3。该模型在仅有700亿参数的情况下,实现了与此前4050亿参数模型相当的性能,标志着自然语言处理领域的重大突破。
DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。通过蒸馏技术,模型在保持较高性能的同时,减少了计算资源的消耗,特别适合在资源受限的环境中应用。该模型经过优化,可用于多种自然语言处理任...
在当前大语言模型蓬勃发展的背景下,微调大模型的需求与日俱增,选择一款优秀的微调框架尤为重要。
微软于2024年12月16日正式发布了GraphRAG 1.0,这是一个将图结构数据与检索增强生成(RAG)模型相结合的开源工具,旨在提升自然语言处理任务的性能。GraphRAG 1.0的主要特点包括DRIFT搜索算法、Update命令以及与LM Studio的整合,使得用户能够更高效地处理图结构数据。此外,微软...