Recent Posts

🚀unsloth微调Qwen3大模型保姆级视频教程!从数据处理到LoRA微调Qwen3-14B到4比特量化并且用LM Studio运行!零代码基础也能完成的LoRA高效微调全过程详解!小白也能轻松入门

9 minute read

unsloth微调Qwen3模型提供显著优势:训练速度提高2倍,VRAM使用减少70%,支持8倍长的上下文。Qwen3-30B-A3B仅需17.5GB VRAM即可运行。unsloth的Dynamic 2.0量化技术保证了高精度,同时支持原生128K上下文长度。Qwen3模型具有思考模式和非思考模式,适用于不同复...

🚀AI颠覆数学领域!客观测评6710亿参数开源大模型DeepSeek-Prover-V2-671B!专攻形式化定理证明,彻底改变研究者探索数学真理的方式!代数、几何、微积分样样精通!AI取代数学家教!

1 minute read

2025年4月底,AI领域迎来了一位重量级新成员–DeepSeek-Prover-V2-671B。这款由DeepSeek团队研发的超大规模开源AI模型,以6710亿参数的惊人体量和专注于自动化数学证明的定位,迅速在科技圈引发热议。它的发布不仅刷新了开源AI模型的规模纪录,也为AI在数学、逻辑推理等高难度领域的应用...

🚀企业级最强开源大模型Qwen3震撼发布!本地部署+全面客观测评!Qwen3-235B-A22B+Qwen3-32B+Qwen3-14B谁是王者?ollama+LM Studio+vLLM本地部署

5 minute read

今天凌晨阿里巴巴正式发布了Qwen3系列大语言模型,标志着阿里在开源AI领域迈出了重要一步。Qwen3不仅在多项权威基准测试中超越了OpenAI的o1和DeepSeek R1等国际主流开源模型,还在模型架构、推理能力、多语言支持等方面实现了全面升级。