autoTrain微调phi-3 medium

less than 1 minute read

autoTrain微调phi-3 medium

注意上图画圈的部分，如果选择LLM ORPO，那么chat-template要选择chatml

在huggingface运行

https://huggingface.co/login?next=%2Fspaces%2Fautotrain-projects%2Fautotrain-advanced%3Fduplicate%3Dtrue

通过ngrok在colab运行UI界面

https://colab.research.google.com/github/huggingface/autotrain-advanced/blob/main/colabs/AutoTrain_ngrok.ipynb

ngrok token

https://dashboard.ngrok.com/get-started/your-authtoken

本地微调命令

    conda create -n autotrain python=3.10
    conda activate autotrain
    pip install autotrain-advanced
    conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
    conda install -c "nvidia/label/cuda-12.1.0" cuda-nvcc

    conda install xformers -c xformers
    python -m nltk.downloader punkt
    pip install flash-attn --no-build-isolation # if you want to use flash-attn
    pip install deepspeed # if you want to use deepspeed

#运行微调，注意，请先设置配置文件的内容
autotrain --config 这里填自己文件名

本地微调的配置文件内容:

    task: llm-orpo
    base_model: unsloth/llama-3-8b-Instruct
    project_name: autotrain-llama3-8b-orpo
    log: tensorboard
    backend: local

    data:
      path: argilla/distilabel-capybara-dpo-7k-binarized
      train_split: train
      valid_split: null
      chat_template: chatml
      column_mapping:
        text_column: chosen
        rejected_text_column: rejected
        prompt_text_column: prompt

    params:
      block_size: 1024
      model_max_length: 8192
      max_prompt_length: 512
      epochs: 3
      batch_size: 2
      lr: 3e-5
      peft: true
      quantization: int4
      target_modules: all-linear
      padding: right
      optimizer: adamw_torch
      scheduler: linear
      gradient_accumulation: 4
      mixed_precision: fp16

    hub:
      username: leo009
      token: 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
      push_to_hub: true

如有问题请联系我的徽信 stoeng

🔥🔥🔥观看更多大模型微调视频请访问我的频道⬇

👉👉👉 我的哔哩哔哩频道

👉👉👉 我的YouTube频道

Twitter Facebook LinkedIn

Comments

🚀【保姆级教程】GLM-4.6 接入 Claude Code：200K 长上下文 + Agentic Coding，开发者福音！编程能力大幅提升！

1 minute read

近两年大模型的迭代节奏越来越快，但真正能把“推理 + 工具使用 + 编程”三件事同时做扎实的，并不多。GLM-4.6 就是奔着这个目标来的：它在长上下文、复杂任务分解、工具调用与代码生成上做了系统化加强，旨在更贴近真实开发与自动化代理（Agent）的落地场景。

🚀Claude Sonnet 4.5+Claude Code 2.0彻底解决过度编码顽疾，编程能力实现质的飞跃！全方位真实评测：从SVG生成到原生iOS APP开发到AI智能体开发，编码能力大幅提升

1 minute read

9 月 29 日，Anthropic 发布了全新的 Claude Sonnet 4.5，并同步推出更自主、更贴近真实开发流程的 Claude Code 2.0。如果把去年的迭代理解为“把助手放到键盘边”，今年的升级就是“让助手坐上工位”：它不仅写代码、修 Bug、跑命令，更重要的是能够在较长时间跨度内保持目标感与...

🚀保姆级教程！🚀谷歌Chrome DevTools MCP彻底颠覆AI浏览器自动化！让Cursor、Claude Codex CLI秒变浏览器控制神器，真正实现浏览器自动化，让AI为你打工！

2 minute read

让 AI 真正在浏览器里“看见与验证”：Chrome DevTools MCP 全面解析。过去两年，AI 编码助手的“聪明程度”突飞猛进，但一个根本性短板始终没被补上：它们大多看不到真实运行时。写前端、调接口、改性能，最后还是要你亲自打开浏览器、按步骤复现、开 DevTools 找证据。Chrome DevToo...

🚀保姆级教程！GitHub Copilot CLI横空出世，支持MCP扩展+自动PR创建，让AI编程效率提升1000%，开发者必看！开发完整应用实战演示！支持GPT-5和Claude Sonnet 4

3 minute read

GitHub Copilot CLI：开发者的终极生产力神器来了！还记得第一次使用 GitHub Copilot 时的惊艳感受吗？那种在编辑器里输入注释，AI 就能自动生成代码的神奇体验，让无数开发者惊呼”未来已来”。而现在，GitHub 再次给我们带来惊喜——GitHub Copilot CLI 正式发布公开预...

AI超元域

autoTrain微调phi-3 medium

autoTrain微调phi-3 medium

注意上图画圈的部分，如果选择LLM ORPO，那么chat-template要选择chatml

在huggingface运行

通过ngrok在colab运行UI界面

ngrok token

本地微调命令

本地微调的配置文件内容:

如有问题请联系我的徽信 stoeng

🔥🔥🔥观看更多大模型微调视频请访问我的频道⬇

👉👉👉 我的哔哩哔哩频道

👉👉👉 我的YouTube频道

Comments

You May Also Enjoy

🚀【保姆级教程】GLM-4.6 接入 Claude Code：200K 长上下文 + Agentic Coding，开发者福音！编程能力大幅提升！

🚀Claude Sonnet 4.5+Claude Code 2.0彻底解决过度编码顽疾，编程能力实现质的飞跃！全方位真实评测：从SVG生成到原生iOS APP开发到AI智能体开发，编码能力大幅提升

🚀保姆级教程！🚀谷歌Chrome DevTools MCP彻底颠覆AI浏览器自动化！让Cursor、Claude Codex CLI秒变浏览器控制神器，真正实现浏览器自动化，让AI为你打工！

🚀保姆级教程！GitHub Copilot CLI横空出世，支持MCP扩展+自动PR创建，让AI编程效率提升1000%，开发者必看！开发完整应用实战演示！支持GPT-5和Claude Sonnet 4