swift

Get Started

SWIFT安装
快速开始
Web-UI

Instruction

命令行参数
预训练与微调
GRPO
GKD
人类对齐
推理和部署
采样
评测
导出与推送
ray的支持
强化微调
Agent支持
支持的模型和数据集
使用Tuners
常见问题整理

Megatron-SWIFT

快速开始
命令行参数
LoRA训练
多模态模型
Mcore-Bridge
GRPO
GKD
Ascend NPU
自定义Megatron模型

Customization

架构介绍
自定义模型
自定义数据集

Best Practices

GRPO完整实验流程
多模态GRPO完整实验流程
GRPO代码训练
Qwen3最佳实践
Qwen3-VL最佳实践
Qwen3.5 最佳实践
DeepSeek-V4 训练支持
注册多模态模型最佳实践
Embedding训练
Reranker训练
快速训练VL模型
NPU支持
Metax支持
AMD GPU 支持
更多最佳实践

swift

Swift DOCUMENTATION
查看页面源码

Swift DOCUMENTATION

Get Started

SWIFT安装
快速开始
Web-UI

Instruction

命令行参数
预训练与微调
GRPO
GKD
人类对齐
- 数据集
- GRPO
- DPO
- RM
- PPO
- KTO
- CPO
- ORPO
- SimPO
推理和部署
- 推理
- 部署
采样
评测
导出与推送
ray的支持
- 技术细节
- 参数设置
强化微调
Agent支持
支持的模型和数据集
- 模型
- 数据集
使用Tuners
- 接口列表
常见问题整理
- 训练
- 推理
- 导出
- 部署
- 评测

Megatron-SWIFT

快速开始
命令行参数
LoRA训练
- 传统方式
- Mcore-Bridge【推荐】
多模态模型
- Dense模型
- Moe模型
Mcore-Bridge
GRPO
- 参数对比
GKD
Ascend NPU
- NPU 性能数据采集
- NPU 精度数据采集
自定义Megatron模型

Customization

架构介绍
- Agent Template
- Callbacks
- Loss
- Loss Scale
- Metrics
- Optimizers
- Tuner Plugin
- ORM
- PRM
- 其他目录结构介绍
自定义模型
- 模型注册
自定义数据集

Best Practices

GRPO完整实验流程
多模态GRPO完整实验流程
GRPO代码训练
- 奖励函数
- 训练脚本
Qwen3最佳实践
Qwen3-VL最佳实践
Qwen3.5 最佳实践
DeepSeek-V4 训练支持
- 精度对齐
- LoRA训练
注册多模态模型最佳实践
Embedding训练
- loss
- 数据集格式
- 训练
- 推理
- 高级功能
Reranker训练
快速训练VL模型
NPU支持
Metax支持
AMD GPU 支持
更多最佳实践

Indices and tables

索引
模块索引
搜索页面

下一页

© 版权所有 2022-2025, Alibaba ModelScope。

利用 Sphinx 构建，使用的主题由 Read the Docs 开发.