swift

Get Started

SWIFT安装
快速开始
Web-UI

Instruction

命令行参数
预训练与微调
GRPO
人类对齐
推理和部署
采样
评测
导出与推送
强化微调
Agent支持
支持的模型和数据集
使用Tuners
常见问题整理

Megatron-SWIFT

快速开始
命令行参数
LoRA训练
多模态模型

Customization

自定义模型
自定义数据集
插件化

Best Practices

GRPO完整实验流程
多模态GRPO完整实验流程
GRPO代码训练
Qwen3最佳实践
Qwen3-VL最佳实践
注册多模态模型最佳实践
Embedding训练
Reranker训练
快速训练VL模型
NPU支持
更多最佳实践

swift

Swift DOCUMENTATION
查看页面源码

Swift DOCUMENTATION

Get Started

SWIFT安装
快速开始
Web-UI

Instruction

命令行参数
预训练与微调
GRPO
人类对齐
- 数据集
- GRPO
- DPO
- RM
- PPO
- KTO
- CPO
- ORPO
- SimPO
推理和部署
- 推理
- 部署
采样
评测
导出与推送
强化微调
Agent支持
支持的模型和数据集
- 模型
- 数据集
使用Tuners
- 接口列表
常见问题整理
- 训练
- 推理
- 部署
- 评测

Megatron-SWIFT

快速开始
命令行参数
LoRA训练
多模态模型
- Dense模型
- Moe模型

Customization

自定义模型
- 模型注册
自定义数据集
插件化

Best Practices

GRPO完整实验流程
多模态GRPO完整实验流程
GRPO代码训练
- 奖励函数
- 训练脚本
Qwen3最佳实践
Qwen3-VL最佳实践
注册多模态模型最佳实践
Embedding训练
Reranker训练
快速训练VL模型
NPU支持
- 环境准备
- 微调
- 推理
- 部署
更多最佳实践

Indices and tables

索引
模块索引
搜索页面

下一页

© 版权所有 2022-2025, Alibaba ModelScope。

利用 Sphinx 构建，使用的主题由 Read the Docs 开发.