AI 微调

批次大小 – 训练期间每个批次中的示例数量。较大的批次大小可降低方差，但会增加训练时间。
学习率乘数 – 调整学习率的缩放因子。较小的值有助于防止过拟合，而较大的值则可加快学习速度。
训练轮数 – 完整遍历训练数据集的次数。较高的值可提升精准度，但会增加成本。
数据集大小限制 –
- 数据集文件最大大小（字节） – 限制训练数据集的大小。
- 数据集中示例的最小数量 – 设置训练数据大小的下限。
- 数据集中示例的最大数量 – 设置训练数据大小的上限。

验证数据集用于测试微调后的模型在未见数据上的表现。配置验证数据集是可选的，但建议进行以评估模型性能。

项目 – 选择与训练所用项目不同的项目。
翻译记忆库 – 包含用于验证的翻译记忆 (TM) 片段。
日期范围 – 按审核日期筛选翻译以用于验证。
数据集大小限制 –
- 数据集文件最大大小（字节） – 限制验证数据集的大小。
- 数据集中示例的最小数量 – 设置验证数据大小的下限。
- 数据集中示例的最大数量 – 设置验证数据大小的上限。

评估微调模型

微调完成后，将生成一个新模型，并附带详细指标，包括训练和验证损失、任务参数及日志。使用这些数据评估模型性能，并确定其是否已准备好集成到您的自动翻译提示词中。

关于您的微调模型的关键信息包括：

关于为微调任务配置的参数详情：

用于评估微调模型性能的指标和工具：

查看结果以确定其是否满足您的要求。如果已准备好，您可以将微调后的模型集成到您的自动翻译提示词中立即使用。

Crowdin 提供多种方式评估微调结果，包括交互式图表和详细的指标表格。

交互式图表 – 可视化微调指标，例如训练损失、验证损失和完整验证损失在整个训练过程中的变化。将鼠标悬停在图表上的点，可查看特定步骤的详细信息。您可以通过点击图表下方的标题来突出显示或隐藏特定指标。
指标选项卡 – 以表格形式访问相同数据，获取全面概览。该表格提供逐步细分，便于识别微调过程中的规律或问题。各步骤中损失值的稳定下降反映了有效的训练，值越接近零表示效果越好。

这两种工具均可在微调任务详情页面中使用，帮助您分析性能趋势并有效排查异常。

消息选项卡提供 AI 提供商返回的日志，呈现任务进度的详细时间线，包括关键里程碑（例如：检查点创建、任务完成）及故障排查信息。

迭代更新微调模型，以纳入新近审核的翻译。使用日期范围参数，避免从头开始重新训练。

示例工作流：

增量微调非常适合持续更新的项目，使您无需从头开始重新训练即可保持模型优化。

持续微调根据 Crowdin 项目中的新翻译，通过增量更新自动执行 AI 模型的微调流程。

数据集可被下载用于外部微调、外部工具使用或训练前的本地验证。

本页面对你有帮助吗？