DeepSeek + HuatuoGPT SFT 调试全记录
本文详细记录了针对 DeepSeek-Coder-7B-base-v1.5 模型,结合 HuatuoGPT 医疗对话数据进行 SFT(Supervised Fine-Tuning) 的全过程。记录从最初设计到逐步调试的每一步,包括所做的改动、背后的原因、遇到的问题、解决方案以及最终结果。1. 项目背景与目标本次任务的目标是:首先加载基模型,在这个项目中基模型为 DeepSeek-Coder-7B-base-v1.5 。加载已有的 LoRA checkpoint(checkpoint-2000),在此基础上继续微调。使用 Freedom...