甫崎咨詢—成功為上海理想舉辦了《deepseek 蒸餾與訓練技術》內訓
為應對大模型部署中的算力與成本挑戰(zhàn),我司在3月19日為電信理想公司成功舉辦了大模型知識蒸餾實戰(zhàn)培訓,聚焦“教師-學生”范式的蒸餾全流程演示。本次實戰(zhàn)以DeepSeek-R1(671B參數(shù))為教師模型,Qwen-7B(7B參數(shù))為學生模型,通過五個階段流程實現(xiàn)模型壓縮與性能平衡。DeepSeek-R1的成功案例表明,通過蒸餾技術可兼顧性能與效率,為行業(yè)提供低成本、高可用的AI部署新范式。