paulwong

          大模型訓(xùn)練的幾個階段

          大模型開發(fā)出來后, 一般要經(jīng)過以下幾個階段的訓(xùn)練:

          預(yù)訓(xùn)練(Pre-Trained)

          單純提供文本: {"text":"..."}
          訓(xùn)練模型由第一個文字開始, 預(yù)測后面的文字, 直到結(jié)束.
          這種模型只會做完成文本的任務(wù)

          監(jiān)督微調(diào)(Supervised Fine Turning)

          為了使模型能完成根據(jù)指令完成回答, 而不是隨機(jī)生成回答
          提供的文本: {"instruction":"...", "output":"..."}

          高效參數(shù)微調(diào)(Parameter Efficient Fine Turning)

          只調(diào)整部分參數(shù), 具體實(shí)現(xiàn)方法有LoRA

          參考:
          https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb



          posted on 2025-03-18 13:14 paulwong 閱讀(80) 評論(0)  編輯  收藏 所屬分類: AI-LLMAI-FINE-TUNNING

          主站蜘蛛池模板: 兴业县| 正镶白旗| 伊宁县| 礼泉县| 新闻| 扎赉特旗| 荆州市| 富顺县| 朝阳区| 静安区| 百色市| 防城港市| 布尔津县| 宜黄县| 福安市| 神农架林区| 尤溪县| 成武县| 北辰区| 遂宁市| 自治县| 昭平县| 宜春市| 芮城县| 久治县| 澄迈县| 洪泽县| 云林县| 延吉市| 六枝特区| 崇仁县| 普格县| 吕梁市| 凤台县| 永德县| 和静县| 隆德县| 赤峰市| 印江| 永济市| 定远县|