paulwong

          My Links

          Blog Stats

          常用鏈接

          留言簿(66)

          隨筆分類(1387)

          隨筆檔案(1145)

          文章分類(7)

          文章檔案(10)

          相冊

          收藏夾(2)

          AI

          Develop

          E-BOOK

          Other

          養生

          微服務

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          大模型訓練的幾個階段

          大模型開發出來后, 一般要經過以下幾個階段的訓練:

          預訓練(Pre-Trained)

          單純提供文本: {"text":"..."}
          訓練模型由第一個文字開始, 預測后面的文字, 直到結束.
          這種模型只會做完成文本的任務

          監督微調(Supervised Fine Turning)

          為了使模型能完成根據指令完成回答, 而不是隨機生成回答
          提供的文本: {"instruction":"...", "output":"..."}

          高效參數微調(Parameter Efficient Fine Turning)

          只調整部分參數, 具體實現方法有LoRA

          參考:
          https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb



          posted on 2025-03-18 13:14 paulwong 閱讀(71) 評論(0)  編輯  收藏 所屬分類: AI-LLMAI-FINE-TUNNING

          主站蜘蛛池模板: 达孜县| 涪陵区| 博兴县| 卢湾区| 辉南县| 木里| 渑池县| 湟中县| 郑州市| 离岛区| 洞口县| 通道| 乾安县| 泰宁县| 上饶县| 辰溪县| 崇阳县| 泾川县| 伊宁县| 昆明市| 马山县| 达州市| 平山县| 安岳县| 延津县| 鄱阳县| 娱乐| 河西区| 梁河县| 东阿县| 吴忠市| 定州市| 上林县| 庄河市| 永吉县| 新安县| 苍溪县| 江达县| 芦溪县| 建瓯市| 博爱县|