paulwong

My Links

Blog Stats

Posts - 1192
Stories - 10
Comments - 108
Trackbacks - 0

常用鏈接

留言簿(66)

隨筆分類(1387)

隨筆檔案(1145)

文章分類(7)

文章檔案(10)

相冊

Test

收藏夾(2)

AI

AI智能PDF問答工具
CSV數(shù)據(jù)分析智能工具
ZLibrary
克隆ChatGPT
爆款小紅書AI寫作助手
視頻腳本生成器

Develop

!!!Event Sourcing
!!!Microservice Patterns
!!!NIO清晰解釋
!!PDF SEARCH
4+1 Architectural View Model
Apache安裝及jboss部署說明文檔
APK自動化測試網(wǎng)站
Command-Query Responsibility Segregation
data source
ELK日志分析平臺搭建全過程
Enterprise Architect中文網(wǎng)
EXT 中文站 ver2.0 since 2006-11-20
GOOGLE
GOOGLE
GOOGLE
Google代理
GOREAD RSS閱讀器
INOREADER RSS閱讀器
JavaScript 全棧工程師培訓(xùn)教程
JBoss3.0 下配置和部署EJB簡介
Jquery Option Plug-in
LCA
MAVEN最佳實踐-版本管理
microservice-security
Mulity Tenant
MYSQL MHA
OAUTH2.0
RARBG TORRENT
Robin's Java World
Spring Boot Admin的使用
spring cloud
SPRING CLOUD教程
Spring 平臺整合 Activiti 工作流引擎實例
SPRING-BEAN自動組裝解釋
Spring-cloud-OAuth2-0配置
SQL2005客戶端下載
SRPING BOOT教程
TCC
TCC
TCC
一個extjs的好網(wǎng)站
一個優(yōu)秀的CQRS框架Reveno
一個非常不錯的J2EE框架。
一個非常不錯的J2EE框架，從前端的JSP，到菜單，用戶和權(quán)限，都有了，還集成了STRUTS。
東莞源豐印刷
本人設(shè)計
中國象棋
中國軟件架構(gòu)師網(wǎng)
不錯的培訓(xùn)網(wǎng)，有相關(guān)文檔下載。
五行湯好轉(zhuǎn)反應(yīng)
五行湯好轉(zhuǎn)反應(yīng)
人體自愈的秘密
分布式事務(wù)1
分布式架構(gòu)教學(xué)
各種大數(shù)據(jù)
在SPRING CLOUD中使用JAX-RS發(fā)布REST服務(wù)
在線思維導(dǎo)圖工具
大數(shù)據(jù)相關(guān)應(yīng)用
學(xué)習(xí)課程
學(xué)習(xí)課程
安徽未名細(xì)胞治療有限公司
建模工具EA的使用
開源會議系統(tǒng)
指定MAVEN中的JDK版本
數(shù)據(jù)層的多租戶淺談
無法連接ITUNES STORE的原因
深圳房網(wǎng)
深圳通余額查詢
甘油三脂高應(yīng)該用什么樣的食療方法
神級翻譯
簡歷模版
管理學(xué)
自動組裝SPRING-BEAN例子
通俗易懂的文章收藏
開放式課程
駕車學(xué)習(xí)
駕駛教學(xué)

E-BOOK

Ebook
ex libgen.io, libgen.org, alternative domains: *.li, *.gs, *.lc
EPDF
http://www.allitebooks.org

搜索

閱讀排行榜

評論排行榜

大模型訓(xùn)練的幾個階段

大模型開發(fā)出來后, 一般要經(jīng)過以下幾個階段的訓(xùn)練:

預(yù)訓(xùn)練(Pre-Trained)

單純提供文本: {"text":"..."}

訓(xùn)練模型由第一個文字開始, 預(yù)測后面的文字, 直到結(jié)束.

這種模型只會做完成文本的任務(wù)

監(jiān)督微調(diào)(Supervised Fine Turning)

為了使模型能完成根據(jù)指令完成回答, 而不是隨機生成回答

提供的文本: {"instruction":"...", "output":"..."}

高效參數(shù)微調(diào)(Parameter Efficient Fine Turning)

只調(diào)整部分參數(shù), 具體實現(xiàn)方法有LoRA

參考:

https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb

posted on 2025-03-18 13:14 paulwong 閱讀(73) 評論(0) 編輯收藏所屬分類: AI-LLM 、AI-FINE-TUNNING

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發(fā)表評論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關(guān)文章: 創(chuàng)建數(shù)據(jù)集的資源足球數(shù)據(jù)資源大模型訓(xùn)練的幾個階段大模型微調(diào)后的評估指標(biāo) LLM全棧框架完整分類清單（預(yù)訓(xùn)練+微調(diào)+工具鏈）醫(yī)療問診系統(tǒng)資源使用nlp提取非結(jié)構(gòu)化數(shù)據(jù)中的信息 AI案例資源不用再找了，這是大模型最全的面試題庫數(shù)據(jù)集資源