微調訓練的數據集
使用trl庫做微調時, 對數據集的要求是:
如果是多輪對話場景:
jsonl 文件,且需符合以下要求:
1.每行是一個獨立的 JSON 對象;
2 每個對象須包含一個鍵名為 messages 的數組,數組不能為空;
3.messages 中每個元素必須包含 role 和 content 兩個字段:
4.role 只能是 system,user 或 assisiant;
5.如果有 system 角色消息, 需在數組首位;
6.第一條非 system 消息必須是 user 角色;
7.user 和 assisiant 角色的消息應當交替、成對出現,不少于1對;
如果是指令微調場景:
jsonl 文件,且需符合以下要求:
1.每行是一個獨立的 JSON 對象;
2 每個對象須包含且只能包含一個鍵名為 text 的鍵值對,值不能為空;
posted on 2025-03-21 21:52 paulwong 閱讀(78) 評論(0) 編輯 收藏 所屬分類: AI-FINE-TUNNING