paulwong

          微調訓練的數(shù)據(jù)集

          使用trl庫做微調時, 對數(shù)據(jù)集的要求是:

          如果是多輪對話場景:
          jsonl 文件,且需符合以下要求:
          1.每行是一個獨立的 JSON 對象;
          2 每個對象須包含一個鍵名為 messages 的數(shù)組,數(shù)組不能為空;
          3.messages 中每個元素必須包含 role 和 content 兩個字段:
          4.role 只能是 system,user 或 assisiant;
          5.如果有 system 角色消息, 需在數(shù)組首位;
          6.第一條非 system 消息必須是 user 角色;
          7.user 和 assisiant 角色的消息應當交替、成對出現(xiàn),不少于1對;

          如果是指令微調場景:
          jsonl 文件,且需符合以下要求:
          1.每行是一個獨立的 JSON 對象;
          2 每個對象須包含且只能包含一個鍵名為 text 的鍵值對,值不能為空;

          posted on 2025-03-21 21:52 paulwong 閱讀(78) 評論(0)  編輯  收藏 所屬分類: AI-FINE-TUNNING

          主站蜘蛛池模板: 蓝山县| 桐庐县| 扬州市| 连城县| 棋牌| 六枝特区| 新安县| 苗栗市| 东至县| 日土县| 云龙县| 和政县| 哈巴河县| 海盐县| 安阳县| 兴宁市| 鹤山市| 上蔡县| 永顺县| 竹溪县| 多伦县| 武定县| 天门市| 富锦市| 遵化市| 长顺县| 克山县| 平昌县| 红桥区| 南澳县| 陇西县| 罗山县| 海淀区| 光泽县| 日土县| 正定县| 肃北| 阜南县| 宁津县| 慈利县| 柳州市|