paulwong

          微調訓練的數據集

          使用trl庫做微調時, 對數據集的要求是:

          如果是多輪對話場景:
          jsonl 文件,且需符合以下要求:
          1.每行是一個獨立的 JSON 對象;
          2 每個對象須包含一個鍵名為 messages 的數組,數組不能為空;
          3.messages 中每個元素必須包含 role 和 content 兩個字段:
          4.role 只能是 system,user 或 assisiant;
          5.如果有 system 角色消息, 需在數組首位;
          6.第一條非 system 消息必須是 user 角色;
          7.user 和 assisiant 角色的消息應當交替、成對出現,不少于1對;

          如果是指令微調場景:
          jsonl 文件,且需符合以下要求:
          1.每行是一個獨立的 JSON 對象;
          2 每個對象須包含且只能包含一個鍵名為 text 的鍵值對,值不能為空;

          posted on 2025-03-21 21:52 paulwong 閱讀(78) 評論(0)  編輯  收藏 所屬分類: AI-FINE-TUNNING

          主站蜘蛛池模板: 康定县| 台东市| 防城港市| 彭泽县| 龙泉市| 佛坪县| 静安区| 兴仁县| 安塞县| 泽州县| 拉萨市| 安国市| 阳信县| 应城市| 万年县| 长沙县| 禹州市| 恩施市| 偃师市| 夏津县| 耒阳市| 达孜县| 中江县| 泗水县| 新平| 翼城县| 阿克陶县| 察隅县| 湘阴县| 泽普县| 东安县| 临潭县| 广水市| 白朗县| 仪征市| 蓬莱市| 冕宁县| 黑水县| 邢台县| 河东区| 峨眉山市|