<strike id="ekgsc"></strike>

<ul id="ekgsc"><center id="ekgsc"></center></ul>

paulwong

2025年3月18日 #

以非root用戶運行docker

sudo useradd -m paul # 創建用戶并自動建立家目錄
sudo passwd paul # 設置用戶密碼（需輸入兩次確認）
sudo usermod -aG wheel paul # CentOS/RHEL
[root@dev69 ~]$ groupadd docker
[root@dev69 ~]$ usermod -aG docker $USER
[root@dev69 ~]$ reboot
[paul@dev69 ~]$ docker run hello-world

posted @ 2025-06-13 16:47 paulwong 閱讀(9) | 評論 (0) | 編輯收藏

創建數據集的資源

AI 數據集生成和模型微調框架 Distilabel 入門指南：基本概念、安裝與快速開始

https://zhuanlan.zhihu.com/p/25766406373

使用Llama3和distilabel構建微調數據
https://huggingface.co/blog/dvilasuero/synthetic-data-with-llama3-distilabel

posted @ 2025-05-18 08:01 paulwong 閱讀(23) | 評論 (0) | 編輯收藏

強化學習資源

蘑菇書EasyRL
李宏毅老師的《深度強化學習》是強化學習領域經典的中文視頻之一。李老師幽默風趣的上課風格讓晦澀難懂的強化學習理論變得輕松易懂，他會通過很多有趣的例子來講解強化學習理論。比如老師經常會用玩 Atari 游戲的例子來講解強化學習算法。此外，為了教程的完整性，我們整理了周博磊老師的《強化學習綱要》、李科澆老師的《世界冠軍帶你從零實踐強化學習》以及多個強化學習的經典資料作為補充。對于想入門強化學習又想看中文講解的人來說絕對是非常推薦的。

本教程也稱為“蘑菇書”，寓意是希望此書能夠為讀者注入活力，讓讀者“吃”下這本蘑菇之后，能夠饒有興致地探索強化學習，像馬里奧那樣愈加強大，繼而在人工智能領域覓得意外的收獲。

https://github.com/datawhalechina/easy-rl?tab=readme-ov-file

posted @ 2025-04-30 14:15 paulwong 閱讀(31) | 評論 (0) | 編輯收藏

足球數據資源

足球基礎數據

https://www.nami.com/details/4nw10i0tela68lq#interface

足球統計數據

https://www.nami.com/details/7xwk3iqtv3s9rk6#interface

足球統計數據

https://www.nami.com/details/7xwk3iqtv3s9rk6#interface

足球高階數據

https://www.nami.com/details/g5wvvikteeixwzd#interface

指數數據

https://www.nami.com/details/o6w9kipt4yi78k3#interface

足球資料庫數據

https://www.nami.com/details/7j8gxi0to7inrql#interface

Marz火星數據（體育）

https://www.kancloud.cn/marz/marz-sport/3098904

posted @ 2025-04-24 14:56 paulwong 閱讀(68) | 評論 (0) | 編輯收藏

ai預測足球資源

基于機器學習的2022世界杯預測實戰

https://www.showmeai.tech/article-detail/400

AI 競彩賽事預測工具

https://www.mysports.ai/cn

posted @ 2025-04-19 01:07 paulwong 閱讀(34) | 評論 (0) | 編輯收藏

微調訓練的數據集

使用trl庫做微調時, 對數據集的要求是:

如果是多輪對話場景:

jsonl 文件，且需符合以下要求:

1.每行是一個獨立的 JSON 對象;

2 每個對象須包含一個鍵名為 messages 的數組，數組不能為空;

3.messages 中每個元素必須包含 role 和 content 兩個字段:

4.role 只能是 system,user 或 assisiant;

5.如果有 system 角色消息, 需在數組首位;

6.第一條非 system 消息必須是 user 角色;

7.user 和 assisiant 角色的消息應當交替、成對出現，不少于1對;

如果是指令微調場景:

jsonl 文件，且需符合以下要求:

1.每行是一個獨立的 JSON 對象;

2 每個對象須包含且只能包含一個鍵名為 text 的鍵值對，值不能為空;

posted @ 2025-03-21 21:52 paulwong 閱讀(74) | 評論 (0) | 編輯收藏

大模型訓練的幾個階段

大模型開發出來后, 一般要經過以下幾個階段的訓練:

預訓練(Pre-Trained)

單純提供文本: {"text":"..."}

訓練模型由第一個文字開始, 預測后面的文字, 直到結束.

這種模型只會做完成文本的任務

監督微調(Supervised Fine Turning)

為了使模型能完成根據指令完成回答, 而不是隨機生成回答

提供的文本: {"instruction":"...", "output":"..."}

高效參數微調(Parameter Efficient Fine Turning)

只調整部分參數, 具體實現方法有LoRA

參考:

https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb

posted @ 2025-03-18 13:14 paulwong 閱讀(75) | 評論 (0) | 編輯收藏

主站蜘蛛池模板：永康市| 奉贤区| 陆河县| 南宫市| 英吉沙县| 辽宁省| 晴隆县| 太仓市| 板桥市| 华宁县| 栖霞市| 云林县| 平谷区| 子长县| 汪清县| 杨浦区| 鹰潭市| 河北省| 襄垣县| 迁安市| 大荔县| 五华县| 侯马市| 花莲市| 获嘉县| 宿州市| 五大连池市| 长治市| 泽普县| 边坝县| 巴中市| 舞钢市| 宁城县| 齐齐哈尔市| 石嘴山市| 樟树市| 台北市| 武平县| 饶平县| 灵石县| 沈丘县|

<th id="mswmo"><nav id="mswmo"></nav></th>

<ul id="mswmo"><center id="mswmo"></center></ul>

<strike id="mswmo"><s id="mswmo"></s></strike>

<samp id="mswmo"></samp>