paulwong

          #

          以非root用戶運(yùn)行docker

          sudo useradd -m paul # 創(chuàng)建用戶并自動(dòng)建立家目錄
          sudo passwd paul # 設(shè)置用戶密碼(需輸入兩次確認(rèn))
          sudo usermod -aG wheel paul # CentOS/RHEL
          [root@dev69 ~]$ groupadd docker
          [root@dev69 ~]$ usermod -aG docker $USER
          [root@dev69 ~]$ reboot
          [paul@dev69 ~]$ docker run hello-world

          posted @ 2025-06-13 16:47 paulwong 閱讀(9) | 評論 (0)編輯 收藏

          創(chuàng)建數(shù)據(jù)集的資源


          AI 數(shù)據(jù)集生成和模型微調(diào)框架 Distilabel 入門指南:基本概念、安裝與快速開始
          https://zhuanlan.zhihu.com/p/25766406373

          使用Llama3和distilabel構(gòu)建微調(diào)數(shù)據(jù)
          https://huggingface.co/blog/dvilasuero/synthetic-data-with-llama3-distilabel

          posted @ 2025-05-18 08:01 paulwong 閱讀(23) | 評論 (0)編輯 收藏

          強(qiáng)化學(xué)習(xí)資源

          蘑菇書EasyRL
          李宏毅老師的《深度強(qiáng)化學(xué)習(xí)》是強(qiáng)化學(xué)習(xí)領(lǐng)域經(jīng)典的中文視頻之一。李老師幽默風(fēng)趣的上課風(fēng)格讓晦澀難懂的強(qiáng)化學(xué)習(xí)理論變得輕松易懂,他會(huì)通過很多有趣的例子來講解強(qiáng)化學(xué)習(xí)理論。比如老師經(jīng)常會(huì)用玩 Atari 游戲的例子來講解強(qiáng)化學(xué)習(xí)算法。此外,為了教程的完整性,我們整理了周博磊老師的《強(qiáng)化學(xué)習(xí)綱要》、李科澆老師的《世界冠軍帶你從零實(shí)踐強(qiáng)化學(xué)習(xí)》以及多個(gè)強(qiáng)化學(xué)習(xí)的經(jīng)典資料作為補(bǔ)充。對于想入門強(qiáng)化學(xué)習(xí)又想看中文講解的人來說絕對是非常推薦的。

          本教程也稱為“蘑菇書”,寓意是希望此書能夠?yàn)樽x者注入活力,讓讀者“吃”下這本蘑菇之后,能夠饒有興致地探索強(qiáng)化學(xué)習(xí),像馬里奧那樣愈加強(qiáng)大,繼而在人工智能領(lǐng)域覓得意外的收獲。
          https://github.com/datawhalechina/easy-rl?tab=readme-ov-file


          posted @ 2025-04-30 14:15 paulwong 閱讀(31) | 評論 (0)編輯 收藏

          足球數(shù)據(jù)資源

          足球基礎(chǔ)數(shù)據(jù)
          https://www.nami.com/details/4nw10i0tela68lq#interface

          足球統(tǒng)計(jì)數(shù)據(jù)
          https://www.nami.com/details/7xwk3iqtv3s9rk6#interface

          足球統(tǒng)計(jì)數(shù)據(jù)
          https://www.nami.com/details/7xwk3iqtv3s9rk6#interface

          足球高階數(shù)據(jù)
          https://www.nami.com/details/g5wvvikteeixwzd#interface

          指數(shù)數(shù)據(jù)
          https://www.nami.com/details/o6w9kipt4yi78k3#interface

          足球資料庫數(shù)據(jù)
          https://www.nami.com/details/7j8gxi0to7inrql#interface

          Marz火星數(shù)據(jù)(體育)
          https://www.kancloud.cn/marz/marz-sport/3098904



          posted @ 2025-04-24 14:56 paulwong 閱讀(69) | 評論 (0)編輯 收藏

          ai預(yù)測足球資源

          基于機(jī)器學(xué)習(xí)的2022世界杯預(yù)測實(shí)戰(zhàn)
          https://www.showmeai.tech/article-detail/400

          AI 競彩賽事 預(yù)測工具
          https://www.mysports.ai/cn

          posted @ 2025-04-19 01:07 paulwong 閱讀(34) | 評論 (0)編輯 收藏

          微調(diào)訓(xùn)練的數(shù)據(jù)集

          使用trl庫做微調(diào)時(shí), 對數(shù)據(jù)集的要求是:

          如果是多輪對話場景:
          jsonl 文件,且需符合以下要求:
          1.每行是一個(gè)獨(dú)立的 JSON 對象;
          2 每個(gè)對象須包含一個(gè)鍵名為 messages 的數(shù)組,數(shù)組不能為空;
          3.messages 中每個(gè)元素必須包含 role 和 content 兩個(gè)字段:
          4.role 只能是 system,user 或 assisiant;
          5.如果有 system 角色消息, 需在數(shù)組首位;
          6.第一條非 system 消息必須是 user 角色;
          7.user 和 assisiant 角色的消息應(yīng)當(dāng)交替、成對出現(xiàn),不少于1對;

          如果是指令微調(diào)場景:
          jsonl 文件,且需符合以下要求:
          1.每行是一個(gè)獨(dú)立的 JSON 對象;
          2 每個(gè)對象須包含且只能包含一個(gè)鍵名為 text 的鍵值對,值不能為空;

          posted @ 2025-03-21 21:52 paulwong 閱讀(74) | 評論 (0)編輯 收藏

          大模型訓(xùn)練的幾個(gè)階段

          大模型開發(fā)出來后, 一般要經(jīng)過以下幾個(gè)階段的訓(xùn)練:

          預(yù)訓(xùn)練(Pre-Trained)

          單純提供文本: {"text":"..."}
          訓(xùn)練模型由第一個(gè)文字開始, 預(yù)測后面的文字, 直到結(jié)束.
          這種模型只會(huì)做完成文本的任務(wù)

          監(jiān)督微調(diào)(Supervised Fine Turning)

          為了使模型能完成根據(jù)指令完成回答, 而不是隨機(jī)生成回答
          提供的文本: {"instruction":"...", "output":"..."}

          高效參數(shù)微調(diào)(Parameter Efficient Fine Turning)

          只調(diào)整部分參數(shù), 具體實(shí)現(xiàn)方法有LoRA

          參考:
          https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb



          posted @ 2025-03-18 13:14 paulwong 閱讀(75) | 評論 (0)編輯 收藏

          python資源

          python
          https://www.w3schools.com/python/

          https://www.runoob.com/python/python-basic-syntax.html


          posted @ 2025-03-16 20:54 paulwong 閱讀(43) | 評論 (0)編輯 收藏

          大模型微調(diào)后的評估指標(biāo)

          大模型微調(diào)后的評估指標(biāo)是衡量模型性能的關(guān)鍵,通常根據(jù)任務(wù)類型和具體需求選擇不同的評估指標(biāo)。以下是一些常見的評估指標(biāo)及其適用場景:


          1. 分類任務(wù)

          • 準(zhǔn)確率(Accuracy):預(yù)測正確的樣本占總樣本的比例。
            • 適用場景:類別分布均衡的任務(wù)。
          • 精確率(Precision):預(yù)測為正類的樣本中,實(shí)際為正類的比例。
            • 適用場景:關(guān)注減少假陽性(False Positive)的任務(wù)。
          • 召回率(Recall):實(shí)際為正類的樣本中,預(yù)測為正類的比例。
            • 適用場景:關(guān)注減少假陰性(False Negative)的任務(wù)。
          • F1分?jǐn)?shù)(F1 Score):精確率和召回率的調(diào)和平均值。
            • 適用場景:類別不平衡或需要平衡精確率和召回率的任務(wù)。
          • ROC-AUC:ROC曲線下的面積,衡量模型區(qū)分正負(fù)類的能力。
            • 適用場景:二分類任務(wù),尤其是類別不平衡的情況。

          2. 回歸任務(wù)

          • 均方誤差(MSE, Mean Squared Error):預(yù)測值與真實(shí)值之差的平方的平均值。
            • 適用場景:對誤差較大的樣本懲罰更重的任務(wù)。
          • 均方根誤差(RMSE, Root Mean Squared Error):MSE的平方根。
            • 適用場景:與MSE類似,但更接近原始數(shù)據(jù)尺度。
          • 平均絕對誤差(MAE, Mean Absolute Error):預(yù)測值與真實(shí)值之差的絕對值的平均值。
            • 適用場景:對異常值不敏感的任務(wù)。
          • R²(決定系數(shù)):模型解釋目標(biāo)變量方差的比例。
            • 適用場景:評估模型擬合優(yōu)度。

          3. 生成任務(wù)

          • BLEU(Bilingual Evaluation Understudy):衡量生成文本與參考文本的n-gram重疊程度。
            • 適用場景:機(jī)器翻譯、文本生成任務(wù)。
          • ROUGE(Recall-Oriented Understudy for Gisting Evaluation):衡量生成文本與參考文本的重疊程度,側(cè)重于召回率。
            • 適用場景:文本摘要、生成任務(wù)。
          • METEOR:綜合考慮精確率、召回率和詞序的評估指標(biāo)。
            • 適用場景:機(jī)器翻譯、文本生成任務(wù)。
          • Perplexity(困惑度):衡量模型預(yù)測概率分布的不確定性。
            • 適用場景:語言模型評估。

          4. 多標(biāo)簽任務(wù)

          • Hamming Loss:預(yù)測錯(cuò)誤的標(biāo)簽比例。
            • 適用場景:多標(biāo)簽分類任務(wù)。
          • Jaccard Similarity:預(yù)測標(biāo)簽與真實(shí)標(biāo)簽的交集與并集之比。
            • 適用場景:多標(biāo)簽分類任務(wù)。

          5. 排序任務(wù)

          • NDCG(Normalized Discounted Cumulative Gain):衡量排序結(jié)果的相關(guān)性。
            • 適用場景:推薦系統(tǒng)、信息檢索。
          • MAP(Mean Average Precision):平均精確率的均值。
            • 適用場景:信息檢索、推薦系統(tǒng)。

          6. 其他指標(biāo)

          • 訓(xùn)練時(shí)間:模型微調(diào)所需的時(shí)間。
          • 推理速度:模型生成結(jié)果的速度。
          • 資源消耗:模型運(yùn)行所需的計(jì)算資源(如GPU內(nèi)存、CPU使用率)。
          • 魯棒性:模型對噪聲、異常值或?qū)箻颖镜牡挚鼓芰Α?/li>

          7. 領(lǐng)域特定指標(biāo)

          • 醫(yī)學(xué)領(lǐng)域:敏感性(Sensitivity)、特異性(Specificity)、AUC-ROC。
          • 金融領(lǐng)域:收益曲線、夏普比率(Sharpe Ratio)。
          • 計(jì)算機(jī)視覺:mAP(mean Average Precision)、IoU(Intersection over Union)。

          8. 人類評估

          • 人工評分:通過人工評估生成結(jié)果的質(zhì)量(如流暢性、相關(guān)性、準(zhǔn)確性)。
          • 用戶滿意度:通過用戶反饋評估模型的實(shí)際效果。

          9. 模型對比

          • 基線對比:與未微調(diào)的模型或基線模型進(jìn)行性能對比。
          • 消融實(shí)驗(yàn):評估微調(diào)過程中不同組件(如數(shù)據(jù)、超參數(shù))對性能的影響。

          10. 綜合評估

          • 多指標(biāo)綜合:根據(jù)任務(wù)需求,結(jié)合多個(gè)指標(biāo)進(jìn)行綜合評估。
          • 任務(wù)特定指標(biāo):針對特定任務(wù)設(shè)計(jì)自定義指標(biāo)。

          在實(shí)際應(yīng)用中,選擇合適的評估指標(biāo)需要結(jié)合任務(wù)目標(biāo)、數(shù)據(jù)特點(diǎn)和業(yè)務(wù)需求,同時(shí)注意避免單一指標(biāo)的局限性。

          posted @ 2025-03-12 10:08 paulwong 閱讀(283) | 評論 (0)編輯 收藏

          LLM全棧框架完整分類清單(預(yù)訓(xùn)練+微調(diào)+工具鏈)

          https://blog.csdn.net/ViniJack/article/details/145789900



          posted @ 2025-03-10 11:29 paulwong 閱讀(62) | 評論 (0)編輯 收藏

          僅列出標(biāo)題
          共115頁: 1 2 3 4 5 6 7 8 9 下一頁 Last 
          主站蜘蛛池模板: 宿州市| 施秉县| 乌兰察布市| 灌阳县| 沁水县| 突泉县| 丰县| 清新县| 汝城县| 交口县| 襄城县| 琼结县| 林周县| 屏边| 普陀区| 句容市| 河南省| 安庆市| 海阳市| 方正县| 时尚| 漾濞| 合川市| 邛崃市| 东阿县| 介休市| 洛隆县| 巧家县| 信宜市| 胶南市| 义乌市| 广安市| 四子王旗| 合肥市| 深州市| 磴口县| 长兴县| 茌平县| 永寿县| 建昌县| 新津县|