paulwong

          #

          微調訓練的數據集

          使用trl庫做微調時, 對數據集的要求是:

          如果是多輪對話場景:
          jsonl 文件,且需符合以下要求:
          1.每行是一個獨立的 JSON 對象;
          2 每個對象須包含一個鍵名為 messages 的數組,數組不能為空;
          3.messages 中每個元素必須包含 role 和 content 兩個字段:
          4.role 只能是 system,user 或 assisiant;
          5.如果有 system 角色消息, 需在數組首位;
          6.第一條非 system 消息必須是 user 角色;
          7.user 和 assisiant 角色的消息應當交替、成對出現,不少于1對;

          如果是指令微調場景:
          jsonl 文件,且需符合以下要求:
          1.每行是一個獨立的 JSON 對象;
          2 每個對象須包含且只能包含一個鍵名為 text 的鍵值對,值不能為空;

          posted @ 2025-03-21 21:52 paulwong 閱讀(78) | 評論 (0)編輯 收藏

          大模型訓練的幾個階段

          大模型開發出來后, 一般要經過以下幾個階段的訓練:

          預訓練(Pre-Trained)

          單純提供文本: {"text":"..."}
          訓練模型由第一個文字開始, 預測后面的文字, 直到結束.
          這種模型只會做完成文本的任務

          監督微調(Supervised Fine Turning)

          為了使模型能完成根據指令完成回答, 而不是隨機生成回答
          提供的文本: {"instruction":"...", "output":"..."}

          高效參數微調(Parameter Efficient Fine Turning)

          只調整部分參數, 具體實現方法有LoRA

          參考:
          https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb



          posted @ 2025-03-18 13:14 paulwong 閱讀(81) | 評論 (0)編輯 收藏

          python資源

          python
          https://www.w3schools.com/python/

          https://www.runoob.com/python/python-basic-syntax.html

          廖雪峰的官方網站
          https://liaoxuefeng.com/books/python/index.html


          posted @ 2025-03-16 20:54 paulwong 閱讀(48) | 評論 (0)編輯 收藏

          大模型微調后的評估指標

          大模型微調后的評估指標是衡量模型性能的關鍵,通常根據任務類型和具體需求選擇不同的評估指標。以下是一些常見的評估指標及其適用場景:


          1. 分類任務

          • 準確率(Accuracy):預測正確的樣本占總樣本的比例。
            • 適用場景:類別分布均衡的任務。
          • 精確率(Precision):預測為正類的樣本中,實際為正類的比例。
            • 適用場景:關注減少假陽性(False Positive)的任務。
          • 召回率(Recall):實際為正類的樣本中,預測為正類的比例。
            • 適用場景:關注減少假陰性(False Negative)的任務。
          • F1分數(F1 Score):精確率和召回率的調和平均值。
            • 適用場景:類別不平衡或需要平衡精確率和召回率的任務。
          • ROC-AUC:ROC曲線下的面積,衡量模型區分正負類的能力。
            • 適用場景:二分類任務,尤其是類別不平衡的情況。

          2. 回歸任務

          • 均方誤差(MSE, Mean Squared Error):預測值與真實值之差的平方的平均值。
            • 適用場景:對誤差較大的樣本懲罰更重的任務。
          • 均方根誤差(RMSE, Root Mean Squared Error):MSE的平方根。
            • 適用場景:與MSE類似,但更接近原始數據尺度。
          • 平均絕對誤差(MAE, Mean Absolute Error):預測值與真實值之差的絕對值的平均值。
            • 適用場景:對異常值不敏感的任務。
          • R²(決定系數):模型解釋目標變量方差的比例。
            • 適用場景:評估模型擬合優度。

          3. 生成任務

          • BLEU(Bilingual Evaluation Understudy):衡量生成文本與參考文本的n-gram重疊程度。
            • 適用場景:機器翻譯、文本生成任務。
          • ROUGE(Recall-Oriented Understudy for Gisting Evaluation):衡量生成文本與參考文本的重疊程度,側重于召回率。
            • 適用場景:文本摘要、生成任務。
          • METEOR:綜合考慮精確率、召回率和詞序的評估指標。
            • 適用場景:機器翻譯、文本生成任務。
          • Perplexity(困惑度):衡量模型預測概率分布的不確定性。
            • 適用場景:語言模型評估。

          4. 多標簽任務

          • Hamming Loss:預測錯誤的標簽比例。
            • 適用場景:多標簽分類任務。
          • Jaccard Similarity:預測標簽與真實標簽的交集與并集之比。
            • 適用場景:多標簽分類任務。

          5. 排序任務

          • NDCG(Normalized Discounted Cumulative Gain):衡量排序結果的相關性。
            • 適用場景:推薦系統、信息檢索。
          • MAP(Mean Average Precision):平均精確率的均值。
            • 適用場景:信息檢索、推薦系統。

          6. 其他指標

          • 訓練時間:模型微調所需的時間。
          • 推理速度:模型生成結果的速度。
          • 資源消耗:模型運行所需的計算資源(如GPU內存、CPU使用率)。
          • 魯棒性:模型對噪聲、異常值或對抗樣本的抵抗能力。

          7. 領域特定指標

          • 醫學領域:敏感性(Sensitivity)、特異性(Specificity)、AUC-ROC。
          • 金融領域:收益曲線、夏普比率(Sharpe Ratio)。
          • 計算機視覺:mAP(mean Average Precision)、IoU(Intersection over Union)。

          8. 人類評估

          • 人工評分:通過人工評估生成結果的質量(如流暢性、相關性、準確性)。
          • 用戶滿意度:通過用戶反饋評估模型的實際效果。

          9. 模型對比

          • 基線對比:與未微調的模型或基線模型進行性能對比。
          • 消融實驗:評估微調過程中不同組件(如數據、超參數)對性能的影響。

          10. 綜合評估

          • 多指標綜合:根據任務需求,結合多個指標進行綜合評估。
          • 任務特定指標:針對特定任務設計自定義指標。

          在實際應用中,選擇合適的評估指標需要結合任務目標、數據特點和業務需求,同時注意避免單一指標的局限性。

          posted @ 2025-03-12 10:08 paulwong 閱讀(337) | 評論 (0)編輯 收藏

          LLM全棧框架完整分類清單(預訓練+微調+工具鏈)

          https://blog.csdn.net/ViniJack/article/details/145789900



          posted @ 2025-03-10 11:29 paulwong 閱讀(66) | 評論 (0)編輯 收藏

          醫療問診系統資源

          計算機畢業設計Python+Neo4j知識圖譜醫療問答系統 大模型
          https://baijiahao.baidu.com/s?id=1815574648931972744&wfr=spider&for=pc

          QABasedOnMedicaKnowledgeGraph
          https://github.com/liuhuanyong/QASystemOnMedicalKG/blob/master/README.md

          非結構文字抽取實體與關系的大模型
          底座, 百川 https://huggingface.co/baichuan-inc/Baichuan2-13B-Chat/tree/main
          底座, llama2 https://huggingface.co/unsloth/llama-2-13b
          微調->百川 https://huggingface.co/zjunlp/baichuan2-13b-iepile-lora
          微調->llama2 https://huggingface.co/zjunlp/llama2-13b-iepile-lora

          SiameseUniNLU通用自然語言理解模型
          https://www.modelscope.cn/models/iic/nlp_structbert_siamese-uninlu_chinese-base/summary

          數據集
          https://huggingface.co/datasets/zjunlp/iepile

          各種已經訓練好的模型
          https://www.modelscope.cn/models?name=zpeng1989&page=1











          posted @ 2025-03-08 20:52 paulwong 閱讀(56) | 評論 (0)編輯 收藏

          使用nlp提取非結構化數據中的信息

          @import url(http://www.aygfsteel.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css); @import url(http://www.aygfsteel.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css); 如果要從結構化的數據中提取信息,用sql即可, 即要提取的信息在select 的字段中.

          如果要從非結構化的數據中, 如純文本, 則要靠nlp, 要對文本理解后, 才能提取相應的信息.

          https://www.w3cschool.cn/article/99991254.html

          文本結構化 with SpaCy 攻略
          https://zhuanlan.zhihu.com/p/556163162
          https://zhuanlan.zhihu.com/p/557953165
          https://zhuanlan.zhihu.com/p/563334531
          https://zhuanlan.zhihu.com/p/573743734

          使用openspg自動構建醫療知識圖譜
          https://blog.csdn.net/myboyliu2007/article/details/139654943

          posted @ 2025-03-08 11:45 paulwong 閱讀(32) | 評論 (0)編輯 收藏

          AI案例資源

          @import url(http://www.aygfsteel.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css);
          從實踐案例介紹大模型應用經驗和思考
          https://mp.weixin.qq.com/s/hcD0-z9Y4PsrILUgHdqGcQ

          LLaMA Factory:微調DeepSeek-R1-Distill-Qwen-7B模型實現新聞標題分類器
          https://gallery.pai-ml.com/#/preview/deepLearning/nlp/llama_factory_deepseek_r1_distill_7b

          deepseek r1微調模型應用落地案例(醫療法律,PatientSeek)
          https://www.bilibili.com/video/BV17zAVevEtw/?spm_id_from=333.788.recommend_more_video.0&vd_source=35b81999db00535703a287d5c98652b1

          文本轉語音的模型ChatTTS體驗極佳,真人般絲滑和流暢,自定義也比較靈活
          https://www.bilibili.com/video/BV1oJ4m1u7B8/?spm_id_from=333.1387.upload.video_card.click&vd_source=35b81999db00535703a287d5c98652b1

          醫療NLP領域 評測/比賽,數據集,論文和預訓練模型資源匯總。
          https://github.com/FreedomIntelligence/Medical_NLP

          posted @ 2025-02-26 16:01 paulwong 閱讀(41) | 評論 (0)編輯 收藏

          滿血版Deepseek R1全網資源

          官網
          https://chat.deepseek.com

          騰訊, 需下載客戶端
          https://ima.qq.com

          阿里, 需自建對話應用, 有網頁版
          https://tbox.alipay.com/

          askmanyai
          https://askmanyai.cn

          360納米搜索, 無網頁版, 需自行下載app


          posted @ 2025-02-15 23:10 paulwong 閱讀(94) | 評論 (0)編輯 收藏

          量化資源

          GPTQ、GGUF、AWQ 大語言模型量化方法對比(轉載) 
          https://caovan.com/gptqggufawq-dayuyanmoxinglianghuafangfaduibizhuanzai/.html

          posted @ 2025-02-08 23:31 paulwong 閱讀(78) | 評論 (0)編輯 收藏

          僅列出標題
          共115頁: 上一頁 1 2 3 4 5 6 7 8 9 下一頁 Last 
          主站蜘蛛池模板: 交口县| 余江县| 曲沃县| 扎兰屯市| 隆德县| 东阳市| 黄骅市| 凭祥市| 山东省| 金门县| 徐水县| 绵阳市| 清苑县| 绥芬河市| 页游| 安远县| 镇远县| 元氏县| 济源市| 大方县| 左云县| 通榆县| 防城港市| 秭归县| 贵溪市| 泊头市| 鞍山市| 兴和县| 曲靖市| 普格县| 凤山县| 铁岭县| 崇左市| 前郭尔| 陕西省| 苏尼特左旗| 永嘉县| 江华| 高邑县| 西乌珠穆沁旗| 合山市|