亚洲一区二区不卡视频,精品国产一区二区三区四区四,91美女片黄在线观看

微調訓練的數據集

使用trl庫做微調時, 對數據集的要求是:

如果是多輪對話場景:

jsonl 文件，且需符合以下要求:

1.每行是一個獨立的 JSON 對象;

2 每個對象須包含一個鍵名為 messages 的數組，數組不能為空;

3.messages 中每個元素必須包含 role 和 content 兩個字段:

4.role 只能是 system,user 或 assisiant;

5.如果有 system 角色消息, 需在數組首位;

6.第一條非 system 消息必須是 user 角色;

7.user 和 assisiant 角色的消息應當交替、成對出現，不少于1對;

如果是指令微調場景:

jsonl 文件，且需符合以下要求:

1.每行是一個獨立的 JSON 對象;

2 每個對象須包含且只能包含一個鍵名為 text 的鍵值對，值不能為空;

posted @ 2025-03-21 21:52 paulwong 閱讀(78) | 評論 (0) | 編輯收藏

預訓練(Pre-Trained)

單純提供文本: {"text":"..."}

訓練模型由第一個文字開始, 預測后面的文字, 直到結束.

這種模型只會做完成文本的任務

監督微調(Supervised Fine Turning)

為了使模型能完成根據指令完成回答, 而不是隨機生成回答

提供的文本: {"instruction":"...", "output":"..."}

高效參數微調(Parameter Efficient Fine Turning)

只調整部分參數, 具體實現方法有LoRA

參考:

https://github.com/huggingface/smol-course/blob/main/1_instruction_tuning/notebooks/sft_finetuning_example.ipynb

posted @ 2025-03-18 13:14 paulwong 閱讀(81) | 評論 (0) | 編輯收藏

python資源

python

https://www.w3schools.com/python/

https://www.runoob.com/python/python-basic-syntax.html

廖雪峰的官方網站

https://liaoxuefeng.com/books/python/index.html

posted @ 2025-03-16 20:54 paulwong 閱讀(48) | 評論 (0) | 編輯收藏

大模型微調后的評估指標

大模型微調后的評估指標是衡量模型性能的關鍵，通常根據任務類型和具體需求選擇不同的評估指標。以下是一些常見的評估指標及其適用場景：

1. 分類任務

準確率（Accuracy）：預測正確的樣本占總樣本的比例。
- 適用場景：類別分布均衡的任務。
精確率（Precision）：預測為正類的樣本中，實際為正類的比例。
- 適用場景：關注減少假陽性（False Positive）的任務。
召回率（Recall）：實際為正類的樣本中，預測為正類的比例。
- 適用場景：關注減少假陰性（False Negative）的任務。
F1分數（F1 Score）：精確率和召回率的調和平均值。
- 適用場景：類別不平衡或需要平衡精確率和召回率的任務。
ROC-AUC：ROC曲線下的面積，衡量模型區分正負類的能力。
- 適用場景：二分類任務，尤其是類別不平衡的情況。

2. 回歸任務

均方誤差（MSE, Mean Squared Error）：預測值與真實值之差的平方的平均值。
- 適用場景：對誤差較大的樣本懲罰更重的任務。
均方根誤差（RMSE, Root Mean Squared Error）：MSE的平方根。
- 適用場景：與MSE類似，但更接近原始數據尺度。
平均絕對誤差（MAE, Mean Absolute Error）：預測值與真實值之差的絕對值的平均值。
- 適用場景：對異常值不敏感的任務。
R²（決定系數）：模型解釋目標變量方差的比例。
- 適用場景：評估模型擬合優度。

3. 生成任務

BLEU（Bilingual Evaluation Understudy）：衡量生成文本與參考文本的n-gram重疊程度。
- 適用場景：機器翻譯、文本生成任務。
ROUGE（Recall-Oriented Understudy for Gisting Evaluation）：衡量生成文本與參考文本的重疊程度，側重于召回率。
- 適用場景：文本摘要、生成任務。
METEOR：綜合考慮精確率、召回率和詞序的評估指標。
- 適用場景：機器翻譯、文本生成任務。
Perplexity（困惑度）：衡量模型預測概率分布的不確定性。
- 適用場景：語言模型評估。

4. 多標簽任務

Hamming Loss：預測錯誤的標簽比例。
- 適用場景：多標簽分類任務。
Jaccard Similarity：預測標簽與真實標簽的交集與并集之比。
- 適用場景：多標簽分類任務。

5. 排序任務

NDCG（Normalized Discounted Cumulative Gain）：衡量排序結果的相關性。
- 適用場景：推薦系統、信息檢索。
MAP（Mean Average Precision）：平均精確率的均值。
- 適用場景：信息檢索、推薦系統。

6. 其他指標

訓練時間：模型微調所需的時間。
推理速度：模型生成結果的速度。
資源消耗：模型運行所需的計算資源（如GPU內存、CPU使用率）。
魯棒性：模型對噪聲、異常值或對抗樣本的抵抗能力。

7. 領域特定指標

醫學領域：敏感性（Sensitivity）、特異性（Specificity）、AUC-ROC。
金融領域：收益曲線、夏普比率（Sharpe Ratio）。
計算機視覺：mAP（mean Average Precision）、IoU（Intersection over Union）。

8. 人類評估

人工評分：通過人工評估生成結果的質量（如流暢性、相關性、準確性）。
用戶滿意度：通過用戶反饋評估模型的實際效果。

9. 模型對比

基線對比：與未微調的模型或基線模型進行性能對比。
消融實驗：評估微調過程中不同組件（如數據、超參數）對性能的影響。

10. 綜合評估

多指標綜合：根據任務需求，結合多個指標進行綜合評估。
任務特定指標：針對特定任務設計自定義指標。

在實際應用中，選擇合適的評估指標需要結合任務目標、數據特點和業務需求，同時注意避免單一指標的局限性。

posted @ 2025-03-12 10:08 paulwong 閱讀(337) | 評論 (0) | 編輯收藏

LLM全棧框架完整分類清單（預訓練+微調+工具鏈）

https://blog.csdn.net/ViniJack/article/details/145789900

posted @ 2025-03-10 11:29 paulwong 閱讀(66) | 評論 (0) | 編輯收藏

醫療問診系統資源

計算機畢業設計Python+Neo4j知識圖譜醫療問答系統大模型

https://baijiahao.baidu.com/s?id=1815574648931972744&wfr=spider&for=pc

QABasedOnMedicaKnowledgeGraph

https://github.com/liuhuanyong/QASystemOnMedicalKG/blob/master/README.md

非結構文字抽取實體與關系的大模型

底座, 百川 https://huggingface.co/baichuan-inc/Baichuan2-13B-Chat/tree/main

底座, llama2 https://huggingface.co/unsloth/llama-2-13b

微調->百川 https://huggingface.co/zjunlp/baichuan2-13b-iepile-lora

微調->llama2 https://huggingface.co/zjunlp/llama2-13b-iepile-lora

SiameseUniNLU通用自然語言理解模型

https://www.modelscope.cn/models/iic/nlp_structbert_siamese-uninlu_chinese-base/summary

數據集

https://huggingface.co/datasets/zjunlp/iepile

各種已經訓練好的模型

https://www.modelscope.cn/models?name=zpeng1989&page=1

posted @ 2025-03-08 20:52 paulwong 閱讀(56) | 評論 (0) | 編輯收藏

@import url(http://www.aygfsteel.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css); @import url(http://www.aygfsteel.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css); 如果要從結構化的數據中提取信息,用sql即可, 即要提取的信息在select 的字段中.

如果要從非結構化的數據中, 如純文本, 則要靠nlp, 要對文本理解后, 才能提取相應的信息.

https://www.w3cschool.cn/article/99991254.html

文本結構化 with SpaCy 攻略

https://zhuanlan.zhihu.com/p/556163162

https://zhuanlan.zhihu.com/p/557953165

https://zhuanlan.zhihu.com/p/563334531

https://zhuanlan.zhihu.com/p/573743734

使用openspg自動構建醫療知識圖譜

https://blog.csdn.net/myboyliu2007/article/details/139654943

posted @ 2025-03-08 11:45 paulwong 閱讀(32) | 評論 (0) | 編輯收藏