paulwong

          #

          AI案例資源

          @import url(http://www.aygfsteel.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css);
          從實踐案例介紹大模型應用經驗和思考
          https://mp.weixin.qq.com/s/hcD0-z9Y4PsrILUgHdqGcQ

          LLaMA Factory:微調DeepSeek-R1-Distill-Qwen-7B模型實現新聞標題分類器
          https://gallery.pai-ml.com/#/preview/deepLearning/nlp/llama_factory_deepseek_r1_distill_7b

          deepseek r1微調模型應用落地案例(醫療法律,PatientSeek)
          https://www.bilibili.com/video/BV17zAVevEtw/?spm_id_from=333.788.recommend_more_video.0&vd_source=35b81999db00535703a287d5c98652b1

          文本轉語音的模型ChatTTS體驗極佳,真人般絲滑和流暢,自定義也比較靈活
          https://www.bilibili.com/video/BV1oJ4m1u7B8/?spm_id_from=333.1387.upload.video_card.click&vd_source=35b81999db00535703a287d5c98652b1

          醫療NLP領域 評測/比賽,數據集,論文和預訓練模型資源匯總。
          https://github.com/FreedomIntelligence/Medical_NLP

          posted @ 2025-02-26 16:01 paulwong 閱讀(33) | 評論 (0)編輯 收藏

          滿血版Deepseek R1全網資源

          官網
          https://chat.deepseek.com

          騰訊, 需下載客戶端
          https://ima.qq.com

          阿里, 需自建對話應用, 有網頁版
          https://tbox.alipay.com/

          askmanyai
          https://askmanyai.cn

          360納米搜索, 無網頁版, 需自行下載app


          posted @ 2025-02-15 23:10 paulwong 閱讀(82) | 評論 (0)編輯 收藏

          量化資源

          GPTQ、GGUF、AWQ 大語言模型量化方法對比(轉載) 
          https://caovan.com/gptqggufawq-dayuyanmoxinglianghuafangfaduibizhuanzai/.html

          posted @ 2025-02-08 23:31 paulwong 閱讀(72) | 評論 (0)編輯 收藏

          DeepSeek背后的數學:深入研究群體相對策略優化(GRPO)

               摘要: 本博客深入探討了群體相對策略優化(GRPO)背后的數學,GRPO是推動DeepSeek卓越推理能力的核心強化學習算法。我們將分解GRPO的工作原理、其關鍵組件,以及為什么它是訓練高級大型語言模型(LLM)的改變者。 GRPO的基礎 GRPO是什么? 群相對策略優化(GRPO)是一種強化學習(RL)算法,專門用于增強大型語言模型(LLM)的推理能力。與傳統的RL方法不同,RL方法嚴重依賴外部評...  閱讀全文

          posted @ 2025-02-08 00:13 paulwong 閱讀(243) | 評論 (0)編輯 收藏

          DeepSeek資源

          DeepSeek大模型由于采用了GRPO算法, 大幅降低了顯存的需求.

          【DeepSeek】復現DeepSeek R1?快來看這個Open R1項目實踐指南~
          https://blog.csdn.net/qq_38961840/article/details/145388142

          !!!實戰LLM強化學習——使用GRPO(DeepSeek R1出圈算法)
          https://blog.csdn.net/qq_38961840/article/details/145390704

          【DeepSeek】一文詳解GRPO算法——為什么能減少大模型訓練資源?
          https://blog.csdn.net/qq_38961840/article/details/145384852

          DeepSeek R1系列
          https://blog.csdn.net/qq_38961840/category_12885087.html


          posted @ 2025-02-02 19:22 paulwong 閱讀(94) | 評論 (0)編輯 收藏

          不用再找了,這是大模型最全的面試題庫

          https://blog.csdn.net/m0_59596990/article/details/135200833

          posted @ 2025-01-22 07:42 paulwong 閱讀(35) | 評論 (0)編輯 收藏

          數據集資源

          @import url(http://www.aygfsteel.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css);
          https://hyper.ai/cn/datasets


          posted @ 2025-01-17 15:52 paulwong 閱讀(26) | 評論 (0)編輯 收藏

          vllm資源

          vllm是一個可以加載大模型, 推理, 量化模型, 以http api的方式暴露服務的框架.

          https://docs.vllm.ai/en/latest/getting_started/examples/basic_with_model_default_sampling.html


          posted @ 2025-01-17 13:01 paulwong 閱讀(66) | 評論 (0)編輯 收藏

          AI應用場景

          @import url(http://www.aygfsteel.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css); @import url(http://www.aygfsteel.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css);
          到底AI是虛的還是假的, 在企業中有沒實際落地場景, 以下取實際應用場景:

          生物公司
          使用qwen2:7b訓練細胞制備領域的數據集,目標是
          1.預測細胞收獲量  
          2.算細胞存活狀態(存活/死亡)
          3.預測工藝是否成功
          4.可以提前預測細胞的質量是否達標,以便及時采取措施進行調整
          5.細胞培養過程中出現大量細胞死亡的情況,模型可以根據實時數據和歷史經驗,分析可能是培養箱溫度失控、培養基成分錯誤或受到污染等原因導致的,并提供相應的排查建議」

          文體旅游
          智能旅游系統:
          提供目的地介紹、
          旅行路線規劃、
          酒店預訂和景
          點推薦等服務。

          考試改卷
          基于大模型,做一個判試卷的應用,能夠判斷主觀題,比如閱讀理解,比如歷史,地理,政治問答題。
          判卷準確率不能低于人工判卷準確率。
          即一次考試,一個班50份試卷,判斷結果錯誤不超過5道題。判斷效率高于或等于人工。

          取過往同學試卷題目, 作答內容, 得分 作一波ocr出數據, 一個科目, 提取所有試卷內容, 最后就是一個科目一個模型, 提取的內容放在文本, csv, json,
          基于“bert-base-chinese”這個模型, 進行微調出專用模型即可,  
          讓大模型成為專業的判卷老師

          考試
          用扣子打一個智能體,實現不同學員對掌握的知識進行測試,根據測試結果進行打分和二次出題測試



          posted @ 2025-01-17 11:23 paulwong 閱讀(136) | 評論 (0)編輯 收藏

          搭建llamafactory微調、評估、測試和量化環境

          0. 配置環境變量
          HF_ENDPOINT=https://hf-mirror.com
          HF_HOME=/root/autodl-tmp/paul/tools/huggingface

          1. 本機安裝python 3.10, 并設置軟件源
          pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
          pip config set global.index-url https://mirrors.huaweicloud.com/repository/pypi/simple

          2. 安裝miniconda

          3. 新建一個環境, 并激活
          conda create -n quantization python=3.12

          2. 本機安裝pytorch2.5.1+cuda12.4
          pip3 install torch torchvision torchaudio
          pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

          3. clone llamafactory源碼
          git clone https://github.com/hiyouga/LLaMA-Factory

          4. llamafactory本地安裝依賴
          pip install -e .
          pip install -e .["vllm","gptq"]

          5. 啟動webui
          llamafactory-cli webui

          6. 在頁面中填入相關參數進行操作

          posted @ 2025-01-16 16:54 paulwong 閱讀(134) | 評論 (0)編輯 收藏

          僅列出標題
          共115頁: 上一頁 1 2 3 4 5 6 7 8 9 下一頁 Last 
          主站蜘蛛池模板: 三门峡市| 双鸭山市| 德清县| 达孜县| 乾安县| 永登县| 武隆县| 天镇县| 永城市| 游戏| 吉林市| 榕江县| 洛浦县| 兴隆县| 桂阳县| 隆子县| 和林格尔县| 阿瓦提县| 夏邑县| 兰考县| 佛山市| 武冈市| 荣昌县| 儋州市| 商水县| 同江市| 达日县| 察雅县| 宜州市| 黎城县| 洛扎县| 咸丰县| 大宁县| 黎平县| 界首市| 城步| 邳州市| 遵义县| 徐水县| 盐城市| 永安市|