以非root用戶運行docker
摘要: Code highlighting produced by Actipro CodeHighlighter (freeware) http://www.CodeHighlighter.com/ -->sudo useradd -m paul # 創(chuàng)建用戶并自動建立家目錄 sudo passwd paul #&... 閱讀全文
2025-06-13 16:47 作者: paulwong【評論:0】【閱讀:8】
創(chuàng)建數(shù)據(jù)集的資源
AI 數(shù)據(jù)集生成和模型微調(diào)框架 Distilabel 入門指南:基本概念、安裝與快速開始
使用Llama3和distilabel構建微調(diào)數(shù)據(jù)
https://huggingface.co/blog/dvilasuero/synthetic-data-with-llama3-distilabel
https://huggingface.co/blog/dvilasuero/synthetic-data-with-llama3-distilabel
2025-05-18 08:01 作者: paulwong【評論:0】【閱讀:22】
強化學習資源
蘑菇書EasyRL
李宏毅老師的《深度強化學習》是強化學習領域經(jīng)典的中文視頻之一。李老師幽默風趣的上課風格讓晦澀難懂的強化學習理論變得輕松易懂,他會通過很多有趣的例子來講解強化學習理論。比如老師經(jīng)常會用玩 Atari 游戲的例子來講解強化學習算法。此外,為了教程的完整性,我們整理了周博磊老師的《強化學習綱要》、李科澆老師的《世界冠軍帶你從零實踐強化學習》以及多個強化學習的經(jīng)典資料作為補充。對于想入門強化學習又想看中文講解的人來說絕對是非常推薦的。
本教程也稱為“蘑菇書”,寓意是希望此書能夠為讀者注入活力,讓讀者“吃”下這本蘑菇之后,能夠饒有興致地探索強化學習,像馬里奧那樣愈加強大,繼而在人工智能領域覓得意外的收獲。
李宏毅老師的《深度強化學習》是強化學習領域經(jīng)典的中文視頻之一。李老師幽默風趣的上課風格讓晦澀難懂的強化學習理論變得輕松易懂,他會通過很多有趣的例子來講解強化學習理論。比如老師經(jīng)常會用玩 Atari 游戲的例子來講解強化學習算法。此外,為了教程的完整性,我們整理了周博磊老師的《強化學習綱要》、李科澆老師的《世界冠軍帶你從零實踐強化學習》以及多個強化學習的經(jīng)典資料作為補充。對于想入門強化學習又想看中文講解的人來說絕對是非常推薦的。
本教程也稱為“蘑菇書”,寓意是希望此書能夠為讀者注入活力,讓讀者“吃”下這本蘑菇之后,能夠饒有興致地探索強化學習,像馬里奧那樣愈加強大,繼而在人工智能領域覓得意外的收獲。
2025-04-30 14:15 作者: paulwong【評論:0】【閱讀:30】