vllm資源
vllm是一個可以加載大模型, 推理, 量化模型, 以http api的方式暴露服務的框架.posted on 2025-01-17 13:01 paulwong 閱讀(66) 評論(0) 編輯 收藏 所屬分類: AI-LLM
posted on 2025-01-17 13:01 paulwong 閱讀(66) 評論(0) 編輯 收藏 所屬分類: AI-LLM
Powered by:
BlogJava
Copyright © paulwong