長連接網(wǎng)關(guān)技術(shù)專題(十二):大模型時代多模型AI網(wǎng)關(guān)的架構(gòu)設(shè)計與實現(xiàn)
摘要: 本文來自嗶哩嗶哩通用技術(shù)團隊分享,下文進行了排版優(yōu)化和修訂。1、引言隨著 AI 技術(shù)快速發(fā)展,業(yè)務(wù)對 AI 能力的渴求日益增長。當(dāng) AI 服務(wù)面對處理大規(guī)模請求和高并發(fā)流量時,AI 網(wǎng)關(guān)從中扮演著至關(guān)重要的角色。AI 服務(wù)通常涉及大量的計算任務(wù)和設(shè)備資源占用,此時需要一個 AI 網(wǎng)關(guān)負責(zé)協(xié)調(diào)這些請求來確保系統(tǒng)的穩(wěn)定性與高效性。因此,與傳統(tǒng)微服務(wù)架構(gòu)類似,我們將相關(guān) API 管理的功能(如流量控制、... 閱讀全文
2025-05-22 14:08 作者: Jack Jiang【評論:0】【閱讀:39】
小紅書APP的全新鴻蒙NEXT端性能優(yōu)化技術(shù)實踐
摘要: 本文來自QCon全球軟件開發(fā)大會王勁鵬的技術(shù)分享,下文進行了排版優(yōu)化和修訂。1、引言性能和體驗在 iOS / Android 雙端場景下已經(jīng)是一個較為成熟的話題,但隨著鴻蒙 OS 的發(fā)展,端側(cè)開發(fā)者需要更多的關(guān)注多端場景的差異性。本次分享的主題是小紅書在鴻蒙平臺上的工程實踐,主要聚焦于性能優(yōu)化和探索。(* PPT講稿原文下載:《小紅書鴻蒙OS下的性能優(yōu)化探索與實踐(PPT)[附件下載]》)先介紹一... 閱讀全文
2025-05-19 11:24 作者: Jack Jiang【評論:0】【閱讀:56】
全平臺開源即時通訊IM聊天框架MobileIMSDK的服務(wù)端開發(fā)指南,支持鴻蒙NEXT
摘要: 全平臺開源即時通訊IM聊天框架MobileIMSDK的服務(wù)端開發(fā)指南,支持鴻蒙NEXT 閱讀全文
2025-05-15 12:27 作者: Jack Jiang【評論:0】【閱讀:48】