中新社北京6月30日電 (記者 劉育英)華為6月30日正式宣佈開源盤古70億參數的稠密模型、盤古Pro MoE 720億參數的混合專家模型和基於昇騰的模型推理技術。這是華為首次開源大模型。
目前,盤古Pro MoE 72B模型權重、基礎推理代碼,已正式上線開源平台。基於昇騰的超大規模MoE模型推理代碼,也已正式上線開源平台。盤古7B相關模型權重與推理代碼將於近期上線開源平台。華為邀全球開發者、企業伙伴及研究人員下載使用。
華為表示,此舉是華為踐行昇騰生態戰略的又一關鍵舉措,推動大模型技術的研究與創新發展,加速推進人工智能在千行百業的應用與價值創造。
達睿咨詢創始人馬繼華介紹,盤古70億參數的稠密模型是全參數稠密結構,適合通用場景微調,能够靈活部署在邊緣設備上。盤古Pro MoE 72B模型,採用混合專家架構,在保持推理效率的同時實現接近千億級稠密模型的性能,比較適合高複雜度任務。華為差異化模型參數規模梯度覆蓋製造業、金融等不同場景需求,開源目的是推動大模型的行業應用落地。
馬繼華認為,目前來看,人工智能領域的技術開放與生態共建非常重要,通過開源能够迅速形成產業優勢,從而達成領跑,讓人工智能飛輪效應得以發揮。(完)
來源中新社