自2023年5月DeepSeek創(chuàng)立以來(lái),佳都科技研發(fā)團(tuán)隊(duì)便密切關(guān)注其大模型技術(shù)研發(fā)進(jìn)展。DeepSeek在2023年11月、2024年5月、2024年9月先后發(fā)布并開(kāi)源的V1、V2、V2.5版本大模型,其技術(shù)報(bào)告中不斷迭代的高效訓(xùn)練與推理技術(shù),與佳都科技持續(xù)深耕的“模型沙盒”優(yōu)化技術(shù)體系高度契合,通過(guò)消化與再創(chuàng)新,有效加速了佳都科技自研垂類(lèi)大模型——佳都知行交通大模型的迭代研發(fā)。
早在2023年佳都科技就發(fā)布了全球首個(gè)交通行業(yè)大模型——佳都知行交通大模型,并于2024年迭代升級(jí)至V2.0。同時(shí),2024年佳都科技基于FP8等預(yù)訓(xùn)練技術(shù),使知行大模型預(yù)訓(xùn)練效率較24年年初提升了150%以上。同時(shí),團(tuán)隊(duì)在國(guó)產(chǎn)千卡GPU集群上完成了大模型優(yōu)化訓(xùn)練方法的驗(yàn)證。通過(guò)結(jié)合多種推理優(yōu)化技術(shù),同等參數(shù)規(guī)格知行大模型的部署成本較年初大幅降低了一個(gè)數(shù)量級(jí),并在超過(guò)8款國(guó)產(chǎn)GPU上完成了推理適配,并憑借卓越的技術(shù)實(shí)力榮膺“華為昇騰最佳原生開(kāi)發(fā)伙伴”。
DeepSeek-V3/R1滿(mǎn)血版,在佳都GPU集群上的部署
感謝您的留言,我們會(huì)第一時(shí)間聯(lián)系您!