加速大模型在企业落地 联想AI服务器首次实现低于1TB本地部署DeepSeek满血大模型
近日,联想集团有限公司(以下简称“联想”)宣布基于联想问天WA7780 G3服务器,在行业内首次实现单机部署DeepSeek-R1/V3 671B大模型,以低于行业公认1TB显存(实际768GB)承载多并发用户流畅体验,可以满足千人企业的使用需求,为行业树立了企业级大模型部署新基准。
作为全球关注的焦点,众多企业正准备在本地化部署DeepSeek大模型。然而,在落地实施过程中用户普遍面临以下关键决策难题:单机能否部署满血版DeepSeek R1?如何确保高并发与吞吐量下的优质体验?
联想此次突破为企业提供科学选型指南。针对行业公认1TB显存是千亿参数大模型运行基线,联想中国基础设施业务群和研究院ICI实验室组成的联合攻关团队通过专家并行优化、智能访存架构升级等,大幅提升显存利用率,实现性能的提升。
据了解,联想问天WA7780 G3服务器在2月初已实现单机768GB GPU显存条件下部署DeepSeek 671B R1和V3满血模型,并能满足中小企业的并发需求,通过联想万全异构智算平台的访存优化等技术优化手段,实现单机一个月内并发能力增长10倍。
业内认为,联想技术突破将有效破除大模型落地瓶颈,显著加速大模型在企业的落地进程。
联想负责人表示,联想中国基础设施业务群与联想研究院ICI实验室将继续合作,依托双方联合打造的联想万全异构智算平台对DeepSeek平台从AI预训练、后训练到推理的全流程进行持续优化,加速大模型的落地。
成都联想服务器总代理 - 成都强川科技有限公司,专注企业IT服务需求,产品可按需定制。主营:联想问天服务器、联想ThinkSystem服务器、联想ThinkStation工作站、联想商用电脑(启天/扬天/ThinkCentre/ThinkPad),以专业的IT解决方案和优质的服务体验赢得企业信赖。QQ:2851150694;服务热线:028-85024766 18215624006(微信同号