• 沸点IT---为科技爱好者提供最新鲜最热门的IT科技资讯!

沸点IT

ad

联想将单台服务器运行大模型性能推向新高

来源:中国经济网  |  发布时间:2025-03-18 08:34  |  阅读量:8383  |   
今天,联想宣布旗下首款AMDAI大模型训练服务器联想问天WA7785aG3在单机部署671B(满血版)DeepSeek大模型时,可实现极限吞吐量6708token/s,将单台服务器运行大模型的性能推向了新高。 据悉,依托联想万全异构智算平...

今天,联想宣布旗下首款AMD AI大模型训练服务器联想问天WA7785a G3在单机部署671B(满血版) DeepSeek大模型时,可实现极限吞吐量6708token/s,将单台服务器运行大模型的性能推向了新高。

据悉,依托联想万全异构智算平台,联想通过访存优化、显存优化、PCIe 5.0全互联架构创新以及精选SGLang框架中性能最优算子等诸多创新方式,对大模型从预训练、后训练到推理的全流程进行持续优化,在单台部署DeepSeek 671B大模型的联想问天WA7785a G3上实测最高吞吐量达6708 token/s。

在模拟问题对话场景时,最高可支持并发数158,TPOT 93毫秒, TTFT 2.01秒;而在模拟代码生成(上下文序列长度512/4K )时,并发数可达140,TPOT 100毫秒, TTFT 5.53秒。意味着单台联想问天WA7785a G3可以支撑1500人规模企业的正常使用,是继联想问天WA7780 G3服务器单机部署满血版DeepSeek大模型总吞吐量突破2500 token/s之后,单机部署该大模型推理性能的又一次突破。

此次突破是联想中国基础设施业务群、联想研究院ICI实验室和AMD联合设计、协同调优、共同实现的。此结果也并非最终结果,联想与AMD还在持续尝试深度调优新方法,实现更高调优突破。

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。

  • 海信贾少谦:以中国管理,建世界一流企业

    海信贾少谦:以中国管

  • 海信贾少谦:世界一流企业必然有一流的ESG表现

    海信贾少谦:世界一流

  • 从“高门槛”到“消费级”,华为引领卫星通信飞入寻常百姓家

    从“高门槛”到“消费

  • 万百万:高净值研究院大健康分院院长万百万分享健康财富密码

    万百万:高净值研究院

沸点IT | 网站地图 | RSS订阅

所载文章、数据仅供参考,使用前务请仔细阅读网站声明。本站不作任何非法律允许范围内服务!

联系我们: jokerdeyouxiang@sina.com

备案号:皖ICP备2023005497号