推广 热搜: 关键词  效果  查询  智能  跳转  网站  下载  链接  互联  自动 

面向大模型训练,腾讯发布高性能计算集群:整体性能提升3倍

   日期:2024-12-05     作者:b1221137    caijiyuan  
核心提示:面向大模型训练,腾讯发布高性能计算集群:整体性能提升3倍高性能4月14日,腾讯云发布新一代HCC(High-Performance Computing Cl
面向大模型训练,腾讯发布高性能计算集群:整体性能提升3倍 高性能

4月14日,腾讯云发布新一代HCC(High-Performance Computing Cluster)高性能计算集群。该集群采用腾讯云星星海自研服务器,搭载英伟达最新代次H800 GPU,服务器之间采用3.2T互联带宽,为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。

实测显示,腾讯云新一代集群的算力性能较前代提升高达3倍。去年10月,腾讯完成首个万亿参数的AI大模型:混元NLP大模型训练。在同等数据集下,将训练时间由50天缩短到11天,如果基于新一代集群,训练时间将进一步缩短至4天。

算力的突破无疑是此次腾讯发布大模型的亮点。腾讯云异构计算产品总监宋丹丹在接受澎湃新闻采访时曾透露,目前大模型处于训练需求的爆发期,行业需要的是可扩缩容的高性能算力,并且对算力的稳定性要求很高,必须能够稳定交付、稳定计算。

在生成式AI的布局方面,去年4月,腾讯已对外披露“混元”AI大模型的研发进展。据了解,混元AI大模型完整覆盖了NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业模型,目前,腾讯混元AI大模型,已经覆盖自然语言处理、计算机视觉、多模态等基础模型和众多行业、领域模型。

此前,腾讯多款自研芯片已经量产。其中,用于AI推理的紫霄芯片、用于视频转码的沧海芯片已在腾讯内部交付使用,性能指标和综合性价比显著优于业界。其中,紫霄采用自研存算架构,增加片上内存容量并使用更先进的内存技术,消除访存能力不足制约芯片性能的问题,同时内置集成腾讯自研加速模块,减少CPU等待时间。目前,紫霄已经在腾讯头部业务规模部署,提供高达3倍的计算加速性能,和超过45%的整体成本节省。

面向大模型训练,腾讯发布高性能计算集群:整体性能提升3倍

目前,腾讯云的分布式云原生调度总规模超过1.5亿核,并提供16 EFLOPS(每秒1600亿亿次浮点运算)的智算算力。未来,新一代集群不仅能服务于大模型训练,还将在自动驾驶、科学计算、自然语言处理等场景中充分应用。

值得注意的是,腾讯高管曾多次在公开场合谈到对生成式人工智能的布局。

此前在博鳌亚洲论坛2023年年会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生告诉澎湃新闻记者,腾讯正在研发类ChatGPT聊天机器人。

本文地址:https://sicmodule.kub2b.com/tnews/1180.html     企库往 https://sicmodule.kub2b.com/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

 
 
更多>同类生活信息

文章列表
相关文章
最新动态
推荐图文
生活信息
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号