欢迎访问天津地方网  今天是 2024年09月21日 星期六

当前位置: 首页 > 科技

智算网络创新技术论坛于2024年8月21日在南京召开

8月21日,由中国通信学会和华为技术有限公司联合主办的“第八届未来网络发展大会——智算网络创新技术论坛”在南京举行。来自中国通信学会、互联网企业、电信运营商、设备制造商、高等院校、科研院所等单位的200余名专家齐聚会场(线上直播累计观看量达28万人次),共同探讨智算网络的创新研究、应用实践、标准体制以及产业生态等。

中国通信学会副秘书长欧阳武出席会议并致辞。欧阳秘书长表示随着人工智能的快速发展与广泛应用,算力集群正在成为目前产业和技术发展的新热点、新趋势,随着AI模型规模的不断攀升,模型训练所需算力也同步增大,网络基础设施面临的挑战更加严峻。在智算中心,网络是连接CPU、GPU、内存等异构算力资源的关键,其性能对提升智算中心的整体算力水平具有绝对性的影响,网络的智能化及智算网络便成为新型基础设施的必然选择。希望通过本论坛引起更多深入的交流和启发性的讨论,形成政府和企业的合力,启发智算网络的技术创新思路,促进智算网络产业的良性发展。中国通信学会愿与产业界、科技界朋友一道,推动智算前沿技术的研发,推动产学研用深度融合,促进智算网络技术的创新发展。

华为网络技术实验室主任刘冰洋博士代表主办单位致辞,表示在过去一年多,面向AI大模型的智算网络技术快速发展,总线网络、以太网络的性能不断摸高,组网规模不断扩大。网络架构、协议、硬件、芯片都围绕着大模型的需求开展系统创新,并与计算组件垂直整合、协同优化,各种创新快速落地。相关的产业组织也如雨后春笋般发起,希望比标准组织更加快速和更加聚焦地推动智算网络技术的产业发展。去年最为火爆的是AI训练网络,大家把AI训练的各种并行模式、流量模型研究得非常细。今年以来,推理服务化的系统架构以其网络开始备受关注,相关的算法和架构快速迭代,成为研究和创新的新热点。本次论坛邀请了来自国内研究机构和ICT企业的顶尖专家学者,开放讨论智算网络技术和产业发展的趋势和关键问题,希望能够促成思维碰撞,凝聚共识,推动合作。

中国信息通信研究院云计算与大数据研究所所长何宝宏在《智算网络的几点观察与思考》主题演讲中,阐述了过去10年互联网/云让数据中心成了技术创新的制高点,现在AI又让数据中心成了算力中心,强调了高吞吐、大规模组网、高可靠及易运维等是智算网络的技术重点,并全面介绍了智算网络的产业新生态、标准研制以及国际合作进展。

清华大学助理教授章明星老师在《以KVCache为中心的LLM推理服务优化》主题演讲中,阐述了大模型时代,高并发场景下,数据供给速度成为计算智能的关键瓶颈,分析了大模型推理服务(MaaS)在系统层面的挑战,并详细介绍了以KVCache为中心的大模型推理架构——Mooncake。

阿里云资深网络架构师席永青在《阿里云可预期智算集群架构HPN7.0》主题演讲中,表示传统网络集群设计不再适用AI计算,强调网络性能与高可靠系统是集群算力的两大关键要素,并详细介绍了阿里云为AI设计的高性能网络架构——HPN7.0,最后展望了未来的AI基础设施网络架构,包括scale up加scale out融合设计、面向训推一体的数据中心架构等。

腾讯自研DPU网络架构杨洁伟在《DPU助力AI大模型网络突破极致性能》主题演讲中,深刻分析了AI大模型对网络的需求及挑战, 分享了腾讯AI大模型集群底座——星脉网络、实现算力卸载同时提高算力效率的自研DPU架构及产品,并展望了星脉2.0网络技术,包括深度融合网卡升级、交换机升级、网络能力升级以及GPU高速互联接口等。

华为数据通信标准专利部部长朱科义在《华为星河AI网络拥抱智能未来》主题演讲中,分析了AI对数据通信网络带来的新挑战,介绍了华为星河AI网络关键技术栈、实践案例以及在标准学术组织的研讨进展,呼吁面向智能时代的高效算力承载目标网共聚产业共识,一起携手推进智算网络新标准、共筑智算网络新生态。

中国电信研究院网络技术研究所副所长雷波在《关于云网融合下的智算基础设施的几点思考》主题演讲中,表示大模型时代需要构建新型智算基础设施,重点阐述了云网融合智算基础设施架构设想与实践,从提升单节点计算密度、多计算节点合一、计算和网络资源统一分配三个角度打造具有泛在接入、高速、确定性承载能力、多要素聚合的智算基础设施,为AI发展提供强大的能力底座。

中科院计算所高性能计算机研究中心主任谭光明在《面向科学智能的高性能网络系统优化》主题演讲中,分析了面向科学智能,传统超算出现了一些新的算法、模型上的变化,主要体现在通过AI技术加速计算建模的求解以及相应的迭代过程,重点分享了其团队在高性能网络系统优化的研究内容及优化效果,并介绍了高通量以太网联盟的愿景与发展理念。

清华大学李丹教授在《大规模智算网络关键技术研究》的主题演讲中,介绍了智算网络的研究工作意义与重要性、国内外现状与发展趋势,重点分享了其团队的研究工作概况,包括智算网络拓扑结构、传输调度、并行策略、仿真寻优等,最后介绍了后续拟开展的研究工作——高联算比智算中心网络。

华为网络技术实验室技术专家任首首在《AI智算网络挑战与关键技术研究》的主题演讲中,分析了未来智算网络规模越来越大,MoE、多租多任务等趋势使得流量特征更加复杂,当前主流RDMA技术的lossless和lossy两条路线在智算场景下所面临的关键技术挑战,重点介绍了数控分离DCP(Data&Control Partition)架构,该架构对控制信息和数据信息采用不同传输策略,通过端网协同方式,高效结合lossless和lossy路线各自优势,使能更低成本、更大范围、更高性能的下一代传输系统与协议。

本次论坛由华为网络技术实验室技术专家陈哲主持。

通过本次论坛,演讲嘉宾们深刻剖析了AI大模型的发展趋势以及对网络提出的关键需求与挑战,介绍了在智算网络上的一些关键基础架构创新以及协议方面创新,分享了面向AI大模型的智算网络部署实践、标准研制、产业生态以及国际合作等方面的进展。

AI主题演讲南京市集群 新浪众测 新浪众测 新浪科技公众号 新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

相关新闻
本文来源于网络,不代表天津地方网立场,转载请注明出处
我要收藏
0个赞
转发到:
腾讯云秒杀
阿里云服务器