您好,欢迎来到报告网![登录] [注册]

中国工程院院士郑纬民:持续优化数据存储结构

  近日,在2024 Inclusion·外滩大会上,中国工程院院士、清华大学计算机科学与技术系教授郑纬民接受上海证券报记者专访表示,人工智能将对经济发展和人民生活水平提高发挥着越来越大的作用。人工智能发展离不开三个要素,分别是数据、算法、算力。算力扩容,除加强基础设施建设外,还应该千方百计扩大存储。建议人工智能企业通过不断优化数据存储结构应对算力挑战。

  郑纬民认为,大模型需要大算力,也需要大存储,但相应会导致大成本,“大模型生命周期的每一个环节都与存储系统有关。分布式技术又存在于大模型生命周期的每一环,建议优化内部存储结构,向存储要算力”。

  郑纬民分析称,比如在数据获取阶段,大模型训练需要收集海量多模态小文件,任一模态的数据集包含多达数亿至数百亿小文件,对文件系统元数据管理提出挑战。在数据处理阶段,频繁、随机的小样本读取等海量数据处理也对底层大数据处理框架提出挑战。模型训练阶段,检查点文件读写对存储系统读写提出挑战。在模型推理阶段,模型参数和中间结果KVCache对内存系统容量和传输速度提出挑战,中间结果KVCache往往要占据更多存储空间。

VIP专享文档

扫一扫,畅享阅读

我要投稿 版权投诉
  1. 标签 存储
  2. 机构、内容合作请点这里: 寻求合作>>
存储行业标签

飒舛**寒i

该用户很懒,什么也没介绍!

关注 私信

报告咨询

  • 400-817-8000全国24小时服务
  • 010-5824-7071010-5824-7072北京热线 24小时服务
  • 059-2533-7135059-2533-7136福建热线 24小时服务

如您想投稿,请将稿件发送至邮箱

seles@yuboinfo.com,审核录用后客服人员会联系您

机构入驻请扫二维码,可申请开通机构号

Copyright © 2024 baogao.com 报告网 All Rights Reserved. 版权所有

闽ICP备09008123号-13