1. 中国移动通信集团设计院有限公司
2. 中国移动通信集团设计院有限公司内蒙分公司
Published:2026
移动端阅览
孙傲, 武振宇, 田雯, et al. 面向多模态大模型训练的算力与存储配比优化方法研究[J]. 2026, 39(1): 22-30.
DOI:
孙傲, 武振宇, 田雯, et al. 面向多模态大模型训练的算力与存储配比优化方法研究[J]. 2026, 39(1): 22-30. DOI: 10.13992/j.cnki.tetas.2026.01.006.
本文旨在解决多模态大模型训练场景中存储资源配置不合理导致的资源浪费与效率瓶颈问题,通过优化算力存储协同机制以提升训练效率,降低建设成本。研究提出一种两阶段存储层级优化算法,基于对训练数据、模型参数等多类数据读写特征的分析,建立数据量测算模型,并结合不同模态任务配置动态微调算存比在某智算集群上展开试验,结果表明,该方法较业界经验法缩短训练时长18%,减少存储浪费26%,实现多模态与单模态场景下算力与存储的精准协同配置,有效提升资源利用率与训练效率。
程振京,汪璐,程耀东,陈刚,胡庆宝,李海波.面向高能物理分级存储的文件访问热度预测[J].计算机工程,2021(02).
冯杨洋,汪庆,谢旻晖,舒继武.从BERT到ChatGPT:大模型训练中的存储系统挑战与技术发展[J].计算机研究与发展,2024(04).
葛旭冉,欧洋,王博,赵宇,吴利舟,王子聪,陈志广,肖侬.大语言模型推理中的存储优化技术综述[J].计算机研究与发展,2025(03).
0
Views
下载量
CSCD
Publicity Resources
Related Articles
Related Author
Related Institution