OneFlow和寒武纪达成适配,推进超大模型训练方案
  • 作者:一流科技
  • 发表时间:2021-05-11 18:54
  • 来源:OneFlow社区

​近日,一流科技OneFlow深度学习框架正式和寒武纪思元270智能芯片及加速卡达成适配。这一合作达成,标志着OneFlow新一代深度学习框架的生态进一步得到完善,与新兴AI芯片进一步融合。

 

 
目前,OneFlow 通过集成寒武纪的高性能机器学习库,已经支持主流神经网络算子,并能支持在各类应用场景下的模型部署,如分类、检测、分割、风格转化等模型。下一步,双方将持续深化合作,以“大规模分布式”为目标,积极探索OneFlow深度学习框架和寒武纪其他产品的打通,丰富训练模型和应用场景。
 
一流科技的OneFlow深度学习框架被称为“新一代深度学习框架”,其核心优势在于用几行代码就可以完成其他主流框架需要深度定制才能做到的“超大规模分布式模型训练”。

OneFlow秉承“效率为王”的开发理念,拥有完全自主知识产权,所有代码全部自研。其独创的自动数据模型混合并行、静态调度、去中心化和全链路异步流式执行四大核心技术,使用纯软件技术完美地解决了大数据、大模型、大计算所带来的异构集群分布式横向扩展挑战,技术水平世界领先。在2020年5月由中国信通院发布的《首轮开源深度学习软件框架测试报告》中,在同样的算法和硬件条件下,OneFlow深度学习框架性能指标大幅领先国外主流框架。
 
寒武纪思元270集成了寒武纪在芯片架构领域的一系列创新性技术,基于16nm先进工艺制造,处理非稀疏深度学习模型的理论峰值性能提升至上一代MLU100的4倍,达到128TOPS(INT8),同时兼容INT4和INT16运算,理论峰值分别达到256TOPS和64TOPS,并支持浮点运算和混合精度运算。
 
思元270采用寒武纪自研的MLUv02指令集,可支持视觉、语音、自然语言处理、传统机器学习等高度多样化的人工智能应用,同时集成了面向视觉应用的视频和图像编解码硬件单元。在系统软件和工具链方面,思元270继续支持寒武纪Neuware软件工具链,方便开发者更好地挖掘思元270的运算能力和开拓更多的应用领域。
随着数据量级的增长,超大模型训练已经成为业界共同的诉求。对于此次合作,一流科技CEO袁进辉表示:“寒武纪是新兴人工智能芯片的领军企业之一,很高兴双方可以达成合作。超大模型训练不是单一技术可以解决的问题,需要算法、算力、数据“三驾马车”的齐头并进,所以软件和硬件的结合非常重要。OneFlow作为新一代深度学习框架,从诞生之初就以“大模型分布式”作为设计理念,我们希望通过和像寒武纪这样优秀的硬件合作伙伴共同进行生态建设,来满足开发者和算法科学家对超大模型的应用需求,加快企业数据资产转化,促进人工智能应用场景落地。”
 
寒武纪副总裁刘道福表示:“寒武纪做芯片的最终目的是支撑客户以及开发者开发应用,构建完整的生态。寒武纪自成立起就一直秉承开放的理念,与产业链上下游通力合作,共同促进整个AI产业的生态繁荣。此次与一流科技完成MLU270的软硬件适配,既契合了寒武纪的开放生态战略,又将进一步赋能寒武纪云边端一体、软硬件协同、训练推理融合的新生态,寒武纪将携手一流科技以及各行各业为整个AI行业贡献更大的动能。”