您的位置:首页 >综合要闻 >正文

2024年06月11日快讯 Yandex开源大型语言模型训练工具YaFSDP

摘要 2024年06月11日转载:界面新闻网 6月11日消息,跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。YaFSDP可用于增强GP...

2024年06月11日转载:界面新闻网

6月11日消息,跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。YaFSDP可用于增强GPU通信并减少LLM训练中的内存使用量,与FSDP相比,其训练速度提升最高可达26%。YaFSDP方法目前已可以在Github上免费访问。

文章转载自:界面新闻网 非本站原创 如有问题可与站长联系!!!

版权声明:本文由用户上传,如有侵权请联系删除!