2024年06月11日快讯 Yandex开源大型语言模型训练工具YaFSDP
•
2024-06-11 18:01:17
摘要
2024年06月11日转载:界面新闻网
6月11日消息,跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。YaFSDP可用于增强GP...
2024年06月11日转载:界面新闻网
6月11日消息,跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。YaFSDP可用于增强GPU通信并减少LLM训练中的内存使用量,与FSDP相比,其训练速度提升最高可达26%。YaFSDP方法目前已可以在Github上免费访问。
文章转载自:界面新闻网 非本站原创 如有问题可与站长联系!!!
版权声明:本文由用户上传,如有侵权请联系删除!
标签: