这份专利围绕AI模型训练相关技术,而闪存存储以往普遍被认为并不适配模型训练工作。
闪迪能够提交这份专利,核心是抓住了技术路径突破口:该专利并不覆盖完整大模型全量训练流程,仅针对LoRA低秩适配微调方案,这套技术方案能让模型绝大多数参数全程保持静态不变。
整套技术逻辑不需要重新完整训练整个大模型,而是冻结主模型全部权重,仅单独训练外接的小型附加适配模块,被冻结的主模型参数在整个微调流程里不会发生任何改动。
闪迪的核心技术洞察:如果大模型主体权重全程固定不变,就无需使用成本高昂的高速内存持续存放,只需要反复读取调用即可。
重复读取数据的工作,恰好是低成本闪存存储完全能够胜任的任务。
隐藏内容
此处内容需要权限查看
会员免费查看
1、本站部分资源源自互联网,如内容存在侵权行为或未标明出处的情况,您可通过邮箱 meiritouyan@qq.com 与我们联系,我们将尽快进行处理。
2、如遇本站资源无法下载、无法查看,请及时联系我们,我们将第一时间修复。
