度小满牵手哈工大研发SmartTrim加速多模态大模型布局

文章来源：网络发布时间：2024-09-03 16:39 点击量：6181

如今，随着大模型在金融领域不断落地，如何创新前沿前沿技术，让大模型技术深度赋能金融行业，是度小满多年来重点关注的一个研究方向。对此，度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法——SmartTrim，通过对技术方面的创新展开对大模型领域的持续布局。

SmartTrim精细化剪枝策略大幅提升计算效率

在视觉语言大模型的研究和应用中，高计算成本一直是制约其广泛部署的主要障碍。近日，哈尔滨工业大学联合度小满共同研发出一种创新的自适应剪枝算法——SmartTrim。该算法针对多模态大模型的冗余计算进行有效削减，实现了显著的效率提升，相关研究成果已被国际自然语言处理领域顶级会议COLING 24接收。

据介绍，SmartTrim技术的核心在于其自适应剪枝能力，通过分析模型中每层的token表示和attention head的冗余性，智能识别并剪除不必要的计算负担。这一过程中，SmartTrim不仅考虑了token在单一模态序列中的重要性，还特别强调了跨模态交互中的关键作用。通过这种精细化的剪枝策略，SmartTrim能够在保持模型性能的同时，大幅提升计算效率。

在基于 VQA 微调的 METER 的跨模态编码器中，层内不同 token和 attention head(下)表示的相似性。

SmartTrim框架的实施涉及两个关键组件:跨模态感知的Token修剪器和模态自适应的注意力头修剪器。Token修剪器利用多层感知器结构，智能地识别并去除那些对于当前层不重要的Token。这一过程不仅考虑了Token在文本或图像序列中的独立重要性，还综合了它们在跨模态交互中的贡献。注意力头修剪器则直接集成在模型的自注意力模块中，评估并修剪那些冗余的注意力头，从而优化了模型的计算效率。

SmartTrim 框架结构图

在训练SmartTrim模型时，研究人员采用了一种结合任务相关目标和计算开销目标的双重优化策略。通过重参数化技巧，解决了不可导二值mask的问题，实现了模型的端到端训练。此外，自蒸馏和课程学习策略的引入，进一步提高了剪枝后模型的性能，确保了训练过程的稳定性。

SmartTrim是度小满大模型研究的重要里程碑

度小满多年来持续加强对各项前沿科技的布局，尤其在大模型方面展开了积极的研究和探索，在这一领域积累了丰富的技术经验。继推出SmartTrim技术后，度小满还将继续加快对大模型技术的布局，推动各项创新技术在金融各大场景中落地应用，为金融行业创新发展注入活力。

声明：本网转发此文章，旨在为读者提供更多信息资讯，所涉内容不构成投资、消费建议。文章事实如有疑问，请与有关方核实，文章观点非本网观点，仅供读者参考。