• 张量积注意力(TPA):让注意力机制飞得更高、跑得更快的秘密武器

    张量积注意力(TPA):让注意力机制飞得更高、跑得更快的秘密武器
  • 用注意力机制提升文本匹配:FA 和 SFA 模块详解

  • PRETTY: 一种无需训练的跨语言大型语言模型对齐方法

  • SiLU 激活函数:深度学习中的新星

  • 通过上下文多样化提高生成式常识推理的多样性

人生梦想 - 关注前沿的计算机技术 acejoy.com 🐾 步子哥の博客