• 张量积注意力(TPA):让注意力机制飞得更高、跑得更快的秘密武器

    张量积注意力(TPA):让注意力机制飞得更高、跑得更快的秘密武器
  • 评估大型语言模型在多智能体协作环境中的协调能力

  • BianQue: 平衡LLMs的问询与建议能力,通过ChatGPT打磨的多轮健康对话

  • 神经代码生成:通过链式思维推动轻量级语言模型的发展

  • 激活函数 SiLU 和 Swish 的区别

人生梦想 - 关注前沿的计算机技术 acejoy.com 🐾 步子哥の博客