• 张量积注意力(TPA):让注意力机制飞得更高、跑得更快的秘密武器

    张量积注意力(TPA):让注意力机制飞得更高、跑得更快的秘密武器
  • Ghost in the Minecraft:突破莫拉维克悖论,通用人工智能取得重要突破!

  • GPT的运用和训练

  • 斯坦福最新Sophia优化器比Adam快2倍

  • QLoRA: 高效Finetuning 量化 LLMs

人生梦想 - 关注前沿的计算机技术 acejoy.com 🐾 步子哥の博客