GPT-4 “认为” 我们的开源版对话模型达到了ChatGPT 90%的性能 —— Vicuna 开发深度经验分享

 ✒️ @halomaster 📅 01 Apr 2023, 01:06 GMT⋮ 【AI】 

https://zhuanlan.zhihu.com/p/618389519


[1] @halomaster • 01 Apr 2023, 01:46 GMT 
300美元平替ChatGPT!UC伯克利领头,130亿参数「小羊驼」诞生,暴杀「草泥马」 https://zhuanlan.zhihu.com/p/618493405


[2] @halomaster • 01 Apr 2023, 03:11 GMT 
大语言模型调研汇总 https://zhuanlan.zhihu.com/p/614766286?utm_medium=social&utm_oi=27383344136192&utm_psn=1625454482556510208&utm_source=ZHShareTargetIDMore


[3] @halomaster • 02 Apr 2023, 06:58 GMT 
大型语言模型(LLM)的快速发展彻底改变了聊天机器人系统,产生了前所未有的智能水平,如OpenAI的ChatGPT所示。然而,尽管其性能令人印象深刻,但 ChatGPT 的培训和架构细节仍然不清楚,阻碍了该领域的研究和开源创新。受Meta LLaMA和斯坦福羊驼项目的启发,我们推出了Vicuna-13B,这是一款开源聊天机器人,由增强的数据集和易于使用的可扩展基础架构提供支持。通过根据从 ShareGPT.com 收集的用户共享对话微调LLaMA基础模型,Vicuna-13B与斯坦福羊驼等其他开源模型相比,表现出了有竞争力的性能。这篇博文提供了对Vicuna-13B性能的初步评估,并描述了其培训和服务基础设施。我们还邀请社区与我们的在线演示互动,以测试此聊天机器人的功能。 https://vicuna.lmsys.org/


1 of 1 pages  3 replies