Baize白泽开源聊天模型

 ✒️ @halomaster 📅 05 Apr 2023, 01:57 GMT⋮ 【AI】 

白泽是一个使用 LoRA 微调的开源聊天模型。 基于ChatGPT自我对话生成的高质量数据训练而来的。通过让ChatGPT自我对话生成多轮对话的“数据集”,研究者训练出了强大的语言模型,并开源了全部代码和数据集。Baize包括四种英语模型和一个垂直领域的模型,供研究和非商业用途使用。研究者还提出了一种自动收集ChatGPT对话的流水线,通过从特定数据集中采样“种子”的方式,让ChatGPT自我对话,批量生成高质量的多轮对话数据集。通过这种方法,研究人员收集了5万条左右的高质量问答语料,并已全部开源。 已经发布了 7B、13B 和 30B 型号。 https://github.com/project-baize/baize


[1] @halomaster • 05 Apr 2023, 01:57 GMT 
可惜是非商用模型。


1 of 1 pages  1 replies