彭博推出BloombergGPT

 ✒️ @halomaster 📅 01 Apr 2023, 14:05 GMT⋮ 【AI】 

彭博今日发布了一份研究报告,详细介绍了彭博GPT(BloombergGPT)的开发情况,这是一种新型的大规模生成式AI模型。该模型是基于特定的金融数据训练的大型语言模型(LLM),旨在支持金融行业内多样的自然语言处理(NLP)任务。基于LLM的AI已在许多领域中展示了令人兴奋的新应用,然而,由于金融领域的复杂性和独特术语的存在,该领域需要一种特定领域的模型。BloombergGPT代表了为金融行业开发和应用这种新技术的第一步,该模型将协助彭博改进其现有的金融NLP任务,如情感分析、命名实体识别、新闻分类和问答等。此外,BloombergGPT还将为彭博终端上的大量数据提供新的机会,以更好地帮助公司的客户,并将AI的全部潜力带入金融领域。 在过去的十多年中,彭博一直是金融领域应用人工智能、机器学习和自然语言处理技术的先锋。现在,彭博支持大量多样化的NLP任务,并且这些任务将受益于新的财经感知语言模型。彭博的研究人员开创了一种混合方法,将金融数据与通用数据集相结合,训练出一个在金融基准上取得最佳成绩的模型,同时在通用LLM基准上保持竞争力。为了实现这一里程碑,彭博的机器学习产品和研究团队与公司的AI工程团队合作,构建了迄今为止最大的领域特定数据集之一,利用公司现有的数据创建、收集和策划资源。作为金融数据公司,彭博的数据分析师在过去的40年里收集和维护了金融语言文件。团队从这些丰富的金融数据中提取,创建了一个包含英文金融文件的3630亿标记数据集。该数据集与一个3450亿标记的公共数据集相结合,创建了一个超过7000亿标记的大型训练语料库。团队利用部分训练语料库,训练了一个具有500亿参数的仅解码器的因果语言模型。生成的模型在现有的针对金融的NLP基准、一套彭博内部基准以及来自热门基准的通用NLP任务的广泛类别(如BIG-bench Hard、知识评估、阅读理解和语言任务)上进行了验证。值得注意的是,在金融任务上,BloombergGPT模型在很大程度上优于类似规模的现有开放模型,同时在通用NLP基准上表现相当或更好。


0 replies