更新时间:2021-12-27 09:55:29
微软首次推出全球最大的AI语言模型Turing-NLG
微软已经发布了其AI语言模型的私人演示,声称它包含了170亿个庞大的参数,使其成为同类产品中最大的公开模型-大约是Nvidia的Megatron的两倍。据说,被称为图灵自然语言生成(T-NLG)的微软模型不仅在各种语言建模基准上优于自然语言处理(NLP)的其他现代先进AI培训模型,而且该公司声称:“在应用于许多实际任务(包括摘要和问答)时表现出色”。
据说T-NLG演示仅向学术界的一小部分用户发布,用于初步测试和反馈,目的是展示该软件的自由格式生成,问题回答和摘要功能。这是一项名为Project Turing的更大计划的一部分,该计划是Microsoft的应用研究部门,致力于将用于文本和图像处理的深度学习模型整合到公司的硬件和软件产品(包括Bing,Office和Xbox)中。
像许多其他NLP模型一样,T-NLG也是基于Transformer的生成语言模型,这意味着它不仅可以生成单词以完成未完成的句子,还可以生成问题的直接答案并汇总整个文档。实际上,该公司表示,它最适合训练大型集中式多任务模型,因为“模型越大,预训练数据越多样化和全面,即使在较少的情况下,它也能更好地推广到多个下游任务培训示例”。
微软在解释其专有的NLP技术的好处时说,其新技术可以为公司及其客户提供新的机会。微软AI研究科学家科比·罗塞特(Corby Rosset)表示:“ T-NLG通过向作者提供写作帮助并回答读者可能对文档提出的问题,可以增强Microsoft Office套件的体验。此外,它为更流畅的聊天机器人和数字助理铺平了道路。”