智源推出飞智大模型技术开源体系,包含FlagAI、FlagPerf等六大模块

收藏
关键词: 推出
资讯来源:DeepTech深科技
发布时间: 2023-03-07



以 ChatGPT 为代表的大模型的出现,推动人工智能迎来了全新的发展浪潮,也引发了后者在技术范式上的变革。作为一种体系化的技术路径,其背后少不了算法、算力和数据的支撑。


在此发展背景下,要想更好地提升大模型技术的创新能力,不仅要扎实推进基础设施的建设以及大模型应用的开发和普及,更要构建开源开放的生态格局。


北京智源人工智能研究院(以下简称“智源”) 是一家人工智能领域的非盈利性质的新型研发机构,也是研究中国大模型的科研机构。


为加速大模型方向的协同创新,智源于近日发布 FlagOpen(飞智)大模型技术开源体系,其主要包括 FlagAI、FlagPerf、FlagEval、FlagData、FlagBoot 和 FlagStudio 六个部分。


全新推出大模型技术开源体系,赋能中国大模型技术创新能力提升   


(一)FlagOpen(飞智):大模型技术开源体系


FlagOpen 是智源与多家产学研单位共同构建的大模型开源开放软件体系。为了更好地推动大模型软硬件生态的建设,该体系包括算法、模型、工具、评测等多个部分,目标要支持多种深度学习框架和 AI 芯片。 


图丨FlagOpen(飞智)大模型技术开源体系(来源:资料图)


据介绍,FlagOpen 能够降低大模型开发的难度,助力全球开发者开展各种大模型的开发和研究工作,让更多的开发者以开源开放的方式,进行自由探索和协同创新。


据悉,未来 FlagOpen 也将为全球 AI 企业和机构,提供 AI 大模型软件发行版本、平台、商业化软件构建方面的支撑。(FlagOpen 开源平台入口:https://flagopen.baai.ac.cn)


(二)FlagAI :大模型算法、模型及工具一站式开源项目


对于算法开发人员来说,其总会面临在浩瀚的开源世界中寻求质量较高、值得信任的算法的需求,也会在集合不同的优化技术工具时,遭遇算法和开源的其他工具无法匹配的问题,这会给其正常高效的工作开展造成不可小觑的影响。


作为一个能够提高大模型开发效率的工具,FlagAI 集合了全球最主流的大模型算法技术和多种加速优化的技术,赋能模型开发的高效训练和有针对性的细节调整。


目前,FlagAI 已经集合了语言大模型 OPT、视觉大模型 ViT、Swin Transformer 等多种国内外主流大模型算法,也包括智源自己的“悟道”大模型 2.0、3.0 等重要模型。此外,FlagAI 已加入 Linux 基金会。


(三)FlagPerf:面向多种 AI 硬件的一体化评测引擎


快速高效地对 AI 软硬件进行适配和评测,解决目前其面临的兼容性差、技术栈异构程度高等问题,是建设 AI 生态的关键环节。


作为面向多种AI硬件的一体化评测引擎,FlagPerf 目标是支持多种芯片和深度学习框架,构建专业且不断迭代的评测体系,赋能 AI 产业生态的发展和繁荣。


目前,FlagPerf 已经联合天数智芯百度 PaddlePaddle、昆仑芯科技、中国移动等企业开展 AI 硬件评测建设的工作。


(四)FlagEval:多领域、多维度的基础大模型评测开源项目


为推进大模型研发的落地,以及对生成任务的客观评价,智源构建了大模型评测工具开源项目 FlagEval,希望未来能够满足多维度、多模态领域的全面评测。


FlagEval 首先开放的是多模态领域——CLIP 系列模型评测工具,是业内首个完整支持多种语言、多种评测难度和任务的文-图跨模态评测工具。之后还将发布更多不同领域和维度的评测工具。


(五)FlagData:开箱即用、易于扩展的数据工具开源项目          


基于过去四年来的不断积累,智源研究院着手数据建设工作,构建了 WuDaoCorpora 语料库,同时开发了一批数据处理的工具。


因此,为了更好地搜集、清理和整理数据,使其能够呈现一种标准可用的状态,是亟需面对和解决的关键。


FlagData 正是在此需求之下应运而生的一款数据工具,其包括清洗、标注、压缩、统计分析等功能在内,能够帮助大模型开发团队完成高质量的数据处理,进而优化和提升大模型的质量。


当下的 AIGC 只是冰山上的小小一角   


在不知不觉中,人工智能已经走过了多年的发展历程。2022 年以来,利用人工智能技术来生成内容(AI Generated Content,AIGC)的蓬勃发展态势,让越来越多的人看到,因大模型的推进而不断派生出的 AI 落地和普及发展的可能性。


在林咏华看来,目前我们正在走由大模型技术推动的向 AIGC 元年,全球范围内尤其是中国的很多企业和团队都纷纷尝试打造自己的 AIGC 应用,也在陆续出现很多类 ChatGPT 的产品模型。


“但是大家所看到的只是冰山浮在水面的部分。要打造 AIGC 的能力,无论是文生图还是 ChatGPT 的能力,都离不开水面之下大模型很厚的全栈技术。”林咏华表示。


具体来说,文生图和 ChatGPT 等应用都离不开强大的语言预训练大模型、视觉基础大模型、图文基础大模型等作为支撑的重要基座。


“大模型只是 AI 从一个高技术领域转入普及的全民应用的代表性产品,远非 AI 技术生态的全部。”北京智源人工智能研究院院长黄铁军表示,如果把开发出的大模型比作能够发电的发电机,那么发电机和能够作为产品和服务走入千家万户的电力相比,“还存在着很长的距离”。


此外,不断提高为 AI 系统的高效运行做支撑的算力,以及构建客观公正的大模型的评价方法,也是推进 AIGC 向前发展的不可或缺的重要环节。


基于此,智源致力于从上述层面出发,集合打造一款包括以上核心内容的技术体系,因此也就有了这次 FlagOpen 大模型技术开源体系的诞生。


“开源本质上是一个大家共建并持续发展的过程。我希望大家共建的开源开放体系,在将来做 AI 的产品或者 AI 的服务时能够用上。”黄铁军表示。


推进大模型持续创新   


作为一种深度学习新范式,预训练模型在经过大量的数据训练之后,可以执行语言理解、图片处理等特定的任务。而大模型,正是预训练模型的代称,这一词语由智源于 2021 年率先提出,后成为学界和业界约定俗成的术语。


近年来,智源始终坚持不懈地走在推进大模型持续创新的发展道路上。其于 2020 年启动了大模型研究的战略方向,完成了大模型攻关团队的搭建。


2021 年 3 月,其推出已经完成了百亿和千亿参数规模预训练的超大规模智能模型“悟道 1.0”。


经过联合攻关,智源又于 2021 年 6 月发布了拥有 1.75 万亿参数量的“悟道 2.0”。


对于“悟道”项目来说,林咏华认为其最重要的意义是帮助锻造了当前中国大模型研究领域的中坚力量。“在过去的两年,我们不断地投入、支持’悟道’大模型研究项目,帮助中国培养了一批大模型的创新团队和研究者。”她说。


据介绍,2022 年以后,智源在大模型上的发展朝着更深、更宽的方向迈进。智源不仅致力于“悟道 3.0”向视觉、文图等多模态领域发展,并通过 FlagOpen 这样的开源体系的建设,推动开放创新。此外,其也将组织和承担科技部 2030 人工智能旗舰项目“人工智能基础模型支撑平台与评测技术。