报告丨甲子光年：2024人工智能开源大模型生态研究

AI芯天下方文三

2024-07-01

当下正处于第四阶段，这一阶段从2020年开始，代表性事件是GPT-3的发布，突破了以往模型在自然语言处理领域的限制，为语言模型的进一步发展提供了强有力的基础，也为实现智能化的语言交互和人机对话打开了全新的可能性，是人工智能发展的一个关键节点。

大模型的发展开启了AIGC时代，没有大模型的AI已经是上一代的AI，缺乏竞争力的AI；

技术是AI每次革命性发展的起点，商业应用是发展的加速器，AI的持久发展看商业落地。

人工智能技术进化出七大核心能力，实现从“解放四肢”到“解放大脑”的升级。

第一阶段AI以逻辑推理为主，AI能力主要聚焦决策和认知；

第二阶段AI注重概率统计的建模、学习和计算，AI能力开始聚焦感知、认知和决策；

第三阶段AI聚焦学习环节，注重大模型的建设，AI能力覆盖学习和执行；

第四阶段则聚焦执行与社会协作环节，开始注重人机交互协作，注重人类对人工智能的反馈训练。

鹏程·盘古模型是全球首个全开源2000亿参数的自回归中文预训练语言大模型，在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出。

文心大模型ERNIE是百度发布的产业级知识增强大模型，涵盖了NLP大模型和跨模态大模型。2019年3月，百度开源了国内首个开源预训练模型文心ERNIE 1.0，此后在语言与跨模态的理解和生成等领域取得一系列技术突破，并对外开源与开放了系列模型，助力大模型研究与产业化应用发展。

通义千问的大语言模型已经实现全尺寸开源——包括18亿、70亿、140亿、720亿7个参数，不同规模和尺寸的模型，可拓宽应用场景。

针对大模型技术，国内企业与欧美国家存在差距，主要体现在底层架构设计和硬件技术方面。在底层架构设计方面，国内尚无类似的底层架构，大模型的预训练方面只能“在别人的地基上盖房子”。

在硬件技术方面，美国占据绝对领先地位，我国自研能力不足，对美国进口依赖程度高，存在“卡脖子”风险。

以下是《2024人工智能开源大模型生态研究》部分内容：

640 (1).png

责编：高蝶

免责声明：凡注明为其它来源的信息均转自其它平台，由网友自主投稿和发布、编辑整理上传，对此类作品本站仅提供交流平台，不为其版权负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。若有来源标注错误或侵犯了您的合法权益，请作者持权属证明与本站联系，我们将及时更正、删除，谢谢。联系邮箱：gaochanggong@szw.org.cn

今日头条号

搜狐号

订阅号

服务号

报告丨甲子光年：2024人工智能开源大模型生态研究