文心大模型最新进展和前沿成果在深圳发布

作者:网络 来源:欧博 2024-04-19   阅读:

深圳新闻网是立足深圳、辐射全国的综合性区域门户网站,为用户提供新闻、视频、博客、房产、汽车、财经、健康、美食、旅游、教育、时尚、娱乐、交友等20多个频道,

深圳新闻网2024年4月17日讯(深圳特区报记者 周雨萌)当前,AI正以肉眼可见的速度掀起一场创造力革命。

不会写代码,可以做出一个AI应用?不用编程,也可以做出一个智能体?只要会说话,就可以成为一名开发者?

答案是肯定的!

昨日,Create 2024百度AI开发者大会在深圳举办,当天现场汇聚了超过5000位开发者和科技爱好者。百度创始人、董事长兼首席执行官李彦宏发表了题为《人人都是开发者》的主旨演讲。演讲中,他公布了文心大模型的最新进展和前沿成果,发布了1个基础模型系列和三大AI开发工具,分享了开发AI原生应用的具体思路,为人们呈现出一幅“AI触手可及”的美好蓝图。

改变思路 开发应用就像拍短视频

李彦宏开宗明义:“过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者。”

因为大模型和生成式AI正在改变开发者这个群体。有了强大的基础大模型,有了很多低门槛,甚至零门槛的开发工具,就使得开发者的生产力大大提高。

会上,百度发布了1个强大的基础模型系列——文心大模型系列,李彦宏强调,大模型本身并不直接创造价值,基于大模型开发出来的AI原生应用才能满足真实的市场需求。

从去年3月16日百度文心一言大模型发布以来,已经进化到4.0版本,推理性能提升了105倍,推理的成本降到了原来的1%。通过不断进化的文心一言,李彦宏提出了开发AI应用的三大思路,分别是MoE、小模型和智能体。MoE是指大小模型的混用,即不要依赖一个模型来解决所有问题;小模型的优势则是推理成本低、响应速度快,在一些特定场景中,经过精调后的小模型可以媲美大模型;智能体可以像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。随着智能体能力的提升,未来会不断催生出大量新的应用。

“AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单。”李彦宏说,“人人都可以成为开发者,人人都是创造者,未来,也必将是一个由开发者一起创造出来的未来。”

三大神器 让AI应用开发更简单

同时,百度还发布了基于大模型来开发各种AI应用的三大工具:智能体开发工具AgentBuilder、无代码编程工具AppBuilder和模型定制工具ModelBuilder,它们代表了先进生产力,也被称为“开发AI应用的三大神器”。

在智能体开发工具AgentBuilder的帮助下,现场迅速生成了新加坡旅游局的智能体,全程无需代码,用自然语言几句话就能创建一个智能体,整个过程不超过5分钟,其可以提供旅游方案、解答问题,以及酒店门票预订服务等;如果再把新加坡百科词条和官网链接都添加到知识库里,它还能每天自动更新,成为一个更加专业的智能体。除了新加坡之外,大连、沈阳等文旅类智能体也都在文心智能体平台上线,还有知识类、创作类、学习类、娱乐类等各式各样的智能体,这些都是用AgentBuilder做出来的。

除了智能体工具,第二大神器——AI原生应用开发工具AppBuilder则能做到用自然语言三步就开发出一个应用。《周处除三害》的漫画,很快就在现场由AppBuilder生成。

第三大神器——模型定制工具ModelBuilder,可以根据开发者的需求定制任意尺寸的模型,简单说就是让开发者用好大模型。据悉,在同等尺寸下,通过裁剪出来的模型比直接拿开源模型调出来的模型,效果更好,成本也更低。

李彦宏说,“这三大开发工具可以组成了一个工具箱,还可以马上打包带走,随取随用。”

面向未来 理解当下或可预测未来

有了强大的基础大模型,有了很多低门槛、甚至零门槛的开发工具,不仅开发者的生产力大大提高了,还会产生更多的AI原生应用、改变更多人的工作和生活。

“视觉大模型最大的应用场景是自动驾驶。”李彦宏以自动驾驶为例说道,基于超过1亿公里的中国复杂城市道路测试里程数据,百度训练出来了Apollo视觉感知大模型,具备检测、跟踪、理解、建图四大基础能力,让百度拥有了更智能、适应性更强、更安全的自动驾驶方案。目前,全球最大规模的车道级地图数据已经上线全国360座城市。

视觉感知,还只是AI在自动驾驶领域能做到的一部分,通过训练,AI甚至可能理解真实世界发生的事情并预测未来。

面向未来,基础模型发展的长期方向,将是文字、图片、语音、视频等多模态大模型的融合,而这,将是通往AGI(人工通用智能)的必经之路。

分享给小伙伴们:
如果本文侵犯了您的权利, 请联系本网立即做出处理,谢谢。
相关文章