从文心一言看百度在AI领域的布局及发展策略
数字经济时代,随着数据、算力、算法的加速发展,让人工智能技术落地千行百业从理论变成了现实。
“中国版ChatGPT”文心一言的发布,将加速国内生成式AI模型的落地应用
近日,百度发布新一代大语言模型、生成式AI产品文心一言(ERNIEbot)。
据李彦宏介绍,文心一言是基于百度2019年自研的通用大模型ERNIE及PLATO预训练对话生成模型而成,训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。因此,文心一言具备文学创作、商业文案创作、数据逻辑推理、中文理解、多模态生成等众多功能。
作为中国科技大厂发布的首个大模型产品,文心一言被誉为“中国版的ChatGPT”。
和GPT-3.5(ChatGPT的原模型)、GPT-4相比,在常识和创作类问题中,三大模型均能正确回答客观常识类问题;在归纳和推理类问题中,文心一言在演绎推理、逻辑推理等领域表现略逊于GPT系列模型;在数学和代码类问题中,GPT-3.5有更好的数学能力表现,文心一言代码问题识别能力有待加强;在应用场景测试中,三大模型均能较好地完成AI生活助手、售后客服、产品推荐、办公场景文本生成等任务,但在在情感推理类问题中仍有提升空间。
文心一言与ChatGPT比较情况
资料来源:百度
在发布会上,李彦宏直言:“目前百度是全球大厂中第一个做出对标ChatGPT产品的企业,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理等需要多年的坚持和积累,没法速成。业界对文心一言的期望值是对标ChatGPT,甚至要对标GPT-4,这个门槛还是很高。”
值得一提的是,百度文心一言的发布不是通过现场演示而是通过事前录屏的方式通过PPT来介绍的,并且发布会后该产品也并未对外直接开放,因此导致公众的体验和反馈效果不佳。
不过,文心一言作为国内首个发布的“类ChatGPT”产品,这个表现总体而言已经非常不错了。从发布预热到正式发布,短短一个多月的时间,已有超650家合作伙伴宣布加入文心一言生态。拿到先发优势后,随着接入用户数量的增加,文心一言模型会持续迭代,模型性能有望进一步优化完善。
未来,文心一言既可以向应用开发者出售API接口,也可以放进自有国民级应用里获取增值服务收入。作为中国AI历史上标志性的一款产品,毫无疑问文心一言的发布将极大加速国内生成式AI模型的落地应用节奏,并且帮助生态伙伴实现用户体验提升和生产降本增效。
国内唯一一家实现全栈布局的AI企业,自研芯片昆仑芯已经实现大规模出货
事实上,百度能在ChatGPT发布后仅三个月左右的时间就发布类似的产品,凭的并不是“运气”,而是十年如一如的在AI领域的深耕。
李彦宏表示,过去一年,无论是在技术层面还是在商业应用层面,人工智能都有了巨大的进展,有些甚至是方向性的改变。百度一直以来就把人工智能业务作为公司发展的重点,公司过去十年在人工智能累计研发投入已超过1000亿元。
在持续高强度的投入下,公司终于迎来了收获期。
在专利上,根据百度的数据,百度专利申请量已达16754件,AI专利授权量5705件,AI专利申请和授予量连续五年全国第一,专利质量(高价值专利及创新驱动力)评测得分92.21,再次位列全国第一。
而在布局上,经过多年的发展,百度已经成为全球为数不多的在“芯片-框架-模型-应用”四层进行全栈布局的人工智能公司。通过在技术栈的四层架构中实现端到端的优化,可以大幅提升AI的效率。
其中在框架层以飞桨为代表,这是百度产业级深度学习开源开放平台,已经凝聚了500多万的开发者,20万家企业以及60多万个模型,目前国内综合市场份额第一;在模型层以文心大模型代表,包含对话模型(PLATO系列)、计算机视觉模型(VIMER系列)、跨模态模型(例如文图生产模型文心一格)、生物计算大模型(Helix系列)、行业大模型等;而在应用层则以百度APP(22年底MAU6.5亿)等为代表。
值得重点强调的是,在芯片层方面,昆仑芯公司前身是百度智能芯片及架构部,成立于2011年6月,于2021年4月完成独立融资,首轮估值约130亿元,截至目前已经完成三轮融资,投资人包含IDG资本、元禾璞华、临芯投资、比亚迪等众多业内知名金融资本及产业资本。
从具体的产品来看,昆仑芯科技于2018年推出云端AI芯片百度昆仑1,采用14nm工艺、16GB HBM先进内存和2.5D封装解决方案,目前已经在百度搜索引擎、小度和广告业务中广泛部署;经过三年的更新迭代,百度于2021年公司推出昆仑芯2,采用7nm制程,搭载自研的第二代XPU架构,相比1代芯片性能提升2-3倍,成为业界最先进的AI芯片之一。
数据来源:百度集团
此后不久,百度发布基于昆仑芯2代AI芯片的新一代AI加速卡R200,可以为数据中心高性能推理提供高达256 TOPS@INT8及128 TFLOPS@FP16算力,并且支持多种计算精度、硬件虚拟化、视频编解码等功能。目前该加速卡已经落地重庆市高级人民法院服务器、北京市实验室服务保障中心AI服务器等众多项目,累计订单已经超过千万级。
随着整个社会数字化水平的不断提升,算力也成为了数字经济的核心驱动力,对算力的需求也不断加大。根据公司介绍,公司正计划在未来推出昆仑芯3、昆仑芯4等更高算力与性能的产品,以实现无人驾驶等领域的大规模商业化落地,其中昆仑芯3代将于2024年初量产。
除了自研之外,百度近年来通过“BV百度风投基金”也做了不少AI方面的产业投资。目前投资项目总计约151个,包括从芯片到传感器,从人体数据采集到天基观测网,从智能工业到智能城市,不仅投资AI背后的底层技术,也投资AI驱动的各种行业变革项目。
智能汽车业务加速发展,集度首款车型预计将于2023年交付
从智能汽车的布局来看,作为国内最早一批进入该行业的科技及AI公司,百度也已经取得了一系列重大成绩。
在高精地图层面,AI是降本增效的核心驱动力。为了更好的助力智能汽车业务的发展,百度地图业务已经从百度CTO王海峰旗下剥离,调整至百度IDG(智能驾驶)事业群。
发展至今,百度高精地图构建自动化率已达到96%,领航辅助驾驶功能已覆盖部分城市的高速公路和城市快速路,大幅解决了应用成本高的问题。此外,百度已经获得城市高级辅助驾驶地图许可,并且已经与广汽、蔚来、威马、长安、本田、长城、吉利、北汽、江淮等众多车企实现量产合作。预计到2023年,百度高级辅助驾驶地图搭载量将超过100万台。
在自动驾驶层面,作为国内最早布局自动驾驶的企业,百度已成为全球四大自动驾驶领导者之一,并且拥有全球最多的3477件自动驾驶领域发明专利,在专利数量上远高于丰田、博世、本田、现代、华为、电装、戴姆勒、福特等汽车整车厂及Tier1厂商。
具体产品上,目前百度主要有以ANP3.0智能驾驶软硬一体产品方案及自动驾驶出行服务平台萝卜快跑两大产品为代表。尽管目前两大产品尚处于变现初期,对于公司的收入贡献较小,但百度对行业前景依旧看好。
数据来源:百度集团
其中,ANP3.0是百度Apollo面向新一代智能汽车推出的L2+级智能驾驶软硬一体产品方案,采用百度自研的自动驾驶控制器,两颗500Top AI计算的NVIDIA Orin-X,800万像素400米视野的摄像头传感器,SOTA半固态激光雷达,目前正在中国的四个一级城市——北京、上海、广州和深圳进行路测。据百度预计,在未来3-5年内,ANP 3.0将搭载在超过100万辆汽车上。
而萝卜快跑是百度在2021年8月发布的自动驾驶出行服务平台,目前已经在北京、上海、广州、深圳、重庆、长沙、沧州及阳泉等城市实现自动驾驶出行服务,订单量超100万,稳坐全球最大自动出行服务平台。
百度萝卜快跑与其他平台比较情况
资料来源:百度
近年来,随着国内新能源汽车的不断超预期发展,以“蔚小理”为代表的一批新能源汽车厂商顺势崛起,在这种情况下,仅做汽车软硬件很显然已经不能够满足百度的胃口了。
经过前期的充分调研后,百度于2021年1月宣布造车,并且于3月成立集度汽车公司并获得超3亿美元启动资金。时隔仅仅10个月,集度汽车再次获得新一轮融资近4亿美元的A轮融资,由百度和战略合作伙伴吉利共同增持。此后,吉利退出,由百度100%控股。
资料来源:百度
作为百度旗下新一代智能汽车品牌,集度将全栈应用百度AI能力。在2022年6月8日,集度正式发布了首款汽车机器人概念车JIDU ROBO-01;2022年10月27日,集度发布首款汽车机器人ROBO-01探月限定版,售价39.98万元。
集度汽车JIDU ROBO-01参数情况
资料来源:百度
在智能化配置上,集度ROBO-01将搭载高通 8295 旗舰智能座舱芯片,拥有30TOPS AI 算力;而自动驾驶芯片将采用英伟达最新的2颗Orin SoC芯片,合计拥有508TOPS的算力。据公司介绍,量产车型预计于2023年在国内46个城市上市,以初步完成销售网络的全国布局。预计到2028年,集度将具备全年交付80万台汽车机器人的能力。
随着当前产业数字化转型的不断深入,AI相关技术正在家居、家电、工业、交通、能源、城市等千行百业“开花结果”,意味着人工智能发展的黄金期已经到来。
作为国内少有的“芯片-框架-模型-应用”全栈布局的AI企业,百度在数据、算力、算法等方面拥有领先于其他厂商的众多优势。随着公司后续产品端的持续落地与迭代完善,百度有望成为AI产业趋势下,中国最为受益的公司之一。
*原创声明:本文系芯八哥原创文章,如需转载请通过关注芯八哥公众号并在后台私信申请开通白名单。以上授权仅针对公众号,转载请保持内容的完整性,并注明来源出处,所有内容不得删减、修改,不得做商业用途,不允许网站及第三方平台直接二次转载,未取得授权等非法转载,芯八哥将保留追究法律责任的权力。更多深度半导体行业观察和报告,请关注芯八哥微信号:icmyna。