百度吴甜:文心大模型已应用于搜索等产品,开发者超6万人

2022-04-19
关注
摘要 百度称,“文心大模型”的收入来源,一方面百度自身的业务需求,另一方面是通过行业客户的垂直场景结合,进入百度智能云的营收当中。

百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜(来源:百度官方)

自从OpenAI发布GPT-3之后,大模型成为几乎所有全球头部人工智能(AI)公司的逐鹿目标。

钛媒体App 4月19日消息,百度集团副总裁吴甜近日接受钛媒体App等采访时表示,百度产业级知识增强大模型“文心”,目前已经大规模应用于百度内部的各类产品,包含搜索、信息流、小度智能屏、百度地图等。而“文心大模型”的个人、企业开发者数量已超过6万人。

吴甜强调,“今年是文心大模型产业落地关键年”。

据悉,“大模型”是目前世界AI研究领域最热门的话题之一。AI 技术发展到今天,GPT和BERT等参数量巨大的模型被人们开发出来,他们在计算机视觉和自然语言处理等领域取得了前所未有的成就。

随着数据井喷、算法进步和算力突破,泛化能力和通用性强的预训练大模型,正在成为 AI 技术发展的关键方向,并成为 AI 产业应用的重要推动力,有望让 AI 技术与各行各业的差异化场景深度融合,让大部分企业的标注数据更少、开发效率更高、应用成本更低,从而大幅降低 AI 的应用门槛。

2019年3月,百度发布中国首个正式开放的预训练模型ERNIE1.0;2021年12月,ERNIE 3.0升级为知识增强千亿大模型“鹏城-百度·文心”,模型参数规模达到2600亿,是目前全球最大中文单体模型。

同时,2021年12月发布全新的文心大模型全景图,文心大模型家族包含NLP(自然语言理解)大模型、CV(计算机视觉)大模型、跨模态大模型,以及工具与平台。

在吴甜看来,“文心大模型”作为产业级大模型,核心价值在于驱动 AI 技术的规模化应用。

因此,为了进一步降低应用难度,百度还为“文心大模型”开发易上手、轻量化的部署工具平台,包括提供各类开发套件,零门槛AI 开发平台EasyDL 、全功能AI 开发平台BML等,让不同群体都能低门槛实现AI技术应用。

吴甜表示,通过百度AI开放平台,现在已经有近1400项能力是开放给企业开发者使用的。

吴甜对钛媒体App表示,基于百度飞桨平台与百舸集群,“文心大模型”在算法、框架、算力层面实现了自主创新。通过大模型与国产深度学习框架融合发展。支撑“文心大模型”训练的是百度飞桨平台自主研发的端到端、自适应、分布式训练框架与4D混合并行技术。百度已经构建出自主创新的AI基底,能驱动 AI 规模化应用。

目前,“文心大模型”已通过飞桨平台、百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业落地应用。其中在智能制造场景中,大模型可应用于质检、巡检这一类型以计算机视觉场景,以及数据设备的运维等自然语言处理场景当中。

具体案例方面,百度与中国人寿合作,针对保险合同中条款文本进行关键字段的提取。基于文心大模型,实现了保险合同条款的智能解析,自动提取近40个维度的关键字段,业务处理效率大幅提升。

“基于企业自己积累的标注信息,然后用‘文心大模型’与此前数据一起进行二次训练,会帮助客户做一些数据增强工作。再通过多次客户反馈构造数据,进行模型迭代,就达到实用状态了。”吴甜对钛媒体App表示,真正使用时,把大模型的能力嵌到私有云当中,在保险人员的工作流中嵌入一个功能,告诉他一些分析后的建议,然后基本上可以快速上手使用“文心大模型”能力了。

交付形态上,“文心大模型”主要有三种交付模式:通过调用API供开发者使用,百度EasyDL、BML全功能AI开发平台(Baidu Machine Learning)等平台上的嵌套工具,以及包含在一些面向场景的产品中交付,例如智能文档分析TextMind,智能创作平台等。

收益来源方面,作为一项基础性质的工作,“文心大模型”的收入来源,一方面百度自身的业务需求,另一方面是通过行业客户的垂直场景结合,进入百度智能云的营收当中。

不过,吴甜告诉钛媒体App,“文心大模型”在前期训练的时候十分消耗算力,在百度搜索场景中,利用昆仑芯在进行文心ERNIE的推理计算,每一天都是过亿的流量在进行计算。而但并不是所有企业都拥有这么大规模的算力平台,到企业场景真正使用大模型,很多只要进行二次训练就可以了,二次训练并不会像训练千亿基础模型那么大的消耗。

对于大模型重复建设以及良性竞争问题,吴甜表示,每一家企业和机构最后会产生的价值和作用,其实是各自侧重的。现在还是有很大的创新空间。

(本文首发钛媒体App,作者|林志佳)

您觉得本篇内容如何
评分

相关产品

CSMS 中科微感 人工智能+嗅觉传感器(AI-Nose) 气体传感器

中科微感逐步攻克了制约人工嗅觉传感发展的核心材料、硬件、算法等技术,开发出了以新型纳米敏感材料为基础,以微纳加工技术为支撑,以人工智能算法为核心的第一代 MEMS 基金属氧化物半导体原理的人工嗅觉传感器产这一产品将解决当前制约人工智能嗅觉技术与市场应用发展的关键问题:提供量产化的高一致、低成本、微型化的嗅觉传感器阵列硬件,以及提供标准化的人工智能+嗅觉气味感知软件平台,使客户能够快速构建和应用气味数据模型

XKCON 祥控 弹药库环境温湿度异常报警与智能监控系统 温湿度变送器

济南祥控自动化设备有限公司自主研发的XKCON祥控弹药库环境温湿度异常报警与智能监控系统采用物联网、传感器、大数据、人工智能等先进技术,能够对弹药库环境温湿度信息实现数字化、可视化管理。

山东美安 矿山电机车防追尾道岔口报警器 控制器及系统

煤矿用机车防追尾保护装置 机车防追尾保护装置是一种矿用人工智能保护装置、具有防追尾保护、无线触发沿途弯道语言保护、输出控制并记录等功能可广泛的使用在矿山井下、井上的运输机车上。

KEYENCE 基恩士 AI-1000C 图像匹配传感器

因此,人工智能系列能够在模式匹配的基础上对物体进行稳定的检测和识别,而这是基于强度或距离的传感器难以实现的。 基于强度或距离的传感器难以实现。

云传物联 水质生态浮标浮台在线测系统 多参数监测系统

电子水质监测解决方案利用信息控制与处理、人工智能、自动化、物联网及多媒体等技术,集水质参数在线采集、无线传输、智能处理、超限报警、远程管理等功能于一体的水质监测解决方案。

DINSEE 鼎信智慧科技 DX-WPS100-SP2... CMOS图像传感器

针对传统配电线路人工巡检效率低、周期长等问题,鼎信智慧结合物联网、红外热成像、人工智能等技术,研发了配电线路图像视频双光球机在线监测装置。

大立科技 DM60-W3 红外体温快速筛检

红外热成像体温快速筛检系统DM60-W3系列为384*288/640*480像素,人工智能算法,远距离、大场景测温更精准。

Maike 迈科光电 MK-PB4023PS&ALS&VC-A01E 接近传感器

EM30918、STK3311-X、STK3321、APDS-9900 ,9901、TMD2772WA、RPR0521RS、VCNL4035X01 WH4530A),广泛应用于平板电脑、工控显示类产品、智能家居、AI人工智能等场景,联想笔记本电脑,九安医疗的测温仪,微步数码的平板等都应用了我们这颗传感器,已量产批量出货。

Handsome 翰德圣 HDSELM V1.1 安全传感器和系统

设备全生命周期管理平台融合的物联网、云计算、大数据、人工智能、优化制造、再制造六项主流技术,通过云端模块化的架构可为企业灵活管理设备,不仅可以随时随地了解设备运行状态、发现故障隐患,还能够通过大数据分析指导企业维修

评论

您需要登录才可以回复|注册

提交评论

广告

钛媒体

这家伙很懒,什么描述也没留下

关注

点击进入下一篇

ICT的圣杯:产业融合的技术乐章

提取码
复制提取码
点击跳转至百度网盘