智东西(公众号:zhidxcom)
文 | 韦世玮
智东西8月23日消息。昨日,百度大脑AI开放平台分享了多项近期发布和升级的新功能,并详细介绍了百度EasyDL的最新进展和典型案例,包括深度学习框架、OCR文字识别和语音自训练平台等。
此外,工作人员还在现场向大家演示了如何快速训练一个AI模型,并集成在硬件中进行离线计算。同时,百度还邀请了中国专利信息中心、茅台博物馆、农信互联三家企业代表,来分享如何利用百度EasyDL协助业务的AI应用和落地化进程。
自2016年底开放以来,百度大脑一直通过研发技术降低AI应用落地的门槛,截止目前,该平台已经积累了218项技术能力,实现24小时快速集成AI工具,覆盖超过130万的开发者。
一、EasyDL:零算法基础训练生成AI模型
百度大脑经调查发现,在各行业的业务场景中,约有86%的行业需要定制开发相关的AI模型以提高业务效率,例如科研机构的生物识别、物流的自动分拣包裹和智慧零售等。
然而,企业们在面对AI业务转型时,也面临着人才不足、数据标注成本高、模型部署繁琐和迭代优化周期长等痛点。
基于此,百度大脑推出了一个名为EasyDL的定制化模型训练和服务平台。简单来说,用户通过该平台,哪怕没有任何算法和代码基础,都可自行定制一个高精度的AI模型。
用户定制模型时,根据可视化页面的提示创建模型,上传图片、文本、视频或音频等数据集并标注,标注完成后再对模型进行训练和校检,最后即可生成发布。
值得一提的是,在数据集标注方面,用户仅需手动处理其中30%的数据,剩下可通过EasyDL的智能标注功能一键标注,减轻了70%的密集劳动力成本。若是第三方合作伙伴,平台还提供数据采集和标注服务。
此外,AI模型的发布支持三种格式,分别为公有云RestAPI、离线SDK和软硬一体方案,实现AI模型跨平台应用。
目前,EasyDL推出了行业版和通用版两种版本。据百度AI技术生态部高级产品经理李景秋介绍,EasyDL自2017年底推出以来,已有超过1.7万个企业客户,创建了超过36000个AI模型,应用覆盖安防监控、零售商品识别以及镜检细胞分类等领域。
李景秋表示,EasyDL计划将上线图像分割模型,支持非矩形和不规则形状等标注,可应用于工业瑕疵检测与道路检测。另外,EasyDL的图像分类、物体检测模型也即将支持本地服务器部署。
二、6大功能升级,深度学习平台支持海思NPU
除了EasyDL的AI开发平台外,百度大脑还拥有其余4项应用架构,包括部署与集成、场景化方案、AI开放能力和深度学习平台。
百度AI技术生态部高级产品经理娄双双介绍,百度大脑在8月已经开放并升级了一系列新功能和服务。
在深度学习平台方面,百度大脑全新发布了一个名为Paddle Lite的深度学习框架。该框架加强了多平台多硬件的支持能力,新增各类硬件Kernel 70种。
娄双双表示,Paddle Lite还增加了对FPGA(ZU3\ZU5\ZU9)和华为海思NPU的深度支持,成为了首个支持华为NPU在线编译的框架。
在OCR文字识别方面,百度大脑升级了名片识别、二维码/条形码识别和手写识别的性能,进一步提升其识别率。官方表示,OCR手写识别的准确率已提升至95%以上,识别效果和速度双指标保持在行业第一。
与此同时,百度大脑还对人体分析中的人流量统计(动态版)算法进行了优化,将准确率提升至92%以上。此外,图像处理方面还增加了图像的拉伸恢复和风格转换功能,它除了能自动识别比例失调的图像并将其恢复成正常比例外,还能够将原图像转换成卡通或素描等风格。
除此之外,百度大脑的内容审核平台也进行了一系列功能升级,其中最核心的两项分别为支持审核模型定制和分钟级策略更新。
一方面,官方打通了EasyDL的应用渠道,内容审核平台能够定制审核模型,以用于识别特殊场景识别和过滤特殊物品、行为。另一方面,官方违禁库实现了分钟级别更新的功能,能够及时过滤最新的风险事件。
最后在语音自训练平台方面,官方扩展了API调用方式,使其能调用搜索模型和输入法模型,让该平台进一步适用于更多领域。
娄双双表示,自语音自训练平台上线以来,已拥有了医疗、金融、物流等多个行业的客户,模型的上线应用也覆盖至业务数据采集录入、智能语音助手等多个场景,其专业领域的词汇识别率已提升5%至25%。
三、三类应用领域介绍,提高业务效率
对企业来说,如何高效低成本利用AI来提升业务效率是一项十分重要的任务。
在现场,中国专利信息中心、茅台博物馆和农信互联的代表为大家分享如何通过百度大脑来实现业务智能化。
在知识产权保护领域,中国专利信息中心软件设计师崔亚坤介绍,他们利用EasyDL训练了一个专利保护的AI模型,该模型不仅能分类图片,还能对图片中的物体进行检测。
此外,他们还将百度大脑的文字识别、图像搜索、NLP语义处理等功能进行整合,以进一步提升其自动化审核流程的工作效率。
EasyDL还可应用于文化领域,帮助人们更好地挖掘、了解相关历史文化。
茅友公社APP负责人张瑞想表示,他们花了三周时间,通过EasyDL训练和迭代生成了一个定制化图像识别模型,该模型能够在几秒内迅速识别出每瓶茅台酒的生产年份和产地等信息,准确率高达99%。
前段时间,网上报道的AI宠物鼻纹识别和猪脸识别引起了许多人的兴趣。此次,农信互联高级工程师孙凌俊为大家分享了AI是如何帮助他们管理养猪场的。
他们通过EasyDL训练出了一个猪棚场景定制模型,并利用AI电子围栏和EasyDL的物体检测功能,可以对猪场进行远程管理,例如当摄像头检测到道路上出现猪而不是人时,便会及时警告工作人员前往现场处理。
此外,他们还训练出了一个猪病识别模型,帮助养殖人员判断猪是否有典型猪病,不仅在一定程度上降低了发病风险,还可改善养殖业目前的生产效率问题。
结语:降低AI入门门槛,为企业提供转型新方向
随着AI技术的不断成熟和多样化发展,越来越多的企业对业务智能化的需求也与日俱增。但他们也面临着AI人才匮乏和数据集标注成本高等困境。
百度大脑推出的EasyDL定制化模型训练和服务平台,不仅降低了AI从应用到落地的门槛和成本,也为相关企业提供了智能化业务转型的新方向。
在未来,随着百度大脑技术的成熟,其OCR文字识别、深度学习、AI语音和视觉等技术也将会扩展至更多应用领域,帮助更多企业创造更大的商业价值。