博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
ICPR 2018|阿里巴巴读光OCR及MTWI数据集亮相引关注
阅读量:7126 次
发布时间:2019-06-28

本文共 1405 字,大约阅读时间需要 4 分钟。

近日,第24届国际模式识别大会(ICPR 2018)在北京举办,阿里巴巴“图像和美”团队成为会场焦点,在本次ICPR大会中,阿里巴巴“图像和美”团队集中展示了在OCR方向的学术能力与读光OCR的产品能力。

阿里巴巴“图像和美”团队是阿里巴巴延续时间最久的图像识别团队,从事OCR研究超过7年,全面覆盖公司内网络图片、文档等类型,日均处理图片超过6亿,累计超千亿,并于2017年底在阿里云上推出了读光云产品,提供企业级的公有云和专有云服务。目前读光OCR已广泛运用于各行业领域,在办公自动化、文档电子化、数据智能等场景实现企业的生产应用。在本次ICPR的展区也重点展示了卡证识别、表单识别、增值税发票识别等综合识别能力。

fa693d40ccea9a48fb177ecc3e94bfb85568dba5

(读光OCR在ICPR的展台)

本次阿里巴巴“图像和美”团队还和华中科技大学、中科院自动化所共同举办了首届深度学习文档分析和识别研讨会,吸引了上百名研究人员参加。研讨会上IAPR主席Simone Marinai教授、华南理工大学金连文教授、阿里巴巴高级算法专家永攀等人发表了报告,各位专家同步了学术界最新研究及工业界的落地进展,现场反响热烈。

31d9600b953c02f5182e3b90224a906d43bfb4dd

(阿里巴巴高级算法专家永攀在研讨会上的报告)
0ca4a4246cea37c949fa76284441793740fb67f9

(Simone Marinai教授在研讨会上做报告)

研讨会的最后,华南理工大学金连文教授、北京大学王勇涛教授、阿里巴巴高级算法专家永攀等嘉宾就“深度学习OCR和DAR领域的未来趋势”进行了探讨,包括深度学习模型构架、数据集构建、算法应用方向等学术界及工业界都共同关注的热门话题。阿里巴巴高级算法专家永攀表示:“阿里读光是OCR应用领域的先行者,在实践中,读光将模型、数据、应用融合,实现通用应用场景的OCR算法架构,并按应用场景构建了完善的数据集系统。OCR是最基础最广泛的AI应用方向,能够与各行业结合形成广泛的社会效应, 我们期待和学术界一起追求算法极限,探索接近客观规律的AI问题。”

88d3c8d5d17faab07076c29cc5ae4766a3f8a642

(研讨会现场座无虚席)

此次,阿里巴巴“图像和美”团队联合华南理工大学共同举办ICPR MTWI 2018 挑战赛在大会进行了报告和颁奖,ICPR MTWI 2018挑战赛是目前参赛人数最多的OCR竞赛,由阿里巴巴天池平台承办,共有4282支队伍参与竞赛。 同时, 本次竞赛标注并公开了MTWI数据集,是现有难度最大、内容最丰富的网络图片OCR数据集,也是阿里巴巴首个公开的OCR数据集。

f6835fba06fd3e64053e46a59b4c7c2337a4277e

(阿里巴巴算法专家永麒在大会进行竞赛报告)

阿里巴巴算法专家永麒在大会报告中表示:“希望通过这个数据集和竞赛,回馈学术界,并且推动业界技术的发展。从最终的效果来看,参加竞赛的队伍包括了众多知名高校和企业,在本次竞赛中,企业展现出了比较大的竞争优势。这也表明,众多企业看好OCR应用,OCR进入了应用爆发期。不过在三个赛道,最好队伍的准确率都没有超过90%。这也表明了网络图片的技术难点还没有完全解决。我们也希望这次的竞赛能够促进业界对这类问题的研究,一起来彻底解决这些问题。”

8fb9cba05d8c464e738b84c7d508de9037c63764

(阿里巴巴资深算法专家雷音为获奖队伍颁奖)

在本次ICPR 2018中,阿里巴巴“图像和美”团队通过竞赛、研讨会、展区展示等形式多元化、全方位的展现了团队在OCR方面的深度积累及学术能力、产品能力,也得到了与会人员的高度评价和关注。

原文发布时间为:2018-08-23

本文来自云栖社区合作伙伴“”,了解相关信息可以关注“”。

转载地址:http://bqeel.baihongyu.com/

你可能感兴趣的文章
geopy使用详解
查看>>
Notebook Workflows: The Easiest Way to Implement Apache Spark Pipelines
查看>>
mysql必知必会表样例
查看>>
我的友情链接
查看>>
python logging 模块在windows报错ConfigParser.NoSectionError: No section
查看>>
windows下python3虚拟环境搭建
查看>>
error at ::0 formal unbound in pointcut
查看>>
关于linux下Squid透明代理的试验
查看>>
马哥2016全新Linux+Python高端运维班第四期-第三次作业
查看>>
AngularJS基础语法
查看>>
程序编译过程
查看>>
《Linux学习并不难》归档和压缩(2):tar包的使用和管理
查看>>
cookie与session详解
查看>>
一键 安装lamp+lnmp+ftp+Tomcat任意选择5分钟起飞
查看>>
我的友情链接
查看>>
K-Backup的网络备份与集中存储介绍
查看>>
WM_CONCAT函数在11g上的变化
查看>>
Hive性能调优
查看>>
初始化oracle用户以及表空间的bash shell脚本
查看>>
CDN加速用途
查看>>