日前,阿里知产保护科技大脑中的一项OCR技术刷新世界纪录。OCR是学界业界必争之战,阿里、谷歌、微软、亚马逊等互联网公司也都研究多年。有OCR奥斯卡之称的ICDAR赛事,吸引全球近百国家数千队伍参加。近期,来自中国的阿里巴巴,一举刷新ICDAR-RCTW17文字检测及端到端文字识别两项世界最好成绩,位列世界第一。
OCR与奥斯卡均诞生于1929年,二者分别代表全球科技和艺术的里程碑事件。1986年中国提出“863”高新科技研究计划,才让OCR的汉字识别研究进入实质性阶段。在该领域研究起步晚半个世纪的中国,后程发力进入世界第一梯队。
OCR是一种能够自动从图像中检测并识别文本的技术,应用场景极为广阔,除了文本翻译、扫描文档阅读等办公场景,自动驾驶等工业场景,还能识别海量图像和视频中的低俗不雅信息,识别海量商品中的疑似侵权标识,是数字经济时代社会治理的新型基础设施。
阿里安全资深算法专家薛晖指出,这项广泛应用于阿里经济体的技术,也在为解决复杂社会问题持续迭代升级。三年前,阿里OCR识别技术每秒能扫描图片文字2000余万个,相当于501本《康熙字典》,识别准确率达97.6%。