Top
首页> 快讯 > 正文

从CVPR到ICDAR,科技大学已经席卷了2019年的计算机视觉顶级会议。

发布时间:2019-06-28 13:41:19        来源:互联网

从计算机视觉顶级会议CVPR对象检测挑战DIW 2019到文档分析与识别顶级会议ICDAR手写数学公式识别挑战CROHME,现场文本视觉问答挑战ST-VQA,今年6月不乏一些计算机语言和劳动力智能专业比赛已经结束。在这些行业活动中,科学技术大学很自然地飞翔。

图片21.jpg

据报道,6月份,由科技大学人工智能研究所和科技大学语音与语言信息处理国家工程实验室(NELSLIP)组成的联合小组(以下简称联合会)迅飞 - 中国科技大学的团队首先遇到了物体探测挑战DIW。在2019年,Objects365 Tiny Track是第一个,Objects365 Full Track是第三个。后来,在手写数学公式识别挑战CROHME全部两个任务和场景文本视觉问答挑战ST-VQA挑战所有三个任务赢得冠军,除了街景中文文本识别挑战ReCTS词识别任务冠军。以上成就可以说是科达迅飞在计算机视觉领域的技术水平和优势。

那些不熟悉计算机视觉领域的人可能对DIW 2019 Challenge略有不熟悉。事实上,此次活动作为行业内的专业级活动,不仅吸引了腾讯,百度和Bytes等300多个团队。就游戏内容而言,使用的Objects365数据集包括630,000件。图像,高达1000万个手动标记框架,涵盖365个日常对象类别,可称为最大的通用对象检测数据集,科技大学可以跻身前300名团队,这在图像识别。强度。

图片22.jpg

在罗切斯特理工学院,科技大学和MyScript,三星,WIRIS(MathType),中国科学院自动化研究所,中山大学等国家和国外知名的手写数学公式识别挑战CROHME识别领域的研究机构相互竞争,依靠对数学公式的特征和位置关系的端到端识别,以及多尺度的空间注意机制来解决由于差异造成的人格缺失问题。字符大小。在技术突破上,通过在线手写数学公式识别和离线手写数学公式识别确定了两个主要任务冠军。

图片23.jpg

最后,在CVC(计算机视觉中心)举办的ST-VQA视觉问答中,面对算法图像检测和分割等前端技术,该算法进行了多模态数据融合,理解和推理的测试。能力,Keda Xunfei完成了候选词汇表的图像,候选词汇表为数据集,没有额外的词汇来直接预测答案的三个任务,直接赢得了Task1-Strongly Contextualized,Task2-Weakly Contextualized和Task3-开放词典冠军。

图片24.jpg

计算机视觉领域的三个高峰,N领域的前沿任务,A.I。科技大学研究院同时获得多项冠军荣誉,充分展示了科达迅飞在文本识别技术方面的领先地位。事实上,作为亚太地区知名的智能语音和人工智能上市公司,坚持技术和产品登陆的战略理念,科达迅飞在核心技术方面进行了创新,特别是在智能语音和智能语音领域。自然语言处理,不仅积累了丰富的成功经验,近年来,它还积极尝试为技术型行业提供人工智能解决方案,进一步发布教育,医疗,政治和法律领域的表现。相信凭借其在核心技术方面的优越地位,香港科技大学将能够为更多领域的更多行业带来新的人工智能经验。