机器心脏释放
机器之心编辑部
计算机视觉顶级学术盛会ICCV 2021于美国东部时间10月11-17日正式举行。尚科技和联合实验室共有50篇论文入选2021,并在MFR、LPCV等多项重要比赛中获奖。中国原创技术再次闪耀国际学术舞台。
ICCV、CVPR和ECCV并称为计算机视觉的三大顶级会议。虽然受疫情影响,今年的ICCV完全在网上举行,但今年的人气依然不减。作为国内AI技术的引领者,商汤科技一直致力于原创。此次再次硕果累累,以学术成果击中行业应用痛点。是对商汤在前沿科技领域长期投入的一次再验证和反馈,也是商汤设定SenseCore尚汤艾设备基于强大的RD团队和领先的人工智能构建稳定创新护城河的战略。50篇论文入选,多次比赛获得冠军。
商汤今年入选的50篇论文涵盖了模型量化、3D建模、自动驾驶、机器学习系统决策等多个领域。,其中不仅包含各领域的前沿基础研究突破,还直击行业应用痛点。
例如,在论文《语义一致性出分布检测》中,商汤团队重新设计了开放世界识别的基准测试。所谓开放世界识别,是指计算机在面对未知世界时,能够识别未知物体,而不是认为所有物体都属于已知类别。
测试数据示意图
商汤团队提出的新基准旨在发展这一领域,即要求开放世界模型不仅能识别未知类别,还能对不同形式的已知类别进行归纳和精确分类。同时,本文还提出了一种有效的解决方案,有助于支持计算机视觉模型的可靠性。
随着三维扫描等技术的成熟,点云数据的应用场景越来越普遍。然而,如何从点云中提取参数化的结构信息,用于下游的识别、理解和编辑仍然是一个难题。现有的方法要么假设一个对象仅由几个简单的基本图元的并集组成,要么使用复杂网络来估计动态CSG树。商汤的论文《CSG-树桩:一种易于学习的用于可解释形状解析的类似CSG的表示法》提出了一种新的几何实体表示法。与传统的CSG树不同,CSG树桩可以将任意深度的CSG树压缩成三层,并用三个二元矩阵表示。在此基础上,商汤提出了结构几何实体的端到端无监督预测网络。生成的结构几何实体不仅具有良好的重建效果,而且具有可解释性和可编辑性高的特点。
CSG-树桩,CSG-树桩网络,效果展示
除了论文,ICCV 2021期间的各种挑战也备受关注。其中,LPCV挑战赛是一项致力于将计算机视觉技术应用于极端低功耗场景的顶级比赛。它由顶级学术机构和软硬件公司如普渡大学、脸书和Xilinx联合举办。依托工业化基础模型生产体系,商汤模型工具链团队通过大规模预训练、测试模型优化、压缩技术、部署能力软硬件算法的全方位合作,获得FPGA赛道冠军。
商汤团队在LPCV赛FPGA赛道上名列第一。
此外,为了更好地推动3D重建社区的发展,新加坡南洋理工大学S-Lab、商汤科技海外RD中心IRDC和上海人工智能实验室共同构建了大规模、丰富的多视角不完整点云数据集和评测基准,并在今年的ICCV举办MVP挑战赛,供研究人员测试和检验更好的点云补全和点云配准方法。大赛吸引了国内外约100个研究团队。经过比赛和交流,启发大家为采集到的不完整点云数据设计更贴近现实的方案,实现不完整点云的补全和配准。
不完整点云图
原始技术长期主义者将技术定义为工业。
商汤与ICCV的缘分由来已久。2016年至今,ICCV在商汤和联合实验室的就业论文超过140篇,持续领先全球。事实上,自成立以来,商汤就以其独创的技术和丰硕的研究成果而闻名于世。目前,商汤已在顶级学术会议和期刊上发表论文600余篇;人工专利和专利申请8000多项,专利申请量连续6年翻番。
“商汤是坚定的长期活动家。作为从实验室走出来的企业,我们的企业文化来源于并深深植根于研究和创新,正面临着技术应用和赋能的无限可能。商汤科技联合创始人、研究院院长王晓刚说为此,我们继续在RD进行长期的大量投资,并与RD顶级团队和人工智能基础设施构建了坚实的创新护城河。」
自2014年在香港中文多媒体实验室诞生以来,商汤吸引了来自全球顶尖大学和研究机构的40位专家、教授和3500多名研究人员,是亚洲规模最大、水平最高的研究团队之一。此外,商汤还与全球52所顶尖大学和15个联合实验室积累了广泛而紧密的研究合作。丰富的人力资源和全球化的技术交流合作,为商汤的全栈人工智能创新体系奠定了坚实的基础。
此外,商汤还构建了业内前所未有的通用人工智能基础设施SenseCore Shang汤艾设备,并实现了多功能和超高精度AI模型的量产。王晓刚表示,“SenseCore开放了计算能力、算法和平台,使我们能够实现高效率、低成本和大规模的AI创新和落地。就耗时而言,尚的和工程团队将开发时间缩短到了几个小时,而业界需要几周时间。到今年上半年,商汤已经针对不同应用开发了超过22,000个商业人工智能模型,涉及多个垂直行业。目前,商汤凭借过硬的技术和模型生产的规模效应,在智慧商业、智慧城市、智慧生活、智能汽车等领域取得了市场领先地位。