搜索 Unity

Unity合成数据集生成服务:为你的视觉模型注入动力

2021年4月19日 类别 技术 | 5 分 阅读
animated boxes of cereal
animated boxes of cereal
涵盖的主题
分享

过小的数据集成为了视觉模型的开发障碍?Unity的Perception Package可以针对个人需求生成自定义数据集,帮助发掘视觉模型的潜力。Computer Vision Datasets自今日起向全球客户开放,本文将详细介绍该功能。

构筑一个高质量合成数据集会同时涉及美术与科学领域。我们曾介绍过“合成数据”的概念,合成数据既可以提高视觉模型的性能,又能大幅降低训练的时间与成本。我们的计算机视觉专家们一直在使用合成数据来解决多种计算机视觉难题,积累技术经验,而这些专业知识现在将对大家开放。

Unity Computer Vision团队会与用户沟通模型的性能目标,并针对性地制定数据集生成策略。我们在每个项目中都会与客户的机器学习工程师多次交流,根据模型表现的反馈来做出改动。请在此处联系我们

带有正确标签的多样化物品

此内容由第三方提供商托管,该第三方提供商不允许在未接受“Targeting Cookies”的情况下观看视频。如果想观看来自这些提供商的视频,请将“Targeting Cookies”的 Cookie 首选项设置为“是”。

图像扫描而成的物品

合成数据拥有几种优势,但亲自上手可能并不轻松:技术本身对许多机器学习从业者来说都略显新鲜,而为研究对象制作一整套的3D资源有时也是耗时耗力,会拖慢开发制作进度。

而由我们制作的3D资源皆为定制资源,每个导入Unity的数据集都会匹配模型的具体训练需求。3D模型可转换成CAD模型,没有模型的我们会使用先进的图像扫描技术来扫描现实物品,或交由专业艺术团队制作3D数字孪生。

Visual examples of image labeling - There are several images, some of a street, some of cereal, some of a dining room, some of a warehouse.
图像标注图示

在制作完3D模型后,我们再制定资源每帧上的行为、加上正确的标签。空间随机化(domain randomizaiton)是一种可程序化生成数据变体的技术,可提高模型的耐用度。每一帧的物品类型、物品位置、遮挡状况等等参数都可以修改,只用少量对象便可生成几套多样化图像。目标对象可使用简单的2D/3D边界盒,或使用复杂的划分法进行标注。如果项目要求使用自定义标注方法,我们的专家将与客户沟通了解需求。 

动态的环境

Panning through a room
环境随机化

Datasets项目中的每个环境要素都可以随机化:光照、纹理、摄像机位置、镜头属性、信号噪波等等皆可改变,用多样化的数据集来应对最为广泛的用例。

在使用合成数据时,组成数据环境的背景并不一定要反映现实。部分计算机视觉的应用可能还需高度随机的背景,当然也有需要一定背景结构的情况存在,比如建筑或住宅内部。

我们团队已开发出一系列针对各种应用的无结构与结构化合成环境制作方法,专家们将针对不同的问题、情景和数据范围推荐环境类型。

One side has general groceries like bananas and rye bread and the other has cereal on shelves

数据集规模可大可小

不同的应用有不同的数据要求,图像的数量取决于场景复杂度、物品品类数和方案精确度。我们将深入理解客户的需求,帮助划定项目的框架,与客户多次交流来保证数据集达到标准。

我们计划在未来提供一个自助式接口,让用户能自行生成额外数据,不必再依赖Unity团队。

服务价格分为多个阶梯,不同数据量报价不同,帮助你掌控预算。

快来行动吧

快来联系我们,了解各种数据集生成服务,包括:

  1. 目标对象的高质量3D模型
  2. 准确的视觉模型训练环境
  3. 随机化的物品与环境,多样化的数据集,降低模型偏差、提高模型耐用度
2021年4月19日 类别 技术 | 5 分 阅读
涵盖的主题
相关文章