过小的数据集成为了视觉模型的开发障碍?Unity的Perception Package可以针对个人需求生成自定义数据集,帮助发掘视觉模型的潜力。Computer Vision Datasets自今日起向全球客户开放,本文将详细介绍该功能。
合成数据拥有几种优势,但亲自上手可能并不轻松:技术本身对许多机器学习从业者来说都略显新鲜,而为研究对象制作一整套的3D资源有时也是耗时耗力,会拖慢开发制作进度。
而由我们制作的3D资源皆为定制资源,每个导入Unity的数据集都会匹配模型的具体训练需求。3D模型可转换成CAD模型,没有模型的我们会使用先进的图像扫描技术来扫描现实物品,或交由专业艺术团队制作3D数字孪生。
在制作完3D模型后,我们再制定资源每帧上的行为、加上正确的标签。空间随机化(domain randomizaiton)是一种可程序化生成数据变体的技术,可提高模型的耐用度。每一帧的物品类型、物品位置、遮挡状况等等参数都可以修改,只用少量对象便可生成几套多样化图像。目标对象可使用简单的2D/3D边界盒,或使用复杂的划分法进行标注。如果项目要求使用自定义标注方法,我们的专家将与客户沟通了解需求。
Datasets项目中的每个环境要素都可以随机化:光照、纹理、摄像机位置、镜头属性、信号噪波等等皆可改变,用多样化的数据集来应对最为广泛的用例。
在使用合成数据时,组成数据环境的背景并不一定要反映现实。部分计算机视觉的应用可能还需高度随机的背景,当然也有需要一定背景结构的情况存在,比如建筑或住宅内部。
我们团队已开发出一系列针对各种应用的无结构与结构化合成环境制作方法,专家们将针对不同的问题、情景和数据范围推荐环境类型。
不同的应用有不同的数据要求,图像的数量取决于场景复杂度、物品品类数和方案精确度。我们将深入理解客户的需求,帮助划定项目的框架,与客户多次交流来保证数据集达到标准。
我们计划在未来提供一个自助式接口,让用户能自行生成额外数据,不必再依赖Unity团队。
服务价格分为多个阶梯,不同数据量报价不同,帮助你掌控预算。
快来联系我们,了解各种数据集生成服务,包括: