DefinedCrowd为AI数据集管理筹集了5050万美元
西雅图的DefinedCrowd自称是“智能”数据管理平台,今天宣布已筹集了5050万美元的股权融资。首席执行官兼创始人丹妮拉·布拉加(Daniela Braga)表示,所得款项将用于扩展公司现有的解决方案,推出基于订阅的产品以及扩大DefinedCrowd的国际影响力。
训练AI算法通常需要高质量的标记数据,这就是为什么制作语料库可以花费几乎与开发摄取它们的模型一样长的时间(通常是更长的时间)的原因。这是DefinedCrowd旨在为客户服务,汽车,零售,保健和其他企业领域的客户提供定制的模型培训服务来解决的问题。
拥有博士学位的布拉加(Braga)在语音技术领域,熟悉数据集管理的来龙去脉。在创立DefinedCrowd之前,她负责1400万美元的工作,以改善微软的AI驱动的Cortana语音助手,她形容这是一场艰苦的战斗。每个产品开发周期中大约有18个月用于采购数据以刷新基础模型。
DefinedCrowd的方法通过Neevo在195个国家/地区雇用了290,000名贡献者(两年前为45,000名),他们完成了涉及标签,打字和口语单词和短语的带薪工作。他们每天通过DefinedCrowd的自然语言处理,语音识别和计算机视觉工具向可用数据集提供超过500,000个样本。
通过API和Web界面,DefinedCrowd的客户可以过滤人口统计数据,指定Neevo成员的年龄,位置和性别,甚至指定他们在某种语言方面的熟练程度,以用于转录,语音情感标记,文本情感和语义注释,问题和答案收集以及自发的演讲。该平台支持50多种语言和79种方言,约占世界上使用最广泛的语言的90%,声称的标签准确性高达98%。
DefinedCrowd的真正价值主张可以说是其可扩展性。客户不仅可以使用该平台在预算限制内从头开始训练模型,还可以使用针对特定技术需求的数据集来扩展现有模型。那些要求更简单的用户可以利用专门的工作流程,模板和现成的解决方案,或者上传自己的专有数据集,同时获得实时成本估算和用于查看实时进度的仪表板。
例如,亚马逊的Alexa平台上的新闻策展技术的开发人员可以使用DefinedCrowd生成多个数据集,以提高算法在整个市场的性能。
去年,DefinedCrowd的收入同比增长了656%,客户包括宝马,万事达卡,Nuance和Yahoo Japan等《财富》 500强公司。该公司拥有超过100名员工,分布在葡萄牙,西雅图和日本的办事处,DefinedCrowd计划将其员工人数增加一倍,达到500人,并在2021年之前开设更多的研发实验室。
在2018年7月筹集了1,180万美元之后,这轮最新融资使DefinedCrowd的总筹资额达到了6,340万美元,其中包括新投资者Semapa Next和Hermes GPE的参与。现有的投资者Evolution Equity Partners,Kibo Ventures,Portugal Ventures,Bynd Venture Capital,EDP Ventures和IronFire Ventures也参加了。他们加入了长期支持者,其中包括亚马逊Alexa基金,索尼创新基金和万事达卡。
值得注意的是,DefinedCrowd并不是争夺超过50亿美元数据注释工具市场份额的唯一创业公司。Scale AI公司最近通过其广泛的数据标签服务套件筹集了1亿美元,CloudFactory公司在去年11月为其数据处理和准备工具筹集了6500万美元。更不用说强大的AI,Hive,Appen和Alegion了。