机器学习辅助数据标注工作流程
运作方式如下
结合最佳的人类注释和机器学习功能,可以将训练数据的速度提高多达20倍,而成本却降低了50%。首先,使用人工注释器标记数据的子集。这些标签被插入图八平台中的模型中,该模型将从这些判断中吸取教训。然后,您可以利用该模型来注释其余未标记的数据。
未达到您设置的准确度阈值的数据行可以发送回人工贴标机,而达到您的准确度阈值的行将被自动标记。实际上,这意味着您将花费更少的时间和金钱,而无需牺牲质量就能从人工注释者那里获得标签。
预训练和可定制的模型
图八使用了我们最值得信赖的合作伙伴提供的机器学习模型。使用这些模型,客户可以快速,轻松地为各种用例准备和标记数据,而不必从头开始构建昂贵的定制模型。这些模型将与您为独特的业务问题选择的类和注释一起使用。
降低贴标成本而不牺牲准确性
将ML和人工生成的训练数据相结合意味着在不牺牲准确性的情况下节省了时间和金钱。这是因为您训练的模型消除了人工注释者的多余标签或不必要的标签,只向人们显示了不太自信的行,并自动为其添加了对其充满信心的行的标签。
自动路由和标签
图8工作流通过UI使用模型和作业之间的基于逻辑的路由规则来自动化多作业流程,以生成汇总结果。上传到工作流的数据在模型和作业之间路由,从而创建了无缝的过程,而用户却很少进行管理。
全面控制的企业规模
基于ML的标签和工作流程允许机器即使在高精度阈值下也可以对您的绝大多数数据进行标签。其余的贴标机由您自己决定。您可以利用我们的数十个BPO合作伙伴,我们网络中的800,000个唯一注释者,或将您自己的内部资源用于敏感项目。
时间:2020-04-08 15:00 来源:可思数据 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
相关文章:
相关推荐:
网友评论: