数据标注是做什么的?
而我们在做数据标注的时候,其产生的数据标注都是提供给客户,使其做机器学习过程中的模型和算法训练数据集
而数据集又分为三类:
1.训练集 用来调试神经网络;
2.验证集 用来查看训练效果;
查看模型训练的效果,是否朝着坏的方向进行,及时停止训练
用在训练的过程中,几个epoch结束后就要跑一次验证集看看效果,及时发现模型或者参数的问题。如果模型设计不合理,训练的时候不容易发现,但是在验证集中可能会发散、mAP不增长或者增长很慢啦等等情况,这时可以及时终止训练,重新调参或者调整模型,而不需要等到训练结束,大大节省时间。另外一个好处是验证模型的泛化能力,如果在验证集上的效果比训练集上差很多,就该考虑模型是否过拟合了。同时,还可以通过验证集对比不同的模型。
3.测试集 用来测试网络的实际学习能力;
而我们在做人脸拉框或者其他的图片标注的时候,这些产生的数据,都会被用来做数据集来用,蜻蜓人脸识别系统,就是以此来进行调试,训练,以及验证的,使其在对你人脸识别的时候,知道你就是你,而不是别人。
当然图片标注只是其中一块,视屏标注的话,其实都差不多,都是靠图片一帧一帧的进行标注、
像语音标注的原理都差不多,不过涉及的方面也就更广一点,回头专门开个帖子来聊下。
以上由可思数据标注平台整理。
时间:2020-04-08 15:00 来源:可思数据 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
相关文章:
相关推荐:
网友评论:
最新文章
热门文章