HI,下午好,新媒云不收取任何费用,公益非盈利机构
24小时服务热线: 4000-162-302
请扫码咨询

新媒易动态

NEWS CENTER

什么是数据标注

2019-05-19

什么是数据标注

著名杂志《经济学人》将数据类比为21世纪的石油,但石油是不能直接使用的,需要经过复杂的炼制过程才能成为可以被利用的资源。

同样,非结构化的数据也是无法直接使用的,需要根据使用者的需要,将其中有用的部分标记出来,转变为计算机可以理解的结构化数据,才可以被用于AI建模,这个过程就称之为数据标注。

结构化数据就是常见的二维表结构,excel或sql数据库都是以二维表的形式存在的。

而非结构化的数据——例如一张图片,本质上是一堆265色的像素点按一定的顺序进行排列组合。如果要知道这张图片上是否有一只鸟,就得人工用一个框把物体框出来,并做好标记,告诉计算机在这个框里有一只鸟。这样计算机就可以把框内的像素点当做鸟的特征进行学习,构建出识别鸟的模型。

在2012年,谷歌首席科学家李飞飞教授带领的团队在计机器视觉方面取得了重大突破,利用神经网络算法让计算机具备了在图片中识别出猫的能力。

这份成就一方面得益于计算机算力和AI算法的发展,但更为重要的基石是ImageNet图像数据集提供的一千多万张带有拉框标注的图片,正是这些经过了标注的图片,让计算机在视觉方向有了新的发展。

相关推荐