郑雯至今觉得记得几个月的下午,那天,她一个小时就赚了2毛钱。她毕业于湖南的一所专科学校,是一名大模型数据标注师,每天的工作并不复杂——给自己领取的原始数据(如图像、视频、文本等)添加标签。
但大模型对于数据的质量要求很高,那天当时一张图片被要求反复修改了8次才通过,整个修改过程花费了一个1小时。也就是说,她这一个小时只赚了2毛钱,而正常情况下可以赚到12块,可以拉600个框。“钱并不好赚”,她反复强调。
这几乎是所有数据标注从业者的共识。数据标注的一端承载着从业者们不足5000元的月薪,他们如蚂蚁雄兵般构建起大模型的基石。而另一端则是互联网大厂们的AI梦想,他们希望借此超越Chat GPT 4。
数据标注采用最原始的计件制算工资,并不存在职场上的勾心斗角。*的苦恼这份过于枯燥的工作,让他们中的大部分很难坚持完3个月。并且,几乎所有人都告诉Tech星球,你*别去。
可他们不知道的是,要不了多久,他们中的大部分可能会失去这份枯燥的工作。因为,那些简单的数据标注将会被AI取代。
01 从5毛到4分,价格暴跌
林双在2017年赚到了一笔“快钱”:15天6000多元。对于专科毕业的林双来说,这个收入着实可观。那是人们对AI期望爆棚的时候,几乎没有人怀疑过它的未来,所有的投资机构都坚信这里可以诞生十亿、百亿甚至千亿规模的企业。
几乎所有AI技术的背后都是算法、算力、算据的竞争,庞大的数据是技术优劣的底层。背景光鲜的程序员们坐在“北上广”的办公室里,通过代码迭代算法描绘AI蓝图,而大专生、宝妈等在三四线城市的格子间处理庞大数据包中的图片、文字、语音等。











