在一家互联网大厂做数据标注的小颜,时常在公司感到一种隔绝。
小颜的工位,跟产品经理、程序员们挨在一起,他们能享受相同的福利:同样的工牌、苹果电脑;随时可以去健身房,或去太空舱睡一觉。
但小颜能察觉到,作为数据标注员的她和其他同事,分属于“两个世界”。
尽管大家是一个团队,但每天的早会,没人会喊上标注员,小颜只能偷偷摸摸在门外看。有一回,有人推来一车台灯,是团队正在做的AI产品样机,程序员们围了上去,很兴奋,拿在手里把玩。标注员们则坐在工位忙自己的事,毫无波澜。“他们不知道那个产品,就是靠标注的数据做出来的。”
入职时,小颜所在的公司正在开发一款教育类AI产品,需要标注大量数据以训练AI。公司买来堆积如山的中小学习题册,小颜的工作是拍下每一道题,然后在电脑上对这些题目拉框,做标注。
同样是为AI工作,程序员清楚地意识到自己的工作价值,享受着算法不断进步带来的快感,但几乎没有标注员会觉得,正是自己的劳动创造了AI。
人工智能的进步离不开数据标注。近几年自动驾驶的发展,带动了数据标注的市场。据德勤的报告显示,2022年自动驾驶领域的标注需求占整个AI下游应用的38%,预计到2027年,比例将上涨到52%。
今年大模型兴起,给数据标注行业再添一把火,大量基于大模型训练场景的订单朝数据标注公司飞去,看上去,数据标注这个枯燥的生意,再次注入活力。
一些技术公司走得更前列,正在尝试使用AI自动合成数据,供AI训练。合成数据是基于少量真实数据,用AI无限生成、无需标注的数据,而不再依赖人工标注。在自动驾驶领域,合成数据可以覆盖一些极端路况,比如行人突然闯入马路等。
违法和不良信息举报电话:010-64158500-8113,18610056652 举报邮箱:infoweb@zero2ipo.com.cn 举报网上不良信息









