大型人工智能公司正在逐步淘汰非洲和亚洲的廉价数据标注人员,转而聘用技术熟练、薪资更高的专业人员来帮助训练更智能的模型。
前, 数据标签工作者主要被赋予简单的注释任务。然而,人工智能公司已经意识到,改进模型需要更大规模的数据。因此,员工的工作速度需要更快,每天要完成数百个任务,因此他们的转移给行业专家。
开发“推理”人工智能系统,包括OpenAI 的 o3以及谷歌的 Gemini 2.5,加速了肯尼亚和菲律宾等国从低薪工人向高技能个人的转变。
Scale AI、Turing 和 Toloka 等公司已经聘请了生物学和金融等领域的顶尖专家,以支持人工智能团队生成更精细、更复杂的训练数据集。
Toloka 首席执行官兼联合创始人 Olga Megorskaya 甚至评论道:“长期以来,人工智能行业高度关注模型和计算,而数据一直是人工智能中被忽视的一部分。最终,(行业)开始认识到数据对于训练的重要性。”
Scale AI、Turing AI 和 Toloka 自近期战略转变以来,投资者的兴趣均有所增加。Meta 于 6 月向 Scale AI 投资 150 亿美元,使其估值升至 290 亿美元。3 月,Turing AI 以 22 亿美元的估值获得 1.11 亿美元融资;5 月,Bezos Expeditions 领投了 Toloka 7200 万美元的投资。
肯尼亚数据标签协会会长琼·金尤阿 (Joan Kinyua) 解释说,现在要求标签员执行依赖于他们对当地语言和文化细微差别的理解的任务。
该组织还增加了质量保证岗位,需要人工审核 AI 生成的内容。OpenAI 表示,人择和谷歌致力于创建能够超越人类智能的模型,重点转向数据准确性和专家分析。
数据标签公司 Turing AI 的联合创始人兼首席执行官乔纳森·西达尔特 (Jonathan Siddharth) 也声称,要改进人工智能模型,就必须使用来自真实人类使用的训练数据,特别是在复杂任务中,并了解模型在这些场景中是如何失效的。
他甚至指出,一个完全先进的人工智能系统可能不仅比物理学家表现更好,而且比构建它所需的所有领域的所有顶尖专家都更聪明。
他补充说,图灵为专家提供的薪酬比他们目前的收入高出20%到30%。尽管人工智能公司仅将其预算的10%到15%用于数据,但与投入计算资源的巨额资金相比,这仍然是一笔不小的财务投入。
Toloka 的 Megorskaya 还认为,思路链等功能可以说明人工智能模型如何逐步解决问题,而这些功能是通过人类专家将问题分解为更小的部分进行演示而开发的。
KEY 差异线:加密货币项目用来获得媒体报道的秘密工具
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com