主要的AI公司正在为非洲和亚洲的廉价数据标记工人提供熟练的高薪专业人员,以帮助培训更智能的模型。
之前,数据标签工人主要得到简单的注释任务。但是,AI公司已经意识到,改进其模型需要大量数据。结果,期望工人每天更快,完成数百个任务,从而将其转移到行业专家。
OpenAI的O3在内的“推理” AI系统,加快了从肯尼亚和菲律宾等国家向更熟练的个人的低薪工人转变。
Scale AI,Turing和Toloka等公司已经在生物学和金融等领域聘请了领先的专家,以支持AI团队生成更精致且复杂的培训数据集。
Toloka的首席执行官兼联合创始人Olga Megorskaya甚至评论说:“ AI行业长期以来一直专注于模型和计算,并且数据一直是AI的监督部分。最后,[行业]接受了培训数据的重要性。”
自从投资者最近的战略转变以来,规模AI,Turing AI和Toloka都在增加了投资者的兴趣。梅塔(Meta)在6月对AI的150亿美元投资将其估值提高到290亿美元。 3月,图灵AI以22亿美元的估值获得了1.11亿美元,5月,贝佐斯探险队(Bezos Expeditions)领导了托洛卡(Toloka)的7200万美元投资。
肯尼亚数据标签协会负责人琼·金努亚(Joan Kinyua)解释说,现在要求标签者执行取决于他们对当地语言和文化细微差别的理解的任务。
该组织还看到了人类审查AI生成的内容的质量保证作用的提高。由于OpenAI, Anthropic和Google致力于创建可能超越人类智能的模型,因此优先级是转移到数据准确性和专家分析。
数据标签公司Turing AI的联合创始人兼首席执行官Jonathan Siddharth还声称,要改善AI模型,有必要使用来自真实人类使用的培训数据,尤其是在复杂的任务中,并了解这些模型在这些情况下如何崩溃。
他甚至指出,完全先进的AI系统不仅表现不仅要优于物理学家,而且比在建造它所需的所有领域中的所有顶级专家都变得更加聪明。
他补充说,图灵赔偿薪水比目前的收入高20-30%的专家。尽管AIFIRMS仅将其预算的10–15%献给了数据,但与涌入计算资源相比,它仍然转化为大量的金融投资。
Toloka的Megorskaya还认为,诸如经过思考链的功能(这些特征)通过人类专家的演示来开发AI模型如何逐步解决问题,这些专家将问题分解为较小的组件。
2025年DeFi赚取被动收入的新方法。了解更多