说四川线多名“声音矿工”用方言华体会- 华体会体育官网- 体育APP下载“投喂”AI
2026-05-15 15:00:12
华体会,华体会体育官网,华体会体育,华体会体育APP下载14日下午,成都金牛区,30多岁的王女士在送孩子上学后的空档,点开微信小程序,对着麦克风用一口地道的四川话念出屏幕上的一句句文本。
与此同时,在城市的另一端,41岁的许女士正将多年累积的语言学经验,转化为一条条四川方言数据。
14日下午,成都金牛区,30多岁的王女士在送孩子上学后的空档,点开微信小程序,对着麦克风用一口地道的四川话念出屏幕上的一句句文本。
与此同时,在城市的另一端,41岁的许女士正将多年累积的语言学经验,转化为一条条四川方言数据。
红星新闻记者了解到,在生成式AI火热的当下,这群人隐于幕后,用最朴素的方言“喂养”着大模型的听觉神经。从“听懂”一句四川话到“看懂”一张医学影像,一场关乎就业重构与技术底座搭建的静默革命,正在这座城市的毛细血管中悄然发生。
“很多人以为AI是凭空变聪明的,其实它的本质是对劳动的重构。”14日下午,成都九州职业技能培训学校(以下简称九州学校)负责人曾静这样解释人工智能训练师这个新兴职业。
如果把大模型比作一个天赋异禀的婴儿,那么数据标注员就是教婴儿认识世界的第一任老师。
红星新闻记者了解到,近期金牛区人社局协同九州学校推出的四川话语音采集项目中,这种“教学”被具象化为一个个清晰的指令。曾静打了个比方:“目前的AI还处于刚刚学会走路的阶段,以扫地机器人为例子,它不知道什么是垃圾,也不知道路该怎么走。我们需要通过海量的数据标注,告诉它‘这是对的’,‘那是错的’。”这种被称为“数据标注”的工作,正是人工智能训练师的基石。
长期以来,AI语音识别技术在西南地区面临“方言数据稀缺”的困境。真实、多样的四川话语料,成为了训练智能语音系统急需的“养料”。金牛区敏锐捕捉到这一市场缺口,将人工智能训练师培训与语音采集需求精准对接。曾静透露,仅四川话这一个板块,就需要成千上百的人采集不同的声音,“这不仅仅是录入,而是在为AI构建听觉认知地图。”
王女士是该项目的“产量冠军”。今年4月,这位全职宝妈通过政务微信号了解到免费培训项目后,生活发生了微妙的变化。“孩子上幼儿园后,我每天有两三个小时的时间,晚上等他睡了还能再录一会儿。”
她向红星新闻记者展示着手机里的结算记录,一个包含200条语音的“方言包”半小时就能完成,时薪最高可达45元左右。对她而言,这不仅意味着每月几千元的额外收入,更重要的是打破了与社会脱节的焦虑。“以前觉得自己的圈子很小,现在我知道,我也在参与最前沿的科技,很有成就感。”
学校老师指导大家如何采集四川话曾静解释道:“一句AI生成的文本,往往需要10多个人重复录制,以覆盖青年、中老人等不同音色和语调。”这种众包式的采集,构建了一道天然的技术壁垒。
尽管方言采集项目预计最快半年内就会完成,但曾静和金牛区人社局看到的远不止于此。
