人工智能訓(xùn)練師:在數(shù)據(jù)海洋中練就“掘金術(shù)”
職教視野
人工智能訓(xùn)練師:在數(shù)據(jù)海洋中練就“掘金術(shù)”
耐心細(xì)致洗數(shù)據(jù)、掘金術(shù)模型訓(xùn)練數(shù)百次、人工調(diào)試參數(shù)到深夜,訓(xùn)練這是師數(shù)人工智能訓(xùn)練師的工作常態(tài),也是據(jù)海這一“新職業(yè)”的工匠精神所在。
從在校的洋中專業(yè)理論學(xué)習(xí),到參與校企合作項目、掘金術(shù)校內(nèi)人工智能工作坊深度實踐,人工再到勇于探索音頻領(lǐng)域現(xiàn)實應(yīng)用、訓(xùn)練獨立創(chuàng)業(yè)……寧波聲韻信息技術(shù)有限公司創(chuàng)始人、師數(shù)剛從寧波職業(yè)技術(shù)大學(xué)(以下簡稱“寧職大”)人工智能技術(shù)應(yīng)用專業(yè)畢業(yè)半年多的據(jù)海00后創(chuàng)業(yè)者張哲屹看似年輕,但已是洋中人工智能訓(xùn)練師領(lǐng)域的“老手”。
張哲屹認(rèn)為:“人工智能不是掘金術(shù)高大上的理論,是人工需要像工匠一樣,在枯燥的訓(xùn)練數(shù)據(jù)海洋中通過千萬次的訓(xùn)練,去打磨出一個可用的模型?!?/p>
“十四五”期間,人力資源和社會保障部累計發(fā)布72個新職業(yè),其中就涵蓋“人工智能訓(xùn)練師”“智能制造工程技術(shù)人員”“虛擬現(xiàn)實工程技術(shù)人員”等新職業(yè)。
當(dāng)前,人工智能賦能千行百業(yè),創(chuàng)造出了更多細(xì)分的新崗位。“人工智能訓(xùn)練師”到底學(xué)什么?又有怎樣的就業(yè)方向和潛力?
“人工智能訓(xùn)練師”學(xué)什么?怎么學(xué)?
張哲屹告訴中青報·中青網(wǎng)記者,“對于這一新職業(yè),如果單指‘訓(xùn)練師’,只進(jìn)行模型的訓(xùn)練和調(diào)試,是不對的。這只是整個流程中比較靠后的環(huán)節(jié)?!?/p>
“從預(yù)處理階段的數(shù)據(jù)清洗和處理,到數(shù)據(jù)指標(biāo)設(shè)定和數(shù)據(jù)標(biāo)注,再到算法設(shè)計、建模,最后才是對成熟模型進(jìn)行訓(xùn)練、調(diào)優(yōu)?!睂幝毚笕斯ぶ悄芗夹g(shù)應(yīng)用專業(yè)主任曹瑛提到,“這些環(huán)節(jié)所需掌握的技能,學(xué)校都有對應(yīng)的課程?!崩鐧C(jī)器學(xué)習(xí)、人工智能數(shù)據(jù)服務(wù)、圖像處理技術(shù)、深度學(xué)習(xí)等,都是人工智能技術(shù)應(yīng)用專業(yè)的核心課程,“均從最基礎(chǔ)的原理展開教學(xué),幫助學(xué)生系統(tǒng)掌握神經(jīng)網(wǎng)絡(luò)等關(guān)鍵技術(shù)的核心邏輯”。
“例如,要訓(xùn)練同學(xué)視覺識別等方面技能的掌握情況,學(xué)校會設(shè)置‘工業(yè)零部件視覺檢測’項目。傳統(tǒng)的人工檢測方式,效率較低?!辈茜f,在教學(xué)中使用來源于真實業(yè)務(wù)場景的案例,再分解成一個個小任務(wù),去教會學(xué)生們整個流程所需的技能。
張哲屹就曾參加過學(xué)校與寧波鋼鐵有限公司合作的“鋼廠數(shù)據(jù)采集打標(biāo)服務(wù)”等校企合作項目,在實踐中進(jìn)一步鍛煉了其專業(yè)技術(shù)能力。
他還提到了學(xué)院的人工智能工作坊?!斑@里營造了一種近乎實戰(zhàn)的研發(fā)氛圍,是我從一名學(xué)生向‘人工智能訓(xùn)練師’蛻變的關(guān)鍵期?!?/p>
以“數(shù)據(jù)標(biāo)注員”這一細(xì)分崗位為例,張哲屹認(rèn)為,正如有點調(diào)侃意味的“人工智能背后,有多少‘智能’就有多少‘人工’”之言,數(shù)據(jù)標(biāo)注在他看來是很重要的一個崗位?!耙詧D片的視覺識別模型為例,‘標(biāo)注’需要不斷訓(xùn)練模型對圖片中部分區(qū)域的框定準(zhǔn)確性,這是后續(xù)工作的基礎(chǔ)。一批‘標(biāo)注’質(zhì)量差的數(shù)據(jù),對于模型訓(xùn)練來說是毀滅性的?!彼J(rèn)為,“標(biāo)注”的質(zhì)量決定了整體模型的上限。
寧職大人工智能學(xué)院副院長何頌頌介紹,學(xué)校人工智能技術(shù)應(yīng)用專業(yè)包括兩個方向:智能應(yīng)用和工業(yè)視覺?!按笠粌蓚€學(xué)期都是專業(yè)基礎(chǔ)課,這兩個方向的課程設(shè)置是一樣的。但大二、大三會有專門的專業(yè)課和實踐課,智能應(yīng)用方向有智能應(yīng)用開發(fā)、大數(shù)據(jù)應(yīng)用實戰(zhàn)等,工業(yè)視覺方向包含工業(yè)系統(tǒng)應(yīng)用項目實戰(zhàn)、計算機(jī)視覺應(yīng)用實戰(zhàn)等課程。”
南京信息職業(yè)技術(shù)學(xué)院(以下簡稱“南信院”)在高職院校中最早成立人工智能學(xué)院,該校人工智能學(xué)院院長何淼告訴中青報·中青網(wǎng)記者,自設(shè)立人工智能技術(shù)應(yīng)用專業(yè)以來,學(xué)校始終緊跟技術(shù)發(fā)展的市場趨勢,更新專業(yè)培養(yǎng)方案。圍繞人工智能應(yīng)用開發(fā)技術(shù)鏈前端數(shù)據(jù)崗位群、末端應(yīng)用開發(fā)崗位群,形成人工智能學(xué)院的專業(yè)區(qū)分定位。
2024年,該校又率先新增了“人工智能數(shù)據(jù)工程技術(shù)專業(yè)”。何淼認(rèn)為,“前期人工智能技術(shù)應(yīng)用,更多是對傳統(tǒng)經(jīng)典算法的使用。隨著人工智能技術(shù)不斷發(fā)展,我們發(fā)現(xiàn)‘算法再好,沒有好的數(shù)據(jù)還是不行’。未來人工智能賦能千行百業(yè),都需要各個領(lǐng)域的高質(zhì)量數(shù)據(jù),這就催生出諸如‘人工智能數(shù)據(jù)工程師’等崗位。”因此,基于人工智能技術(shù)的數(shù)據(jù)基座邏輯,該院在專業(yè)設(shè)置方面已開始提前布局。
在競賽考證中,充滿“技能值”
在剛結(jié)束不久的第五屆全國工業(yè)設(shè)計職業(yè)技能大賽決賽中,寧波職業(yè)技術(shù)大學(xué)人工智能技術(shù)應(yīng)用專業(yè)大二學(xué)生留梓菡拿下了人工智能訓(xùn)練師賽項學(xué)生組冠軍。
“這個比賽分考查理論和實操兩部分,有5個模塊,包括:智能家居搭建,數(shù)據(jù)信息處理,模型的調(diào)試和運(yùn)用,智能體搭建,圖片生成、聲音克隆等智能模型的生成。選手需要在4個半小時內(nèi),完成所有模塊的任務(wù),按點計分?!绷翳鬏照f。
她提到,自己是在學(xué)校的人工智能工作坊中,獲取到一些校企合作項目和參與各種競賽的信息資源。
張哲屹曾參加過第二屆全國工業(yè)和信息化技術(shù)技能大賽,那是他第一次深刻體會到“人工智能訓(xùn)練師”的含義。他記得,在老師們的指導(dǎo)下,“為了提升模型在特定工業(yè)場景下的識別精度,我們團(tuán)隊反復(fù)進(jìn)行了數(shù)百次的模型訓(xùn)練與迭代?!庇性S多個夜晚,團(tuán)隊成員一起盯著屏幕上的損失函數(shù)曲線,一行行地檢查預(yù)處理管線,一遍遍地調(diào)整超參數(shù)。
通常在大三時,同學(xué)們會去考“人工智能訓(xùn)練師”這一證書?!皩W(xué)校人工智能技術(shù)應(yīng)用專業(yè)2024屆學(xué)生共163人,162人拿到了這個證書?!睂幝毚笕斯ぶ悄軐W(xué)院教師李超煒介紹道。
早在2021年,人力資源和社會保障部就已發(fā)布《人工智能訓(xùn)練師國家職業(yè)技能標(biāo)準(zhǔn)》,提出“人工智能訓(xùn)練師是指使用智能訓(xùn)練軟件,在人工智能產(chǎn)品實際使用過程中進(jìn)行數(shù)據(jù)庫管理、算法參數(shù)設(shè)置、人機(jī)交互設(shè)計、性能測試跟蹤及其他輔助作業(yè)的人員”。
該新職業(yè)包含數(shù)據(jù)標(biāo)注員、人工智能算法測試員兩個核心工種,共設(shè)五個等級,依次為初級工、中級工、高級工、技師和高級技師。李超煒表示,“學(xué)生的專業(yè)技能和考這個證書的技能是一致的,基本上都能拿下三級/高級工的證書?!?/p>
浙江工商職業(yè)技術(shù)學(xué)院人工智能學(xué)院副院長李福安告訴中青報·中青網(wǎng)記者,該校2025屆首屆人工智能技術(shù)應(yīng)用專業(yè)畢業(yè)生,在“人工智能訓(xùn)練師”高級工證書方面的下證率達(dá)到“全員通過”。李福安認(rèn)為,這個證書在一定程度上能反映學(xué)生們的基本技能水平,有助于其求職就業(yè)。
人工智能“新職業(yè)”需面向現(xiàn)實場景
隨著人工智能技術(shù)和產(chǎn)業(yè)迅速迭代升級,新的專業(yè)、職業(yè)正在迅速豐富。何淼表示,“可以預(yù)估,未來人工智能產(chǎn)業(yè)的崗位肯定呈體系化布局,中職、高職、本科都會有差異化定位的新職業(yè)出現(xiàn)。職業(yè)教育需要更加及時地調(diào)整相應(yīng)的專業(yè)設(shè)置和更新技能人才培養(yǎng)的模式”。
他進(jìn)一步補(bǔ)充道,光是前期的數(shù)據(jù)采集處理和測試、數(shù)據(jù)集開發(fā)等環(huán)節(jié),就可能產(chǎn)生“人工智能數(shù)據(jù)服務(wù)員”“人工智能數(shù)據(jù)工程師”等崗位,未來甚至可能會有“人工智能數(shù)據(jù)集測試質(zhì)檢員”“數(shù)據(jù)資產(chǎn)交易員”等更細(xì)分的崗位?!霸凇丁?dāng)?shù)據(jù)要素×’三年行動計劃(2024-2026年)》背景下,這些新職業(yè)都可能在數(shù)據(jù)市場化配置過程中應(yīng)運(yùn)而生?!?/p>
產(chǎn)教融合的培養(yǎng)體系之下,張哲屹敏銳地發(fā)現(xiàn)了音頻合成領(lǐng)域的痛點:市面上的相關(guān)資料稀缺,且落地產(chǎn)品很少。于是,畢業(yè)后,他創(chuàng)立了公司,專注于實時語音轉(zhuǎn)換服務(wù)。短短3個月,公司運(yùn)營的平臺用戶已突破3萬人。并且,為了推動音頻領(lǐng)域AI的發(fā)展,張哲屹選擇開源數(shù)個核心訓(xùn)練成果,讓更多開發(fā)者能在此基礎(chǔ)上繼續(xù)探索。
面對AI“新職業(yè)”的廣闊前景,學(xué)校面向當(dāng)?shù)禺a(chǎn)業(yè)和現(xiàn)實需要辦學(xué),培養(yǎng)“直接能上手、入職就能干”的職業(yè)技能人才。
此前,寧職大啟動了第二批“海康機(jī)器人工業(yè)視覺訂單班”的招募?!?024年首批學(xué)生通過訂單班培養(yǎng),已全部加入??翟趯幉ǖ貐^(qū)的核心經(jīng)銷商體系,以工業(yè)視覺工程師身份負(fù)責(zé)客戶現(xiàn)場方案調(diào)試、設(shè)備運(yùn)維及技術(shù)培訓(xùn)工作,服務(wù)領(lǐng)域覆蓋汽車零部件檢測、智能倉儲分揀等新質(zhì)生產(chǎn)力領(lǐng)域?!辈茜f。
她強(qiáng)調(diào),正是基于首批合作在人才輸送精準(zhǔn)度、崗位適配性上的成功實踐,此次第二批訂單班在課程設(shè)置、實訓(xùn)安排上進(jìn)一步優(yōu)化,將更精準(zhǔn)對接??诞a(chǎn)業(yè)鏈上下游的人才需求。
相比于人工智能相關(guān)專業(yè)的本科生、研究生,職業(yè)院校的同學(xué)畢業(yè)后直接進(jìn)入大廠、車企、大型工業(yè)企業(yè)的難度比較大?!暗?,我們?yōu)橥瑢W(xué)們規(guī)劃的職業(yè)路徑就是,先進(jìn)入這些企業(yè)的下游集成商,在實際的AI應(yīng)用場景中鍛煉解決問題的能力、提升技能。這樣經(jīng)過幾年的工作經(jīng)驗積累,同學(xué)們也有機(jī)會進(jìn)入到上游、更高層次的一些企業(yè)中,或者自己成為獨立的集成商?!焙雾烅炋寡?。
此外,寧波當(dāng)?shù)氐闹圃鞓I(yè)企業(yè)數(shù)量較多,許多公司正在進(jìn)行智能化改造,需要相應(yīng)的技術(shù)運(yùn)維人員,“學(xué)生們?nèi)ゴ祟惣缮唐髽I(yè),工作常態(tài)就是去各種行業(yè)的企業(yè)、工廠,為其搭建整體的智能化改造方案,并進(jìn)行技術(shù)運(yùn)維?!焙雾烅炚f。這也是人工智能技術(shù)應(yīng)用專業(yè)賦能、跨界的生動體現(xiàn)。
中青報·中青網(wǎng)記者 李思 來源:中國青年報
2026年01月09日 07版
相關(guān)文章
中新社拉斯維加斯1月8日電 (記者 張朔)當(dāng)?shù)貢r間6日至9日,2026年美國消費電子展(CES)在拉斯維加斯舉行。眾多中國企業(yè)攜擁有領(lǐng)先技術(shù)的新品參展,“中國智造”亮點紛呈。當(dāng)?shù)貢r間1月6日,20262026-01-09
記者:布倫南·約翰遜身穿水晶宮11號球衣,3500萬鎊轉(zhuǎn)會費創(chuàng)紀(jì)錄
直播吧1月2日訊 記者Chris Wheatley曬照,布倫南·約翰遜將身穿水晶宮11號球衣。記者Chris Wheatley在社媒曬出一張布倫南·約翰遜身穿水晶宮11號球衣的照片,并配文:布倫南·約2026-01-09
瓜帥賽前:困難會讓我們更強(qiáng) 對于馬雷斯卡下課只能說自己很幸運(yùn)
直播吧1月2日訊 北京時間1月5日凌晨1:30,英超第20輪將迎來一場焦點戰(zhàn),曼城坐鎮(zhèn)主場對戰(zhàn)切爾西。今日曼城主帥瓜迪奧拉出席了新聞發(fā)布會。談球隊的周轉(zhuǎn)情況我們將看看球員們的恢復(fù)情況,眼下在這個階段,2026-01-09
弗拉格:希望獲得更多三分出手機(jī)會 只要出現(xiàn)空位就會果斷出手
直播吧1月2日訊 NBA常規(guī)賽,獨行俠108-123不敵76人。賽后,弗拉格接受了采訪。談及自己NBA生涯至今三分球出手選擇與嘗試次數(shù),弗拉格表示:“我當(dāng)然希望能獲得更多出手機(jī)會。教練已經(jīng)給了我們無限2026-01-09
奇才封神!3年把比爾變成特雷楊+12個未來資產(chǎn),這波操作太魔幻
兄弟們,NBA 最顛覆認(rèn)知的交易來了!奇才用 3 年時間玩了一場 " 魔術(shù) ",硬生生把有交易否決權(quán)的比爾,變成了特雷楊 +8 個選秀權(quán)和 4 個首輪互換權(quán),這波操作直接可以給到 S+,簡直是教科書級2026-01-09
羅體:羅馬與拉斯帕多里尚未達(dá)成個人協(xié)議,拉齊奧想要鉆空子截胡
直播吧1月2日訊 據(jù)《羅馬體育報》報道稱,拉齊奧想要截胡拉斯帕多里。羅馬已經(jīng)打響冬窗引援第一炮,他們與馬競就拉斯帕多里達(dá)成了協(xié)議,這將是一筆總價2200萬歐元的先租后買交易,若達(dá)成某些特定條件,如獲得2026-01-09
