人工智能模型消化80小時(shí)的視頻以學(xué)習(xí)手語(yǔ)
對(duì)于聾人和重聽(tīng)者來(lái)說(shuō),像Alexa和Siri這樣的語(yǔ)音識(shí)別技術(shù)反而可能是有效溝通的障礙。研究人員利用人工智能開(kāi)發(fā)了一種將手語(yǔ)轉(zhuǎn)換為文本的工具,可能會(huì)增加聾人社區(qū)的包容性和可及性。
翻譯手語(yǔ)需要精確理解手語(yǔ)者的姿勢(shì),以產(chǎn)生準(zhǔn)確的文字轉(zhuǎn)寫。巴塞羅那超級(jí)計(jì)算中心(BSC)和加泰羅尼亞理工大學(xué)(UPC)的研究人員利用人工智能開(kāi)發(fā)了一種改進(jìn)手語(yǔ)翻譯的工具,這是允許聾人和重聽(tīng)者與技術(shù)互動(dòng)并獲得為口語(yǔ)設(shè)計(jì)的數(shù)字服務(wù)的重要一步。
研究人員使用了一個(gè)轉(zhuǎn)化器式的機(jī)器學(xué)習(xí)模型,與ChatGPT等其他人工智能工具背后的模型類似。變壓器之所以有用,主要有兩個(gè)原因。第一,這些模型特別善于學(xué)習(xí)如何應(yīng)用上下文,這是因?yàn)榧軜?gòu)中存在自我注意機(jī)制--自我注意是神經(jīng)網(wǎng)絡(luò)如何通過(guò)查看文本中的其他詞匯來(lái)確定詞匯的上下文。其次,當(dāng)從訓(xùn)練實(shí)例中學(xué)習(xí)時(shí),它們?cè)试S更快的吞吐量,使更多的訓(xùn)練數(shù)據(jù)在特定時(shí)間內(nèi)被使用。
這里的訓(xùn)練數(shù)據(jù)集來(lái)自How2Sign,這是一個(gè)公開(kāi)可用的大規(guī)模、多模態(tài)和多視圖數(shù)據(jù)集,包括80小時(shí)的美國(guó)手語(yǔ)教學(xué)視頻和相應(yīng)的英語(yǔ)文字記錄。
該研究的主要作者Laia Tarrés說(shuō):"所開(kāi)發(fā)的新工具是以前同樣由BSC和UPC發(fā)布的名為How2Sign的出版物的延伸,在那里,訓(xùn)練模型所需的數(shù)據(jù)(超過(guò)80小時(shí)的視頻,其中美國(guó)手語(yǔ)翻譯人員翻譯了烹飪食譜或DIY技巧等視頻教程)被公布。有了這些已經(jīng)可用的數(shù)據(jù),該團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)新的開(kāi)源軟件,能夠?qū)W習(xí)視頻和文本之間的映射。"
對(duì)于研究人員來(lái)說(shuō),使用連續(xù)簽名的視頻而不是孤立的簽名是很重要的,因?yàn)樗鎸?shí)地反映了說(shuō)話者是如何自然地使用一連串的詞(連接)來(lái)構(gòu)建句子的,這對(duì)確定一個(gè)句子的含義是至關(guān)重要的。
研究人員面臨的一個(gè)挑戰(zhàn)是手語(yǔ)的多變性和復(fù)雜性,它可能受到諸如手語(yǔ)者的背景、背景和外表的影響。為了在這方面有所幫助,他們使用膨脹式三維網(wǎng)絡(luò)(I3D)對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,這是一種視頻提取方法,對(duì)視頻進(jìn)行三維過(guò)濾,允許直接從視頻中獲取時(shí)空信息。
研究人員發(fā)現(xiàn),文本預(yù)處理也大大改善了簽名到文本的翻譯。為了預(yù)處理原始文本,他們將其全部轉(zhuǎn)換為小寫字母,從而降低了詞匯的復(fù)雜性。
總體而言,他們發(fā)現(xiàn)他們的模型能夠產(chǎn)生有意義的翻譯,但并不完美。"研究人員說(shuō):"雖然我們的工作顯示出有希望的結(jié)果,但仍有改進(jìn)的余地。
由于該模型仍處于實(shí)驗(yàn)階段,研究人員將繼續(xù)努力創(chuàng)建一個(gè)工具,使聾人和重聽(tīng)者能夠獲得與無(wú)聽(tīng)力損失者相同的技術(shù)。
Tarrés說(shuō):"這個(gè)自動(dòng)手語(yǔ)翻譯的開(kāi)放工具是對(duì)關(guān)注無(wú)障礙環(huán)境的科學(xué)界的寶貴貢獻(xiàn),它的發(fā)表代表了向?yàn)樗腥藙?chuàng)造更具包容性和無(wú)障礙的技術(shù)邁出的重要一步。"
該研究報(bào)告在線發(fā)表在arXiv上。
關(guān)鍵詞: 人工智能 人工智能模型 手語(yǔ)學(xué)習(xí)
責(zé)任編輯:hnmd004
- 人工智能模型消化80小時(shí)的視頻以學(xué)習(xí)手語(yǔ)2023-05-25
- 如果信用卡逾期了怎么辦呢?支付寶信用卡還2023-05-25
- 成交額多少的股票適合買?股票成交金額越大2023-05-25
- 如果信用卡逾期了怎么辦?臨時(shí)額度可以分期2023-05-25
- 工行visa信用卡怎么用?工行visa信用卡怎么2023-05-25
- 吊秤日常怎么維護(hù)保養(yǎng)?電子吊秤怎么校準(zhǔn)?2023-05-25
- 企業(yè)所得稅匯算清繳什么時(shí)候報(bào)送?企業(yè)所得2023-05-25
- 離婚孩子撫養(yǎng)權(quán)能變更嗎?可以變更的法定情2023-05-25
- MateX3典藏版如何分屏 matex3典藏版和普通2023-05-25
- 股票短線是多少天?炒股短線中線長(zhǎng)線各是多2023-05-25
- 信用卡逾期名下有房子能轉(zhuǎn)移嗎?信用卡分期2023-05-25
- 不得用考試選拔學(xué)生 義務(wù)教育拒絕“挑三揀2023-05-25
- 一季度中國(guó)大陸PC市場(chǎng)出貨量是多少?同比有2023-05-25
- 股票價(jià)格變化跟公司有關(guān)系嗎?剛被st的股票2023-05-25
- 強(qiáng)令違章冒險(xiǎn)作業(yè)罪和重大責(zé)任事故罪的區(qū)別2023-05-25
- 攝影師用4小時(shí)曝光捕捉到北極星附近隱藏星2023-05-25
- 標(biāo)準(zhǔn)差計(jì)算公式是怎樣的?標(biāo)準(zhǔn)差是什么意思2023-05-25
- 國(guó)債逆回購(gòu)是買漲還是買跌?28天國(guó)債逆回購(gòu)2023-05-25
- 營(yíng)業(yè)執(zhí)照查詢方法是什么?個(gè)體戶怎么辦理營(yíng)2023-05-25
- 銀行信用貸款怎么貸?信用貸最容易批的銀2023-05-25
- 夫妻已離婚去世后的財(cái)產(chǎn)怎么分配?夫妻已離2023-05-25
- 借唄是哪個(gè)銀行放款?借唄無(wú)力還款最佳處理2023-05-25
- 股票超大單是多少?股價(jià)跌破凈資產(chǎn)意味著什2023-05-25
- 華嚴(yán)洞是怎樣的景點(diǎn)?華嚴(yán)洞內(nèi)有哪些景觀?2023-05-25
- 代償是什么意思?代償期和失代償期區(qū)別2023-05-25
- 股票補(bǔ)缺口是啥意思?融資利率一般是多少?2023-05-25
- 婚姻登記條例第五條的內(nèi)容有哪些?辦理結(jié)婚2023-05-25
- 信用卡逾期1個(gè)月怎么辦?信用卡逾期被起訴2023-05-25
- 什么是毛利率法?毛利率法計(jì)算公式是什么?2023-05-25
- 建筑工程合同的特點(diǎn)有哪些?施工合同的內(nèi)容2023-05-25