AI“讀唇術(shù)”,靠什么讓“失語者”重新“開口”?
[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”。現(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的
原創(chuàng)
2020-04-06 07:30:49
來源:釘科技??

[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。

之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的唇部動作的的技術(shù),一種僅靠檢測喉嚨運動的“讀唇術(shù)”據(jù)說也被研發(fā)出來了。

圖片 1.png

據(jù)《itmedia》網(wǎng)站消息,近日,東京大學(xué)和索尼計算機科學(xué)研究所共同研發(fā)出的AI系統(tǒng)“Derma”,通過將傳感器貼合在喉嚨周圍的皮膚上,就能成功實現(xiàn)從口形(無聲說話)到語音的轉(zhuǎn)化。

研究靈感最初來源于視聽障礙者的觸診唇讀法,他們會用手指觸摸說話者的嘴唇和下巴周圍,以此讀取說話內(nèi)容。也就是說,他們通過觸摸障礙者嘴唇周圍的皮膚得知他們的說話內(nèi)容。

AI系統(tǒng)“Derma”應(yīng)用時,在下顎皮膚的兩個位置安裝加速度計和角速度傳感器,輔之機器學(xué)習(xí),通過隨著說話發(fā)生的下顎運動和舌肌運動引起的從下顎到喉嚨的皮膚顫動,進行無聲“語音識別”。(釘科技編譯,消息來源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

最新文章
1
科技行業(yè)超“級”玩家誕生 Vidda兩大新品助力年輕人享受科技樂趣
2
創(chuàng)維G7F Pro,為什么能“超越”O(jiān)LED?
3
康佳G9W新品全球首發(fā),全網(wǎng)最具性價比的Mini AI-LED壁紙電視
4
創(chuàng)維Mini LED電視G7F Pro震撼上市|極致體驗超越OLED
5
培生集團與亞馬遜云科技宣布 為全球數(shù)百萬人開啟AI賦能的個性化學(xué)習(xí)
6
空調(diào)子品牌2025很活躍:格力用晶弘打天下,美的系華凌求變化
7
第35屆中國家電交易會電商新渠道選品會:創(chuàng)新引領(lǐng)趨勢,賦能行業(yè)發(fā)展
8
100英寸Mini LED類紙屏!京東定制創(chuàng)維JD100 Mini開售:國補后8999元
9
2月中國電視市場海信出貨量第一!索尼、夏普等外資品牌繼續(xù)承壓
10
中國彩電出口創(chuàng)歷史新高,美加征關(guān)稅下能否持續(xù)增長?
11
315關(guān)注:國檢曝光網(wǎng)購家電質(zhì)量問題,平臺莫縱容偽劣家電泛濫
12
新款小鵬G6/G9最高降價近8萬,何小鵬很想再贏一次
13
蘋果帶頭干掉實體卡槽,eSIM終于要普及了?
14
憑借輕薄外觀與軟件優(yōu)化,OPPO Find N5備受女性用戶青睞
15
可搭桌面5090、內(nèi)置全套水冷,重量達10斤 你管這玩意叫筆記本?
16
TCL發(fā)布“第四代液晶電視”,前三代液晶電視分別什么樣?
17
中低端空調(diào)變天?格力子品牌晶弘將入場 華凌、Leader迎強力挑戰(zhàn)
18
平板電腦市場,華為=小米+榮耀+聯(lián)想
19
康佳新品G9W體驗:新品優(yōu)惠疊加國補,目前全網(wǎng)性價比最高的Mini LED壁紙電視
20
零跑B10想做13萬級智駕平權(quán)“屠夫”,憑什么?
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512