很多人每天花費(fèi)大量時(shí)間使用移動(dòng)設(shè)備鍵盤:撰寫電子郵件,發(fā)短信,參與社交媒體等。 然而,移動(dòng)鍵盤仍然在處理速度方面處于劣勢。 用戶平均在移動(dòng)設(shè)備上的打字速度比在物理鍵盤上慢35%。 為了改變這一點(diǎn),*近谷歌團(tuán)隊(duì)為Gboard for Android提供了許多改進(jìn),致力于創(chuàng)建一個(gè)智能機(jī)制的 鍵盤,能夠?yàn)橛脩粢匀魏芜x擇的語言提供建議和糾正錯(cuò)誤,從而實(shí)現(xiàn)更快更高質(zhì)量的輸入。
事實(shí)上,移動(dòng)鍵盤將觸摸輸入轉(zhuǎn)換為文本的方式類似于語音識(shí)別系統(tǒng)將語音輸入轉(zhuǎn)換為文本的方式,雷鋒網(wǎng)了解到,該團(tuán)隊(duì)將利用語音識(shí)別的經(jīng)驗(yàn)來實(shí)現(xiàn)觸摸輸入。
團(tuán)隊(duì)首先創(chuàng)建了一個(gè)強(qiáng)大的空間模型,將原始觸摸點(diǎn)的模糊序列映射到鍵盤上的按鍵,就像用聲學(xué)模型將聲音定位到語音單元的順序一樣。
第二,構(gòu)建一個(gè)基于有限狀態(tài)傳感器(FST)的核心解碼引擎,以確定給定輸入觸摸序列的*有可能的字符序列。 隨著數(shù)學(xué)形式主義和語音應(yīng)用的廣泛成功, FST解碼器將提供支持各種復(fù)雜鍵盤輸入行為以及語言特性所需的靈活性。 在這篇文章中,將為您詳細(xì)介紹這兩個(gè)系統(tǒng)的發(fā)展。
神經(jīng)空間模型
移動(dòng)鍵盤輸入的錯(cuò)誤通常歸結(jié)于“胖手指打字”(fat finger typing,或在滑動(dòng)打字中定位到空間位置相似的詞,如下圖所示)以及認(rèn)知和操作錯(cuò)誤(表現(xiàn)為拼寫錯(cuò)誤,字符插入,刪除或互換等)。 智能鍵盤需要能夠解決這些錯(cuò)誤,并且可以快速**地預(yù)測**的單詞。 據(jù)雷鋒網(wǎng)了解,該團(tuán)隊(duì)為Gboard構(gòu)建了一個(gè)空間模型,用于在字符級(jí)別處理這些錯(cuò)誤,將屏幕上的觸摸點(diǎn)映射到實(shí)際按鍵。