雖然蘋果和谷歌的語音識別技術看起來很強大,不過使用硬件去進行相應的信息處理仍顯得吃力。
以Siri為例,它很依賴於芯片上的數字信號處理器(DSP,digital signals processor)來增強CPU處理這方面數據的能力,讓其移除背景噪音,準備好上傳到雲端進行處理的語音文件。用戶的話語需要說得比較規範,比如聲音要更洪亮,說得更專注,而這樣說話也顯得不自然。
無論蘋果和谷歌的技術,都需要按下手機上的按鍵,然後才能說出話語讓其接收語音信息(原文似乎忽略了Moto X的存在)。
英特爾計劃在Bay Trail上通過SST DSP來解決這樣的問題,並且會把這功能集成到2014年的Broadwell上。這技術將會帶來一個更自然的語音識別系統,而不會讓CPU有那麼重的工作負擔。
據稱Windows 8提供把聲音處理的工作交給DSP的軟件支持,就VR-Zone所掌握的的資料而言,英特爾的技術有可能會和微軟的這些軟件技術結合起來共同運作。

沒有留言:
張貼留言