目前,智能手機的賽點正在從“全面屏”轉向AI。由于AI成為一個越來越熱門的話題與概念,從互聯網廠商到手機廠商,幾乎所有公司都在給自身貼上AI的標簽,以便占據未來一波潮流的坑位。事實上,在智能助手方面,除了走在前列的谷歌、蘋果之外,仍有部分知名巨頭在這一領域努力耕耘。比如今年11月21日,三星電子在北京正式發布了三星Bixby語音中文(普通話)版,完美的詮釋了一個人工智能多模交互平臺,將語義理解、場景感知、認知容忍等人工智能技術與智能手機產品進行深度融合,通過自然對話形式的人機交互最大化方便用戶的操作。
而這種人機交互變革還體現在視覺智能化層面——視覺結合內置相機應用,當對準特定的物體時,可通過Bixby視覺攝像頭檢測文本并提取、翻譯,通過街景的相機視窗,定位或者搜索購物信息與場景感知,這是一種視覺層面的人機交互。雖然我們還處在語音交互的早期,正如當初網絡出現時并非交互式的一樣,但我們可以看到語音交互這種技術已經浮出水面?!痘ヂ摼W趨勢》報告顯示,語音將是人機交互的新范式,語音技術將解放人類雙手和眼睛,用戶以較低的成本實現隨時訪問。當人機共存無可避免,人類該采取什么態度?上海大學社會科學學院教授楊慶峰的答案是“開放、理性和包容”:“整個社會所需要的準備是多方面的,至少包括制度政策、價值觀、倫理和法律這四個方面。”
然而也有專家強調要為人工智能的發展設限。人與機器人完全平等、相互尊重是一種道德理想,就跟人需要把自然當朋友一樣。但在具體的人類活動面前,開明的人類中心主義才是具有可操作性的現實途徑。人類必須為機器人設置禁區,在與機器人和諧相處的同時,慎重開發機器人的情感和意識。
作為人工智能的重要一步,語音識別的進步代表著機器的聽力發展。近些年來,語音識別技術突飛猛進,受到廣大公眾的極大關注。但是在硬件、算法、內容方面,語音識別技術依然存在問題。首先是硬件,硬件部分芯片與麥克風陣列是核心部件。當下的語音技術還只在算法階段;其次是算法,主要包括語音檢測、降噪、去混響和回聲消除等傳統音箱和通訊工具也需要具備的基本算法;第三是內容,語音識別的目的是將語音信號轉化為文本。
目前,語音識別技術相對成熟。聲紋識別是根據語音波形反映出的個人生理和行為特征的語音參數,并以此來識別說話者的身份。但在現實中,該識別的準確率并不如指紋、虹膜識別。這也是智能語音更高“智能”形態的表現特征。但如果我們從未來趨勢看,AI如果要在智能手機市場爆發變革創新方向,絕不會僅僅停留在優化拍照的路上。因為真正的AI,它的核心在于人機的互動,讓機器越來越懂人類。