SoundHound 再也不是一個音樂識別軟件了,他要做Siri沒做到的事情

SoundHound 再也不是一個音樂識別軟件了,他要做Siri沒做到的事情
SoundHound 再也不是一個音樂識別軟件了,他要做Siri沒做到的事情

音樂雷達類產品,都“意不在音樂”。Shazam 從音樂識別擴展到圖像識別,瞄準多屏互動和O2O,切入到整個企業營銷市場。

而另一個產品SoundHound,看起來沒有Shazam這麼多動靜,直到今天——今天他們上線了新產品Hound的安卓內測版。

說出來嚇死你,Hound 已經秘密研發了9 年。創始人和CEO Keyvan Mohajer 形容他們過去低調的經歷為“矽谷隱藏得最深的秘密”。音樂識別從來只是他們的第一步,他們一直以來都在埋頭研究技術:語音識別和自然語言處理。現在時候到了,他們推出了Hound,要讓它來解決人類對語音助手更大的需求。

換句話說,Hound 就是在做一個Siri 這樣的語音助手。市面上有這麼多款語音助手了,Hound 的區別在哪裡?其實沒有什麼差異,Hound 要做到的區別只有一個字:更好。

官方稱目前Hound 比較強的地方包括導航,本地搜索,天氣、股票、時區、地理等信息,酒店信息、航班信息,新聞,圖片和視頻搜索,貨幣換算等。

在Mohajer 向外媒展示Hound 的時候,我們能看到Hound 在一些方面表現很強大:

能理解複雜的長句。Mohajer 向TC 展示的時候說了一個很複雜​​的長句:When is the sun going to rise two days before Christmas of 2021 in Tokyo, Japan?

可以理解對不同主體的連續疑問,比如問“日本有多少人口啊”,然後再問一句“中國呢?”。也能對一個主體的不同事情聯繫發問,比如問完“中國有多少人口啊”之後,直接再問“所以按每平方公里來算是多少”。

另一個特點是延遲低。在發文之後,Hound 不會隔太久就能給出回答。Mohajer 解釋道,這是因為SoundHound 把語音識別和自然語言處理結合在一個引擎裡,而不是把它們當成兩個分別的任務區處理。

此外,Hound 在一些服務上接入了第三方應用的服務。比方在處理酒店預訂時,Hound 和Expedia 合作,用戶實際上是在後者的庫裡搜尋信息以及預訂服務。但是與第三方合作的時候,貌似延遲會嚴重一些,大概3-4 秒左右。

除了直接面向用戶的Hound App,這款產品還上線了一個開放平台。開發者可以輕鬆地為自己的App 裡添加一個語音交互。Mohajer 提到,Hound 地最終目標,不只是和Siri 這樣的語音助手或者Google 這樣的搜索引擎去競爭,而是希望將整個移動互聯網的交互趨勢從“觸摸和點擊”轉移到“語音”。

但是一個創業公司來做這件事情的確困難。技術只是一方面,長久以來用戶已經形成的使用習慣是另一個門檻。如果說服用戶下載Hound 並探索Hound 的種種功能,這並不容易。

這也是他們要做開放平台的原因,讓各種各樣不同的App 去幫Hound 推起語音交互這個潮流,比他們自己推面向用戶的App 容易一些。

題圖來自Re/code

[參考來源:TC、Re/code ]

原創文章,作者:thethief