siemens x
智能穿戴

你正在使用的智能音箱 可能偷聽了你的所有對話

2025China.cn   2019年12月16日

  據(jù)外媒,自2014年亞馬遜發(fā)布智能音箱Echo以來,亞馬遜Echo、谷歌Home和Apple HomePod等“智能音箱”設備已經(jīng)銷售了數(shù)以百萬臺,大科技公司正在將亞馬遜Alexa、蘋果Siri、谷歌Assistant、微軟Cortana,以及Facebook的類似服務整合到人們生活中。咨詢公司Juniper Research估計,到2023年,全球智能音箱年市場規(guī)模將達到110億美元,全球約有74億部語音控制設備。

  科技公司表示智能音箱只有在用戶激活時才會錄音,但事實上正在把永遠開著的麥克風引入私密空間。亞馬遜及其競爭對手表示,絕大多數(shù)語音請求都是由電腦自動執(zhí)行的,無需人工審核。然而,這些智能設備都在依賴成千上萬的低薪員工進行人工轉(zhuǎn)錄,用戶私密對話已經(jīng)成為他們最有價值的數(shù)據(jù)集之一。所有科技公司都認為,這是改善他們產(chǎn)品的一種合理方式。

  其實我們一直在被偷聽

  Ruthy Hope Slatis簡直不敢相信她所聽到的。她曾被波士頓郊外的一家臨時機構雇用,為亞馬遜轉(zhuǎn)錄音頻文件,這是一項被亞馬遜所模糊的工作。作為每小時只拿12美元薪酬的合同工,她和同事(正式名稱為數(shù)據(jù)助理)需要聽取隨機交談的片段,并在自己的筆記本電腦里記下聽到的每個單詞。

  亞馬遜對外只會說這項工作對其絕密的語音識別產(chǎn)品至關重要,然而,這些語音片段中卻包含著用戶親密時刻的錄音。

  2014年秋天,亞馬遜推出了Echo智能音箱,該設備帶有語音激活虛擬助手軟件Alexa。亞馬遜在其首個Echo廣告中將Alexa視為人工智能的奇跡。在該廣告中,一個幸福的家庭正在命令Alexa接收新聞更新、回答問題答案,并幫助孩子們做作業(yè)。但是,Slatis很快就開始意識到人類在這款產(chǎn)品背后的影響力。

  她記得當時自己在想:“天哪,這就是我正在做的事情?!眮嗰R遜會捕獲云中的每個語音命令,并依靠像她這樣的數(shù)據(jù)助理來訓練系統(tǒng)。一開始,Slatis認為自己所聽取的片段來自有酬勞的測試人員,這些測試人員自愿用自己的語音模式來換取幾美元的獎勵。然而,她很快意識到這個想法是錯誤的。

  她和她的同事正在聽取的錄音通常很激烈、很尷尬,而用戶也會在音箱面前承認自己的秘密和恐懼。隨著轉(zhuǎn)錄項目的發(fā)展以及Alexa的流行,錄音中透露的私人信息也隨之增加。其他合同工回憶說,自己聽過孩子分享了他們的家庭住址和電話號碼,聽到一名男子試圖訂購性玩具,甚至聽到一名晚宴客人大聲地想知道亞馬遜當時是否正在偷聽。Slatis說:“用戶往往只是開玩笑,但其實完全不知道自己正在被偷聽?!彼?016年選擇了辭職。

  科技公司們說他們正在改正

  記者了解到,自從Slatis第一次感到毛骨悚然以來的五年中,四分之一的美國人購買了“智能音箱”設備,例如Echo、Google Home和Apple HomePod。到目前為止,亞馬遜已經(jīng)贏得了這場銷售大戰(zhàn),據(jù)報道,用戶已經(jīng)購買了超過1億個Alexa設備。

  但是如今,這些全球最大的公司之間正在展開一場新的戰(zhàn)爭,通過將麥克風內(nèi)置于手機、智能手表、電視、冰箱、SUV等各種物品中,把Alexa、Siri、Google Assistant和Cortana嵌入到人們的生活中。咨詢公司Juniper Research估計,到2023年,全球智能音箱的年市場規(guī)模將達到110億美元,語音控制設備將達到約74億個,這相當于地球上的每個人都擁有一個設備。

  而現(xiàn)在的問題是,我們要如何處理這樣的規(guī)模呢?

  按照科技公司的聲明,這些機器并沒有每時每刻創(chuàng)建音頻文件,因為智能音箱僅在用戶激活它們時才錄制音頻。但是,當始終在線的麥克風被引入廚房和臥室中時,它們可能會無意間捕獲到用戶不想共享的聲音。

  然而,這些所謂的智能設備無疑需要依賴成千上萬的低薪人群,他們需要在這些聲音片段中添加注釋,以便技術公司可以升級其“電子耳朵”。至此,我們最微弱的耳語竟成為科技公司最有價值的數(shù)據(jù)集之一。

  今年早些時候,彭博社首先報道了技術行業(yè)使用人類來審查從用戶那里收集的音頻(并且沒有向用戶披露這一事實)。這其中就包括了蘋果、亞馬遜和Facebook。相關高管和工程師表示,建立龐大的人類監(jiān)聽網(wǎng)絡會帶來問題或干擾,盡管這一直是改善其產(chǎn)品的明顯方法。

  除此之外,記者也注意到,在過去的幾年中,蘋果在收集和分析人們的聲音方面變得更加激進,擔心Siri的理解力和速度落后于Alexa和Google Assistant。蘋果將Siri視為語音搜索引擎,因此它必須做好準備以應付無休止的用戶查詢,并加大對音頻分析的依賴。

  2015年,當蘋果首席執(zhí)行官蒂姆·庫克宣稱隱私是一項“基本人權”之時,蘋果的機器每周需要處理超過十億次請求。當時,用戶可以開啟一項功能,保持語音助手始終在線,這樣他們就不再需要按下按鈕來激活語音助手。蘋果在其用戶協(xié)議法律條款中表示,可能會記錄和分析語音數(shù)據(jù)以改善Siri,但沒有任何地方提到會是人類員工在監(jiān)聽。一位前合同工說:“監(jiān)聽別人的語音,讓我感到非常不舒服。曾在Siri高級開發(fā)團隊工作的John Burkey說?!斑@不是間諜行為。這與應用崩潰并詢問是否要將報告發(fā)送給蘋果的行為是相同的?!?/FONT>

  許多合同工表示,盡管大多數(shù)Siri要求都是很普通的,但他們?nèi)匀粫牭降纳榛恼Z音,以及種族歧視或恐同性言論。

  蘋果表示,只有不到0.2%的Siri請求需要進行人類分析。前任經(jīng)理將合同工的指控視為夸張。曾帶領開發(fā)團隊的Siri聯(lián)合創(chuàng)始人Tom Gruber說:“實際上,我們要處理的很多都是噪音,并不是說機器打算錄制某些聲音,這只是某種意義上的概率問題?!?/FONT>

  到2019年,蘋果將Siri引入其無線耳機和HomePod揚聲器等產(chǎn)品后,每月需要處理150億條語音命令。0.2%意味著每月,人類合同工需要處理3000萬條語音命令,一年下來就會是3.6億條。Siri團隊的前首席研究科學家Mike Bastian說,隨機錄制的風險隨著用例的增加也在不斷增長。他提到了Apple Watch的“抬起激活”功能,該功能在檢測到佩戴者的手腕被抬起時會自動激活Siri。他說:“這就導致假陽性率很高?!?/FONT>

  2016年,亞馬遜創(chuàng)建了Frequent Utterance Database(FUD),以幫助Alexa為常見請求添加答案。與FUD合作的前員工表示,渴望更積極挖掘數(shù)據(jù)的產(chǎn)品團隊與負責保護用戶信息的安全團隊之間存在緊張關系。2017年,亞馬遜推出了配備攝像頭的Echo Look,該產(chǎn)品被稱為AI造型師,可以推薦服裝搭配。知情人士說,它的開發(fā)者考慮將相機編程為在用戶要求Alexa講笑話時自動開機。他們的想法是錄制用戶面部的視頻并評估用戶是否在笑。這些人說,亞馬遜最終擱置了這個想法。該公司表示,Alexa目前沒有使用面部識別技術。

  該公司已在世界各地設立了轉(zhuǎn)錄“農(nóng)場”。今年,它舉行了多次面向海外轉(zhuǎn)錄員的入門招聘活動。一位花了數(shù)十年時間為科技公司開發(fā)識別系統(tǒng)的語音技術專家說,最近的招聘規(guī)模暗示亞馬遜音頻數(shù)據(jù)分析的規(guī)模令人震驚。亞馬遜表示,它“認真對待客戶及其錄音的安全性”,并且需要全面了解區(qū)域性口音和口語化才能使Alexa走向全球。

  微軟在今年8月承認,它使用人類幫助審查通過語音識別技術生成的語音數(shù)據(jù)。BMW、惠普和Humana等企業(yè)正在將這一技術集成到自己的產(chǎn)品和服務中。包括阿里巴巴、搜索巨頭百度和手機制造商小米在內(nèi)的中國科技公司每個季度都在收集數(shù)百萬個智能音箱的語音數(shù)據(jù)。

  谷歌搜索向Google Assistant提供了來自數(shù)十億種可用設備的查詢,這些設備包括Android智能手機和平板電腦、Nest恒溫器和Sony TV。谷歌已經(jīng)雇用了海外的臨時工來轉(zhuǎn)錄片段,以提高系統(tǒng)的準確性。谷歌已承諾,審閱的錄音不會與任何個人信息相關聯(lián)。但是今年夏天,一家谷歌承包商向比利時廣播公司VRT NWS分享了1000多個用戶記錄。這家媒體能夠根據(jù)用戶所說的話找出錄音中的某些人是誰,這讓那些被查明的用戶感到震驚。這些記錄中的10%,是因為設備錯誤地檢測到激活詞,并在未經(jīng)用戶同意的情況下進行了錄音。

  在相關新聞報道不斷出現(xiàn)之后,這些大型科技公司于今年調(diào)整了他們的虛擬助手項目。

  谷歌暫停了人類對Assistant音頻的轉(zhuǎn)錄,蘋果開始允許用戶刪除他們的Siri歷史記錄并選擇不共享更多內(nèi)容,使共享錄音成為可選內(nèi)容,并直接雇用了許多前承包商來增強其對人類監(jiān)聽的控制力。

  Facebook和微軟在其隱私政策中添加了更明確的免責聲明。

  亞馬遜也引入了類似的披露方式,并開始允許Alexa用戶選擇不進行人工審核。

  一些研究人員說,智能手機處理能力的提高和一種稱為聯(lián)合學習的計算機建模形式可能最終會淘汰這些監(jiān)聽行為,因為這些機器將變得足夠聰明,可以在沒有合同工幫助的情況下解決問題。目前,由于沒有更嚴格的法律或消費者的強烈反對,隨著語音設備的激增,人類音頻審核隊伍幾乎肯定會繼續(xù)增長。

(轉(zhuǎn)載)

標簽:智能音箱 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機器人下載中心
西克
2024全景工博會
專題報道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會,本屆展覽會... [更多]