谷歌氣球的人工智能為何令開發(fā)者自己感到驚奇?

2025China.cn 2021年03月05日

　　使用人工智能的算法正在嘗試以意想不到的技巧來(lái)解決問(wèn)題，這讓它們的開發(fā)者感到驚訝。但與此同時(shí)，這也引發(fā)了人們對(duì)如何控制人工智能的擔(dān)憂。

　　谷歌公司的一群?jiǎn)T工正茫然地盯著自己的電腦屏幕。幾個(gè)月來(lái)，他們一直在完善一個(gè)算法，用來(lái)控制一個(gè)無(wú)人熱氣球從波多黎各一直飛到秘魯。但還是有些地方不盡如人意，氣球在機(jī)器智能的控制下不斷偏離既定路線。

　　Loon項(xiàng)目(Project Loon)是谷歌公司現(xiàn)已停止的一個(gè)項(xiàng)目，旨在通過(guò)氣球?qū)⒒ヂ?lián)網(wǎng)接入偏遠(yuǎn)地區(qū)。作為該項(xiàng)目的負(fù)責(zé)人，塞爾瓦托·坎迪多無(wú)法解釋這個(gè)氣球的軌跡。最后，他的同事們手動(dòng)控制了系統(tǒng)，讓氣球回到了正軌。

　　后來(lái)他們才意識(shí)到發(fā)生了什么。令人意想不到的是，氣球上的人工智能學(xué)會(huì)了重現(xiàn)人類在幾百年，甚至幾千年前發(fā)明的古老航海技術(shù)，例如“改變航向”，這指的是操縱船只迎風(fēng)航行，然后再向外傾斜，從而在大致方向上以之字形前進(jìn)。

　　在不利的天氣條件下，自主飛行的氣球已經(jīng)學(xué)會(huì)了完全靠自己來(lái)改變航向。它們自發(fā)地完成了這一過(guò)程，讓所有人都感到震驚，尤其是參與這個(gè)項(xiàng)目的研究人員。

在Loon項(xiàng)目中控制氣球飛行的人工智能學(xué)會(huì)了一種迎風(fēng)航行的技術(shù)

　　“當(dāng)?shù)谝粋€(gè)被允許完全執(zhí)行這種技術(shù)的氣球創(chuàng)造了從波多黎各到秘魯?shù)娘w行時(shí)間記錄時(shí)，我們馬上意識(shí)到自己被打敗了，”坎迪多在一篇關(guān)于該項(xiàng)目的博客文章中寫道，“我從來(lái)沒(méi)有像這樣，同時(shí)感到自己既聰明又愚蠢?！?/FONT>

富有創(chuàng)造力的人工智能

　　當(dāng)人工智能在設(shè)備中被放任自流時(shí)，很可能就會(huì)發(fā)生這樣的事情。與傳統(tǒng)的計(jì)算機(jī)程序不同，人工智能的設(shè)計(jì)目的就是探索和開發(fā)新的方法，以完成人類工程師沒(méi)有明確告訴它們的任務(wù)。

　　然而，在學(xué)習(xí)如何完成這些任務(wù)的同時(shí)，人工智能有時(shí)會(huì)想出一種極富創(chuàng)造力的方法，甚至?xí)屢恢笔褂眠@種系統(tǒng)的人大吃一驚。這可能是一件好事，但同時(shí)也可能使人工智能控制的一切變得不可預(yù)測(cè)，甚至可能帶來(lái)危險(xiǎn)。例如，機(jī)器人和自動(dòng)駕駛汽車最終可能做出將人類置于危險(xiǎn)境地的決定。

　　人工智能系統(tǒng)怎么可能“智勝”它的人類主人呢?我們能否以某種方式約束機(jī)器智能，以確保不致某些不可預(yù)見的災(zāi)難?

　　隨著人工智能開始應(yīng)用于現(xiàn)實(shí)世界，了解它們是否會(huì)做一些意想不到的事情是很重要的　　在人工智能研究界，有一個(gè)關(guān)于人工智能創(chuàng)造力的例子似乎被引用得最多。佐治亞理工學(xué)院的馬克?里德爾表示，真正讓人們對(duì)人工智能的能力感到興奮的時(shí)刻，是DeepMind的人工智能機(jī)器學(xué)習(xí)系統(tǒng)AlphaGo如何掌握圍棋這一古老的游戲，然后擊敗了世界上最優(yōu)秀的人類棋手之一。DeepMind是一家創(chuàng)立于2010年的人工智能公司，在2014年被谷歌收購(gòu)。

　　里德爾解釋道：“事實(shí)證明，它們可以用一些以往從未有人用過(guò)——或者至少很多人不知道——的新策略或新技巧，來(lái)對(duì)付人類棋手?！?/FONT>

　　然而，即使是這樣一場(chǎng)單純的圍棋游戲，也會(huì)引起人們不同的感受。一方面，DeepMind自豪地描述了其系統(tǒng)AlphaGo的“創(chuàng)新”之處，并揭示了圍棋，這一人類已經(jīng)玩了數(shù)千年的游戲的新玩法。另一方面，一些人質(zhì)疑如此有創(chuàng)造性的人工智能有朝一日是否會(huì)對(duì)人類構(gòu)成嚴(yán)重威脅。

　　在AlphaGo取得歷史性勝利后，澳大利亞西悉尼大學(xué)的機(jī)器學(xué)習(xí)、電子學(xué)和神經(jīng)科學(xué)研究者喬納森?塔普森寫道：“認(rèn)為我們能夠預(yù)測(cè)或管理人工智能最壞的行為是很可笑的，我們實(shí)際上無(wú)法想象它們可能的行為。”

　　里德爾表示，我們需要記住的重要一點(diǎn)是，人工智能并不真正像人類那樣思考。它們的神經(jīng)網(wǎng)絡(luò)確實(shí)是受到了動(dòng)物大腦的啟發(fā)，但更確切地說(shuō)，它們是所謂的“探索設(shè)備”。當(dāng)它們?cè)噲D解決一個(gè)任務(wù)或問(wèn)題時(shí)，并不會(huì)帶有很多(如果有的話)對(duì)更廣闊世界的先入之見。它們只是嘗試——有時(shí)是數(shù)百萬(wàn)次——去找到一個(gè)解決方案。

　　“我們?nèi)祟愑泻芏嗨枷肷系陌?，我們?huì)考慮規(guī)則，”里德爾說(shuō)，“人工智能系統(tǒng)甚至不理解規(guī)則，因此它們可以隨意地?fù)芘挛铩！?/FONT>

　　里德爾補(bǔ)充道，在這種情況下，人工智能可以被描述為具有“學(xué)者癥候群”的硅等量物。所謂學(xué)者癥候群，通常是指一個(gè)人有嚴(yán)重的精神障礙，但卻在某種藝術(shù)或?qū)W術(shù)上擁有非凡的能力，其天賦通常與記憶有關(guān)。

不斷帶給我們驚奇

　　人工智能讓我們感到驚奇的方式之一，是它們能夠使用相同的基本系統(tǒng)來(lái)解決根本不同的問(wèn)題。最近，一款機(jī)器學(xué)習(xí)工具就被要求執(zhí)行一項(xiàng)非常不同的功能：下國(guó)際象棋。

　　該系統(tǒng)被稱為“GPT-2”，由非營(yíng)利的人工智能研究組織OpenAI開發(fā)。GPT-2利用數(shù)以百萬(wàn)計(jì)的在線新聞文章和網(wǎng)頁(yè)信息進(jìn)行訓(xùn)練，可以根據(jù)句子中前面的單詞預(yù)測(cè)下一個(gè)單詞。開發(fā)者肖恩·普萊瑟認(rèn)為，國(guó)際象棋的走法可以用字母和數(shù)字的組合來(lái)表示，因此如果根據(jù)國(guó)際象棋比賽的記錄來(lái)訓(xùn)練算法，這一工具就可以通過(guò)計(jì)算理想的走法序列來(lái)學(xué)習(xí)如何下棋。

　　普萊瑟對(duì)GPT-2系統(tǒng)進(jìn)行了240萬(wàn)場(chǎng)國(guó)際象棋比賽的訓(xùn)練?！翱吹较笃逡孀兂涩F(xiàn)實(shí)真是太酷了，”他說(shuō)，“我當(dāng)時(shí)根本不確定這能不能行得通。”但GPT-2做到了。盡管它的水平還比不上專門設(shè)計(jì)的國(guó)際象棋計(jì)算機(jī)，但已經(jīng)能夠成功地完成艱苦的比賽。

　　普萊瑟表示，他的實(shí)驗(yàn)表明GPT-2系統(tǒng)具有許多尚待探索的能力，堪稱一個(gè)具有國(guó)際象棋天賦的專家。該軟件后來(lái)的一個(gè)版本讓網(wǎng)頁(yè)設(shè)計(jì)人員大為震驚，當(dāng)時(shí)，一位開發(fā)人員對(duì)其進(jìn)行了簡(jiǎn)單的訓(xùn)練，讓它寫出用于在網(wǎng)頁(yè)上顯示項(xiàng)目(如文本和按鈕)的代碼。盡管只有一些簡(jiǎn)單的描述，如“表示‘我愛你’的紅色文本和帶有‘ok’的按鈕”，但這個(gè)人工智能依然生成了適當(dāng)?shù)拇a。很顯然，它已經(jīng)掌握了網(wǎng)頁(yè)設(shè)計(jì)的基本要領(lǐng)，但所受的訓(xùn)練卻少得驚人。

　　長(zhǎng)期以來(lái)，人工智能給人們留下的深刻印象主要來(lái)自電子游戲領(lǐng)域。在人工智能研究界，有無(wú)數(shù)例子揭示了算法在虛擬環(huán)境中所做到的事情有多么令人驚訝。研究者經(jīng)常在諸如電子游戲等空間中對(duì)算法進(jìn)行測(cè)試和磨練，以了解它們到底有多強(qiáng)大。

　　2019年，OpenAI因?yàn)橐欢我曨l登上了新聞?lì)^條。視頻中，一個(gè)由機(jī)器學(xué)習(xí)控制的角色正在玩捉迷藏游戲。令研究人員驚訝的是，游戲中的“尋找者”最終發(fā)現(xiàn)，它們可以跳到物品上方進(jìn)行“沖浪”，從而進(jìn)入“躲藏者”所在的圍欄。換言之，“尋找者”學(xué)會(huì)了為了自己的利益而改變游戲規(guī)則。

　　反復(fù)試錯(cuò)的策略會(huì)帶來(lái)各種有趣的行為，但并不總能帶來(lái)成功。兩年前，DeepMind的研究員維多利亞·克拉科夫娜邀請(qǐng)她博客的讀者分享人工智能解決棘手問(wèn)題的故事，但要求解決問(wèn)題的方式是不可預(yù)測(cè)或不可接受的。

　　她整理出了一長(zhǎng)串很吸引人的例子。其中有一個(gè)游戲算法，在第1關(guān)結(jié)束時(shí)學(xué)會(huì)了自殺，以避免在第2關(guān)死亡，這就實(shí)現(xiàn)了在第2個(gè)關(guān)卡中不死的目標(biāo)，只不過(guò)采用了一種特別令人印象深刻的方式。另一個(gè)算法發(fā)現(xiàn)，它可以在游戲中跳下懸崖，并將對(duì)手帶向毀滅;通過(guò)這種方式，人工智能得到了足夠的點(diǎn)數(shù)以獲得額外的生命，從而在無(wú)限循環(huán)中不斷重復(fù)這種自殺策略。

　　紐約大學(xué)坦登工程學(xué)院的電子游戲人工智能研究者朱利安·托格里烏斯試圖解釋這其中發(fā)生的一切。他表示，這些都是“獎(jiǎng)勵(lì)分配”錯(cuò)誤的典型例子。當(dāng)人工智能被要求完成某件事時(shí)，它可能會(huì)找到一些奇怪的、出乎意料的方法來(lái)實(shí)現(xiàn)目標(biāo)，并最終證明這些方法是正確的。人類很少采取這樣的策略，指導(dǎo)我們?nèi)绾斡螒虻姆椒ê鸵?guī)則十分重要。

　　托格里烏斯及其同事發(fā)現(xiàn)，當(dāng)人工智能系統(tǒng)在特殊條件下接受測(cè)試時(shí)，這種目標(biāo)導(dǎo)向的偏見會(huì)暴露出來(lái)。在最近的實(shí)驗(yàn)中，他的團(tuán)隊(duì)發(fā)現(xiàn)，被要求在銀行進(jìn)行投資的游戲人工智能角色會(huì)跑到虛擬銀行大廳附近的一個(gè)角落，等待獲得投資回報(bào)。托格里烏斯指出，這個(gè)算法已經(jīng)學(xué)會(huì)了將跑到拐角處與獲得金錢回報(bào)聯(lián)系起來(lái)，盡管這種運(yùn)動(dòng)與得到多少回報(bào)之間并沒(méi)有實(shí)際的關(guān)系。

　　托格里烏斯表示，這有點(diǎn)像人工智能在發(fā)展迷信，在得到了某種獎(jiǎng)勵(lì)或懲罰之后，它們開始思考為什么會(huì)得到這些。

　　這是“強(qiáng)化學(xué)習(xí)”的陷阱之一。所謂“強(qiáng)化學(xué)習(xí)”，是指人工智能最終會(huì)根據(jù)它在環(huán)境中遇到的情況設(shè)計(jì)出判斷錯(cuò)誤的策略。人工智能不知道自己為什么會(huì)成功，它只能將自己的行動(dòng)建立習(xí)得聯(lián)想的基礎(chǔ)上。這有點(diǎn)像人類文化早期階段時(shí)，將祈禱儀式與天氣變化聯(lián)系起來(lái)的行為。

　　鴿子可以學(xué)會(huì)將食物與某些行為聯(lián)系起來(lái)，而人工智能會(huì)表現(xiàn)出類似的耦聯(lián)行為　　一個(gè)有趣的例子是，鴿子也會(huì)出現(xiàn)這樣的行為。1948年，一位美國(guó)心理學(xué)家發(fā)表了一篇論文，描述了一個(gè)不尋常的實(shí)驗(yàn)：他將鴿子放在圍欄里，間歇性地給予食物獎(jiǎng)勵(lì)。這些鴿子開始將食物與它們當(dāng)時(shí)正在做的事情聯(lián)系起來(lái)，有時(shí)是拍打翅膀，有時(shí)是舞蹈般的動(dòng)作。然后，它們會(huì)重復(fù)這些行為，似乎期待著獎(jiǎng)勵(lì)會(huì)隨之而來(lái)。

用新辦法解決老問(wèn)題

　　托格里烏斯所測(cè)試的游戲人工智能與心理學(xué)家所使用的活體動(dòng)物之間有著巨大的差異，但托格里烏斯暗示，其中起作用的似乎是相同的基本機(jī)制，即獎(jiǎng)勵(lì)與特定行為錯(cuò)誤地聯(lián)系在一起。

　　人工智能研究者可能會(huì)對(duì)機(jī)器學(xué)習(xí)系統(tǒng)所選擇的路徑感到驚訝，但這并不意味著他們對(duì)機(jī)器學(xué)習(xí)系統(tǒng)感到敬畏。DeepMind的深度學(xué)習(xí)研究科學(xué)家拉亞?哈德賽爾表示：“我從不覺得這些人工智能有自己的想法?！?/FONT>

　　哈德賽爾對(duì)許多人工智能系統(tǒng)進(jìn)行了試驗(yàn)，發(fā)現(xiàn)它們能對(duì)她或她同事未曾預(yù)料的問(wèn)題提出有趣和新穎的解決方案。她指出，這正是研究人員應(yīng)該致力于增強(qiáng)人工智能的原因，因?yàn)檫@樣，它們就可以完成人類自己無(wú)法完成的事情。

　　哈德賽爾還認(rèn)為，使用人工智能的產(chǎn)品，比如自動(dòng)駕駛汽車，可以經(jīng)過(guò)嚴(yán)格測(cè)試，以確保任何不可預(yù)測(cè)性都在一定的可接受范圍內(nèi)。“你可以對(duì)基于經(jīng)驗(yàn)證據(jù)的行為做出合理的保證，”她說(shuō)道。

　　在這一點(diǎn)上，只有時(shí)間才能證明所有銷售人工智能產(chǎn)品的公司是否都如此小心謹(jǐn)慎。但與此同時(shí)，值得注意的是，人工智能表現(xiàn)出的意外行為絕不僅僅局限于研究環(huán)境，而是已經(jīng)進(jìn)入了商業(yè)產(chǎn)品領(lǐng)域。

　　2020年，在德國(guó)柏林的一家工廠里，由美國(guó)強(qiáng)化學(xué)習(xí)機(jī)器人技術(shù)公司Covariant開發(fā)的一款機(jī)器人手臂在物品經(jīng)過(guò)傳送帶時(shí)，展現(xiàn)出了意想不到的分類方法。盡管沒(méi)有專門的程序，但控制手臂的人工智能學(xué)會(huì)了瞄準(zhǔn)透明包裝的物品中心，以確保其每次都能成功地將物品抓起來(lái)。由于這些物品是透明的，在重疊時(shí)可能會(huì)混在一起，因此瞄準(zhǔn)不精確意味著機(jī)器人可能無(wú)法抓起物品。

　　Covariant的聯(lián)合創(chuàng)始人兼首席執(zhí)行官陳曦(Peter Chen)說(shuō)：“它避免了物體的重疊角，而是瞄準(zhǔn)了最容易拾取的表面。這真的讓我們很吃驚?！?/FONT>

　　無(wú)獨(dú)有偶，哈德賽爾的團(tuán)隊(duì)最近試驗(yàn)了一款機(jī)器人手臂，可以通過(guò)形狀分類孔洞來(lái)選取不同的物品。一開始機(jī)器人的手臂很笨拙，在人工智能的控制下，它通過(guò)不斷地拿起和放下物品進(jìn)行學(xué)習(xí);最終，機(jī)器人可以在物品進(jìn)入正確位置時(shí)將其抓住，并將物品很容易地放入適當(dāng)?shù)目锥?，而不是試圖用鉗子擺弄它。

　　所有這些都印證了OpenAI研究管理者杰夫·克倫的觀點(diǎn)，即人工智能的探索性是其未來(lái)成功的基礎(chǔ)。近年來(lái)，克倫一直在與世界各地的同行合作，收集人工智能以出人意料的方式開發(fā)出問(wèn)題解決方案的例子。

　　克倫說(shuō)：“隨著我們不斷擴(kuò)展這些人工智能系統(tǒng)的規(guī)模，可以看到，它們正在做著一些富有創(chuàng)造性且令人印象深刻的事情，而不只是表現(xiàn)出學(xué)術(shù)上的好奇心?！?/FONT>

　　如果人工智能系統(tǒng)能找到更好的方法來(lái)診斷疾病，或者向有需要的人群運(yùn)送緊急物資，它們就可以挽救更多的生命?？藗愌a(bǔ)充道，人工智能有能力找到解決老問(wèn)題的新方法。但他也認(rèn)為，開發(fā)這類系統(tǒng)的人需要對(duì)其不可預(yù)測(cè)的本質(zhì)保持開放和誠(chéng)實(shí)，以幫助公眾了解人工智能的工作機(jī)制。

　　畢竟，這是一把雙刃劍。人工智能的承諾和威脅一直同時(shí)存在，它們接下來(lái)會(huì)想到什么?這是耐人尋味的問(wèn)題。

（轉(zhuǎn)載）

標(biāo)簽：谷歌人工智能

我要反饋

相關(guān)鏈接

輸煤棧橋新伙伴的十八般武藝 — 粉塵高溫全不怕，智能巡檢保安全

輸煤棧橋，是連接煤礦地面建筑和電廠建筑的關(guān)鍵組成部分，一旦出現(xiàn)故障，將直接影響正常生產(chǎn),造成長(zhǎng)時(shí)間的停產(chǎn)及重大經(jīng)濟(jì)損失。為了提高輸煤棧橋運(yùn)行信息化和智能化管理水平，快速推進(jìn)... [詳情]

2021年03月05日國(guó)自機(jī)器人

聚焦物流設(shè)備的預(yù)測(cè)性維護(hù)

文章來(lái)源：物流技術(shù)與應(yīng)用微信公眾號(hào)近年來(lái)，國(guó)內(nèi)物流系統(tǒng)建設(shè)項(xiàng)目大幅增加，應(yīng)用在各個(gè)行業(yè)領(lǐng)域的物流設(shè)備數(shù)量急劇上升。目前，設(shè)備發(fā)生故障后的緊急搶修、定期維護(hù)保養(yǎng)是最常采用的... [詳情]

2021年03月05日物流技術(shù)與應(yīng)用

人工智能的發(fā)展前景如何

人工智能產(chǎn)業(yè)鏈可以分為基礎(chǔ)層、技術(shù)構(gòu)架層、平臺(tái)層和應(yīng)用層?；A(chǔ)層：包括了算力、數(shù)據(jù)以及傳感系統(tǒng)，包括了人工智能三要素中的兩部分，是整個(gè)人工智能技術(shù)實(shí)現(xiàn)的基礎(chǔ);技術(shù)構(gòu)架層：包... [詳情]

2021年03月05日人工智能