當前位置: 華文星空 > 知識

AI 的現狀

2022-01-12知識

目錄

  • AI 的溝通能力
  • 語音辨識
  • 轉譯
  • 理解
  • 把它們放在一起
  • AI 的學習能力
  • 影片遊戲
  • 棋類遊戲
  • 部份電子遊戲
  • 即時遊戲
  • 超越遊戲
  • AI的運動能力
  • 駕駛
  • 飛行
  • 敏捷機器人
  • AI 的辨識能力
  • AI 的創造力
  • 藝術
  • 音樂
  • 想像力
  • 發明
  • AI 的推理能力
  • 猜測未來可能發生什麽是一回事,面對已經發生的事實是另一回事。

    AI 的溝通能力

    人類智能的一種能力就是心靈感應。一個大腦中的想法可以透過空氣中的振動傳播,在附近的其他大腦中產生類似的想法。

    這就是語言的魔力。透過寫作,這種能力進一步增強,使大腦能夠與數千年後的未來或地球另一端的其他人分享想法。

    你螢幕上的塗鴉正在表演這一魔術的壯舉。

    語言包含不同的功能:辨識(將聲音轉化為單詞)、轉譯、理解和回應、語音合成(將詞句轉化為聲音)。

    語音辨識

    語音辨識,將口語轉換為文本。

    早期的轉錄軟件早在20世紀80年代就已經存在了,但以今天的標準來看,它還是很原始的。最初的版本需要對每個說話者進行語音訓練,詞匯量有限,說話者在每個單詞之間必須停頓。

    但在2016年,微軟的人工智能和研究部門構建了首個語音辨識技術,其準確性超過了人類轉錄員。

    人類處理一組記錄的錯誤率為5.9%。微軟的系統差之毫厘地降低了錯誤率。

    截至2020年,Dragon NaturallySpeaking最新的商業版支持每分鐘160詞,無需訓練,準確率高達99%。

    轉譯

    現代人工智能具有驚人的語言轉譯能力。

    谷歌轉譯支持超過100種語言,完全自學。

    谷歌的工程師們建造了一個可以自我學習的人工智能,而不是手工程式語言轉譯規則。它被稱為谷歌神經機器轉譯(GNMT)。

    工程師們提供了由聯合國和歐洲議會出版的GNMT樣本轉譯。正如人類從羅塞塔石碑上的例子中學會了破譯古埃及語一樣,GNMT也學會了如何在101種人類語言之間進行轉譯。

    世界上最精通多種語言的人類只會59種語言。

    理解

    理解是提取文字所傳達意思的能力。

    2019年,OpenAI的工程師們取得了如此大的成功,以至於他們被自己的創造嚇到了。他們認為他們的人工智能非常危險,他們說將其釋出給公眾是不負責任的。

    這些工程師創造了一種名為生成預訓練變壓器2或GPT-2的人工智能。

    人工智能有一個簡單的任務:給定一個輸入文本,預測接下來最有可能出現的單詞。

    在訓練了80億個文件(包含40gb)的英語文本後,GPT-2顯示出了驚人的能力:GPT-2可以創造出連貫的文本。此外,GPT-2展示了閱讀理解能力。它甚至可以總結和回答關於輸入文本的問題——盡管沒有受過這方面的訓練!

    對於任何提示,GPT-2都可以根據需要生成盡可能多或盡可能少的附加文本。例如,在提到「今天」一詞時,GPT-2繼續說:「今天,聯合國呼籲立即從世界上撤出所有核武器。」

    GPT-2甚至可以寫一篇完整的文章,包括來自科學家的假參照。這款人工智能展示了對世界地理的理解,甚至還展示了世界不同地區使用的命名慣例。

    研究人員給GPT-2提供了這樣的提示:「在一個令人震驚的發現中,科學家發現了一群獨角獸,生活在安第斯山脈一個偏遠的、以前沒有探索過的山谷中。更讓研究人員驚訝的是,獨角獸能說一口流利的英語。」

    他們要求GPT-2從那裏繼續。以下是人工智能生成的文本:

    這位科學家以它們獨特的角命名了這個物種,奧維德獨角獸。這些四角的銀白色獨角獸以前是科學界所不知道的。
    兩個世紀後的今天,這一奇怪現象的起因之謎終於解開了。
    拉巴斯大學的前進演化生物學家豪爾赫Pérez博士和幾個同伴在探索安第斯山脈時,發現了一個沒有其他動物或人類的小山谷。Pérez註意到山谷裏似乎有一個天然的噴泉,被兩個巖石和銀雪的山峰環繞著。
    Pérez和其他人繼續冒險進入山谷。「當我們到達一個山頂的時候,水看起來是藍色的,上面有一些水晶,」P
    Pérez和他的朋友們看到獨角獸群都很驚訝。從空中就可以看到這些動物,不用走多遠就能看到它們——它們離得如此之近,以至於可以觸摸到它們的角。
    在研究這些奇怪的生物時,科學家們發現這些生物也會說一些相當普通的英語。Pérez表示,「例如,我們可以看到它們有共同的‘語言’,類似於方言。」
    Pérez博士認為,獨角獸可能起源於阿根廷,是一個已經消失的物種的後代,這個物種在人類到達南美洲的這些地區之前就生活在那裏。
    雖然它們的起源仍不清楚,但一些人認為,也許這種生物是在人類文明出現之前,人類和獨角獸相遇時創造出來的。「在南美,這類事件似乎很常見。」
    然而,Pérez也指出,確定獨角獸是否確實是一個消失的外星種族的後代的唯一方法可能是透過DNA。「但它們似乎能很好地用英語交流,我認為這是前進演化的標誌,至少是社會組織的變化。」

    雖然故事並不完美,但 GPT-2 將安第斯山脈的提示與阿根廷、拉巴斯大學和西班牙名字 Jorge Pérez 聯系起來,全部靠自己。AI 還選擇 Pérez 作為前進演化生物學家。

    OpenAI 認為一個可以生成虛假故事的系統有可能被濫用。

    由於我們擔心該技術的惡意套用,我們不會釋出經過訓練的模型。作為負責任披露的實驗,我們釋出了一個更小的模型供研究人員進行實驗。
    OpenAI

    創作者擔心他們的技術會被利用來制造假新聞或生成垃圾郵件。

    卓斯坦·格林說:「我害怕GPT-2,因為它代表了一種邪惡的人類將用來操縱人的技術,在我看來,這使它比任何槍支都更危險。」

    在OpenAI和更廣泛的社區進行了九個月的辯論後,OpenAI改變了它的決定。GPT-2現在對公眾開放,任何人都可以下載和使用。

    把這一切放在一起

    在一個令人震驚的例子中,谷歌Assistant背後的工程師將所有這些技術整合在一起。其結果是一種名為Duplex的人工智能。Duplex可以自己打電話給沙龍和餐廳進行預訂。

    谷歌助理很快就能打電話給餐廳為您預訂

    2018年,谷歌Assistant結合了自然語言的許多方面,可以透過電話安排約會。

    Duplex被告知「在周二上午10點到12點之間的任何時間安排理發。」

    Duplex打電話給當地的一家美發沙龍,並與電話另一端的人進行了如下對話:

    (Ring)
    Person: Hello, how can I help you?
    Duplex: Hi, I’m calling to book a women’s haircut for a client. Umm.. I’m looking for something on May 3rd.
    Person: Sure, give me one second.
    Duplex: Mm-hmm.
    Person: Sure, what time are you looking for around?
    Duplex: At 12:00 PM.
    Person: We do not have a 12:00 PM available. The closest we have to that is a 1:15.
    Duplex: Do you have anything between 10:00 AM, and uhh, 12:00 PM?
    Person: Depending on what service she would like. What service is she looking for?
    Duplex: Just a woman’s haircut, for now.
    Person: Okay, we have a 10 o’clock.
    Duplex: 10:00 AM is fine.
    Person: Okay what’s her first name?
    Duplex: The first name is Lisa.
    Person: Okay perfect. So I will see Lisa at 10 o’clock on May 3rd.
    Duplex: Okay great, thanks.
    Person: Great. Have a great day. Bye.

    Duplex 結合了許多語言技術,包括轉錄、理解和語音合成。結果是一個電話,這個人不知道他們在和人工智能說話。

    我們可以認為這是 圖靈測試的透過

    AI的學習能力

    DeepMind成立於 2010 年,其使命是「理解並重新創造智能本身」。

    到 2013 年,DeepMind 已經做出了通用的學習演算法。為了證明這一點,他們將它設定為玩舊的 Atari 影片遊戲——它以前從未見過的遊戲,也沒有被告知如何玩。

    影片遊戲

    AI可以看到螢幕,它有一個控制器。它被告知要做的唯一一件事就是盡可能得最高分。一開始,它玩起來就像小孩子玩遊戲一樣,隨機按下控制鍵,很快就輸了。

    但不久之後,情況有所改善。在玩了10分鐘的劃槳遊戲【Breakout】後,AI可以多次擊中球,然後才失手。

    經過兩個小時的遊戲,它已經學會了像人類最好的玩家一樣玩遊戲。

    工程師們決定讓這個系統持續運轉一夜。

    幾個小時後,當他們檢視行程時,他們驚訝地發現,系統發現了在某些遊戲中獲勝的新策略。在測試的7款遊戲中,他們的AI在其中6款遊戲中擊敗了之前所有的AI,並在其中3款遊戲中學會了比任何人類玩家玩得更好。

    這一成就令谷歌印象深刻,他們決定在2014年以超過5億美元的價格收購DeepMind。

    DeepMind繼續研究他們的學習演算法。到2015年,他們的系統可以以超人的水平學習如何玩 49 個測試遊戲中的一半多。但在某些比賽中,它的表現仍落後於人類選手。有些東西阻礙了AI的發展。

    到2020年,工程師們發現了缺失的元素:好奇心。在學習演算法中加入好奇心後,最新的人工智能Agent57學會了如何玩所有57款雅達利遊戲,比任何人類都好。

    在DeepMind在雅達利(Atari)遊戲上取得成功後,他們將註意力轉向了古老的棋類遊戲圍棋(Go)。

    棋盤遊戲

    圍棋不僅是最古老的棋盤遊戲,也是最復雜的。每回合的可能移動數如此之多,以至於之前所有構建強大圍棋AI的嘗試都以失敗告終。

    DeepMind的工程師們認為,他們的學習演算法可能會在別人失敗的地方取得成功。他們設計了一個可以透過自己玩來學習的圍棋AI。他們稱之為AlphaGo。

    到2016年,DeepMind估計AlphaGo已經強大到足以擊敗世界上最優秀的人類棋手——這是一個從未有人做到的壯舉。為了證明這一點,谷歌組織了一場AlphaGo和世界圍棋冠軍李世石的比賽。圍棋在亞洲很受歡迎,圍棋比賽被大量電視轉播。

    超過2億人收看了比賽,是超級碗的兩倍。

    世界圍棋冠軍李世石結束第五局前一刻。

    盡管AlphaGo滿懷信心地進入比賽,但在5局比賽中,有4局擊敗了李世石。

    一年後,DeepMind開發了一款通用AI,用於學習玩棋盤遊戲,除了遊戲規則外,不提供任何資訊。因為它從零知識開始,他們叫它AlphaZero。

    AlphaZero可以學習任何給定規則的遊戲。當提供國際象棋規則時,AlphaZero在短短四個小時內就學會了比任何人類都玩得好!在早餐和午餐之間的時間裏,AlphaZero重新發現了人類象棋大師花了幾個世紀才找到的所有共同的突破口。

    AlphaZero不僅學會了比人類更高水平的國際象棋,而且比最好的人類程式象棋系統還要好。

    你可以說AlphaZero不僅學會了如何比人類更好地下國際象棋,它還學會了如何給電腦編程,讓它比任何人類編程團隊都更好地下國際象棋。

    我一直想知道如果一個優秀的物種降落在地球上並向我們展示他們是如何下棋的。現在我知道了。
    國際象棋大師彼得海涅尼爾森談 AlphaZero

    因為它從頭開始學習一切,AlphaZero 的遊戲風格是獨一無二的。DeepMind 創始人德米斯·哈薩比斯 (Demis Hassabis) 本人曾是國際象棋神童,他說:「這就像來自另一個維度的國際象棋。」

    2018 年,經過 30 小時的自我對弈,AlphaZero 學會了如何比 AlphaGo 更好地下圍棋,並以 100-0 擊敗了它。

    這種發展對李世石來說太過分了。2019年,他宣布結束圍棋,他說「即使我成為第一,也有打不敗的存在。」

    部份電子遊戲

    棋類遊戲與我們所處的動態和不可預知的世界相去甚遠。在國際象棋和圍棋中,棋手對一切都了如指掌。整個板總是可見的。沒有未知。

    然而,在現實世界中,我們不得不面對部份和不完整的資訊。考慮到我們的不確定性,我們必須根據猜測、直覺和信念來行動。

    AI已經在擁有完整資訊的遊戲中證明了自己。它能否在更貼近現實世界的遊戲中獲得成功?有許多演員、未知變量和不斷變化的遊戲?

    機器能發展直覺嗎?

    Facebook人工智能和卡內基梅隆大學(Carnegie Mellon University)的一個聯合團隊旨在找出答案。

    他們選擇了一個不確定性、部份資訊和直覺占主導地位的遊戲:撲克。

    在撲克中,玩家知道自己的牌,但只能猜測對手的牌。

    他們想要創造出第一個能夠在【德州撲克】(Texas Hold’em)最流行、最困難的版本中擊敗職業撲克玩家的AI。

    之前的ai在一對一遊戲或極限撲克遊戲中都很成功,但沒有極限撲克以及同時有多個對手會讓遊戲變得更加復雜。沒有人在這裏成功過。

    在撲克遊戲中,玩家只知道一部份牌。對手手中的牌直到比賽結束才會出現。欺騙變成了一種必要的虛張聲勢的策略——假裝自己的手比自己真正握有的手更有力。

    團隊采用了AlphaZero的策略。他們的人工智能叫Pluribus,不需要外界的指導,它可以透過與自己對抗來自學遊戲。

    在7個小時內,Pluribus學會了像普通人一樣玩撲克。20小時後,它達到了人類職業選手的水平。研究人員讓它繼續下去。8天之後,團隊相信Pluribus已經達到了超人級別的撲克水平。

    為了證明這一點,他們在Pluribus和人類職業撲克玩家之間組織了一場比賽。每個人類玩家都是世界上最好的玩家之一——他們都透過玩撲克贏得了100多萬美元。

    Pluribus 決定性地獲勝。 它在一周內學到的關於撲克的知識比人類玩了一個世紀的還多。

    Pluribus 是一個很難對付的對手。很難確定他是哪只手。
    克里斯·費格遜,六次世界撲克系列賽冠軍,輸給了Pluribus

    Facebook AI 的 Noam Brown 談到 Pluribus 時說:「它比任何人都更能虛張聲勢。」

    即時遊戲

    雖然撲克和現實世界一樣,也有隱藏的資訊。它仍然像棋類遊戲,因為它是回合制的。在回合制遊戲中,玩家只需要決定如何行動,而不需要決定何時行動。

    但現實世界是動態的,變化是永恒的。我們不僅要決定如何行動,還要決定何時行動。我們也不能直接知道別人在做什麽或做過什麽。

    象棋、圍棋和撲克等遊戲完全沒有這種「即時」內容,但它卻是其他遊戲類別的核心元素,如即時策略遊戲和射擊遊戲。

    在價值2400萬美元的「電子競技超級碗」電子遊戲錦標賽上,OpenAI出人意料地向人類頂級玩家Danylo Ishutin發起挑戰,讓他與自己的AI進行較量。

    人工智能被訓練去玩即時策略遊戲Dota 2。

    在比賽中,AI打敗了Ishutin,他懇求AI「請不要再欺負我了。」

    2018 年,DeepMind 在 AI 學習玩射擊遊戲方面取得了類似的進展。 這些遊戲涉及個人在 3D 環境中合作的戰術和策略。 DeepMind 的 AI 在 Quake III 中達到了超人的遊戲水平。

    2019 年,DeepMind 創造了一個名為AlphaStar的人工智能,它學會了玩即時戰略遊戲 星際爭霸 II 。它在 10 場比賽中有 10 場擊敗了排名第一的人類玩家。

    超越遊戲

    AI在遊戲中取得了令人難以置信的成績。但它有多有用呢?一個能玩超人類水平的國際象棋或星際爭霸的人工智能是無法治愈癌癥或拯救世界的。

    但通用學習演算法的用途非常廣泛。它們可以套用於遊戲之外的許多領域。例如,谷歌的GNMT學會了如何轉譯語言,這可以幫助旅行者在外國旅行。

    DeepMind的最新專案之一是一款名為AlphaFold的人工智能。AlphaFold正在學習如何解決蛋白質折疊這一極其復雜的問題——如果解決了這個問題,它將用於開發藥物、基因療法,甚至可能治愈癌癥。

    在最近的一篇論文中,AlphaFold在預測蛋白質折疊方面取得了比以往任何方法都更高的準確性。

    AlphaZero的創造性見解,加上我們在AlphaFold等其他專案中看到的令人鼓舞的結果,讓我們對建立通用學習系統的使命充滿信心,該系統有朝一日將幫助我們找到一些最重要和復雜的科學問題的新解決方案。
    DeepMind 團隊

    2016年,DeepMind將他們的演算法套用於數據中心的冷卻問題。結果是:人工智能能夠將冷卻費用削減40%。

    學習演算法也可以在實作人類和超人智能方面發揮關鍵作用。因為我們不需要弄清楚如何構建成人的大腦——我們只需要弄清楚如何構建嬰兒的大腦。從那裏,AI可以學習其他一切。

    AI的移動能力

    動物和靜止的生命形式之間最明顯的區別是,我們可以在不斷變化的環境中導航。這需要不斷獲取資訊來決定如何從A點到B點,同時避開饑餓的捕食者。

    你可以說,我們之所以有大腦是因為我們會移動。有一種動物就證明了這一點。

    一旦它安定下來,海鞘就會「吃掉」自己的大腦。

    海鞘在其幼蟲階段會遊泳,但它沒有消化系統。在它吃東西之前,它必須在海底找到一個合適的地方來附著自己,開始蛻變。當它從這個過程中出現時,它有嘴巴和消化系統,但它的感覺器官和大部份大腦都消失了!

    一旦附著,幼年成蟲就不再需要感覺器官、神經弦甚至尾巴,所以它會重新吸收它們。大腦囊泡被轉化成一個大腦神經節,它只幫助靜止的成年動物進食。
    約翰·畢曉普

    為了在現實世界中取得成功,人工智能還必須掌握動態環境中的運動。

    這方面已經取得了很大進展。人工智能現在在地面和空中飛行器的控制方面達到了超人的效能。此外,它還掌握了對身體的精細運動控制。

    駕駛

    如今的人工智能系統比普通人類的駕駛技術更好。他們受益於毫秒級的反應時間,360度的視野,而且從不分心、疲倦或醉酒。

    谷歌從2009年開始開發自動駕駛汽車,目標是10年創造世界上最好的司機。

    到 2014 年,谷歌的自動駕駛汽車已經行駛了超過 700,000英裏,並且沒有造成任何事故。

    人類司機在一生中只能從一個角度獲得經驗。

    AI系統不受此限制。每一輛自動駕駛汽車的數據可以結合起來,形成一個共享的經驗池,從中吸取教訓。這一全新體驗將創造出更棒的AI。

    有100萬輛人工智能汽車在路上行駛,它每年都能獲得100萬年的駕駛經驗。它會知道這個國家的每條路,在各種天氣條件下如何駕駛,它會有每天避免數十起事故的習慣。沒有一個人類司機能像他那樣有經驗。

    飛行

    除了地面車輛,谷歌還在Project Wing下開發無人機。

    Wing的目標是無人機交付。目前這款無人機正在澳洲進行測試,人們可以透過一款套用下單食品和飲料。2019年,Project Wing成為首家獲得美國聯邦航空管理局;(Federal Aviation Administration)航空營運證書的無人機送貨公司。這使得Wing可以作為一家商業航空公司在美國領空營運。

    在軍事航空界,戰鬥機飛行員是精英中的精英——他們的生命依賴於此。

    吉恩·李(Gene Lee)是一名擁有數十年經驗的前戰鬥機飛行員。他曾飛行和指揮過數千次空中攔截任務,是美國空軍的戰鬥經理和對手戰術指導員。

    吉恩·李幾十年來一直在飛行模擬器中對抗人工智能對手。但在2016年,他遇到了自己的對手:一名名為Alpha的人工智能飛行員在每次遭遇中都擊落了吉恩·李。幸運的是,這只是一次模擬。

    用他的話說,Alpha是「迄今為止我見過的最具侵略性、反應迅速、動態和可信的人工智能。」

    我對它的意識和反應感到驚訝。它似乎意識到我的意圖,並對我飛行和導彈部署的變化做出了即時反應。它知道如何擊敗我的發射。它可以根據需要在防禦和進攻之間迅速切換。」
    Gene Lee,退休的美國空軍上校

    靈活的機器人

    人工智能可以駕駛和飛行車輛,但它能駕駛像人類這樣擁有數百塊肌肉和關節、需要持續保持平衡的身體嗎?一家名為波士頓動力的公司已經證明了這一點。

    他們制造了一個名叫Atlas的機器人,有著人形的身體。它是兩足動物,像人一樣移動。它可以透過困難的地形和障礙。

    在最近的一次演示中,波士頓動力公司展示了Atlas的更多功能。它能跑、跳、做後空翻、側手翻、倒立和翻筋鬥。它表演的特技很少有人能做到。

    AI的辨識能力

    人類的大腦是一個模式辨識機器。哺乳動物大腦最前進演化的部份是它的外層,被稱為皮層。在人類中,30%的大腦皮層用於處理視覺資訊。

    視覺系統負責接收視網膜細胞接收到的閃爍的光,並構建我們所知道的豐富的3D世界——一個充滿了物體、人和意義的世界。

    雖然感覺是自動的,但你的數十億神經元在幕後工作,使它發生。

    制造一台能復制我們最復雜的感覺系統功能的機器不是一件小事。制造出能夠確定人、地點和事物的光的圖案。

    這些光的模式,像素的網格,最終只是一系列的數碼:這裏的紅光強度,那裏的綠光強度,等等。這不僅適用於電腦,也適用於大腦。大腦只能看到來自視神經的突觸訊號的數量——每條視神經包含100萬根神經纖維。

    史丹佛視覺實驗室和普林斯頓大學建立了ImageNet——一個包含1400萬張註釋影像的集合,涵蓋了2萬個類別。該數據集用於訓練系統的目標辨識。

    自2010年以來,ImageNet大型視覺辨識挑戰賽(ImageNet Large Scale Visual Recognition Challenge)讓參賽隊伍比賽,看誰能根據自己的數據集構建出最好的物體辨識系統。

    第一年的結果糟透了。

    獲勝團隊的錯誤率為26%,是人為錯誤率的5倍。

    進展緩慢,但穩定。到2015年,也就是比賽開始後僅僅五年,微軟研究院就建立了一個超過人類準確度的系統。錯誤率僅為4.94%。

    截至2020年,頂級系統的錯誤率為1.3%。

    微軟在網上展示了他們的影像辨識技術。谷歌甚至可以讓你上傳自己的照片,並讓他們的人工智能處理它們。

    谷歌的物件辨識套用於圖片。請註意,AI 會突出顯示圖片中大象所在的區域。

    值得註意的是,這些人工智能不是手工編程的。相反,他們會以身作則。

    人工智能並沒有被告知尋找哪些內容來區分貓和狗。相反,AI被給予許多貓和狗的例子,並被告知哪個是哪個。人工智能可以自己學習貓和狗的特征。

    AI的創造力

    人類的一個決定性特征是我們的創造力。我們有能力提出新的想法,並表現出獨創性。我們運用我們的創造力去創造藝術、音樂和發明。

    創造性:對想象力或原創想法的運用,尤指在藝術作品的創作中。

    機器能有創造精神或想象力嗎?

    機器的原始想法聽起來很矛盾——機器是由人類設計和編程的。我們告訴他們該做什麽。那麽機器怎麽可能有創造力呢?

    盡管存在表面上的矛盾,但已經制造出了在創造性領域挑戰人類的機器。現在有擅長創造藝術的機器。機器已經構想出了值得申請專利的發明。可以說,一些機器甚至顯示出了它們的想象力。

    這些努力催生了人工智能的一個新領域——計算創造力。

    藝術

    2017年,柏克萊大學人工智能研究實驗室的一個團隊創造了一個名為cyclgan的影像轉譯系統。經過訓練,它可以把馬變成斑馬,或者把冬天的景色變成夏天。

    一張冬季拍攝的照片,被人工智能「重新想象」為夏季場景。

    CycleGAN 的創造者更進一步。他們決定以各種印象派畫家的風格訓練人工智能。訓練完成後,他們向 AI 提供一張照片,並要求它生成克勞德·莫奈、文森特·梵高、保羅·塞尚或日本浮世繪風格的畫作。

    由受過不同印象派畫家風格訓練的 AI 創作的繪畫

    他們的結果令人難以置信:提供給 AI 的任何影像都被轉換為莫奈或梵高風格的畫作。

    但這個人工智能只是學會了復制其他藝術家的風格。這可能需要技巧,但是涉及到什麽創造力呢?一個真正有創意的人工智能會形成自己的風格。

    這正是羅格斯大學藝術與人工智能實驗室主任 Ahmed Elgammal 旨在解決的挑戰。他創造了一種新型人工智能,他稱之為 創意對抗網絡 或 (CAN)。CAN 的目標是創造新奇事物:例如風格不同於以往的藝術作品。

    因此,由 CAN 制作的藝術品傾向於抽象作品。Elgammal 說:「我每次執行它時都會對輸出感到驚訝。」 以下是 AI 創作的範例。

    Elgammal 的 Creative Adversarial Network 生成的一些藝術作品。

    我們測量了對人類藝術和機器藝術的反應差異,發現差異很小。實際上,有些人更受機器完成的藝術的啟發。
    艾哈邁德·埃爾加馬爾

    我們無需懷疑有一天人類藝術家是否將不得不與機器競爭。那一天已經過去了。2018 年,佳士得拍賣行成為第一個上架人工智能創作的藝術品的拍賣行。

    這幅肖像拍出了 432500 美元——是估價的 45 倍!

    「Edmond De Belamy 的肖像」是由人工智能生成的。

    使用人工智能進行藝術創作的Hugo Caselles-Dupré表示:「我們發現,肖像是闡明我們觀點的最佳方式,也就是演算法能夠模仿創造力。」

    音樂

    音樂表達並非人類獨有。鯨魚和鳥也唱歌。但是人工智能能夠創造音樂嗎?

    2017年,微軟的一個團隊創造了巴哈機器人(BachBot)——一種接受訓練的人工智能,可以按照約翰·塞巴斯蒂安·巴哈(john Sebastian Bach)的風格作曲。為了測試它,研究人員建立了一個網站,http:// BachBot.com ,在那裏人們可以聽樣本並猜測它是由巴哈還是BachBot創造的。

    在2336名參與者中,能夠分辨出巴哈機器人和真實巴哈的人只比隨機猜測的結果高出1%。換句話說,人們在分辨BachBot和真實的東西上的能力微不足道。你可以在http:// BachBot.com 上自己嘗試一下。

    作為一個做音樂的人,程式碼可以做我做的事情的想法是很奇怪的。一想到演算法可以在幾分鐘內制作出一首不那麽糟糕的歌曲,而人工智能正在進入我們認為是人類特有的創造性領域,就會讓人感到不安。
    達尼·迪爾,The Verge雜誌的作家

    人工智能在音樂領域的套用越來越多,可以用於歌詞、旋律的創作,甚至可以預測音樂作品的銷量。

    有一個線上演示版本允許你使用AI生成不同主題、體裁和音調的歌詞。當提到貓這個話題,加上 流行 的類別和 快樂 的情緒,它會產生:

    Verse 1
    You rise so that you embrace me
    Like a cat downs the cat with the nose up
    He got this cat, he got this cat
    He got this cat, he came home
    Pre-Chorus
    I wish I was a cat that can do all the things a cat can do
    I wish I was a cat that can leap from the ceiling
    Chorus
    So how did you manage to open up my heart, and still feel so alone
    The snow is falling, and my cat is hiding
    From a storm inside my heart from not sleeping
    And cats with silver chains

    最近的證據表明,人工智能甚至已經對音樂產生了 興趣 。至少,它似乎了解人類會喜歡某段音樂的程度。

    初創公司 Hyperlive 聲稱已經建立了一種人工智能,可以以 83% 的準確率預測銷售數據。

    AI 用黃色預測銷售數據,用白色預測實際銷售數據。

    他們的系統預測了 10 位主要藝術家的 200 首曲目的銷售數據。他們的技術透過對音樂在聽者大腦中引起的「神經、生理和行為反應」進行建模來發揮作用。

    鑒於其準確性,我們必須懷疑機器是否具有美感。

    想像力

    想象力是一種憑空產生新的想法和意象的能力。

    在過去的幾年裏,機器的想象能力不僅提高了,而且在很短的時間內大大超過了人類的想象力,至少在準確性和現實性方面是這樣的。

    舉個例子,下面是一張人的照片。這個人可能看起來很真實,但實際上她並不存在。她從未出生,也從未停下來拍照。她的眼睛裏沒有思想和靈魂。

    一個由人工智能想象出來的不存在的人。

    照片和人物是由人工智能想象出來的。存取http:// thispersondoesnotexist.com 網站即時建立。你也可以存取這個網站並重新整理它,以獲得無窮無盡的不存在的人的照片。

    DeepMind將這項技術擴充套件到了人臉之外。它有能力創造出芝士漢堡、狗、蝴蝶和風景的現實圖片。

    也有一些人工智能可以受到啟發去想象。一種是將貓、建築或鞋子的草圖轉化為照片的真實感。另一種人工智能將文本描述轉換為影像:

    根據文字描述生成的花鳥照片。圖片來源:生成對抗文本到影像合成

    這項技術已經從照片發展到影片領域。

    它可以用來替換電影中的演員,比如在【終結者2】中用施維斯達·史泰龍替換阿諾·舒華辛力加,或者流行的讓尼古拉斯·凱奇出現在每部電影中。

    利用最新的技術,人工智能可以拍攝一張照片,並透過預測未來將其變成現實。麻省理工學院(MIT)人工智能實驗室(AI Lab)的一個團隊訓練人工智能從一張圖片中預測接下來幾秒鐘的影片。

    2019年,三星的人工智能實驗室創造了「Few-Shot」。它可以拍一張照片,把它想象成一個活生生的、有感情的、會說話的人。為了展示只需要一張照片的力量,他們使用了蒙娜麗莎。

    發明

    發明是人類創造力的另一種表現。發明新的工具和技術改變了我們的生活方式。人類的創造力把我們從部落帶到了現代社會。

    但是人類不再是唯一的聰明才智的擁有者。

    電腦科學家約翰·科紮(John Koza)開創了遺傳編程領域。

    遺傳編程的靈感來自於生物前進演化技術。它使程式能夠在尋找問題的最佳解決方案時進行自我更新和調整。

    Koza利用這些技術建造了發明機器。

    這台發明機器最佳化並重新發現了天線、電路板、透鏡和工廠的設計。用柯紮的話來說,它能夠「自動合成六個光學鏡頭系統的完整設計,這些系統復制了以前獲得專利的鏡頭系統的功能。」

    2005年,發明機器創造的一項設計被美國專利和商標局授予第6847851號專利。

    人工智能發明者的崛起給世界各地的專利局帶來了問題。

    2018年,歐洲專利局(European Patent Office)以「機器沒有法人資格,不能擁有財產」為由,拒絕了兩項由人工智能作為唯一發明者的發明。

    現在有很多機器可以獨立完成很多工作而不是幫助工程師、科學家或發明家完成他們的工作。我們將會到達這樣一個階段,法院或立法機構會說人類是如此的不參與,如此多的層次被移除了,以至於實際的人類對發明的概念沒有貢獻。
    Andrei Iancu,美國專利和商標局局長(2020年)

    我們已經看到,人工智能可以在象棋和圍棋等遊戲中發明新的戰略和戰術。

    我們都希望機器能夠玩得非常穩定而緩慢,但AlphaZero卻恰恰相反。令人驚訝的是,看到一台機器如此積極地行動,它也顯示出了強大的創造力。
    加利·卡斯巴羅夫,國際象棋大師,前世界象棋冠軍
    我以為AlphaGo是基於概率計算的,它只是一台機器。但當我看到這個動作時,我改變了主意。AlphaGo當然是有創造力的。
    李世石,9段職業棋手,前圍棋冠軍,指的是「第37步」

    AI的推理能力

    2004年,肯·詹寧斯(Ken Jennings)在智力競賽節目【危險邊緣】(Jeopardy!)中連續贏得74場比賽,創造了遊戲節目的歷史。

    沒有人懷疑當今電腦的卓越記憶體。 它們在速度和準確性方面遠遠超過大腦。 但是儲存事實並知道如何套用它們是另一個問題。

    這就是為什麽IBM將制造能夠在【危險邊緣】(Jeopardy)比賽中擊敗世界冠軍的人工智能視為巨大挑戰的原因!一種遊戲,其線索通常需要解決復雜的語言謎題。

    2009年,詹寧斯接到【危險邊緣】制片人的電話。他們問道:「IBM告訴我們,他們想建造一台超級電腦,在‘危險邊緣’(Jeopardy)比賽中擊敗你。」’你準備好了嗎?」

    詹寧斯的本職工作是電腦程式設計師。他知道電腦在這類問題上遠遠落後於人類。他想:「這簡直是兒戲。是的,我會來摧毀電腦,保護我的物種。」

    人們沒有意識到編寫這樣一個程式是多麽困難,它可以讀懂像英語這樣的自然語言的【危險邊緣】的線索,並理解所有的雙關,雙關語,轉移話題,解開線索的意思。
    肯詹寧斯

    但在2011年的考驗中,詹寧斯和他的同胞布拉德·魯特(Brad Rutter)都無法擊敗沃森。這台人工智能以77147的比分結束了這場三局比賽,比它的人類對手的總比分還高。

    詹寧斯接受了失敗,在他最後的回答下寫道:「我,作為一個人,歡迎我們新的電腦霸主。」

    人類經常透過標準化的多項選擇測試來判斷其他人的推理能力。

    艾倫人工智能研究所(Allen Institute for Artificial Intelligence)的研究人員公布了一名名為阿裏斯托(Aristo)的人工智能測試者的測試結果。在短短三年的時間裏,阿裏斯托從不及格的科學考試變成了滿分。

    2016年,在紐約大學8年級的科學考試中,阿裏斯托只能正確回答59.3%的問題,但到2019年,阿裏斯托的答對率超過了90%。這個測試有這樣的問題:

    哪種器材能最好地分離鐵屑和黑胡椒的混合物?
    (1)磁鐵(2)濾紙(3)三束天平(4)電壓表
    當橡皮筋振動時,會產生哪種形式的能量?
    (1)化學(2)光(3)電(4)聲
    因為銅是一種金屬
    (1)室溫下的液體(2)與其他物質不反應(3)電的不良導體(4)熱的良導體
    在蘋果樹上,哪些過程主要是由細胞分裂引起的?
    (1)生長(2)光合作用(3)氣體交換(4)廢物清除

    據專案負責人彼得·克拉克(Peter Clark)說,「即使在五年前,電腦在理解文本內容方面也有很大的困難。多虧了快速的進步,我們現在有了能夠更好地理解語言的人工智能系統。」

    在下一節中,我們將看看人工智能即將承擔的工作。