這篇文章告訴你AlphaGo隱藏弱點 以及它是如何下棋的



傑米斯 哈薩比斯(Demis Hassabis) ,Google DeepMind CEO

企鵝智酷 | 深度解讀

靜電除油機


這篇分析中,企鵝智酷將結合 AlphaGo 相關權威論文中提供的信息,以及這兩場比賽中李世石與 AlphaGo 表現,來用更簡潔的方式,告訴你谷歌(微博) AlphaGo 到底如何下棋,以及它有哪些被隱藏起來的弱點。

先說核心結論:

作為戰勝瞭人類圍棋冠軍的人工智能,AlphaGo (目前版本)強在小范圍戰鬥,弱點在於對全局的判斷;

AlphaGo 並非沒有“情緒”。它也會懷疑自己,隻是用另一種形式呈現(不是人類的抖手或者撓頭發);

是誰在訓練 AlphaGo ?是它自己。用一種遠超人類效率的方式學習;

李世石如何贏?和很多圍棋專傢分析的一樣,從科技角度看,李世石必須在開局階段建立優勢,並且最好能夠更頻繁轉移戰場范圍;

未來,AlphaGo 會將人類棋手遠遠甩在身後。它就隻能繼續和自己玩瞭。

一、AlphaGo 是如何決定下每一步棋的?

企鵝智酷沒有能夠真的打開 AlphaGo 代碼庫,去檢查它全面的運行邏輯。我們隻能從已公開的權威論文中,來梳理這個迄今為止走進公眾視野的最強大人工智能,是如何做出決策,戰勝人類的。

簡單說,AlphaGo 下的每一步棋,都依賴於“概率”。

1.當一開始,棋盤有大量空白區域,棋子較少時,AlphaGo會更願意采用“固定策略”。

這種策略來自於 AlphaGo 自己模擬訓練的數百萬場棋局(每一局都從開始模擬到結束)。這讓 AlphaGo 心中有一個大概的最佳選擇可能性,即下在點A和點B,哪個更好些。

在這個時候,AlphaGo 是通過經驗來判斷的。雖然這個經驗不來自與人類,而是來自於它結合人類下棋方靜電除油煙機價格式學習後,自己和自己對弈的數百萬經驗值。但這種基於經驗的判斷,是人類挑戰它的最佳機會 和“恐怖”的機器推演能力相比,經驗,起碼離人類更近一些。

為什麼 AlphaGo 不在一開始就用蒙特卡羅算法,盡量窮盡所有可能性,去給出更可靠的“計算答案”,而不是“經驗答案”呢?

我們猜測,一方面是當棋局尚未真正交鋒時,各種選擇的概率差不多,沒必要做精確計算;另一方面,也為瞭節省時間。

2.當棋局有局部拼殺時,AlphaGo 的戰力就升級瞭。

這時候,再依賴那數百萬局“自己與自己下棋”的經驗,明顯是不夠的。因為棋局瞬息萬變,李世石的下法,很可能是 AlphaGo 沒有模擬過的(不要高估數百萬局訓練,和圍棋的可能性相比,隻是滄海一粟)。

這時候,AlphaGo 會不再聚焦於整個棋盤,而將計算精力縮到一個小范圍(戰鬥區域,例如右下角5*5,8*8這種)。這時候,它會啟動現場演算推理功能,即開始計算每一個落子位置的後續走勢,來計算最佳一步。

這需要時間。所以,AlphaGo 在短兵相接時,不得不縮小觀察范圍,在局部啟動現場計算。這雖然失去瞭一定的“大局觀”,但換來瞭計算的效率,和電腦比,人腦的純粹計算力是相對弱勢的,所以,短兵相接,機器占大優勢。

3.當局勢需要兼顧大局和計算力時,AlphaGo 怎麼辦?

開局佈局,AlphaGo 用經驗;短兵相接,AlphaGo 用計算力。那麼在局勢復雜時,AlphaGo 的另一個特長就有用武之地瞭 兼顧大局觀和計算能力。

靜電除煙機

台灣電動床工廠 電動床
台灣電動床工廠 電動床
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
一川抽水肥清理行|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運
X戰警多鏡頭行車記錄器專業網|多鏡頭行車記錄器|多鏡頭行車紀錄器比較|多鏡頭行車紀錄器推薦|多鏡頭行車紀錄器影片
台中抽水肥專業網|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運
台灣靜電機批發工廠|靜電機|靜電機推薦|靜電油煙處理機|靜電油煙處理機推薦
優美環保科技工程-靜電機,靜電機推薦,靜電機保養,靜電機清洗,靜電油煙處理機


arrow
arrow

    yqx178z3c8 發表在 痞客邦 留言(0) 人氣()