您現在的位置:海峽網>新聞中心>體育頻道>體育新聞
      分享

      人機大戰第二季,AlphaGo閑庭信步地把柯潔打哭,在完成暴擊人類的重任后,deepmind團隊宣布AlphaGo作為一名競技棋手生涯已經終結。從此機器與人類的戰斗,已經像騎自行車與騎摩托車比拼速度,毫無意義。但很多人都在疑惑:如此獨孤求敗的AlphaGo如果自己與自己殺上一盤,會是怎樣的局面?現在,這個問題終于有答案了,這幾天deepmind團隊放出的50局AlphaGo自戰棋譜,就告訴了大家,“狗咬狗”到底會發生什么?

      “狗咬狗”會發生什么?首先他毀了人類“三觀”

      “白狗”與“黑狗”的惡戰

      Alphago自從誕生以來,主要通過自我對弈左右互搏不斷提升水平。和李世石對戰的版本已經自我對弈了超過3000萬盤,而和柯潔對戰的版本恐怕早已左右互搏了上億盤。此番公布的50盤AlphaGo自戰都是慢棋,1-2分鐘一步,應該說實力上和與柯潔對戰的版本相同,所以很具有代表性。

      “狗咬狗”會發生什么?可以肯定的是,其結局不是以拔電源告終,而是同樣互有輸贏,輸棋的一方也并不是先死機的那個,在很大程度上是決定于手里棋子的顏色。在AlphaGo的50局自戰中,執白的一方——俗稱“白狗”贏了38盤,勝率接近80%,相當驚人。在人機大戰第二局中,柯潔執白曾經把局勢導入到很混亂的局面,他自稱一度看到了機會,在發布會上,他主動申請第三局執白,希望能夠復制第二盤的格局,因為傳聞AlphaGo執白棋的勝率會到55%。

      但其實這終究不是一個概率學問題,AlphaGo自戰中“白狗”勝率驚人也并非因為運氣好,而是涉及到中國圍棋規則中的貼子(指先手一方補償給后手一方,確保黑白開局時局面均衡的保障),在人類高手看來,黑貼3又3/4子對黑棋來說負擔有點重,導致黑棋的行棋趨向于激烈化。如今看來,AlphaGo的自戰對局也證實了這一點,而且表現出來的差距遠比人類對局明顯,根據大量職業比賽的實戰結果統計,中國規則下人類職業棋手黑棋的勝率大概在47%。在棋力已入化境的AlphaGo看來“黑狗”勝率太低,所以或許中國規則中關于貼子的規定該有所改變了。

      “狗咬狗”會發生什么?首先他毀了人類“三觀”

      “狗咬狗”中人類被毀掉的“三觀”

      AlphaGo的50局自戰棋譜,對于職業棋手來說,可是珍貴的“武功秘籍”,如同當年王重陽走后留下的一部九陰真經。但是這本秘籍卻讓人大跌眼鏡,“三觀”盡毀,因為如果按照AlphaGo的套路,這么多年的圍棋可能真的是白學了,要不就是學了個假圍棋。

      首先是“套路觀”。眾所周知,下圍棋是有是定式的,有套路的。AlphaGo的套路是什么?就是沒套路。在這50盤對局中,AlphaGo幾乎沒有擺完一個人類常見的定式,要么是開了個定式的頭,但走兩步就脫先(各走各路,你走一步我不理,我走一步你當看不見)了,等什么時候想起來再看情況再出招,要么是直接忽略人類定式大全下出全新下法——可見人類圍棋史上總結的各類定式,絕大多數AlphaGo都是不認同的,這也說明了定式其實是人類圍棋的“過擬合”——為了得到一致假設而使假設變得過度嚴格。

      “狗咬狗”會發生什么?首先他毀了人類“三觀”

      其次是戰斗觀。如果你懂棋,那么AlphaGo自戰棋譜恐怕會讓你不敢直視,如果你不懂棋,那么設想一下,“狗咬狗”的畫面是黃藥師大戰歐陽鋒,而“狗咬人”則是黃藥師戲??骆倫?。如果人類高手對局的對抗激勵程度是10,AlphaGo自我對弈的激烈程度起碼是100。全局性攻殺,大規模轉換,反復的劫爭在狗狗的自戰譜中比比皆是,這樣看和人類棋手對弈時求穩的假象只是巨大優勢下簡明取勝的策略而已,就像老虎和獅子爭霸那一定是打得天翻地覆,老虎跟人打隨便撓兩下就結束戰斗了。所以像柯潔與AlphaGo第二盤那樣的全局混戰在人類眼中可能是非常復雜激烈,人類會有機會,但在AlphaGo看來其實都是小把式。

      “狗咬狗”會發生什么?首先他毀了人類“三觀”

      再有是“目標觀”。AlphaGo是實現“小目標”的堅定執行者,盡管廝殺過程極其慘烈,但大部分情況下,激戰結束雙方各自收兵輕點棋盤上的累累尸骨劃定疆域,就會發現其實雙方的差距也就是半目或者一目半而已。50局自戰譜如果正常收完官子有約一半會以半目勝負收尾,可見AlphaGo掌控局勢的能力。而且在細微局面下AlphaGo的官子也不會出現和人類對弈時那種不斷退讓的情況。----比如本次人機大戰第一局,AlphaGo在開局領先后穩穩收兵最終只贏了1/4子,可以簡單理解為AlphaGo并不在乎贏多少,只在乎贏沒贏,它會在任一局面下尋找當前勝率最高的一點,而且AlphaGo這種勝率就像GDP制約達康書記一樣牽著AlphaGo,它的每一個選點都是當前局面勝率最高的一點(它自己認為的),所以才會經常出現在一個局部走了幾步突然就不走了,脫先到另外一個地方走幾步,然后又回來了之類的前后不連貫的情況。

      “狗咬狗”會發生什么?首先他毀了人類“三觀”

      自相殘殺后留下“打狗秘籍”?

      既然拿到了“武功秘籍”,勤加修煉是必然,但能“以其人之道還治其人之身”嗎?說得深一點,能實現人類圍棋的大躍進嗎?

      人類圍棋的知識體系和AlphaGo完全不同,一個是由局部到全局的整合,一個是直接基于全局勝率選擇每一步棋的最佳選點。由于存在這樣根本性的差異,人類很難真正學會AlphaGo布局階段那些匪夷所思的脫先、打破定式的下法。再有,AlphaGo中后盤在激戰中的計算深度,遠遠超過人類大腦所能達到的限度——可以簡單粗暴的理解為“狗”在復雜戰斗中能把未來100步棋的最優解找出來,而人類遠遠不能。

      “狗咬狗”會發生什么?首先他毀了人類“三觀”

      但“秘籍”不是廢紙,人類圍棋發展的套路,就是每次都是出現一個天才,大幅度拓展大家的思路,讓圍棋發展到一個頂峰,然后出現了“過擬合”,大家的棋都局限在一個地方,直到下一個天才出現再次打破常規。以往這個角色是道策、秀策、吳清源,而如今,可能就是穿越千年而來,提前告訴我們1000年后的圍棋該如何下的AlphaGo。

      責任編輯:莊婷婷

      最新體育新聞 頻道推薦
      進入新聞頻道新聞推薦
      福州:鮮花代替紙錢 “云端”寄托思念
      進入圖片頻道最新圖文
      進入視頻頻道最新視頻
      一周熱點新聞
      下載海湃客戶端
      關注海峽網微信
      ?

      職業道德監督、違法和不良信息舉報電話:0591-87095414 舉報郵箱:service@hxnews.com

      本站游戲頻道作品版權歸作者所有,如果侵犯了您的版權,請聯系我們,本站將在3個工作日內刪除。

      溫馨提示:抵制不良游戲,拒絕盜版游戲,注意自我保護,謹防受騙上當,適度游戲益腦,沉迷游戲傷身,合理安排時間,享受健康生活。

      CopyRight ?2016 海峽網(福建日報主管主辦) 版權所有 閩ICP備15008128號-2 閩互聯網新聞信息服務備案編號:20070802號

      福建日報報業集團擁有海峽都市報(海峽網)采編人員所創作作品之版權,未經報業集團書面授權,不得轉載、摘編或以其他方式使用和傳播。

      版權說明| 海峽網全媒體廣告價| 聯系我們| 法律顧問| 舉報投訴| 海峽網跟帖評論自律管理承諾書

      友情鏈接:新聞頻道?| 福建頻道?| 新聞聚合
      亚洲黄色在线电影| 亚洲精品自产拍在线观看动漫| 亚洲国产一二三精品无码| 国产亚洲精品美女2020久久| 亚洲综合一区国产精品| 亚洲一本之道高清乱码| 亚洲免费在线观看视频| 亚洲成a人片7777| 亚洲AV福利天堂一区二区三| 国产精品亚洲аv无码播放| 国产国拍精品亚洲AV片| 自拍偷自拍亚洲精品被多人伦好爽| 亚洲视频人成在线播放| 浮力影院亚洲国产第一页| 国产亚洲av片在线观看18女人 | 亚洲毛片基地日韩毛片基地| 亚洲国产老鸭窝一区二区三区 | 含羞草国产亚洲精品岁国产精品 | 亚洲s码欧洲m码吹潮| 亚洲国产av玩弄放荡人妇| 亚洲AV成人一区二区三区观看| 亚洲七久久之综合七久久| 国产成人亚洲综合网站不卡| 亚洲一区二区三区成人网站| 亚洲国产精品成人AV在线| 狼人大香伊蕉国产WWW亚洲| 亚洲国产精品无码久久九九| 国产亚洲精品高清在线| 亚洲日韩国产精品第一页一区| 亚洲成AV人片在线观看| 久久久久亚洲AV无码网站| 亚洲精品在线播放视频| 亚洲人成网站在线观看播放青青| 亚洲乱码一二三四区乱码| 亚洲中文字幕精品久久| 综合偷自拍亚洲乱中文字幕| 亚洲一区二区三区乱码A| 国产亚洲综合色就色| 亚洲综合国产精品| 亚洲一区二区三区免费在线观看| 亚洲真人无码永久在线观看|