聲明:本站所有資源皆來源于互聯網,本站所有文章觀點均不代表站長個人觀點,投資理財有風險,請謹慎操作!

  1. 安徽快3
  2. 燈光觀點

圍棋人工智能程序 ——阿爾法狗

相信大家都玩過圍棋,圍棋每一步的選擇比象棋多得多,多得像宇宙中所有原子一樣。因此沒有一種方法可以計算出所有的可能性,這是不可能實現的。正因為如此,圍棋像是人工智能的圣杯。而阿爾法狗的出現展現了機器真的可以像人類一樣學習和思考。

阿爾法圍棋是一款圍棋人工智能程序,由位于英國倫敦的谷歌旗下DeepMind公司的戴維西爾弗、艾佳黃和戴密斯哈薩比斯與他們的團隊開發。

這個程序的原理是深度學習和兩個大腦。深度學習是指多層的人工神經網絡和訓練它的方法。一層神經網絡會把大量矩陣數字作為輸入,通過非線性激活方法取權重,再產生另一個數據集合作為輸出。兩個大腦:第一大腦是落子選擇器,阿爾法圍棋的第一個神經網絡大腦是監督學習的策略網絡 ,觀察棋盤布局企圖找到最佳的下一步。第二大腦是棋局評估器,根據棋子的位置情況,預測每一個棋手贏棋的可能。這就是第二個神經網絡大腦:價值網絡。通過整體局面的判斷來輔助落子選擇器。但這個判斷僅僅是大概的。

阿爾法圍棋的發展分為四個階段:

阿爾法圍棋-樊

阿爾法圍棋-李

阿爾法圍棋-大師

阿爾法圍棋-零前三個版本在剛開始學習圍棋時,都要依靠人類知識,即先教它們一些人類摸索出的基本下法,然后再開始自己學習。而阿爾法圍棋-零擺脫了這個限制,研究人員沒有給它除棋盤和棋子之外的任何輸入,它完全是從零開始,自己與自己對弈,通過更為優秀的算法,取得飛速進步。阿爾法圍棋-零取得的進步已經證明,基于強化學習的人工智能比基于人類知識經驗的智能表現地更好。

阿爾法圍棋-零帶來的進步是圍棋棋手日后學習的寶庫。 阿爾法圍棋-零是獨立學習訓練的,但它使用的招數卻超越了許多人類棋手的下棋順序和招法。也就說,人工智能豐富了我們下圍棋的選擇?;蛐硭諳縷騫討杏行┫路ㄊ僑死轡薹ɡ斫獾?,甚至認為是錯誤的,但在機器的理解看來確實萬分正確的。從這些經驗中,人類棋手看到了與以往不同的圍棋世界。

本文內容來自互聯網轉載,不代表本人立場,若侵犯您的權益,請聯系我們第一時間刪除,謝謝!如若轉載,請注明出處://www.fcwht.com/guandian/ddf962d860b7062a5ab7d898.html

標簽:

標簽:

標簽:

{ganrao}