alphago吧 关注:859贴子:4,557
  • 5回复贴,共1

简单说一下AlphaGO,不捧不吹,纯介绍+科普

只看楼主收藏回复

主要是有些人不懂AlphaGO的原理,
导致于进入很多误区和错误的解读。
所以我就简简单单的说一下AlphaGO的基本理论。


首先有几点要澄清的是:
1.它这做法不是穷举,而是用模拟『天演论』的方式进化的。
2.它只知道围棋规则,不懂定式、套路。
3.可以把它想像成人类历史上第一个学习、玩围棋的怪胎。
4.它的核心概念是靠着『机率之神』的帮忙,渐渐逼近『围棋之神』的。
5.这是一套『模拟人类学习过程』的软体,下围棋只是顺带的。
6.在此之前它都只是在尝试一些小游戏,google感觉可行,所以这次搞围棋。
7.它自己的那一套下棋模式,不是建立在围棋理论上面,而是建立是『尝试经验』上面。


回复
1楼2016-03-14 15:12
    这种模式下来,有几点就很容易理解的
    ●AlphaGO它的命脉是"机率",它能进化也是靠机率产生多样性。
    ●它并非不会出错,因为有机率抽到劣棋,只是若它进化过很多次的话,抽到的机率会很低。


    它是由完全不懂围棋,靠着天演论进化到现在这种程度的,
    演算法模拟的是一个『自然环境』,而淘汰的契机就是『每一次胜负的结果』
    所以开发团队才会说完全不知道它会怎么下,毕竟这全靠机率。

    人类下棋,是建立在前人累积的精华上,
    在加上自己亲身的经验锻炼来的棋感、棋风,
    最后在配合上人脑的计算,单论『起步点』人类就比AlphaGO高了,
    但问题在于人类的进步太慢了。

    不可否认AlphaGO的方法如果用在人身上,一定会更没有效率,
    但是它是台机器,所以它可以实现这种人类无法实现的练棋方式,
    当然它之所以只能用这种方式,就是因为它没有人类的逻辑能归纳出围棋理论。

    【【【【【AlphaGO会输的真正原因】】】】】
    第四局AlphaGO会被击败,真正的原因在于『算错79~87歩』的胜率,
    它是错在算错『胜率』,也就是它79~87歩眼瞎了。

    也就是说,我们目前可以质疑:『它的胜率机算方式,有问题。 』
    但不能就此认为『靠胜率判断落子』这个逻辑是错的。


    第四局会获胜,就是因为李40下的棋,
    超乎了AlphaGO的计算,导致它算错胜率,后来才步步错。
    但要注意,它犯的错是算错胜率,而不是『靠胜率判断落子』这个决策的错误。


    回复
    3楼2016-03-14 15:12
      那也许有人会问了,那为什么AlphaGO到后面时会乱下?
      那边会乱下不是因为BUG,而是因为无力回天,
      每个地方胜率都很低,所以它就随机选地方下,
      一直下到它判断的胜率到了投降的临界点,它才会投降。
      ==================================================


      我是希望大家理解一下,它不是人,
      它走的道路也不是建立在我们的理论上,
      它是一个从零开始,靠着《天演论》进化到现在的....

      所以尝试用人类数千年建立下来的围棋理论去理解它,
      是搞不懂的,因为进化的路线就不一样。

      所以它难算清的路,人也许很容意算清,
      人看不清的路,它也许觉得很简单。

      要注意一点,
      它的生成方式,就注定了,它也会犯错(毕竟靠机率)。


      回复
      4楼2016-03-14 15:13
        晚上看


        回复
        来自Android客户端5楼2016-03-14 17:02
          阿尔法狗是自己和自己下,类似周博通的左右手互搏,而不是两台阿尔法狗对下


          回复
          来自iPhone客户端6楼2016-03-14 17:14
            顶上去


            回复
            来自Android客户端7楼2016-03-14 20:31