说一说4500ELO和挑战星际【alphago吧】

alphago吧关注：819贴子：4,582

5回复贴，共1页

说一说4500ELO和挑战星际

4500ELO是和之前版本对弈来的，拿训练样本测试肯定不科学，谷歌也说了这个不准，过拟合严重。蒙特卡洛下让子棋在对局前期会认为局面大优，从而轻易地舍弃四子带来的优势。所以这种以让子来判断棋力差距的方式和人与人对弈中的以让子判断棋力差距的方式是不能一概而论的

。
如果狗真有4500分，石头的胜率只有千分之3左右，而且事实上说棋类游戏elo分真差特别多的份上，双方胜率要比elo模型给出的更加悬殊，就像elo算法樊麾理论上对柯洁有3%上下的胜率，但是事实上如果有人以100比1的赔率开盘，完全敢赌柯洁胜。可以说差1000分胜率根本就是0

，实际上赢下一局就已经打破了4500分这个神话。棋类游戏等级分是有上限的，围棋上帝也不可能达到几万分，按目前的估计围棋上帝大概能让顶尖职业棋手2-4子。
再说说电脑打星际吧，计算机看问题的难度和人不一样，对人而言看出面前的人是人毫无压力，算一万道微积分很头疼，对电脑来说微积分50年代就毫无压力，人是人现在还智商捉急。不懂的人就说了，天啊电脑一秒钟能算一万道微积分了，为啥还不能认出人是人呢

对电脑来说星际很麻烦，首先模型复杂，围棋基本规则非常简单，星际光是把单位彻底讲明白就要花很多时间，还有不同的地图，电脑处理这么多东西压力也很大。其次状态空间巨大，围棋的10^170相比星际太小了，从没听过星际还能复盘的，搜索树肯定不能用了。第三信息不对称，有限状态机主义智商捉急，其实我觉得谷歌可以先考虑挑战炉石，再谋星际，循序渐进

。
电脑不能作弊，不能在屏幕上连下两个子

。一个星际之神坐在电脑前，AI最多只能做出和它一样的操作，比如说星际每帧只能操作一次，那AI一秒也就只能操作30次或者60次，没有什么几万APM。小狗打坦克那个视频是用触发作弊的，实际上星际之神也不知道坦克打的是其炮口方向的哪条狗，也就无法散开。当然电脑也不需要去识别屏幕或者机械手，星际这么多单位建筑魔法效果乱七八糟还不停的动，以现在的图像识别技术根本识别不出来，肯定是直接把数据送给AI。
伯克利大学有星际AI比赛，好多年了，还是打不过职业选手，谷歌的工程师也说这事对他们有挑战性，未必办不成，但绝不是手到擒来的事。

送TA礼物

IP属地:上海