要开发一个能玩英雄联盟的人工智能，难度几颗星

这个问题源于今天和一个朋友的讨论。具体问题有以下几个：
1、alphago都会下围棋了，对于一般人来说下围棋比打lol难多了，那对于人工智能或者电脑来说，能打lol应该是比alphago的技术简单很多啊（我不知道我这种逻辑正不正确）
2、LOL里的人机模式里的电脑玩家算作人工智能吗？如果不算，那区别在哪？
3、开发一个人工智能，要求如下：能模仿（或者媲美）职业选手的操作，自我bp，设计战术，操控五个位置，团战完美配合，脚本走位躲技能，超快反应，懂得骗技能，懂得故意吃技能勾引对面，预测敌方位置等等，能吊打全世界任意战队
目前能做到吗？如果能难度高吗？如果不能，技术瓶颈在哪？

deepmind做了很多种AI玩游戏的，openai也在做，例如dota，这类游戏，他们的做法，基本思想都是深度卷积结构强化学习为主，以连续几帧游戏画面的组合压缩成灰度为例如4*80*80的画面，再以此画面为一个状态，这样状态的多个序列都有一个关系，即前一状态按某一策略采取有限动作中的一种，会紧接着或过一会儿后产生新的关联状态及回报，只要按累积最大回报的评估原则去求解出每种状态下的最佳动作，就能让智能强化学习出对应画面对应最佳或次佳策略得到总体最佳或次佳的表现。
简单点场景单一的游戏，一般的笔记本算力训练十来天，就用图像帧作输入，类似于玩家可操作的动作为输出（例如玩家可以上下左右、发射、什么都不做、开始，那机器的动作也可通过接口作此类操作），反复强化学习，就能超过普通人。复杂的游戏，得高算力，仍以图像帧作输入，动作为输出，中间除了强化学习，可能会引入更复杂的策略，例如围棋用了蒙特卡罗搜索树。现在听说dota电脑打白金玩家没问题，战胜所有人只是个时间问题。

难度系数=资本
1.lol的难度大于alphago （我自己的看法）围棋一局 “变数= 10的172次方”
王者荣耀一局10个英雄 “变数10的2万次方” 所以说lol的难度大于围棋
2.lol的电脑属于“行为树”的行为并不算智能（因为n年没变过了）
区别：人机= 有限行为机 + 行为树不会自主学习
人工智能：这不用解释了吧
3.分三类
1.监督模式+强化学习
2.半监督模式 +强化学习
3.无监督模式 +强化学习
这3种投入的训练时间几何的差别
可以达到博士级别的就可以搞出来
难点就两大点1.模型 2.训练
因为你拿不到游戏接口你只能开大量设备去训练
一个游戏窗口一天大约40次
如果无监督模式大约训练200w次左右（我猜的）应该可以看见一点效果了至于要训练多少次才能达到职业水平的话得你亲测

*** 写那么多直接被删了

搜搜OPEN AI VS OG 吧 dota2这个领域早就有AI人工智能了

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

32回复贴，共1页

<<返回人工智能吧

分享到:

日	一	二	三	四	五	六