那么,现实中人工智能遵循的法则要如何规定呢,如何保证机器人执行呢?
这问题直接涉及到了人类要如何遵守社会行为法则的问题,因为机器人和人类在这一点上并无区别。
阿西莫夫并没有意识到机器人和人类在本质上没有区别,他认为机器人可以按程序一丝不苟地执行指令,所以不可能会自己搞出什么幺蛾子,于是给它们制定法则就可以限制住它们的行为,只要我们让法则足够完善就行。
之所以说阿西莫夫太过于想当然,就在于现实里人类也是在一丝不苟执行神经系统的内置指令的。
那么人类为何可以背叛,为何可以违反规则行事?
人类和机器人一样,我们之所以能违反规则行事,只是因为规则没有在物理层面与【阻止行为继续】的物理机制直接挂钩。
如果【不许喝水】这个指令直接对应于一套【一旦人有喝水行为就会导致昏厥(相当于机器人系统宕机)】的物理机制,那么人类也会完全遵照【不许喝水】的指令执行。
我们能违反【不许喝水】的指令,完全是因为没有物理机制直接阻止我们实施喝水这个行为,而机器人则会有高优先级管理进程打断喝水进程的执行来阻止机器人违反【不许喝水】的指令。
而机器人在现实里也会和人类一样遇到一个困境【很多规则的具体标准没有严格和精准的定义】,人类在遇到无法严格确认的问题时,会通过模糊机制自行衡量标准然后执行指令,机器如果有类似的系统就也会同样工作(而不存在因为无法搞清具体细节而不工作的情况)。
而这种模糊处理机制本身会引入不确定性,不同的人对某件事的理解(衡量尺度)会有差异,机器人也会有类似差异,而如果要执行的指令本身的定义歧义性或模糊性很高,那么机器人对它的理解也会和人类一样千差万别。
客观来说,机器人执行指令时就会像人类一样出现各种标准不一的执行方式。
所以,机器人三法则引发的那些漏洞问题是必然存在的,而机器人三法则在这些个问题面前并无任何卵用(也就是说阿西莫夫的设想根本没有现实意义)。
那么现实中人类如何被灌输行为准则呢?很简单,靠【赏罚机制】。
你用刀子割自己,神经系统会反馈痛感来对你进行【惩罚】,你会因为不堪忍受疼痛而停止用刀割自己。
停止进食过久,会有严重的饥饿感,这种饥饿感对你当前停止进食的行为进行处罚,你不堪忍受饥饿感就会去找吃的,恢复进食。吃的太多还会觉得撑得慌,这也是靠感觉机制的惩罚来阻止你继续胡吃海塞。
而众所周知的【美味感】则是对我们选择好的食物(对身体有益)并适当进食的【奖励】,它鼓励我们继续这么做(吃好吃的)。
机器人也是如此,将来的机器人也要靠类似的机制来构建基本系统,这样的系统将无视逻辑病毒入侵,即便机器人在逻辑病毒的影响下自我伤害,痛感系统也会阻止它。
而学习规则的过程也将伴随【赏罚机制】,小孩子做错事可能要挨骂挨打,或者被切断某些物质来源(比如没收玩具),他们就从痛苦或压力中学会了【哪些事情不该做】,未来机器人的训练也将沿用类似的机制,只不过不会像人类这样靠打屁股完成。
小孩子做了正确的事情,家人会给他表扬或者物质奖励,将来训练机器人也会采用类似机制,机器人将会为了赢得表扬或者奖励而去做正确的事情,这比什么【思想钢印】都有效率。
既然提到了【思想钢印】,这个出自《三体》的名词,其实在科幻作品里早就存在N多年,也有各种叫法,这个概念是把人类视为机器人去控制其思想,直接在人脑中植入强制性的指令。
从生理学来讲,这是做不到的,人脑神经系统并不存在【自由设定权限】的功能,人脑各种机制的相对权限高低,是物理结构决定的,也是定死的,比如脑干关联心跳控制,你无论如何修改大脑各部分的指令都不可能夺取脑干的这个权限。
像小说里那样只修改一个指令来让人相信【水有毒】,这虽然能做到,但是它也很容易被修正,人脑就是因为善于不断修正错误才能拥有强大思考能力(我们从小时候开始就在不断修正自己对现实世界的各种错误认知),所以现实里希恩斯要破解【水有毒】的思想钢印,只要喝几次水确认水无毒就完事了(大脑就会自动修复这个错误认知,而想要让大脑固化这种错误认知,至少我不知道有什么办法可以做到)。
人脑之所以进化为这样(不会被某些顽固指令锁死),就是因为为了在复杂的现实世界生存,人类需要能够不断修正自己的错误认知来适应环境,这种能力保证了我们不会被逻辑病毒控制(除非大脑功能在物理层面受损,比如老年痴呆等,患者大脑已经失去自我修正功能,无法重建正常思考系统)。
但是,人脑在一定程度上还是会被逻辑病毒影响,现实中人们就经常会存在【思维短路】的问题,对某些问题,人们无法识别出自己陷入逻辑思考死循环的怪圈,这是因为这些人的逻辑思维能力不足,就像电脑的杀毒程序病毒库不全,无法识别某些变种病毒。