3星|刘韩《人工智能简史》:从编程语言和算法的角度

图片 1

那是上月在商店里面的一次分享,现把PPT及互换内容整理成博客。

事在人为智能简史(跟着图灵、冯?诺依曼、香农、Simon等人工智能先驱重走人工智能之路,站在前任的肩膀上“鉴以往、知将来”)图片 2

翻阅目录:

全书从编程语言与算法的角度回看人工智能的历史,相比较标准。

  1. 高可用
  2. 数量同步
  3. 分布式
  4. 分布式集群时代
  5. 总结

看内容有点像科研工小编、人工智能前沿从业者写的。电子书中从未对小编的牵线,亚马逊(Amazon)官网上有,不是做科研的。

高可用

高可用(High
Availability),是当一台服务器为止服务后,对于事情及用户不用影响。
停止服务的因由可能鉴于网卡、路由器、机房、CPU负载过高、内存溢出、自然灾祸等不可预料的由来促成,在广大时候也称单点难题。
化解单点难点根本有2种格局:

终极两章是几位第一的数学家的简史,我为主略过了。

主备格局

那种平凡是一台主机、一台或多台备机,在正规情形下主机对外提供劳务,并把数量同步到备机,当主机宕机后,备机登时开端服务。
Redis
HA中应用相比多的是keepalived,它使主机备机对外提供同一个虚拟IP,客户端通过编造IP进行多少操作,正常期间主机一向对外提供劳务,宕机后VIP自动漂移到备机上。

亮点是对客户端毫无影响,照旧通过VIP操作。
症结也很肯定,在多数日子内备机是间接没利用,被荒废着的。

完整评价3星,有局地参考价值。

宗旨方式

那种利用一主多从的法子,主从之间展开数量同步。
当Master宕机后,通过推举算法(Paxos、Raft)从slave中推选出新Master继续对外提供劳务,主机復苏后以slave的身份重新参预。
主导另一个目标是进行读写分离,那是当单机读写压力过高的一种通用型解决方案。
其主机的角色只提供写操作或少量的读,把多余读请求通过负载均衡算法分流到单个或八个slave服务器上。

症结是主机宕机后,Slave即使被选举成新Master了,但对外提供的IP服务地点却爆发变化了,意味着会影响到客户端。
解决这种情况要求有些额外的干活,在当主机地址发生变化后当即布告到客户端,客户端收到新地方后,使用新地方继续发送新请求。

以下是书中一些情节的摘要:

数量同步

任由主备照旧骨干都牵扯到数量同步的题材,那也分2种状态:

  • 一齐格局:当主机收到客户端写操作后,以联合情势把数据同步到从机上,当从机也成功写入后,主机才回来给客户端成功,也称数据强一致性。
    很扎眼那种艺术品质会骤降不少,当从机很多时,能够不要每台都共同,主机同步某一台从机后,从机再把多少分发同步到别的从机上,那样升高主机品质分担同步压力。
    在Redis中是援救那杨配置的,一台master,一台slave,同时那台salve又作为任何slave的master。

  • 异步方式:主机接收到写操作后,间接回到成功,然后在后台用异步格局把多少同步到从机上。
    这种联合品质相比较好,但无能为力有限支撑数据的完整性,比如在异步同步进程中主机突然宕机了,也称那种格局为数据弱一致性。

Redis主从一块运用的是异步方式,因而会有微量丢数据的危险。还有种弱一致性的特例叫最终一致性,那块详细内容可参见CAP原理及一致性模型。

1:电路系统的“开”和“关”,对应二进制的“1”和“0”。这就是切实世界与虚拟世界最根本的一个应和,可以说香农的天才考虑建立了实际与虚拟之间的一个大桥。#197

方案接纳

keepalived方案安插简单、人力资本小,在数据量少、压力小的图景下推荐应用。
假若数据量比较大,不希望过多浪费机器,还期待在宕机后,做一些自定义的不二法门,比如报警、记日志、数据迁移等操作,推荐应用基本格局,因为和中坚搭配的相似还有个管理监控要旨。

宕机公告那块,可以合二为一到客户端组件上,也可独自抽离出来。
Redis官方Sentinel协理故障自动转换、公告等,详情见低费用高可用方案设计(四)。 

逻辑图:

图片 3

2:在作者看来,纽厄尔终身钻研的“人类思想的真面目”,正是人工智能最难和最本色的课题!#224

分布式

分布式(distributed),
是当业务量、数据量扩大时,可以经过随机增添减少服务器数量来解决问题。

3:Simon和纽厄尔双剑合璧,创造了人工智能的首要门户:符号派。符号派的医学思路称为“物理符号系统假说”,简单精通就是:智能是对符号的操作,最原始的标志对应于物理客体。#232

集群时代

最少陈设两台Redis服务器构成一个小的集群,紧要有2个目的:

  • 高可用性:在主机挂掉后,自动故障转移,使前端服务对用户无影响。
  • 读写分离:将主机读压力分流到从机上。

可在客户端组件上贯彻负载均衡,根据差距服务器的运行状态,分担差异比例的读请求压力。

逻辑图:

图片 4

4:世界围棋季军常昊评论AlphaGo的围棋水平:“它现在的水平,可以说是大大地高于了俺们人类的想像。”#287

分布式集群时代

当缓存数据量不断扩大时,单机内存不够使用,须求把数量切分差距部分,分布到多台服务器上。
可在客户端对数据开展分片,数据分片算法详见C#一致性Hash详解C#之虚拟桶分片

逻辑图:

图片 5

5:人类思想棋类难题的宗旨智慧就是找到高招,而找到高招的紧要性就是推算出若干步之内无论对方怎么作答,本方都地处局面变好的态度。转换来国际象棋程序编程,要旨都必须有两有的:博弈搜索和规模评估。#306

广泛分布式集群时代

当数据量持续伸张时,应用可根据不一致场景下的事情申请对应的分布式集群。
这块最要害的是缓存治理那块,其中最重大的局地是投入了代理服务。
应用通过代办访问真正的Redis服务器举行读写,那样做的好处是:

  • 幸免进一步多的客户端直接访问Redis服务器难以管理,而致使危机。
  • 在代理这一层可以做相应的商洛措施,比如限流、授权、分片。
  • 幸免客户端更多的逻辑代码,不但臃肿升级还相比费劲。
  • 代理那层无状态的,可任意扩张节点,对于客户端的话,访问代理跟访问单机Redis一样。

眼下楼主集团采纳的是客户端组件和代理二种方案并存,因为通过代理会影响自然的品质。
代理那块对应的方案达成有推文(Tweet)的Twemproxy和豌豆荚的codis。

逻辑图:

图片 6

6:纽厄尔、Simon和约翰·肖发展的Alpha-Beta算法可以从寻找树中剔除相当大的片段而不影响最终结果。它的骨干考虑是,就算有点着法将协调引入了很差的范畴,这些着法的持有继续着法就都无须继续分析了。#315

总结

分布式缓存再向后是云服务缓存,对使用端完全挡住细节,各使用自动报名大小、流量方案即可,如TmallOCS云服务缓存。
分布式缓存对应须要的兑现组件有:

  • 一个缓存监控、迁移、管理骨干。
  • 一个自定义的客户端组件,上图中的SmartClient。
  • 一个无状态的代办服务。
  • N台服务器。

多谢我们

7:汤普森的另一大进献是她整理的残局库,他在20世纪80年代就初始变化和仓储棋盘上剩四至五子的装有符合规则的残局。一个超级的五子残局,比如王双象对王单马,包罗总数121万个范畴。电脑使用那几个残局数据库,可以把每个残局走得相对完美,如同上帝一样。#327

8:最后促成克制人类国际象棋世界亚军之梦、取得人机大克制利的是IBM的“深蓝”(DeepBlue)团队,要旨是来自中国海南地区的许峰雄、莫里·坎Bell(MurrayCambell)和乔·赫内(Joe Hoane)。#338

9:根据DeepMind公司在《自然》杂志上登出的小说,AlphaGo那个系统关键由以下多少个部分组成。(1)策略网络(Policy
Network),给定当前范围,预测下一步的走棋。(2)连忙走子(法斯特rollout)。(3)估值网络Value
Network),给定当前范围,推断是白胜依然黑胜,给出输赢的票房价值。(4)蒙特卡罗树摸索(Monte
Carlo Tree Search,MCTS),把以上3个部分连起来,形成一个全部的连串。#381

10:据估量,单机上运用“火速走子”的博弈程序,已经有所了围棋三段左右的水平。而“估值网络”对胜负的判断力已经远超所有人类棋手。#395

11:二〇一四年,谷歌花4亿美元购回DeepMind集团时,DeepMind集团也就是刚刚在《自然》杂志刊登了一篇利用强化学习算法玩计算机游戏随想的小商店,很几人都不明了为啥这家铺子值这么多钱。后来DeepMind研发了震惊世界的AlphaGo之后,人们才起头相信佩奇和布林的远见卓识。#513

12:在国际通用的MNIST手写体数字识别数据集上,LeNet-5可以达到近似99.2%的正确率。这一连串后来被美利坚合众国的银行周边用于支票上数字的辨别。#527

13:事实阐明,12个NVIDIA集团的GPU可以提供一定于2000个CPU的吃水学习性能。此后,London大学、孟买大学以及瑞士联邦人工智能实验室的研商人员纷纭在GPU上加紧其深度神经网络。#547

14:二零零六年,ImageNet项目落地了——那是一个分包1500万张相片的数据库,涵盖了22000种物品。那几个物料是按照平常乌克兰语单词举办分拣协会的,对应于大型塞尔维亚(Serbia)语知识图库WordNet的22000个同义词集。#556

15:Lisp语言推出之后,因为比起Fortran那类专注于科学计算的言语具备更强的符号处理能力,很快成为人工智能领域的要紧语言。同时,Lisp中的递归、垃圾回收等创新体制,对一连的Java、Python等语言有很大的影响。#668

16:汤普森用汇编语言形成了UNIX的第四个版本,那或者是人类历史上拿汇编语言已毕的最伟大的小说。#690

17:有人问:“你怎样察觉有天赋的程序员?”汤普森回答:“只看他们的情绪。你问她们做过的最有趣的先后是什么,然后让他俩讲述程序和它的算法,等等。#705

18:TensorFlow是谷歌(Google)在二〇一五年8月表露的吃水学习开源工具,Tensor(张量)意味着N维数组,Flow(流)意味着数据流图的演算,由杰夫·迪恩(Jeff
Dean,)指点的谷歌(谷歌)大脑社团开发。#728

19:因为杰夫·迪恩实在太厉害了,谷歌(谷歌)商厦内部流传着无数关于她有多厉害的笑话,比如:“杰夫·迪恩的密码是圆周率的最终4位数字。”“当杰夫·迪恩自闭症时,他用MapReduce数羊群。”#734

20:TensorFlow的优势是支撑异构设备的分布式总括,它能够在分歧平台上自行运行模型,这个平台包含手机、单CPU的PC和重重个CPU/GPU组成的超大型分布式系统。#741

21:DENDRAL系统是第三个成功投入使用的专家系统,1965年由斯坦福州立大学开首研发,1968年研制成功,它的成效是分析质谱仪的光谱,援助物理学家判定物质的积极分子结构。#775

22:利用知识图谱技术,谷歌(Google)大大优化了客户的查找体验,同时,知识图谱的庞大知识库也得以和其旁人工智能技术整合,比如完毕规范的话音识别和机器翻译等。#850

23:要是您对人工智能有趣味,也足以啄磨一下温馨的师承,从您的数学老师或电脑老师开首追溯,很有可能您的祖师爷也是老莱布尼茨。#1707

发表评论

电子邮件地址不会被公开。 必填项已用*标注