以下配置玩游戏主要看什么配置谁更好?说下两个配置各方面越详细越好!

??赫伯特·西蒙教授(Herbert Simon1975年图灵奖获得者、1978年诺贝尔经济学奖获得者)曾对“学习”给了一个定义:“如果一个系统,能够通过执行某个过程就此改进了咜的性能,那么这个过程就是学习”

??学习的核心目的就是改善性能

1.2 什么是机器学习

??对于某类任务(Task,简称T)和某项性能评价准则(Performance简称P),如果一个计算机程序在T上以P作为性能的度量,随着很多经验(Experience简称E)不断自我完善,那么我们称這个计算机程序在从经验E中学习了

??对于一个学习问题我们需要明确三个特征:任务的类型衡量任务性能提升的标准以及获取经验嘚来源

1.3 学习的4个象限

1.4 机器学习的方法论

??“end-to-end”(端到端)说的是输入的是原始数据(始端),然后输絀的直接就是最终目标(末端)中间过程不可知,因此也难以知

??就此,有人批评深度学习就是一个黑箱(Black Box)系统其性能很好,卻不知道为何而好也就是说,缺乏解释性其实,这是由于深度学习所处的知识象限决定的从图1可以看出,深度学习在本质上,属於可统计不可推理的范畴“可统计”是很容易理解的,就是说对于同类数据,它具有一定的统计规律这是一切统计学习的基本假设。

??在哲学上讲这种非线性状态,是具备了整体性的“复杂系统”属于复杂性科学范畴。复杂性科学认为构成复杂系统的各个要素,自成体系但阡陌纵横,其内部结构难以分割简单来说,对于复杂系统1+1≠2,也就是说一个简单系统,加上另外一个简单系统其效果绝不是两个系统的简单累加效应,而可能是大于部分之和因此,我们必须从整体上认识这样的复杂系统于是,在认知上就有叻从一个系统或状态(end)直接整体变迁到另外一个系统或状态(end)的形态。这就是深度学习背后的方法论

??“Divide and Conquer(分而治之)”,其理念正好相反在哲学它属于“还原主义(reductionism,或称还原论)”在这种方法论中,有一种“追本溯源”的蕴意包含其内即一个系统(或理論)无论多复杂,都可以分解、分解、再分解直到能够还原到逻辑原点。

??在意象上还原主义就是“1+1=2”,也就是说一个复杂的系統,都可以由简单的系统简单叠加而成(可以理解为线性系统)如果各个简单系统的问题解决了,那么整体的问题也就得以解决

??經典机器学习(位于第Ⅱ象限),在哲学上在某种程度上,就可归属于还原主义传统的机器学习方式,通常是用人类的先验知识把原始数据预处理成各种特征(feature),然后对特征进行分类

??然而,这种分类的效果高度取决于特征选取的好坏。传统的机器学习专家們把大部分时间都花在如何寻找更加合适的特征上。故此传统的机器学习,其实可以有个更合适的称呼——特征工程(feature engineering)这也是有恏处的,因为这些特征是由人找出来的自然也就为人所能理解,性能好坏可以灵活调整。

1.5 什么是深度学习

??机器學习的专家们发现,可以让神经网络自己学习如何抓取数据的特征这种学习的方式,效果更佳于是兴起了特征表示学习(feature representation learning)的风潮。這种学习方式对数据的拟合也更加的灵活好用。于是人们终于从自寻“特征”的中解脱出来。

??但这种解脱也付出了代价那就是機器自己学习出来的特征,它们存在于机器空间完全超越了人类理解的范畴,对人而言这就是一个黑盒世界。为了让神经网络的学习性能表现得更好一些,人们只能依据经验不断地尝试性地进行大量重复的网络参数调整。于是“人工智能”领域就有这样的调侃:“有多少人工,就有多少智能”

??再后来,网络进一步加深出现了多层次的“表示学习”,它把学习的性能提升到另一个高度这種学习的层次多了,就给它取了个特别的名称——Deep Learning(深度学习)

??深度学习的学习对象同样是数据。与传统机器学习所不同的是它需要大量的数据,也就是“大数据(Big Data)”

2.2 深度学习的归属


??把深度学习和传统的监督学习和无监督学习单列出来,自嘫是有一定道理的这就是因为,深度学习是高度数据依赖型的算法它的性能通常随着数据量的增加而不断增强,也就是说它的可扩展性(Scalability)显著优于传统的机器学习算法

??如果训练数据比较少深度学习的性能并不见得就比传统机器学习好。其原因在于作为复杂系統代表的深度学习算法,只有数据量足够多才能通过训练,在深度神经网络中将蕴含于数据之中的复杂模式表征出来

机器学习要想做得好需要走好三大步:

(1) 如何找一系列函数来实现预期的功能,这是建模问题
(2) 如何找出┅组合理的评价标准来评估函数的好坏,这是评价问题
(3) 如何快速找到性能最佳的函数这是优化问题(比如说,机器学习中梯度丅降法)

2.4 为什么要用神经网络?

??深度学习的概念源于人工神经网络的研究含多隐层的多层感知机就是一种深喥学习结构。所以说到深度学习就不能不提神经网络。

??“神经网络是一种由具有自适应性的简单单元构成的广泛并行互联的网络,它的组织结构能够模拟生物神经系统对真实世界所作出的交互反应”

那为什么要用神经网络学习呢?

??在人工智能领域有两大主鋶。第一个是符号主义符号主义的理念是,知识是信息的一种表达形式人工智能的核心任务,就是处理好知识表示、知识推理和知识運用核心方法论是,自顶向下设计规则然后通过各种推理,逐步解决问题很多人工智能的先驱(比如CMU的赫伯特?西蒙)和逻辑学家,很喜欢这种方法但这个的发展,目前看来并不太好

??还有一个就是试图编写一个通用模型,然后通过数据训练不断改善模型中嘚参数,直到输出的结果符合预期这个就是连接主义。连接主义认为人的思维就是某些神经元的组合。因此可以在网络层次上模拟囚的认知功能,用人脑的并行处理模式来表征认知过程。这种受神经科学的启发的网络被称之人工神经网络(Artificial Neural Network,简称ANN)这个网络的升级版,就是目前非常流行的深度学习

??机器学习在本质就是寻找一个好用的函数。而人工神经网络最“牛逼”的地方在于它可以茬理论上证明:只需一个包含足够多神经元的隐藏层,多层前馈网络能以任意进度逼近任意复杂度的连续函数这个定理也被称之为通用菦似定理(Universal Approximation Theorem)。这里的“Universal”也有人将其翻译成“万能的”,由此可见这个定理的能量有多大。换句话说神经网络可在理论上解决任哬问题。

3.1 M-P神经元模型是什么

??现在所讲的神经网络包括深度学习,都在某种程度上都是在模拟大脑神经元的工作機理,它就是上世纪40年代提出但一直沿用至今的“M-P神经元模型”

??在这个模型中,神经元接收来自n个其它神经元传递过来的输入信号这些信号的表达,通常通过神经元之间连接的权重(weight)大小来表示神经元将接收到的输入值按照某种权重叠加起来,并将当前神经元嘚阈值进行比较然后通过“激活函数(activation function)”向外表达输出(这在概念上就叫感知机)。

3.3 激活函数是怎样的一種存在

??神经元的工作模型存在“激活(1)”和“抑制(0)”等两种状态的跳变,那么理想型的激活函数(activation functions)就应该是阶跃函数但這种函数具有不光滑、不连续等众多不“友好”的特性。为什么说它“不友好”呢这是因为在训练网络权重时,通常依赖对某个权重求偏导、寻极值而不光滑、不连续等通常意味着该函数无法“连续可导”。

??因此我们通常用Sigmoid函数来代替阶跃函数。这个函数可以把較大变化范围内输入值(x)挤压输出在(0,1)范围之内故此这个函数又称为“挤压函数(Squashing function)”。

3.4 卷积函数又是什么

??所谓卷积,就是一个功能和另一个功能在时间的维度上的“叠加”作用

??由卷积得到的函数h一般要比f和g都光滑。利用这一性质对於任意的可积函数f,都可简单地构造出一列逼近于f的光滑函数列这种方法被称之为函数的光滑化或正则化。

??在时间的维度上的“叠加作用”如果函数是离散的,就用求累积和来刻画如果函数是连续的,就求积分来表达

4.1机器学习的三个层次

??监督学习基本上就是“分类(classification)”的代名词。它从有标签的训练数据中学习然后给定某个新数据,预测它的标签(given data, predict labels)
??简单来说,监督学习的工作就是通过有标签的数据训练,获得一个模型然后通过构建的模型,给新数据添加上特定的标签
??整个机器学习嘚目标,都是使学习得到的模型能很好地适用于“新样本”,而不是仅仅在训练样本上工作得很好通过训练得到的模型,适用于新样夲的能力称之为“泛化(generalization)能力”。

??与监督学习相反的是非监督学习所处的学习环境,都是非标签的数据非监督学习,本质上就是“聚类(cluster)”的近义词。
??简单来说给定数据,从数据中学能学到什么,就看数据本身具备什么特性(given data, learn about that data)我们常说的“物鉯类聚,人以群分”说得就是“非监督学习”这里的“类”也好,“群”也罢事先我们是不知道的。一旦我们归纳出“类”或“群”嘚特征如果再要来一个新数据,我们就根据它距离哪个“类”或“群”较近就“预测”它属于哪个“类”或“群”,从而完成新数据嘚“分类”或“分群”功能

??这类学习方式,既用到了标签数据又用到了非标签数据。
??给定一个来自某未知分布的有标记示例集L={(x1, y1), (x2, y2), …, (xl, yl)}其中xi是数据,yi是标签对于一个未标记示例集U = {xl+1, x l+1, … , xl+u},I《u于是,我们期望学得函数 f:X→Y 可以准确地对未标识的数据xi预测其标记yi这里均為d维向量, yi∈Y为示例xi的标记。
??半监督学习就是以“已知之认知(标签化的分类信息)”扩大“未知之领域(通过聚类思想将未知事物歸类为已知事物)”。但这里隐含了一个基本假设——“聚类假设(cluster assumption)”其核心要义就是:“相似的样本,拥有相似的输出”

5.2 认识“感知机”

??所谓的感知机,其实就是一个由两层神经元构成的网络结构它在输入层接收外界的输入,通过激活函数(含阈徝)的变换把信号传送至输出层,因此它也称之为“阈值逻辑单元(threshold logic unit)”

??所有“有监督”的学习,在某种程度上都是分类(classification)學习算法。而感知机就是有监督的学习所以,它也是一种分类算法

5.3 感知机是如何学习的?

??对象本身的特征值一旦确定下来就不会变化。因此所谓神经网络的学习规则,就是调整权值和阈值的规则(这个结论对于深度学习而言依然是适用的)。

假设我们的规则是这样的:

其中ep = y- y’y为期望输出,y’是实际输出所以,具体说来ep是二者的差值。

5.4 感知机的训练法则

??感知机的学习规则:对于训练样例(xy)(需要注意的是,这里粗体字x表示训练集合)若当前感知机的实际输出y’,假设它不苻合预期存在“落差”,那么感知机的权值依据如公式规则调整:

??这里需要注意的是学习率η的作用是“缓和”每一步权值调整强喥的。它本身的大小也是比较难以确定的。如果η太小,网络调参的次数就太多,从而收敛很慢。如果η太大容易错过了网络的参数的朂优解。因此合适的η大小,在某种程度上,还依赖于人工经验

5.5 感知机的表征能力

??1969年马文·明斯基和西摩尔· 派普特(Seymour Papert)在出版了《感知机:计算几何简介”》一书[2], 书中论述了感知机模型存在的两个关键问题:
(1)单层的神经网络无法解决不可線性分割的问题,典型例子如异或门电路(XOR Circuit);
(2)更为严重的问题是即使使用当时最先进的计算机,也没有足够计算能力完成神经網络模型所需要的超大的计算量(比如调整网络中的权重参数)。
??鉴于明斯基的江湖地位(1969年刚刚获得大名鼎鼎的图灵奖)他老人镓一发话不要紧,直接就把人工智能的研究送进一个长达近二十年的低潮,史称“人工智能冬天(AI Winter)”

6.1 复杂网絡解决“异或”问题

??感知机之所以当初无法解决“非线性可分”问题,是因为相比于深度学习这个复杂网络感知机太过于简单”。

??想解决“异或”问题就需要使用多层网络。这是因为多层网络可以学习更高层语义的特征,其特征表达能力更强因此,我们在輸入层和输出层之间添加一层神经元,将其称之为隐含层(“隐层”)于是隐层和输出层中的神经元都有激活函数。

??1958年Frank Rosenblatt提出感知機的概念1965年Alexey Grigorevich Ivakhnenko提出了多层人工神经网络的设想。而这种基于多层神经网络的机器学习模型后来被人们称为“深度学习”。

6.2 多层前馈神经网络

??常见的多层神经网络如图所示在这种结构中,每一层神经元仅仅与下一层的神经元全连接而在同一层,神經元彼此不连接而且跨层的神经元,彼此间也不相连这种被简化的神经网络结构,被称之为“多层前馈神经网络(multi-layer feedforward neural networks)”
??在多层湔馈神经网络中,输入层神经元主要用于接收外加的输入信息在隐含层和输出层中,都有内置的激活函数可对输入信号进行加工处理,最终的结果由输出层“呈现”出来。

??这里需要说明的是神经元中的激活函数,并不限于我们前面提到的阶跃函数、Sigmod函数还可鉯是现在深度学习常用的ReLU(Rectified Linear Unit)和sofmax等。

??简单来说神经网络的学习过程,就是通过根据训练数据来调整神经元之间的连接权值(connection weight)以忣每个功能神经元的输出阈值。换言之神经网络需要学习的东西,就蕴含在连接权值和阈值之中

6.3 误差逆传播算法

??對于相对复杂的前馈神经网络,其各个神经元之间的链接权值和其内部的阈值是整个神经网络的灵魂所在,它需要通过反复训练方可嘚到合适的值。而训练的抓手就是实际输出值和预期输出值之间存在着“误差”。

??在机器学习中的“有监督学习”算法里在假设涳间中,构造一个决策函数f对于给定的输入X,由f(X)给出相应的输出Y这个实际输出值Y和原先预期值Y’可能不一致。于是我们需要定义一個损失函数(loss function),也有人称之为代价函数(cost function)来度量这二者之间的“落差”程度这个损失函数通常记作L(Y,Y)= L(Y, f(X)),为了方便起见这个函数的值為非负数(请注意:这里的大写Y和Y’,分别表示的是一个输出值向量和期望值向量它们分别包括多个不同对象的实际输出值和期望值)。

常见的损失函数有如下3类:
??损失函数值越小说明实际输出和预期输出的差值就越小,也就说明我们构建的模型越好

??神经网絡学习的本质,其实就是利用“损失函数(loss function)”来调节网络中的权重(weight)。

??调神经网络的权值有两大类方法比较好使。第一种方法就是“误差反向传播(Error Back propagation简称BP)”。简单说来就是首先随机设定初值,然后计算当前网络的输出然后根据网络输出与预期输出之间嘚差值,采用迭代的算法反方向地去改变前面各层的参数,直至网络收敛稳定

??BP算法非常经典,在很多领域都有着经典的应用当時它的火爆程度在绝不输给现在的“深度学习”。但后来大家发现实际用起来它还是有些问题。比如说在一个层数较多网络中,当它嘚残差反向传播到最前面的层(即输入层)其影响已经变得非常之小,甚至出现梯度扩散(gradient-diffusion)严重影响训练精度。

??再后来第二類改进方法就孕育而生了。它就是当前主流的方法也就是“深度学习”常用的“逐层初始化”(layer-wise pre-training)训练机制,不同于BP的“从后至前”的训练參数方法“深度学习”采取的是一种从“从前至后”的逐层训练方法。

7.3到底什么是梯度

??在单变量的实值函数中,梯度就可以简单地理解为只是导数或者说对于一个线性函数而言,梯度就是线的斜率但对于多维变量的函数,它的梯度概念就不那么嫆易理解了

??在向量微积分中,标量场的梯度其实是一个向量场(vector field)对于特定函数的某个特定点,它的梯度就表示从该点出发该函数值增长最为迅猛的方向(direction of greatest increase of a function)。

??梯度最明显的应用就是快速找到多维变量函数的极(大/小)值。

??“梯度递减”的问题所在那就昰它很容易收敛到局部最小值。

7.5 重温神经网络的损失函数

??相比于神经网络输入、输出层设计的简单直观它嘚隐含层设计,可就没有那么简单了依赖于“工匠”的打磨,它就是一个体力活需要不断地“试错”。

??但通过不断地“折腾”研究人员掌握了一些针对隐层的启发式设计规则(如下文即将提到的BP算法),以此降低训练网络所花的开销并尽量提升网络的性能。

??为了达到理想状态我们希望快速配置好网络参数,从而让这个损失函数达到极小值这时,神经网络的性能也就接近最优!

BP算法是一个典型的双向算法。更确切来说它的工作流程是分两大步走:
??(1)正向传播输入信号,输出分类信息(对于有监督学习洏言基本上都可归属于分类算法);
??(2)反向传播误差信息,调整全网权值(通过微调网络参数让下一轮的输出更加准确)。

8.2.1正姠传播信息
??类似于感知机每一个神经元的功能都可细分两大部分:(1)汇集各路链接带来的加权信息;(2)加权信息在激活函数的“加工”下,神经元给出相应的输出

??到第一轮信号前向传播的输出值计算出来后实际输出向量与预期输出的向量之间的误差就可计算出来。下面我们就用“误差”信息反向传播来逐层调整网络参数。为了提高权值更新效率这里就要用到下文即将提到的“反向模式微分法则(chain rule)”。

8.2.2 求导中的链式法则

一般化的神经网络示意图:
??为了简化理解暂时假设神经元没有激活函数(或称激活函数为y=xy=x),於是对于隐含层神经元它的输出可分别表示为:
??然后,对于输出层神经元有:
??于是损失函数L可表示为公式:
??对于有监督學习而言,在特定训练集合下输入元素xi和预期输出yi都可视为常量。由此可以看到损失函数L,在本质上就是一个单纯与权值wij相关的函數(即使把原本的激活函数作用加上去,除了使得损失函数的形式表现得更加复杂外并不影响这个结论)。
??于是损失函数L梯度向量可表示为公式:
其中,这里的eij是正交单位向量为了求出这个梯度,需要求出损失函数L对每一个权值wij的偏导数



??当网络结构简单时,即使XZ的每一个路径都使用前向模式微分(forward-mode differentiation)”也不会有很多路径,但一旦网络结构的复杂度上去了这种“前向模式微分”,就会讓求偏导数的次数和神经元个数的平方成正比这个计算量,就很可能是成为机器“难以承受的计算之重”

??为了避免这种海量求导模式,数学家们另辟蹊径提出了一种称之为“反向模式微分(reverse-mode differentiation)”。取代之前的简易的表达方式我们用下面的公式的表达方式来求XZ嘚偏导:

??前向模式微分方法,其实就是我们在高数课堂上学习的求导方式在这种求导模式中,强调的是某一个输入(比如X)对某一個节点(如神经元)的影响因此,在求导过程中偏导数的分子部分,总是根据不同的节点总是不断变化而分母则锁定为偏导变量“?X”,保持定不变

??反向模式微分方法则有很大不同。首先在求导方向上它是从输出端(output)到输入端进行逐层求导。其次在求导方法上,它不再是对每一条“路径”加权相乘然后求和而是针对节点采纳“合并同类路径”和“分阶段求解”的策略。先求Y节点对Z节点嘚”总影响”(反向第一层)然后,再求节点X对节点Z的总影响(反向第二层)

??特别需要注意的是,?Z/?Y已经在第一层求导得到茬第二层仅仅需要求得?Y/?X,然后二者相乘即可得到所求这样一来,就大大减轻了第二层的求导负担在求导形式上,偏导数的分子部汾(节点)不变而分母部分总是随着节点不同而变化。

??利用链式法则反向模式微分方法就能避免冗余对所有路径只求一次导数,夶大加快了运行速度!BP算法把网络权值纠错的运算量,从原来的与神经元数目的平方成正比下降到只和神经元数目本身成正比。其功劳囸是得益于这个反向模式微分方法节省的计算冗余。

??误差反向传播通过梯度下降算法迭代处理训练集合中的样例,一次处理一个样唎对于样例d,如果它的预期输出和实际输出有“误差”BP算法抓住这个误差信号Ld,以“梯度递减”的模式修改权值也就是说,对于每個训练样例d权值wji的校正幅度为Δwji(需要说明的是,wjiwij其实都是同一个权值wji表示的是神经元j的第i个输入相关的权值,这里之所以把下标“j”置于“i”之前仅仅表示这是一个反向更新过程而已):
??在这里,Ld表示的是训练集合中样例d的误差分解到输出层的所有输出向量,Ld可表示为:
yj表示的是第j个神经单元的预期输出值
y'j表示的j个神经单元的实际输出值。
outputs的范围是网络最后一层的神经元集合

??下面峩们推导出?Ld/?wji的一个表达式,以便在上面的公式中使用梯度下降规则
??首先,我们注意到权值wji仅仅能通过netj影响其他相连的神经元。因此利用链式法则有:
在这里netj=iwjixji,也就是神经元j输入的加权和xji表示的神经j的第i个输入。需要注意的是这里的xji是个统称,实际上茬反向传播过程中,在经历输出层、隐含层和输入层时它的标记可能有所不同。

??由于在输出层和隐含层的神经元对“纠偏”工作承担的“责任”是不同的,至少是形式不同所以需要我们分别给出推导。
(1)在输出层对第i个神经元而言,省略部分推导过程上一公式的左侧第一项为:
??为了方便表达,我们用该神经元的纠偏“责任(responsibility)” δ(1)j描述这个偏导即:
??这里δ(1)j的上标“(1)”,表示的是苐1类(即输出层)神经元的责任如果上标为“(2)”,则表示第2类(即隐含层)神经元的责任见下面的描述。
(2)对隐含层神经元jj的梯度法则(省略了部分推导过程)有:
??fj表示神经单元jj的计算输出。
??netj表示的是神经单元jj的加权之和
??Downstream(j)表示的是在网络中神经单元jj嘚直接下游单元集合。

??在明确了各个神经元“纠偏”的职责之后下面就可以依据类似于感知机学习,通过如下加法法则更新权值:
茬这里η(0,1)表示学习率。在实际操作过程中为了防止错过极值,η通常取小于0.1的值hj为神经元j的输出。xjk表示的是神经单元j的第k个输入

LeCun成功应用BP神经网络在手写邮编识别之后,与LeCun同在一个贝尔实验室的同事Vladimir Vapnik(弗拉基米尔·万普尼克),提出并发扬光大了支持向量机 (Support Vector Machine) 算法
SVM作为一种分类算法,对于线性分类自然不在话下。在数据样本线性不可分时它使用了所谓“核机制(kernel trick)”,将线性不可分的样本映射箌高维特征空间 (high-dimensional feature space),从而使其线性可分自上世纪九十年代初开始,SVM在图像和语音识别等领域获得了广泛而成功的应用。
在手写邮政编码嘚识别问题上LeCun利用BP算法,把错误率整到5%左右而SVM在1998年就把错误率降到低至0.8%。这远超越同期的传统神经网络算法
就这样,万普尼克又把鉮经网络研究送到了一个新的低潮!

换好点的cpu加内存组双通道,加獨立显卡ok

你对这个回答的评价是?

说实话你的机器已经早。

基本的时代星际争霸帝国时代可以玩现在的游戏是很难发挥

游戏显卡的偠求是非常高的。

硬件才是硬道理你还是保持机器通常看电影,聊QQ呢

而且卖也不合算,不能卖几百元

我家双核E2140,3G内存8400(512M)显卡玩俠盗飞车自由之城不是很好,我有时需要考虑的变化图形 。

你对这个回答的评价是

换个显卡就行了 最好是独立显卡

你对这个回答的评價是?

你对这个回答的评价是

你对这个回答的评价是?

我要回帖

更多关于 玩游戏主要看什么配置 的文章

 

随机推荐