关于概率要素和统计学要素在游戏设计中的运用（中）

簡體傳統

　　《关于概率要素和统计学要素在游戏设计中的运用（上）》从三个方面讲述了概率要素和统计学要素在游戏设计中的运用，本篇就从实例告诉你统计和概率在进行游戏设计中所起到的辅助作用。

　　四、举例论述游戏设计蕴含的概率学原理
　　

　　下面是答题时间！

　　问题1. 假设你正在设计一款全新MMORPG游戏，你设定当玩家消灭一只怪兽时，特殊道具Orc Nostril Hair将有10%的出现几率。某位测试者回馈称，他消灭20只怪兽，发现Orc Nostril Hair 4次，而另一位测试者则表示，自己消灭20只怪兽，没有发现Orc Nostril Hair。这里是否存在编程漏洞？

　　问题2. 假设你正在设计游戏的战斗机制，决定植入一个重击机制。若角色进行成功袭击(假设是75%的成功几率)，那么他就可以再次发动进攻。若第二次袭击也成功，那么玩家就会形成双倍破坏性(2x)。但若出现这种情况后，你再次进行袭击，且这次袭击也获得成功，那么破坏性就上升至3倍(3x)。只要袭击都获得成功，你就可以继续发动新的进攻，破坏性就会继续成倍提高，直到某次袭击出现失败。玩家释放至少双倍(2x)破坏性的几率是多少？玩家形成4倍(4x)或更高破坏性的几率是多少？

　　问题3. 你决定在最新杰作RTS-FPS-电子宠物-运动混合游戏中植入赌博迷你游戏。此赌博迷你游戏非常简单：玩家下注红宝石，赌硬币会出现正面，还是反面。玩家可以在胜出的赌局获得同额赌注。你会将硬币投掷设计成公平程式，但你会向玩家提供额外功能：在屏幕右侧显示最近20次的硬币投掷结果。你是否会请求程序员引入额外逻辑运算，防止玩家利用此20次投掷结果列表，以此摧毁你的整个游戏经济体系？

　　我们将在文章末尾附上这些问题的答案。

　　游戏设计师——复兴人士&非专家

关于概率要素和统计学要素在游戏设计中的运用（上） ...

　　如今设计师这一职业要求各种各样的技能。设计师是开发团队的多面手，需要消除美工和编程人员之间的隔阂，有效同团队成员沟通——或者至少要学会不懂装懂。优秀设计师需要对众多知识有基本的了解，因为游戏设计是各学科的随机组合。

　　我们很常听到设计师争论线性或非线性故事叙述、人类心理学、控制人体工学或植入非交互事件序列中的细节内容；你很少看到他们深究微积分、物理学或统计学之类晦涩科学的梗概内容。当然依然存在Will Wrights这样的人士，全心致力于天体粘性物及动态城市交通规划。但多数人都会在遇到方程式时选择退缩。

　　概率学+统计学=杰出成果

　　概率学(P)和统计学(S)是两门对游戏设计师来说非常重要的复杂科学——或者至少对他们来说应该非常重要。它们之间的关系就像豌豆和胡萝卜，但和那些美味的蔬菜一样，它们不是同个事物。简略来说就是：

　　概率学：预测事件发生的可能性

　　统计学：基于已发生事件下结论

　　综合起来，P和S让你可以做到这些：同时预测未来和分析过去。这多么强大！但记住：“力量越强大，责任越重大。”

　　P和S只是设计师工具箱中的工具。你可以且应该在设计游戏时充分利用它们，这样游戏才会更具平衡性和趣味性。

　　好事坏事接二连三

　　P和S有许多厚厚的教材，本文并非这类教材的替代内容。

　　这一系列的文章旨在让你把握P和S的若干主要话题，主要围绕设计师需投以关注的要点。

　　这一部分主要谈论针对游戏设计师的概率学。

　　记住，成为多面手设计师并不意味着你需要变成这些领域的专家；你只要能够唬弄其他人即可。

　　建议：强化对“理论”、“编撰”和“分类法”的运用能够促使合伙伙伴朝这些目标迈进。开发者不妨对各学科进行高谈论阔。

　　现在我们开始切入正题。

　　概率学

　　多数游戏都会在基础机制中融入1-2个概率学元素。就连国际象棋也需要靠掷硬币来决定谁执白棋。通常，我们将概率学机制称作“随机事件”。随机一词的意思也许是“完全随机”，也许是“刻意随机”。无论是《德州扑克》、《魔兽世界》，还是《炸弹人》，随机事件都有融入它们的核心游戏机制中。

　　概率学：这不仅是个不错构思，还是个设计法则！

　　你多半听过“根据概率学法则”这样的表述。这个短语的关键词是“法则”。概率学围绕的是无可争辩的事实，而不是猜测。从学术角度来说，这就主要是概率论，但出于游戏设计目的，你完全能够计算概率。当你投掷6面骰时，摇到“6”的几率是1/6=16.7%—–假设这是次公正的“投掷”，骰子制作合格。16.7%不是猜测数值。这几乎等同于事实(也许有人会从量子力学角度出发，认为16.7%不属于事实。我的意思是，骰子可能会突然变形，进而不复存在，或者你查看骰子的不当方式曲解它原本的波动函数)。大家在概率学方面的多数错误理念都和认为概率学不是基于法则，而是基于近似值或指导方针的观念有关。不要陷入这些误区。下面我将谈到几个常见误区，大家务必多加注意。

　　独立和相关事件

　　我将先从一个重要特性切入，谈论概率学的热门话题：事件属于独立，还是相关。这你是计算概念前必须要把握的要点。

　　独立事件：事件的出现概率和另一事件发生与否无关。例如，投掷6面骰(事件1)，然后再次进行摇掷(事件2)，都是属于独立事件。第一次摇掷和第二次摇掷没有任何关系。你在事件1的摇掷结果对事件2没有任何影响。另一独立事件的例子是，从一个牌组中抽出一张纸牌，然后再从另一个不同牌组中抽出一张纸牌。

　　相关事件：一个事件的出现几率和另一事件存在相关性。例如，从牌组中抽出一张牌(事件1)，然后再从同个牌组中抽出一张牌(事件2)。第二次抽到王的几率会受到事件1的影响(注：若你在事件1中抽到王，那么在事件2中抽到王的几率就会受到影响，因为牌组中的王变少了)。

　　条件概率

　　概率学的一大益处是，能够计算条件事件的概率——也就取决于其他事件发生概率的事件。例如，我过去一直玩传统《战锤》桌面游戏，游戏主要基于6面骰。根据“撞击”图表，若不熟练的战士(配备低级的武器技能)和高级敌人配成一组，那么你就需要连续摇到两次“6”，方能进行袭击。那么连续两次摇到“6”的概率是多少？

　　先说重点，你需要先摇到第一个“6”(1/6的几率)，然后你得摇到另一个“6”(1/6的几率)。若一个事件的发生取决于另一事件的成败，那么你需要将二者的概率相乘，方能得到最终发生概率。在此，就是1/6 x 1/6 = 1/36，这就是你连续两次摇到“6”的概率。

　　通过这一新发现的条件概率，我们很容易进行疯狂骰子投掷的几率运算。你连续摇到4个“6”的几率是多少？答案是1/6 x 1/6 x 1/6 x 1/6。或者更简单的，(1/6)4 = .0008 = .08%。那么连续摇到10个“2”呢？(1/6)10 =相当小的百分比。

关于概率要素和统计学要素在游戏设计中的运用（上） ...

　　逐步提高难度，在摇到“5”或“5”以上数字后，摇到“3”或“3”以上数字的几率是多少？就是4/6 x 2/6 = 8/36 = 2/9 = 22.2%。

　　迷信和均分谬论——“赌徒谬论”

　　大家在概率学方面的一个常见错误观念是，模糊独立事件和相关事件之间的界限。这主要体现在如下模式：

　　错误1：认为若上次摇到的是“5”，那么“5”出现的几率就变小。

　　错误2：认为若连续10次都没摇到“6”，那么“6”出现的几率就很高。这相当于认为，若“红色”多次没有在轮盘上出现，那么它很快就会出现。

　　错误3：在投掷10次硬币，8次出现正面，2次出现反面后认为，在接下来的10次投掷中，反面出现的几率会更高，以实现“平均化”。

　　所有这些都属于“赌徒谬论”。从根本来说，这其实就是混淆独立事件和关联事件的概念。这一谬论的另一表现是，“我刚在赌轮盘中输掉所有资金，因为概率法则违抗均分谬论”。这和鲜为人知的“赌场为什么允许我记录轮盘旋转结果？——显然他们知道我将发现其中模式，打破轮盘谬论？”这一观念存在密切关系。

　　不要陷入这些误区。摇掷骰子多次或旋转轮盘都是属于独立事件，纯粹而简单。下面就来深入查看上述错误：

　　错误1：通过6面骰摇到“5”的概率是1/6 = 16.7%。这从来没有变过。这和你是否连续摇到8次“5”或很久都没摇到“5”毫无关系。16.7%依然是个幻数。“骰子没有记忆”是个惯用语，这完全正确。

　　错误2：和上述内容相同。摇到“6”或转到“红色”的几率和此前的摇掷或旋转情况毫无关系。轮盘也没有任何记忆。

　　平均数定律遭到否决

　　错误3也是个类似，但有所拓展的错误观念：认为所有事件在长期范围内都会“均衡化”——平均数法则。的确投掷硬币1000次，你有望看到50%的正面，50%的反面。但这里没有所谓的“校正”。若你投掷硬币10次，有8次正面，2次反面，那么接下来的10次投掷没有理由会出现更多反面。你也许会犯下哲学错误，认为“该出现正面”，甚至犯下更大错误，在此投入众多资金。

　　这里的要领是，若你投掷硬币100万次，你看到正面和反面的几率都是50%。但不要认为正面出现的次数会和反面保持平均——其实它们可能会相差几百次，或者甚至几千次。记住，当正面出现次数比反面少1万次时，二者的出现概率依然接近于50%/50%(注：准确来说，是49%/51%)。所以不要在此下赌注，认为8：2的正反出现概率会在随后的投掷过程中得到“校正”。虽然从长远来看，正反面的出现概率接近于50%/50%，但正反面各自的出现次数差距会随投掷次数的增加而增加。

　　反向概率

　　我们很容易找到计算独立或关联事件出现概率的公式。但有时要计算更多相关概率就没那么容易。一个需要你把握的重要概念是“反向概率”。计算反向概率，你需要判断的是某事件没有发生的概率，而不是它发生的概率。然后将1.0 (100%)扣除此数，这样你就会得到你所要的概率数值。

　　反向概率101：简单例子

　　假设你即将投掷一个6面骰。你投到“6”的概率有多大？虽然我们已经知道答案，这里我们将运用反向概率进行论证。你没有摇到“6”的概率是5/6 ，因此你摇到“6”的概率是1–5/6 = 1/6，或是16.7%。换而言之，你没有摇到“6”的概率是5/6，那么你摇到“6” 的概率是1/6。这毫无疑义。

　　反向概率201：凑成同花顺

　　在某情况下，反向概率能够帮你节省资金。那就是《德州扑克》，假设你在拼凑红桃同花顺，手中已有2张红桃(公共牌有2张)，然后还有2次抽牌机会。换而言之，若你下次抽到红桃，那么你的牌组就是同花顺。这出现的概率有多大？

关于概率要素和统计学要素在游戏设计中的运用（上） ...

　　我们很容易就能算出红桃在下张牌中出现红桃的概率。“牌组”中还有9张红桃没被抽取(13-4=9，手中2张+公共牌2张)。牌组还剩47张牌(52-5=47，手中3张，公共牌3张)。因此，下次抽到红桃的概率是9/47。若抽到的不是红桃，那么随后抽到的概率就是9/46(红桃数量依然没变，但总牌数减少)。

　　唯一问题是，我们如何算出在两次抽牌中抽到红桃的总概率？我们很容易就会犯下这一错误，认为是9/47 + 9/46。但这并不正确。这和下述错误类似：认为6次摇到“6”的总概率是1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1.0 = 100%。遗憾的是，我们无法在摇掷6次骰子后100%摇到“6”。

　　事实证明，通过反向概率解决这两个问题要简单得多。我们会这样设问：“没有抽到红桃的概率是多少？”就第一次而言，概率是(47 – 9)/47 = 38/47。第二次的概率是(46 – 9)/46 = 37/46。根据条件事件方面的知识，我们很容易就能够算出这两个事件的发生概率。换而言之，我们需要算出两次都没抽到红桃的概率，即38/47 x 37/46 = 65.0%。我们对凑成同花顺的概率非常感兴趣，所以我们将1.0扣去此数值，得到1.0 –0 .65 = 0.35 = 35%。所以凑成同花顺的概率是35%。

　　注意：摇骰子问题的计算方式也类似。6次中至少摇到1次“6” 的概率是通过计算没有摇到“6” 的概率得来。在每次摇掷中，没有摇到“6”的概率是5/6。因此，6次完全没有摇到“6”的概率就是：5/6 x 5/6 x 5/6 x 5/6 x 5/6 x 5/6 = 0.33 = 33%。所以，至少摇到1次“6”的概率是1.0 –0 .33 =0 .67 = 67%。因此你将有2/3的几率摇到至少一次“6” 。

　　关于反向概率，我们需记住的是，有时算出事件未发生的概率要比计算它们发生的概率简单得多。

　　关于随机数据生成器

　　关于概率，数字游戏设计师须知的一点是：随机数据生成器并不随机。随机数据算法需要“始值”，这是算式获得自身原始数据，进行能够带来所谓随机数据的循环运算的的基础。很多时候，程序会取样CPU钟点，或类似于始值的数据注：这能够促使算法保持随机性)。但对于包含众多随机数据生成内容的高强度游戏而言，有时这依然不够随机。让我们以在线扑克供应商为例。玩家需要知道控制牌组重洗的随机数据没有潜在模式。在诸如这类的极端情况下：资金取决于收入，程序员需要进行精心设计，逐步以CPU热量和函数作为始值，而不是钟点。

　　这里的建议是，数字游戏没有真正的随机数据。很多时候，这没有问题，但若你的游戏融入众多数据信息，就要留心其中模式。

　　回到问答题目

　　下面回到文章开始的问题。

　　问题1. Orc Nostril Hair的出现概率

　　在此情况中，两位测试者的结果都处于概率范围内。若每次消灭怪兽，发现Orc Nostril Hair(ONH)的基本概率是10% ，那么消灭20只怪兽后发现至少4次ONH的概率是13.3%。你也许会问，我如何得到这一数据？在此，我运用了一个高级概念，叫做二项分配，但这并不是本文的谈论内容。

　　在20次机会中发现0次ONH的几率是由反向概率决定：

　　在每次消灭怪兽后有10%的几率发现道具意味着同时会有90%的概率没有发现道具。

　　在20次机会中没有发现道具的概率是(.90)^20 = 12.2%。

　　所以在20次机会中发现4次ONH的概率和发现0次ONH的相同。

　　要判定自己是否真的需要担心编程漏洞，你需要更多信息。你需要测试者提供更多数据点，这样你才能够做出令人信服的结论。

　　例如收集100个体验回合的信息(注：每个回合包含100种技能)。这是一组庞大数据。若在这些体验回合中，玩家发现ONH的概率多于或少于10%，那么你的回馈率可能存在漏洞。在这种情况下，你就应该加以关注。

　　问题2. 2x-3x-4x+重击

　　形成至少2x破坏性也就是连续击中两次的条件概率：

　　2x或更高破坏性的概率=0.75 x 0.75 = 56.3%

　　4x或更高破坏性的概率=(0.75)^4 = 31.6%

　　哇，玩家形成4x或更高破坏性的几率是1/3。你需要修改游戏机制。或降低基础击中率，或提高连续重击难度。

　　问题3. 投掷硬币

　　这个问题是个设计粗糙的陷阱。首先，你通过向玩家呈现前20次投掷情况给予他们一定援助，然后你需要稳固自己的机制，防止玩家滥用。

　　答案就是，告知玩家前20次投掷情况丝毫不影响硬币投掷结果的50/50比例。这让玩家陷入赌徒谬论中。

　　我甚至建议当玩家在连续出现两次“反面”后下注“正面”时，若他们胜出，支付他们少于同额赌注的资金。告诉他们，你们处于不公平的有利地位，知道“正面”定会出现。他们会信以为真。

　　五、统计学在游戏设计领域的应用

　　虽然统计学是一门基于数学的学科，但是它实在很枯燥！严格地说——如果你曾经不得不大量地研究双边置信区间、学生T检验以及卡方分布测试，有时你会觉得很难消化这些知识点。

　　一般来说，我是喜欢物理学和力学的，因为很多时候只需简单地分析一个事例，你就能核实现状。当你计算苹果从树上落下的速度及方向时，如果你的结果是苹果应以每小时1224英里垂直向上抛出，也就是实际上你已经在头脑中核实过结果了。

　　统计学的优势在于易理解且具合理性；而劣势在于它的奇特性。无论如何，这篇文章的话题不会让你觉得枯燥。因为大部分的话题都是有形的、属于重要的数据资料，你应有精力去慢慢摸索。

关于概率要素和统计学要素在游戏设计中的运用（上） ...

　　统计学：黑暗的科学

　　统计学是所有学科领域中最易被邪恶势力滥用的科学。

　　统计学可以同邪恶行径相比较是因为在使用不当时，这门学科的分支就会被推断出各种无意义或者不真实的裙带关系(参见本文末尾的实例)。如果政治家或其它非专业人士掌控了统计学，那么他们就可以操纵一些重要决定。一般来说，基于错误总结的坏决策从来不受好评。

　　也就是说，使用得当时，统计学无疑非常有用且有益。而对于强权势力者来说，他们会将统计学应用于一些非法途径，甚至是一些纯粹无用的渠道。

　　统计学——所谓的争议

　　我已准备好作一个紧凑的总结，然而我注意到维基百科已经对统计学作了定义，而且语言几近诗歌体系。如下：

　　统计学是应用数学的一个分支，主要通过收集数据进行分析、解释及呈现。它被广泛应用于各个学科领域，从物理学到社会科学到人类科学；甚至用于工商业及政府的情报决策上。(Courtesy Wikipedia.org)

　　这真的是一段很感人的文章。特别是最后那句“用于情报决策上”。

　　当然，作者忘记添上“在游戏设计领域”，但是我们原谅他对这一蓬勃发展的新兴行业的无知。

　　以下为我自己撰写：

　　统计学是应用数学的一个分支，它涉及收集及分析数据，以此确定过去的发展趋势、预测未来的发展结果，获得更多我们需了解的事物。(Courtesy Tylerpedia)

　　如果将此修改为适用游戏设计领域，那可以如此陈述：

　　统计学为你那破损的机制及破碎的设计梦指引了一条光明大道。它为你有意义的设计决策提供了稳定且具有科学性的数据。

　　须知的事实

　　统计学同其它硬科学一样深奥且复杂。如同第一部分的内容一样，本文只涉及一些精选的话题，我自认为只要掌握这些就足够了。

　　再次突击测验

　　很抱歉我要采取另一项测试了。别讨厌出题目的人，讨厌测试吧。

　　Q1a)假设有20名测试员刚刚完成新蜗牛赛跑游戏《S-car GO！》中的一个关卡。你得知完成一圈的时间最少为1分24秒，最多为2分32秒。你期望的平均时间为2分钟左右。请问这个测试会成功吗？

　　Q1b)在同一关卡中你收集了过多的数据，在分析后得出这样的结果：平均值=2分5秒；标准差=45秒。请问你会满意这个答案吗？

　　Q2)你设计了一款休闲游戏，不久就要发行。在最后的QA阶段，你分布了一个测试版本，然后收集了所有的数据作为试验对象。你记录了1000多位玩家的分数，还有100多位特殊的玩家的分数(有些玩家允许重复玩游戏)。运算这些数据可知平均分为52000pts，标准差为500pts。请问这游戏可以发行了吗？

　　Q3)你设计了一款RPG游戏，然后收集数据分析新的玩家从关卡1到关卡5的游戏进程会有多快。收集的数据如下所示：4.6小时、3.9小时、5.6小时、0.2小时、5.5小时、4.4小时、4.2小时、5.3小时。请问你可以计算出平均值和标准差吗？

　　总体和样本

　　统计学的基础为分析数据。在分析数据的时候，你需要了解两个概念：

　　1.总体：

　　总体是指某一领域中所有需要测量的对象。总体是抽象的，只在你需要测量时候才会具体化。比如，你想了解人们对某一特定问题的看法。那你就可以选择地球上所有的人，或者爱荷华州所有的人或者只是你街道附近所有的人作为一个总体。

　　2.样本：

　　样本实际上就是指抽取总体中部分用于测量的对象。原因很明显，因为我们很难收集到所有总体的数据。相对来说，你可以收集部分总体的数据。这些就是你的样本了。

　　正确性及样本容量

　　统计学结果的可靠性通常由样本容量的大小决定。

　　我们完美的想法是希望样本容量就是我们的总体——也就是说，你想整个收集全部涉及到的数据！因为样本越少，你就需要估计可能的趋势(这是一种数学性的推断)。而且，数据点越多越好；你最好能建立一个大型的总体而不是小型的。

　　例如，相对于调查10000个初中生对《Fruit Roll-Ups》的感想，试想下调查人员能否询问到每一个学生。100万个的数目过于庞大，做不到的话，10万个也不错。仍然做不到，好吧，10000个刚刚好。

　　由于时间和费用的关系，通常呈现出的研究结果都是基于样本所做的调查。

　　1.统计学的常识性规则：

　　你无法通过一个数据点来预测整个趋势。如果你知道我喜欢巧克力冰淇淋，你不能总结所有的Sigmans都喜欢巧克力冰淇淋。如果现在你询问我家庭中的许多成员，然后你可能会得出关于他们的想法这类比较合理的结论，或者你至少知道是否能总结出一个合理的推断。

　　广泛的分布图(重点！)

　　由于种种原因，只有《The Big Guy》可以解释生活中的许多事情倾向于同一模式发展或者分布。

　　最普遍的分布也有一个合理的名称——“正态分布”。是的，无法匹配这一分布图的都为非正态，所以有点怪异(需要适当避免)。

　　正态分布也称“高斯分布”，主要因为“正态”一词听起来不够科学。

　　正态分布也称为“钟形曲线”(又称贝尔曲线)，因为其曲线呈钟形。

关于概率要素和统计学要素在游戏设计中的运用（上） ...

　　钟形曲线的突出特点是大多数的总体均分布在平均值周围，只有个别数据散落在一些极限位置(主要指那些偏高或偏低的数据)。中间成群的数据构成了钟的外形；而那些偏高数据或偏低数据分布在钟的边缘。

　　我们周围有上百万的不同事例呈现出正态分布的景象。如果你测量了你所生活的城市中所有人的身高，结果可能呈现正态分布。这表明，只有少数个体属于非正常的矮，少数个体属于姚明那样的身高，而大多数人会比平均身高多几英寸或者矮几英寸。

　　钟形曲线同样极典型地适用于调查人们的技能水平。以运动为例——极少部分人在这一领域为专业人士，大多数的人都还过得去，只有少部分的人实在不擅长，所以没有被选为队员(比如我)。

　　其它分布图

　　尽管正态分布图很完美，但它并非我们周围唯一的一种分布图。只是它比较普遍地存在。

　　比如有些其它的分布图直接与赌博及游戏设计有关，只要看下扔骰子的概率分布图，这种情况下出现了如下的d6情形及2d6情形：

关于概率要素和统计学要素在游戏设计中的运用（上） ...

　　现在我想说的是第一个分布图看起来一点也不像钟形曲线，而第二幅图开始呈现出了钟的形状。

　　平均值

　　这一小块内容可以说是这篇冗长的文章中的一个小插曲。这块自我指涉的小内容的存在只有一个目的：提醒你什么是“平均值”。这块自我指涉且迂腐的小内容将被动地提醒你平均值是指一整套的数学平均数据。

　　方差和标准偏差

　　我们必须理解什么是方差和标准偏差，并且它们也具有许多有形的价值。除了能够帮助我们做出有价值的数据总结外，这两个术语还能够帮助我们更明智地陈述分布问题。比起说“中间聚集了大量的数据点”，我们可以换个说法，即“68.2%的样本是一个平均值的标准偏差”。

关于概率要素和统计学要素在游戏设计中的运用（上） ...

　　方差和标准偏差是相互联系的，它们都能够测量一个元素，即分散数据。直观地说，较高的方差和标准偏差也就意味着你的数据分散于四处。当我在投掷飞镖时，我便会获得一个较高的方差。

　　我们可以通过任何数据集去估算方差和标准偏差。我本来应该在此列出一个方程式的，但是这似乎将违背“听起来不像是一本教科书”的规则。所以我这里不引用公式，而是采用以下描述：

　　标准偏差：样本或人口统计的平均数值偏离平均值的程度。由希腊之母σ(sigma)表示。

　　举个例子来说吧，你挑选了100个人并测试他们完成你的新游戏第一个关卡分别用了多长时间。让我们假设所有数据的平均值是2分钟30秒而标准偏差则是15秒。这一标准偏差表明游戏过程中出现了集聚的情况。也就是平均来看，每个游戏过程是维持在平均值2.5分钟中的±0.25分钟内。从中看来这一数值是非常一致的。

　　这意味着什么以及为何你如此在乎这一数值？答案很简单。假设你不是获得上述结果，而是如下结果：

　　平均值=2.5分钟(如上)

　　σ=90秒=1.5分钟

　　所以我们现在拥有相同的平均值以及不同的标准偏差。这套数值表明玩家所用的游戏时间差别较大。90秒钟的游戏时间背离了平均游戏时间。而因为游戏时间是2.5分钟，所以这种偏差过大了！基于各种设计目的，出现这种较大的差值都不是设计师想看到的结果。

　　而如果我们所说的游戏时间是15分钟而标准偏差是90秒(1.5分钟)的话差别变更大了。

　　通过一个小小的标准偏差便能够衡量一致性。标准偏差比率除以平均值便能够获得相关数值。就像在第一个例子中，15秒/150秒=10%，而在第二个例子中，90秒/150秒=60%。很明显，60%的标准偏差真是过大了！

　　但是并不是说较大的标准偏差“总是”糟糕的。有时候设计师在进行测量时反而希望看到较大的标准偏差。不过大多数情况下还是糟糕的，因为这就意味着数值的差异性和变化性较大。

　　更重要的是，标准偏差的计算将告诉你更多有关游戏/机制/关卡等内容。以下便是通过测量标准偏差能够获得的有用的数据：

　　1.玩家玩每个关卡的游戏时间

　　2.玩家玩整款游戏的游戏时间

　　3.玩家打败一个经典的敌人需要经历几次战斗

　　4.玩家收集到的货币数量(游戏中有一个意大利水管工)

　　5.玩家收集到的吊环数量(游戏中有一个快速奔跑的蓝色刺猬)

　　6.在教程期间时间控制器出现在屏幕上

　　误差

　　误差与统计结论具有密切的关系。就像在每一次的盖洛普民意测验(注：美国舆论研究所进行的调查项目之一)中也总是会出现误差，如±2.0%的误差。因为民意调查总是会使用样本去估算人口数量，所以不可能达到100%精准。零误差便意味着结果极其精确。当你所说的人口数量大于你所采取的样本数量，你便需要考虑到误差的可能性。

　　如果你是利用全部人口作为相关数据来源，你便不需要考虑到误差——因为你已经拥有了所有的数据！就像我问街上的任何一个人是喜欢象棋还是围棋，我便不需要考虑误差，因为这些人便是我所报告的全部数据来源。但是如果我想基于这些来自街上行人的数据而对镇上的每个人的答案做出总结，我便需要估算误差值了。

　　你的样本数量越大，最终出现的误差值便会越小。Mo data is bettuh(越多数据越好)。

　　置信区间

　　你可以使用推论统计为未来数据做出总结。一个非常有效的方法便是估算置信区间。理论上来看，置信区间与标准偏差密切相关，即通过一种数学模式去表示我们多么确定某一特定数据是位于一个特定范围内。

　　置信区间：即通过一种数学方法传达“我们带着A%的置信保证B%的数据将处于C和D价值区间。”

　　虽然这个定义很绕口，但是我们必须知道，只要具有一定的自信，我们便能够造就任何价值。让我以之前愉快但却缺乏满足感的工作为例：

　　我过去是从事应力分析和飞机零部件的设计工作。如果你知道，或者说你必须知道，飞机，特别是商业飞机的建造采用的是现代交通工具中最严格的一种形式。人们总是会担心机翼从机身上脱落下来。

　　作为飞机建造工程师，我们所采取的一种方法便是基于材料优势属性设置一个高置信区间。关于飞机设计的传统置信区间便是“A基值许可”，即我们必须95%地确信装运任何一种特殊材料都有99%的价值落在一个特定的价值区间内。然后我们将根据这一价值与可能发生的最糟糕的空气条件进行设计，并最终确立一个最佳安全元素。

　　当你真正想了解某种数据值时，置信区间便是一种非常有帮助的方法。幸运的是在游戏中我们并不会扯到生死，但是如果你想要平衡一款主机游戏，你便需要在设计过程中融入更多情感和直觉。计算置信区间能够帮助你更清楚地掌握玩家是如何玩你的游戏，并更好地判断游戏设置是否可行。

　　不管你何时想要计算置信区间，备用统计规则都是有效的：越多数据越好。你的样本中拥有越多数据点，你的置信区间也就越棒！

　　你不可能做到100%的肯定

　　这便引出了另一个统计规则：

　　并不存在100%之说：你永远不可能创造一个100%的置信区间。你不可能保证通过推论统计便能够预测一个数据点具有一个特定的价值。

　　当玩家在《魔兽世界》中挑战任务时，唯一可以确定的只有死亡，税金以及不可能找到最后的Yeti Hide。所以玩家只需要接受这些事实并勇往直前便可。

　　滥用

　　我在之前提过，统计是一种邪恶的技能。为了更好地解释原因，我写下了这篇弹头式爱情诗：

　　十四行诗1325：美好的统计，让我细数下我滥用你的每种方式：

　　1.误解

　　2.未明确置信区间

　　3.只因为不喜欢而丢弃了有效的结论

　　4.基于有缺陷的数据而做出总结

　　5.体育实况转播员的失误——混淆了概率和统计错误

　　6.基于一些不相干元素做出总结

　　误解

　　人们一直在误解统计报表。我知道，这一点让人难以置信。

　　未明确置信区间或误差

　　置信区间和误差是信息中非常重要的组成部分。在过去30天内有43%的PC拥有者购买了一款可下载的游戏(误差为40%)与同样的陈述但存在2%的误差具有巨大的差别。而如果遗漏了误差，便只会出现最糟糕的情况。我们需要始终牢记，小样本=高误差。

　　只因为偏见而丢弃了有效的结论

　　操作得当的话，统计数据是不会撒谎的。但是人们却一直在欺骗自己。我们经常在政治领域看到这类情况的出现，人们总是因为结论不符合自己预期的要求而忽视统计数据。在焦点小组中亦是如此。当然了，政治领域中也常常出现滥用统计结论的现象。

　　基于有缺陷的数据而做出总结

　　这种情况真是屡见不鲜，特别是在市场调查领域。你的统计结果总是会受到你所获得的数据的影响。如果你的数据存在缺陷，那么你所获得的结果便不会有多少价值。得到有缺陷的数据的原因多种多样，包括失误和严重的操作问题等。提出含沙射影式问题便是引出能够支持各种结论(就像你所希望的那样)的缺陷数据的一种简单方法。“你比较喜欢产品X，还是糟糕的产品Y？”将快速引出反弹式回答，如“95%的费者会选择产品X！”

　　体育实况转播员的失误

　　体育实况转播员可以说是当今时代的巫医。他们会收集各种统计，概率以及情感，然后将其混合在一起而创造出一些糟糕的结果。如果你想看一些围绕着没有根据的结论的统计，你只要去观看一款足球比赛便可。

　　例如一个广播员会说“A队在最后5局游戏中并未阻止B队的进攻。”这种模糊的结论是关于A队不大可能阻止B队的进攻，而不是他们在最后5局游戏中成功阻拦了B队。但是你也可以反过来说——也许他们将会这么做，因为他们之前从未阻挡过任何对手。

　　但是事实却在于根本不存在足够的信息能够支持任何一种说法。也许这更多地取决于一种概率。阻挡进攻的机会是否就取决于一方在之前的游戏中是否这么做过？它们也许是两种相互独立事件，除非彼此间存在着互相影响的因素。

　　但是这并不是说所有体育运动的结论都存在着缺陷。就像对于棒球来说统计数据便非常重要。有时候统计分析也将影响着球的投射线或者击球点等元素。

　　最终还是取决于数据：当你拥有足够的数据时，你便能够获得更好的统计结论。棒球便能够提供各种数据：每一赛季大约会进行2百多场比赛。但是足球比赛的场次却相对地少了很多。所以我们最终所获得的误差也会较大。但是我并不会说统计对于足球来说一点用处都没有，只是我们很难去挖掘一些与背景相关的有用数据。

　　基于一些不相干元素做出总结

　　人们始终都在误解统计报表。比起使用对照关系，我们总是更容易推断出一些并不存在的深层次的关系。我最喜欢的一个例子便是着名的飞行面条怪物信仰。

　　我们是否能够开始解答问题了？

　　问题1的答案—-关卡时间

　　这一问题的答案很简单：你未能获得足够的信息去估算平均值。因为在1：24与2：32范围中波动的价值并不意味着它们的平均值就是2分钟。(单看这两个数值的平均值是1.97分钟，但是我们却不能忽视其它18个结果！)你必须掌握了所有的20个结果才能估算平均值，除此之外你还需要估算标准偏差值。

　　问题2的答案—-后续关卡时间

　　这时候你可能不会感到满足，因为标准偏差值过高了，超过平均值的40%。如此看来你的关卡中存在着过多变量。同时这里也存在着一些可利用的潜在元素，并且技能型玩家能够发挥其优势而造福自己。或者，你也可以严厉惩罚那些缺少技能的玩家。而作为游戏设计师，你最终需要做的便是判断这些结果(居于高度变量)是否符合预期要求。

　　问题３的答案—-标准偏差值

　　统计只是你所采用的一种方法，你同时还需要懂得如何进行游戏设计。如此，过于接近的计数分组使得我们总是能够获得一个较低的标准偏差值(500/52000=1%)，这就意味着你所获得的分数几乎没有任何差别，也就是说在最终游戏结果中玩家的不同技能并不会起到任何影响作用。而当玩家发现自己技能的提高并不会影响游戏分数的发展时，便会选择退出游戏。

　　所以在这种情况下你更希望看到较高的标准偏差，如此游戏分数才能随着技能的提高而提高。

　　问题3的答案—-游戏时间

　　可以说这是一个很难获取的数值，不过它却说明了数据收集中的一个要点：你需要警惕那些看起来是错误的数据。就像0.2小时看起来就有问题。也许这是排印错误，或者是设备故障所造成的，谁知道呢。但是不管怎样在进行各种计算之前你都需要坚定不移地说服自己0.2小时是一个有效数据，或者你也可以选择将其丢弃而基于剩下的数据点进行估算。

　　其它有趣的内容

　　为了控制本文篇幅，我不得不略过许多有趣的主题。我只要在此强调理解统计不仅能够帮助你更好地进行游戏设计，同时也能够帮助你做出消费者决策，投票决策或者财政决策等。我敢下23.4%的赌注保证我所说的内容中至少有40%的内容是正确的。

　　对于设计师而言，统计能够帮助他们获取来自有记录的游戏过程(样本)的相关数据，并帮助他们为更大的未记录的游戏过程(人口统计)做出总结。

　　在实践中学习

　　例如在我刚完成的游戏中，我便是通过记录游戏过程的相关数据，并围绕着源自这些数据的平均值和标准偏差去设定游戏挑战关卡。我们将中等难度等同于平均值，较容易的等同于平均值减去一定量的标准偏差，而较困难的等同于平均值加上一定量的标准偏差。如果我们能够收集到尽可能多的数据，我们的统计便会越精准。

　　就像概率论一样，当你的项目范围变得越来越大时，统计也会变得越来越有帮助。很多时候你可以通过自己的方法进行摸索，而无需使用任何形式理论。但是随着游戏变大，用户群体的壮大以及预算的扩大，你便需要做好面对一个不平衡，且完全凭直觉的游戏设计中存在固有缺陷的准备。

　　你需要牢记的是，统计和概率都不可能为你进行游戏设计，它们最多只能起到辅助作用！