您当前的位置:首页 > 其他技术 > 开区杂谈

魔兽世界冰霜数学家统计副本出橙

本文出处:网游动力作者:本站发布时间:2017-08-25阅读次数:

 暑假在家比较闲,作为一个冰霜数学家,由于沉浸吃鸡导致肝的时刻有限,因而想知道怎么更有功率不靠形而上学地肝橙,于是就写了一个爬虫,来看一下各种来历的橙装出率究竟怎么。

这篇帖子的首要意图是探究什么活动出橙功率更高,因而能够在时刻缺乏以刷爆一切东西的状况下做出合理的取舍。不是评论形而上学,也不是评论防脸黑,每周通刷爆一切难度副本的甘地能够无视。

一句话定论:国际使命和抗魔联军箱子很重要,各个团队副本各个难度掉率距离不大,5M和大米不给力,如果时刻缺乏,那么先确保国际使命箱子,然后优先多刷简略的团本boss,先确保数量,再确保质量。

注:下面文字中,赤色文字与黑色文字是简直断定的定论,而蓝色文字则在必定程度上有片面猜想的成分,也有可能是核算差错较大的数据得出的定论,请我们理性看待。

8月18日更新:关于之前一些问题的会集回答:

Q1:现已拾取完三系一切橙装的人,可能都是深度玩家,这些人没有必要刷翡翠和暗夜,只会打H/M萨墓,这些人拖低了萨墓的坠落率,导致了萨墓坠落率低。

A1:好问题,我的确认识到了这些玩家会形成差错。可是着实没有任何办法判别一个人是否全系满橙。不过我们能够预算一下这些玩家形成的影响。

如果假定在9万样本中,这些玩家占到了2%(我感觉这种甘地极端稀有,2%现已算是往多了估量的了),那么这2%玩家共约1850人,假定他们一切人都全通了一次H/M难度的萨墓而没有打其他副本,那么别离会发生1850*9=16650个击杀记载。

在记载中减去这么多玩家再算比率,两者别离下降到了115与141,由此可见,下降的起伏并不高,这个差错并不会影响后边的大体定论。

Q2:关于副本次序对数据形成的影响:

他这个核算还疏忽了玩家打副本的次序问题。

假定桌子上放了10个馒头,馒头的巨细是顺次减小的。

我们都从最大的开端吃,假定不同人的食欲是一个随机值,那么大概率很多人会在吃第8或许第九个馒头的时分就吃饱了。

那么,你得出定论说,第8个馒头最大?

这个显然有问题。

A2:的确不同人的食欲是随机值,如果只需一次吃馒头的行为,那么无疑,后边的第7~10个馒头吃饱的人数更大。

可是,这位朋友疏忽了一个重要的问题,就是,刷本/出橙的行为,不是一次一次的独立行为,而是一个接连、循环的行为。

首要一个要害问题是,你们以为,绝大多数玩家每周的活动形式是以下哪一种:

(A)依出橙率凹凸打完各项活动,直到出橙停止,出橙之后马上下线下周再上,如果不出就一向肝。

(B)依据自己的肝度,肝固定的几个副本或许活动,不论出不出橙都肝这么多,不会由于这周一向不出橙就无限肝下去。

我以为绝大多数玩家都是形式B,比方每周固定打M/H/pt萨墓,大米低保,H暗夜,日常箱子,打完就下线,橙靠随缘而不是靠硬肝。如果你以为A占多数,那这个怀疑很有道理,你如果能证明大多数玩家依照形式A举动,那我必定会承认核算办法存在严重问题。

反之,如果你和我一样,以为绝大多数玩家都遵照形式B,那么请看下面剖析。

还用吃馒头作为比方,可是,一个要害现实是:即便你每周打副本的次序都一样(就比作这10个从大到小的馒头)。

可是你每次吃饱之后,下次不是从第1个馒头重新开端吃,而是接着上次吃剩的持续接着吃(由于你不会在某次副本出了橙之后马上下线这周再也不上线了),如果吃完了10个就再按次序拿10个(适当于新CD)。因而,在屡次吃饱之后,每次从哪个馒头开端吃,是彻底随机的,而在每个馒头吃完之后吃饱的概率的份额,在很屡次重复后,也会趋向于馒头的巨细份额。

而这些玩家现已屡次出橙,吃饱之后新一轮从哪个馒头开端吃(出橙之后打的榜首个副本是哪个)也是彻底随机的,因而只需核算足够多的数据,不管我们打本的次序有没有一致的规则,终究的出橙份额都会趋向于真实的出橙率之比。

Q3:防脸黑机制是否会影响数据精确性:

比方A每周次序是一切能打的H本,M本,PT本,随机本,刺进每天的箱子和5H,终究还不出橙会挑选整理5M本,竞技场等。

假定他是0KP开端肝橙,能够预见到由于一开端防脸黑机制不收效,即便M本给6KP,实际上出橙率也仅有0.4%x6=2.4%(0.4%假定为每KP无防脸黑的出橙率),

而由于把随机本打完后,KP抵达了防脸黑收效线,防脸黑开端收效(假定400点KP开端收效),

此刻M本即便6KP也没用了由于现已打过了,但此刻一次5M的3KP出橙率抵达了0.8%x3=2.4%的高度,也就是一次5M的出橙率与一个M本boss持平,

这不公正对吧?

A3:其实和上面那个问题相似。

这也是吃馒头的问题,依据上面定论,在屡次出橙,以及很多核算样本之下,我们防脸黑值清零(新一轮吃馒头)的时刻点是彻底随机的。因而,即便我们都按固定的次序刷各种副本或许活动,终究防脸黑机制很高的时刻段,也是随机的。

比方,一个玩家每周固定顺次打10个出橙率由高到低的活动。那么屡次出橙之后,这个人防脸黑清空的时刻点,是随机的。相应地,防脸黑堆集到高水平的时刻点,也是随机的。

你如果从活动10出了橙,那么从活动1开端堆集防脸黑,大约在7~10的时分防脸黑到达水平,此刻7~10的掉率高于根底掉率。

可是你如果这一次从活动7出了橙,那么你下次的防脸黑,就是从活动8开端堆集了。这个时分,防脸黑堆集到高水平的时刻段,很有可能就是活动4~6了。

经过很多循环与样本,能够以为,防脸黑机制的加成,均匀地作用在每一项可能的活动上,因而并不会影响各项活动相对的坠落率凹凸。

一、数据来历

数据的来历分为两部分:

榜首部分是获取一些活跃强力人物(最好是没有2橙以下的新手维护的人物,防止影响精确性)。在此从wcl上,选取了美服和欧服一切打过H格罗斯(萨墓H1),并且DPS在100万以上的猛男,共约10万人,扫除有些现已改名导致404的 25仔 ,终究大约有92500个人。

第二部分,是依据这些人物的ID和所在的服务器,获取这些人的boss击杀记载/拾取记载等等。能够供给这些数据,能够获取到恣意一个人物最近50条活动记载(包含boss击杀,一些重要拾取,成果等等),我们依据这些信息来剖析不同活动的出橙率。

二、终究数据

这个数据包含了欧服和美服的。

注:黄色背景的比率指的是出橙率的倒数,越小表示出橙率越高,也就是说,如果比率是150就阐明均匀刷150次这个活动能够出1件橙。

置信区间的算法是:把每次出橙看成独立同散布的二项散布,依据中心极限定理估量的95%置信区间。能够大致理解为核算差错的上/下限。

三、开始定论

1. 即便是关于这些深度副本玩家(能够从数据看出,简直每个人都清了H萨墓的CD,有一半多人清掉了PT萨墓的CD,还有好多打其他副本的)而言,绝大多数(约四分之三)的橙装都来历于副本之外(包含但不限于国际使命箱子、抗魔联军箱子、国际boss、PVP箱子、路旁边箱子)。依据个人以及公会内关于这些副本外渠道出橙的体感,我猜想国际使命箱子/抗魔联军箱子的出橙率是适当高的,务必不要糟蹋这些箱子。

2. 不同难度的团本之间,出橙率的距离并没有幻想中的那么大,M萨墓的出橙率,甚至不到随机萨墓的2倍,远远没有之前的KP理论所核算的那么夸大(那篇帖子中,M难度的出橙率为随机难度的3倍,各难度KP值为6:4:3:2)。考虑到M的难度与耗费的时刻,单纯为了出橙的话,不应当以M难度(尤其是M萨墓)为首选刷橙计划,比起击杀boss的质量,击杀boss的数量更为重要。

3. 不同的团队副本的出橙率距离也不大,在考虑到核算差错的状况下,简直能够以为没有区别,因而使用通刷各种难度的翡翠和暗夜来刷橙,是功率很高的合理挑选。

4.值得一提的是,在这次核算以及之前的几回小范围核算中,各难度的翡翠出橙率都偏高,尽管由于翡翠的样本相对较少,这些数据都落在了置信区间里边,可是每次都偏高从来没有偏低我感觉也不正常……有可能真的是阿三弄错了代码导致翡翠的出橙坦率的偏高(笑).

8.18更新:在增大了样本之后,翡翠各难度的出橙率仍然很高,我感觉就是翡翠的掉率出了什么工作……当然也欢迎有理有据的关于核算差错的剖析

5. 5M和大米的出率差不多,整个副本约等于一个(一般/随机)团本boss,因而经过通刷5M来刷橙的功率并不高,时刻缺乏的话,优先通刷翡翠和暗夜要塞的各难度为宜。

6. 低保箱子的确很勇,和我们的感觉,包含与KP理论都契合。

7.(8.18更新)极端不靠谱的,把这个定论用来修正KP理论的测验:

(郑重声明:下面这段文字与数值仅仅强行用概率代入KP理论的模型,纯属YY,仅供参考,本人不对此定论负任何职责)

下面是使用KP理论的模型,结合本文数据得出的修正版KP——

(M/H/N/R难度)萨墓每个boss:5/4/3/3

全难度暗夜要塞每个boss:3.75

全难度翡翠梦魇每个boss:4.75

大米每次:3

5M每个boss:0.75

低保箱子:9

国际使命箱子:10~15

抗魔联军箱子:5

pvp箱子:我也不知道

国际boss:我也不知道

四、其他阐明和差错剖析

由于暴雪API能获取的内容十分有限,在此我做了一些必要的假定与估量,因而可能形成的差错与过错均列在下方。

样本结构

为了防止新手维护(也就是2橙以内的高出橙率)的搅扰,在此选取的是H1打到100万以上的玩家,能打到这个数值的选手简直没有在新手维护期的。当然,如果某个猛男俄然切了一个别的专精拾取触发了另一个专精的新手维护,这种状况就无法断定了。可是我信任这两种特殊状况适当少,影响也能够疏忽不计。

样本数量

不考虑防脸黑机制的状况下,每次boss击杀断定是否出橙能够近似视为独立同散布的二项散布变量,核算出橙率p在1/150左右,其方差为p(1-p)≈1/150,标准差σ约为1/12。依据中心极限定理,在总样本为10000的状况下,真实出橙率的95%置信区间约为[ p - 1.96*σ/sqrt(10000) , p + 1.96*σ/sqrt(10000) ],差错动摇项1.96*σ/sqrt(10000)的巨细约为1/600;而在总样本为100000的状况下,差错动摇项的巨细仅有约1/2000。前者可能导致真实出橙率在核算的出橙率邻近±40左右的动摇,后者只会导致±12左右的动摇。

简略来讲,样本数量低于10000的核算的可信度相对较低,而样本数量高于100000的根本能够以为十分精确。为了减小由于样本缺乏导致的核算差错,过几天可能再去扒一点其他服务器的数据汇总一下。

新一版核算增加了95%置信区间(算法是把每次出橙看做独立二项散布)

关于5人副本的核算办法

由于5M或许大米只需击杀尾王的记载,而这个记载是不区别大米与5M(都是Mythic xxxxxx)的(以下这两者一致称为5人本)……因而在此使用了一些假定来别离估量这两者的出橙率。

首要,断定是否是大米的办法是看这个人摸出的配备(大米获取的配备有记载并且有特殊符号“challenge”)。

一个遍及认同的现实就是大米出的配备与出橙无关,因而能够经过估量出装的一起出橙,与只出配备这两者的份额来核算大米的出橙率。

大米出橙率 ≈ (出配备一起出橙的次数)/(出大米配备的次数)

别的一个重要的问题是怎么估量大米的总次数,在此做了一个要害假定是“每次大米每个部队均匀获取3件配备”,也就是1箱。这个假定我没有数据,也无从获取数据,并不知道合不合理,可是有必要做一个相似的假定才能够预算出大米次数,欢迎我们提出定见。

如果认同了这个假定,那么每个人均匀打的大米次数约为获取大米配备次数的5/3倍,据此能够获取大米的真实出橙次数与完结次数。

真实的大米出橙次数 = 出配备一起出橙的次数 * (5/3)

真实的大米通关次数 = 出配备的次数 * (5/3)

由此就能够算出真实的5M通关次数与击杀次数了。

真实的5M出橙次数 = 核算的5人本出橙次数 - 真实的大米出橙次数

真实的5M通关次数 = 核算的5人本通关次数 - 真实的大米通关次数

至此5人本的问题解决结束。

值得一提的是,还有一个差错来历就是5人本内出橙的断定。由于只需尾王的击杀记载,因而我设定的是,尾王击杀前的1000秒(约16.7分钟)到尾王击杀后的30秒。

大米前面的boss不会有坠落因而没什么影响,可是5M的话,如果有一些人击杀老一到击杀尾王超过了1000秒,那么老一坠落的橙可能就不会被核算到5人本出橙的数量里边了……(可能关于klz不太友爱不过真实没有什么太好的处理办法)。

还有就是如果有人通关之后过于兴奋忙于庆祝导致开箱时刻离boss究竟时刻超过了30秒,可能也不会被核算进去……

或许心够大的人刷本的过程中不捡东西等邮政长送的……这个很有可能直接就算到其他来历的橙装里边了。

不过上面几种状况应该都不多,不会过火影响定论。

副本外获取的橙装

4. 至于副本外获取的橙装占到3/4这件工作,会不会是由于有些只做国际使命不进副本的玩家导致的。这个我觉得不会,由于我挑选的都是能打100w的猛男,并且从样本数量与击杀boss数量的份额就能看出,这些人打的副本一点都不少……