考慮這樣一個(gè)現(xiàn)實(shí)的問題:
碧藍(lán)檔案的總力戰(zhàn)中,每個(gè)人每天有3次機(jī)會(huì)打總力戰(zhàn),而將每個(gè)人打出的分?jǐn)?shù)(最高分)進(jìn)行排序,前15000名可以獲得最多的獎(jiǎng)勵(lì). 第15000名的分?jǐn)?shù)被稱為一檔線. 那么如何建模才可以在一定程度上給出一檔線隨時(shí)間變化這一過程.
由于隨機(jī)過程如果考慮最最完善的情況的話,就會(huì)出現(xiàn)一個(gè)過程套另一個(gè)過程套另一個(gè)過程這樣套娃的情況,導(dǎo)致只能依賴數(shù)據(jù)進(jìn)行數(shù)值計(jì)算,與此文章的目的相悖.
(資料圖)
故本文章考慮這樣一個(gè)理想的模型:
首先,要求不論什么時(shí)間(包括上班時(shí)間睡眠時(shí)間),都有穩(wěn)定的玩家數(shù)量,一個(gè)人不打總力戰(zhàn)就得有另一個(gè)人去打總力戰(zhàn),這樣就可以認(rèn)為打總力戰(zhàn)是一個(gè)泊松過程,而且保證了泊松過程的強(qiáng)度恒定. 其次假定各位玩家的實(shí)力相當(dāng),且都打ins難度,這就意味著不同的人打完時(shí),產(chǎn)生的分?jǐn)?shù)獨(dú)立且同分布.?第三是每人只打一次,這個(gè)假定意味著玩家不能覆蓋自己的歷史最高分.
現(xiàn)在開始分析:?
首先,沒有足夠的證據(jù)證明成績近似服從正態(tài)分布,所以在分析中我們考慮最一般的情況,設(shè)各位參與者的成績服從分布的概率密度是??,而分布函數(shù)是 . 然后設(shè)分?jǐn)?shù)線為第??個(gè)人的成績.?
由模型的假設(shè),得到的分?jǐn)?shù)的個(gè)數(shù)服從泊松分布??
當(dāng)? 時(shí),有以下條件概率密度
這個(gè)就是引用了n-m+1次序統(tǒng)計(jì)量的概率密度函數(shù)
此時(shí)算出條件分布函數(shù)為
而當(dāng)? 時(shí),由于沒有足夠的樣本,故可以認(rèn)為m次序統(tǒng)計(jì)量為任意比可能的最低分還要小的數(shù),因此
而根據(jù)全概率公式
得到第??大的分?jǐn)?shù)的分布函數(shù),并且求導(dǎo)還可以得到概率密度
這便是分?jǐn)?shù)線服從的分布函數(shù),其中參數(shù)??代表最多只能有多少人過線,參數(shù)? 是泊松分布的強(qiáng)度,參數(shù)? 是經(jīng)過的時(shí)間. 雖然成績個(gè)數(shù)有幾率不足m個(gè),使得P并非從0開始,但是隨著時(shí)間增長,分?jǐn)?shù)個(gè)數(shù)不足m的概率快速趨于0,對(duì)于較大的??幾乎無影響.
此公式用于預(yù)測的示例:
一個(gè)比賽,每個(gè)人只能參加一次,并得到一個(gè)分?jǐn)?shù),每位選手得分服從期望和標(biāo)準(zhǔn)差都為10的正態(tài)分布,參加人數(shù)服從強(qiáng)度為10的泊松分布,只有前10名可以獲得獎(jiǎng)品,預(yù)測時(shí)間為10時(shí)的分?jǐn)?shù)線.
對(duì)其的預(yù)測可以用上述概率密度函數(shù)代入數(shù)值求期望來得到,通過mathematica進(jìn)行數(shù)值積分得到期望約為23.02
而對(duì)其的檢驗(yàn)試驗(yàn)則可以通過生成偽隨機(jī)數(shù)來進(jìn)行,方法如下:
(順帶一提,此種情況產(chǎn)生成績個(gè)數(shù)不足m的概率,數(shù)量級(jí)僅為10^(-32))
調(diào)用mathematica生成一個(gè)服從Poi(100)的隨機(jī)數(shù)n
調(diào)用mathematica生成n個(gè)服從的隨機(jī)數(shù)?
對(duì)??進(jìn)行排序
輸出第10大的數(shù)
重復(fù)1-4步若干次,把輸出的數(shù)取平均值
這里進(jìn)行了12次試驗(yàn),得到的數(shù)據(jù)如上,試驗(yàn)樣本平均值為22.41,相較于預(yù)測值23.02,相對(duì)誤差2.6%
預(yù)測分?jǐn)?shù)線關(guān)于參數(shù)的性質(zhì)
上面已經(jīng)介紹了對(duì)于各項(xiàng)參數(shù)都已經(jīng)確定時(shí),預(yù)測分?jǐn)?shù)線的方法,但是我們有時(shí)也很關(guān)心分?jǐn)?shù)線隨時(shí)間的變化情況.
用上述概率密度計(jì)算期望,并表示為??的函數(shù)
接下來我們來計(jì)算其一個(gè)特殊的漸近展開,即當(dāng)成績服從正態(tài)分布時(shí)的漸近展開
簡單的變形得到
我們知道u趨于0時(shí)y趨于無窮,函數(shù)g的值主要由0附近的積分貢獻(xiàn),所以考慮y在u=0附近的展開,由簡單的分部積分可以得到?
其中W是Lambert W 函數(shù),因此?
代入積分得到?
這個(gè)積分的漸近展開我在此直接給出(或許未來的某天我會(huì)把證明發(fā)出來)
這便是在成績服從正態(tài)分布這一情況下,預(yù)測分?jǐn)?shù)線的函數(shù)在時(shí)間很大時(shí)的漸近展開.
關(guān)鍵詞:
責(zé)任編輯:Rex_26