Mga function ng pamamahagi ng isang random na variable. Paano mahanap ang distribution function ng isang random variable

Talaan ng mga Nilalaman:

Mga function ng pamamahagi ng isang random na variable. Paano mahanap ang distribution function ng isang random variable
Mga function ng pamamahagi ng isang random na variable. Paano mahanap ang distribution function ng isang random variable
Anonim

Upang mahanap ang mga function ng pamamahagi ng mga random na variable at ang kanilang mga variable, kinakailangang pag-aralan ang lahat ng mga tampok ng larangang ito ng kaalaman. Mayroong ilang iba't ibang mga pamamaraan para sa paghahanap ng mga halaga na pinag-uusapan, kabilang ang pagbabago ng isang variable at pagbuo ng isang sandali. Ang pamamahagi ay isang konsepto batay sa mga elemento tulad ng pagpapakalat, mga pagkakaiba-iba. Gayunpaman, inilalarawan lamang nila ang antas ng scattering amplitude.

Mga function ng pamamahagi ng isang random na variable
Mga function ng pamamahagi ng isang random na variable

Ang mas mahalagang mga function ng random variable ay ang mga nauugnay at independiyente, at pantay na ipinamamahagi. Halimbawa, kung ang X1 ay ang bigat ng isang random na napiling indibidwal mula sa isang populasyon ng lalaki, ang X2 ay ang bigat ng isa pa, …, at ang Xn ay ang bigat ng isa pang tao mula sa populasyon ng lalaki, kung gayon kailangan nating malaman kung paano ang random na pag-andar. Ang X ay ipinamahagi. Sa kasong ito, nalalapat ang classical theorem na tinatawag na central limit theorem. Binibigyang-daan ka nitong ipakita na para sa malaki n ang function ay sumusunod sa mga karaniwang pamamahagi.

Mga pag-andar ng isang random na variable

Ang Central Limit Theorem ay para sa pagtatantya ng mga discrete values na isinasaalang-alang gaya ng binomial at Poisson. Ang mga function ng pamamahagi ng mga random na variable ay isinasaalang-alang, una sa lahat, sa mga simpleng halaga ng isang variable. Halimbawa, kung ang X ay isang tuluy-tuloy na random na variable na mayroong sariling probability distribution. Sa kasong ito, ginalugad namin kung paano hanapin ang density ng function ng Y gamit ang dalawang magkaibang diskarte, katulad ng paraan ng distribution function at ang pagbabago sa variable. Una, isa-sa-isang halaga lamang ang isinasaalang-alang. Pagkatapos ay kailangan mong baguhin ang pamamaraan ng pagbabago ng variable upang mahanap ang posibilidad nito. Panghuli, kailangan nating matutunan kung paano makakatulong ang inverse cumulative distribution function na magmodelo ng mga random na numero na sumusunod sa ilang partikular na sequential pattern.

Paraan ng pamamahagi ng mga itinuturing na halaga

Ang paraan ng probability distribution function ng isang random variable ay naaangkop upang mahanap ang density nito. Kapag ginagamit ang pamamaraang ito, kinakalkula ang isang pinagsama-samang halaga. Pagkatapos, sa pamamagitan ng pag-iiba nito, maaari mong makuha ang probability density. Ngayon na mayroon na tayong paraan ng pagpapaandar ng pamamahagi, maaari tayong tumingin sa ilang higit pang mga halimbawa. Hayaang ang X ay isang tuluy-tuloy na random na variable na may partikular na probability density.

Ano ang probability density function ng x2? Kung titingnan mo o i-graph ang function (itaas at kanan) y \u003d x2, maaari mong tandaan na ito ay isang pagtaas ng X at 0 <y<1. Ngayon ay kailangan mong gamitin ang isinasaalang-alang na paraan upang mahanap ang Y. Una, ang pinagsama-samang pagpapaandar ng pamamahagi ay matatagpuan, kailangan mo lamang na mag-iba upang makuha ang probability density. Sa paggawa nito, makakakuha tayo ng: 0<y<1. Ang paraan ng pamamahagi ay matagumpay na naisakatuparan upang mahanap ang Y kapag ang Y ay isang tumataas na function ng X. Siyanga pala, ang f(y) ay sumasama sa 1 sa y.

Sa huling halimbawa, ginamit ang mahusay na pag-iingat upang i-index ang pinagsama-samang mga function at probability density sa alinman sa X o Y upang isaad kung saang random na variable sila kabilang. Halimbawa, kapag hinahanap ang pinagsama-samang function ng pamamahagi ng Y, nakuha namin ang X. Kung kailangan mong maghanap ng random na variable X at ang density nito, kailangan mo lang itong ibahin.

Variable Change Technique

Hayaan ang X na maging tuluy-tuloy na random variable na ibinibigay ng distribution function na may common denominator f (x). Sa kasong ito, kung ilalagay mo ang halaga ng y sa X=v (Y), pagkatapos ay makukuha mo ang halaga ng x, halimbawa v (y). Ngayon, kailangan nating makuha ang distribution function ng isang tuluy-tuloy na random variable Y. Kung saan ang una at pangalawang pagkakapantay-pantay ay nagaganap mula sa kahulugan ng pinagsama-samang Y. Ang ikatlong pagkakapantay-pantay ay humahawak dahil ang bahagi ng function kung saan ang u (X) ≦ y ay totoo rin na X ≦ v (Y). At ang huling isa ay ginagawa upang matukoy ang posibilidad sa isang tuluy-tuloy na random na variable X. Ngayon ay kailangan nating kunin ang derivative ng FY (y), ang pinagsama-samang distribution function ng Y, upang makuha ang probability density Y.

Distribution function ng isang tuluy-tuloy na random variable
Distribution function ng isang tuluy-tuloy na random variable

Generalization para sa pagpapababa ng function

Hayaan ang X na maging tuluy-tuloy na random na variable na may karaniwang f (x) na tinukoy sa c1<x<c2. At hayaan ang Y=u (X) na isang nagpapababang function ng X na may inverse X=v (Y). Dahil tuloy-tuloy at bumababa ang function, mayroong inverse function na X=v (Y).

Upang matugunan ang isyung ito, maaari kang mangolekta ng quantitative data at gamitin ang empirical cumulative distribution function. Gamit ang impormasyong ito at kaakit-akit dito, kailangan mong pagsamahin ang mga sample ng ibig sabihin, standard deviations, media data, at iba pa.

Katulad nito, kahit na ang isang medyo simpleng probabilistic na modelo ay maaaring magkaroon ng malaking bilang ng mga resulta. Halimbawa, kung pumitik ka ng barya nang 332 beses. Kung gayon ang bilang ng mga resultang nakuha mula sa mga flip ay mas malaki kaysa sa google (10100) - isang numero, ngunit hindi bababa sa 100 quintillion beses na mas mataas kaysa sa elementarya na mga particle sa kilalang uniberso. Hindi interesado sa isang pagsusuri na nagbibigay ng sagot sa bawat posibleng resulta. Ang isang mas simpleng konsepto ay kinakailangan, tulad ng bilang ng mga ulo, o ang pinakamahabang stroke ng mga buntot. Upang tumuon sa mga isyu ng interes, isang partikular na resulta ang tinatanggap. Ang kahulugan sa kasong ito ay ang mga sumusunod: ang random variable ay isang tunay na function na may probability space.

Ang hanay ng S ng isang random na variable ay kung minsan ay tinatawag na state space. Kaya, kung ang X ay ang value na pinag-uusapan, kaya N=X2, exp ↵X, X2 + 1, tan2 X, bXc, at iba pa. Ang huli sa mga ito, ang pag-round X sa pinakamalapit na buong numero, ay tinatawag na floor function.

Mga function ng pamamahagi

Kapag natukoy na ang distribution function ng interes para sa isang random na variable na x, ang tanong ay kadalasang nagiging: "Ano ang mga pagkakataong nahuhulog ang X sa ilang subset ng mga B value?". Halimbawa, B={odd numbers}, B={greater than 1}, o B={between 2 and 7} para isaad ang mga resultang iyon na mayroong X, ang valuerandom variable, sa subset A. Kaya, sa halimbawa sa itaas, maaari mong ilarawan ang mga kaganapan tulad ng sumusunod.

{X is an odd number}, {X is greater than 1}={X> 1}, {X is between 2 and 7}={2 <X <7} para tumugma sa tatlong opsyon sa itaas para sa subset B. Maraming mga katangian ng mga random na dami ay hindi nauugnay sa isang partikular na X. Sa halip, nakadepende sila sa kung paano inilalaan ng X ang mga halaga nito. Ito ay humahantong sa isang kahulugan na parang ganito: ang distribution function ng isang random variable x ay pinagsama-sama at tinutukoy ng quantitative observation.

Distribution function ng isang discrete random variable
Distribution function ng isang discrete random variable

Random na variable at distribution function

Kaya, maaari mong kalkulahin ang posibilidad na ang distribution function ng isang random variable x ay kukuha ng mga halaga sa pagitan sa pamamagitan ng pagbabawas. Isipin ang pagsasama o pagbubukod ng mga endpoint.

Tatawagin namin ang isang random na variable na discrete kung mayroon itong finite o countably infinite state space. Kaya, ang X ay ang bilang ng mga ulo sa tatlong independiyenteng pag-flip ng isang bias na barya na tumataas sa probabilidad p. Kailangan nating hanapin ang pinagsama-samang distribution function ng isang discrete random variable FX para sa X. Hayaang X ang bilang ng mga peak sa isang koleksyon ng tatlong card. Pagkatapos Y=X3 sa pamamagitan ng FX. Nagsisimula ang FX sa 0, nagtatapos sa 1, at hindi bumababa habang tumataas ang mga halaga ng x. Ang pinagsama-samang FX distribution function ng isang discrete random variable X ay pare-pareho, maliban sa mga jump. Kapag tumatalon ang FX ay tuloy-tuloy. Patunayan ang pahayag tungkol sa tamaang continuity ng distribution function mula sa probability property ay posible gamit ang definition. Parang ganito: ang pare-parehong random na variable ay may pinagsama-samang FX na naiba.

Upang ipakita kung paano ito mangyayari, maaari kaming magbigay ng halimbawa: isang target na may radius ng unit. Malamang. ang dart ay pantay na ipinamamahagi sa tinukoy na lugar. Para sa ilang λ> 0. Kaya, ang mga function ng pamamahagi ng tuluy-tuloy na random variable ay tumataas nang maayos. Ang FX ay may mga katangian ng isang function ng pamamahagi.

Naghihintay ang isang lalaki sa hintuan ng bus hanggang sa dumating ang bus. Napagpasyahan para sa kanyang sarili na tatanggi siya kapag umabot sa 20 minuto ang paghihintay. Dito kinakailangan upang mahanap ang pinagsama-samang pagpapaandar ng pamamahagi para sa T. Ang oras kung kailan ang isang tao ay nasa istasyon pa rin ng bus o hindi aalis. Sa kabila ng katotohanan na ang pinagsama-samang pagpapaandar ng pamamahagi ay tinukoy para sa bawat random na variable. Gayunpaman, ang iba pang mga katangian ay madalas na gagamitin: ang masa para sa isang discrete variable at ang distribution density function ng isang random variable. Karaniwan ang value ay output sa pamamagitan ng isa sa dalawang value na ito.

Hanapin ang distribution function ng isang random variable
Hanapin ang distribution function ng isang random variable

Mass function

Ang mga halagang ito ay isinasaalang-alang ng mga sumusunod na katangian, na may pangkalahatang (mass) na karakter. Ang una ay batay sa katotohanan na ang mga probabilidad ay hindi negatibo. Ang pangalawa ay sumusunod mula sa obserbasyon na ang set para sa lahat ng x=2S, ang state space para sa X, ay bumubuo ng partition ng probabilistikong kalayaan ng X. Halimbawa: paghagis ng isang bias na barya na ang mga kinalabasan ay independyente. Maaari mong ipagpatuloy ang paggawailang mga aksyon hanggang sa makakuha ka ng isang roll ng mga ulo. Hayaang tukuyin ng X ang isang random na variable na nagbibigay ng bilang ng mga buntot sa harap ng unang ulo. At ang p ay nagsasaad ng posibilidad sa anumang ibinigay na aksyon.

Kaya, ang mass probability function ay may mga sumusunod na katangiang katangian. Dahil ang mga termino ay bumubuo ng isang numerical sequence, ang X ay tinatawag na geometric random variable. Geometric scheme c, cr, cr2,.,,, may kabuuan ang crn. At, samakatuwid, ang sn ay may limitasyon bilang n 1. Sa kasong ito, ang walang katapusang kabuuan ay ang limitasyon.

Ang mass function sa itaas ay bumubuo ng isang geometric na sequence na may ratio. Samakatuwid, natural na mga numero a at b. Ang pagkakaiba sa mga value sa distribution function ay katumbas ng value ng mass function.

Ang mga halaga ng density na isinasaalang-alang ay may kahulugan: Ang X ay isang random na variable na ang FX distribution ay may derivative. FX satisfying Z xFX (x)=fX (t) dt-1 ay tinatawag na probability density function. At ang X ay tinatawag na tuluy-tuloy na random variable. Sa pangunahing teorama ng calculus, ang density function ay ang derivative ng distribution. Maaari mong kalkulahin ang mga probabilidad sa pamamagitan ng pagkalkula ng mga tiyak na integral.

Dahil ang data ay kinokolekta mula sa maraming obserbasyon, higit sa isang random na variable sa isang pagkakataon ang dapat isaalang-alang upang imodelo ang mga eksperimentong pamamaraan. Samakatuwid, ang hanay ng mga halagang ito at ang kanilang magkasanib na pamamahagi para sa dalawang variable na X1 at X2 ay nangangahulugan ng pagtingin sa mga kaganapan. Para sa mga discrete random variable, ang magkasanib na probabilistic mass function ay tinukoy. Para sa mga tuloy-tuloy, ang fX1, X2 ay isinasaalang-alang, kung saannasiyahan ang joint probability density.

Independent random variable

Dalawang random na variable na X1 at X2 ang independyente kung magkapareho ang alinmang dalawang kaganapang nauugnay sa kanila. Sa mga salita, ang posibilidad na ang dalawang kaganapan {X1 2 B1} at {X2 2 B2} ay nangyari sa parehong oras, y, ay katumbas ng produkto ng mga variable sa itaas, na ang bawat isa sa kanila ay nangyayari nang paisa-isa. Para sa mga independiyenteng discrete random variable, mayroong pinagsamang probabilistic mass function, na produkto ng paglilimita sa dami ng ion. Para sa tuluy-tuloy na random na mga variable na independyente, ang joint probability density function ay ang produkto ng mga marginal density values. Sa wakas, isinasaalang-alang namin ang n independiyenteng mga obserbasyon x1, x2,.,,, xn na nagmumula sa hindi kilalang density o mass function f. Halimbawa, isang hindi kilalang parameter sa mga function para sa isang exponential random variable na naglalarawan sa oras ng paghihintay para sa isang bus.

Ang random variable ay ibinibigay ng distribution function
Ang random variable ay ibinibigay ng distribution function

Paggaya ng mga random na variable

Ang pangunahing layunin ng teoretikal na larangang ito ay ibigay ang mga tool na kailangan upang bumuo ng mga pamamaraan ng inference batay sa mahusay na mga prinsipyo ng agham sa istatistika. Kaya, ang isang napakahalagang kaso ng paggamit para sa software ay ang kakayahang bumuo ng pseudo-data upang gayahin ang aktwal na impormasyon. Ginagawa nitong posible na subukan at pagbutihin ang mga pamamaraan ng pagsusuri bago kailangang gamitin ang mga ito sa mga totoong database. Ito ay kinakailangan upang galugarin ang mga katangian ng data sa pamamagitan ngpagmomodelo. Para sa maraming karaniwang ginagamit na pamilya ng mga random na variable, ang R ay nagbibigay ng mga utos para sa pagbuo ng mga ito. Para sa iba pang mga pangyayari, kakailanganin ang mga pamamaraan para sa pagmomodelo ng pagkakasunud-sunod ng mga independiyenteng random na variable na may karaniwang distribusyon.

Discrete random variable at Command pattern. Ang sample command ay ginagamit upang lumikha ng simple at stratified random sample. Bilang resulta, kung ang isang sequence x ay input, ang sample(x, 40) ay pipili ng 40 record mula sa x upang ang lahat ng mga pagpipilian na may sukat na 40 ay may parehong posibilidad. Ginagamit nito ang default na R command para sa pagkuha nang walang kapalit. Magagamit din para magmodelo ng mga discrete random variable. Upang gawin ito, kailangan mong magbigay ng puwang ng estado sa vector x at ang mass function na f. Ang isang tawag upang palitan=TRUE ay nagpapahiwatig na ang sampling ay nangyayari na may kapalit. Pagkatapos, para magbigay ng sample ng n independent random variable na may karaniwang mass function f, ang sample (x, n, replace=TRUE, prob=f) ay ginagamit.

Natukoy na 1 ang pinakamaliit na value na kinakatawan at 4 ang pinakamalaki sa lahat. Kung ang command prob=f ay tinanggal, ang sample ay magsa-sample ng pantay mula sa mga halaga sa vector x. Maaari mong suriin ang simulation laban sa mass function na nakabuo ng data sa pamamagitan ng pagtingin sa double equals sign,==. At muling pagkalkula ng mga obserbasyon na kumukuha ng bawat posibleng halaga para sa x. Maaari kang gumawa ng isang mesa. Ulitin ito para sa 1000 at ihambing ang simulation sa kaukulang mass function.

Ilustrasyon ng pagbabago ng posibilidad

Unagayahin ang homogenous distribution function ng random variables u1, u2,.,,, un sa pagitan [0, 1]. Humigit-kumulang 10% ng mga numero ay dapat nasa loob ng [0, 3, 0, 4]. Ito ay tumutugma sa 10% ng mga simulation sa pagitan [0, 28, 0, 38] para sa isang random na variable na may ipinapakitang FX distribution function. Katulad nito, humigit-kumulang 10% ng mga random na numero ang dapat nasa pagitan [0, 7, 0, 8]. Ito ay tumutugma sa 10% simulation sa pagitan [0, 96, 1, 51] ng random variable na may distribution function na FX. Ang mga halagang ito sa x axis ay maaaring makuha sa pamamagitan ng pagkuha ng inverse mula sa FX. Kung ang X ay isang tuluy-tuloy na random na variable na may densidad na fX positibo sa lahat ng dako sa domain nito, kung gayon ang function ng pamamahagi ay mahigpit na tumataas. Sa kasong ito, ang FX ay may inverse FX-1 function na kilala bilang quantile function. FX (x) u lang kapag x FX-1 (u). Ang pagbabago ng posibilidad ay sumusunod mula sa pagsusuri ng random variable na U=FX (X).

Probability distribution function ng isang random variable
Probability distribution function ng isang random variable

Ang

FX ay may saklaw na 0 hanggang 1. Hindi ito maaaring mas mababa sa 0 o mas mataas sa 1. Para sa mga halaga ng u sa pagitan ng 0 at 1. Kung maaaring i-simulate ang U, ang isang random na variable na may FX distribution ay kailangang kunwa sa pamamagitan ng quantile function. Kunin ang derivative upang makita na ang density u ay nag-iiba sa loob ng 1. Dahil ang random variable na U ay may pare-parehong density sa pagitan ng mga posibleng halaga nito, ito ay tinatawag na uniporme sa pagitan [0, 1]. Ito ay na-modelo sa R gamit ang runif command. Ang pagkakakilanlan ay tinatawag na probabilistic transformation. Makikita mo kung paano ito gumagana sa halimbawa ng dart board. X sa pagitan ng 0 at 1, functiondistribution u=FX (x)=x2, at samakatuwid ang quantile function x=FX-1 (u). Posibleng mag-modelo ng mga independiyenteng obserbasyon ng distansya mula sa gitna ng dart panel, at sa gayon ay lumikha ng magkatulad na random na mga variable U1, U2,.,, Un. Ang distribution function at ang empirical function ay batay sa 100 simulation ng distribution ng isang dart board. Para sa isang exponential random variable, maaaring u=FX (x)=1 - exp (- x), at samakatuwid x=- 1 ln (1 - u). Minsan ang lohika ay binubuo ng mga katumbas na pahayag. Sa kasong ito, kailangan mong pagsamahin ang dalawang bahagi ng argumento. Ang pagkakakilanlan ng intersection ay magkapareho para sa lahat ng 2 {S i i} S, sa halip na ilang halaga. Ang unyon Ci ay katumbas ng state space S at ang bawat pares ay kapwa eksklusibo. Dahil Bi - ay nahahati sa tatlong axioms. Ang bawat tseke ay batay sa kaukulang probabilidad na P. Para sa anumang subset. Gumagamit ng pagkakakilanlan upang matiyak na ang sagot ay hindi nakadepende sa kung kasama ang mga endpoint ng interval.

Ang batas ng pamamahagi ng function ng isang random variable
Ang batas ng pamamahagi ng function ng isang random variable

Exponential function at mga variable nito

Para sa bawat kinalabasan sa lahat ng kaganapan, ang pangalawang katangian ng pagpapatuloy ng mga probabilidad ay ginagamit sa huli, na itinuturing na axiomatic. Ang batas ng distribusyon ng function ng isang random variable dito ay nagpapakita na ang bawat isa ay may sariling solusyon at sagot.

Inirerekumendang: