Mga pangunahing konsepto ng mathematical statistics. Paglalapat ng mga istatistika ng matematika

Talaan ng mga Nilalaman:

Mga pangunahing konsepto ng mathematical statistics. Paglalapat ng mga istatistika ng matematika
Mga pangunahing konsepto ng mathematical statistics. Paglalapat ng mga istatistika ng matematika
Anonim

Ang Mathematical statistics ay isang pamamaraan na nagbibigay-daan sa iyong gumawa ng matalinong mga desisyon sa harap ng mga hindi tiyak na kundisyon. Ang pag-aaral ng mga pamamaraan para sa pagkolekta at pag-systematize ng data, pagproseso ng mga huling resulta ng mga eksperimento at mga eksperimento na may mass randomness, at pagtuklas ng anumang mga pattern ang ginagawa ng sangay na ito ng matematika. Isaalang-alang ang mga pangunahing konsepto ng mathematical statistics.

Pagkakaiba sa teorya ng posibilidad

Mga pamamaraan ng matematikal na istatistika ay malapit na sumasalubong sa probability theory. Ang parehong mga sangay ng matematika ay nakikitungo sa pag-aaral ng maraming random na phenomena. Ang dalawang disiplina ay konektado sa pamamagitan ng limit theorems. Gayunpaman, mayroong isang malaking pagkakaiba sa pagitan ng mga agham na ito. Kung tinutukoy ng probability theory ang mga katangian ng isang proseso sa totoong mundo batay sa isang mathematical model, kung gayon ang mathematical statistics ay kabaligtaran - ito ay nagtatakda ng mga katangian ng modelo sabatay sa naobserbahang impormasyon.

Teorya ng probabilidad at banig. mga istatistika
Teorya ng probabilidad at banig. mga istatistika

Mga Hakbang

Ang aplikasyon ng mga istatistika ng matematika ay maaaring isagawa lamang kaugnay ng mga random na kaganapan o proseso, o sa halip, sa data na nakuha mula sa pagmamasid sa mga ito. At ito ay nangyayari sa maraming yugto. Una, ang data ng mga eksperimento at eksperimento ay sumasailalim sa ilang partikular na pagproseso. Ang mga ito ay iniutos para sa kalinawan at kadalian ng pagsusuri. Pagkatapos ay ginawa ang eksaktong o tinatayang pagtatantya ng mga kinakailangang parameter ng naobserbahang random na proseso. Maaari silang maging:

  • pagsusuri ng posibilidad ng isang kaganapan (ang posibilidad nito ay hindi alam sa simula);
  • pag-aaral ng gawi ng isang hindi tiyak na function ng pamamahagi;
  • pagtatantya ng inaasahan;
  • variance estimation
  • etc.
Mga batayan ng banig. mga istatistika
Mga batayan ng banig. mga istatistika

Ang ikatlong yugto ay ang pagpapatunay ng anumang hypotheses na itinakda bago ang pagsusuri, ibig sabihin, pagkuha ng sagot sa tanong kung paano tumutugma ang mga resulta ng mga eksperimento sa mga teoretikal na kalkulasyon. Sa katunayan, ito ang pangunahing yugto ng mga istatistika ng matematika. Ang isang halimbawa ay ang pagsasaalang-alang kung ang pag-uugali ng isang naobserbahang random na proseso ay nasa loob ng normal na pamamahagi.

Populasyon

Ang mga pangunahing konsepto ng mathematical statistics ay kinabibilangan ng pangkalahatan at sample na populasyon. Ang disiplina na ito ay nababahala sa pag-aaral ng isang set ng ilang mga bagay na may paggalang sa ilang mga ari-arian. Ang isang halimbawa ay ang gawain ng isang taxi driver. Isaalang-alang ang mga random na variable na ito:

  • load o bilang ng mga customer: bawat araw, bago ang tanghalian, pagkatapos ng tanghalian, …;
  • average na oras ng paglalakbay;
  • bilang ng mga papasok na aplikasyon o ang kanilang attachment sa mga distrito ng lungsod at marami pa.

Nararapat ding tandaan na posibleng pag-aralan ang isang hanay ng mga katulad na random na proseso, na magiging random variable din na maaaring obserbahan.

Populasyon
Populasyon

Kaya, sa mga pamamaraan ng matematikal na istatistika, ang buong hanay ng mga bagay na pinag-aaralan o ang mga resulta ng iba't ibang mga obserbasyon na isinasagawa sa ilalim ng parehong mga kondisyon sa isang partikular na bagay ay tinatawag na pangkalahatang populasyon. Sa madaling salita, sa mas mahigpit na matematika, ito ay isang random na variable na tinukoy sa espasyo ng elementarya na mga kaganapan, na may isang klase ng mga subset na itinalaga dito, ang mga elemento nito ay may alam na posibilidad.

Sample na populasyon

May mga kaso kung saan imposible o hindi praktikal para sa ilang kadahilanan (gastos, oras) na magsagawa ng patuloy na pag-aaral upang pag-aralan ang bawat bagay. Halimbawa, ang pagbubukas ng bawat garapon ng selyadong jam upang suriin ang kalidad nito ay isang kahina-hinalang desisyon, at ang pagtatangkang tantiyahin ang tilapon ng bawat molekula ng hangin sa isang metro kubiko ay imposible. Sa ganitong mga kaso, ang paraan ng selective observation ay ginagamit: isang tiyak na bilang ng mga bagay ang pinipili (karaniwan ay random) mula sa pangkalahatang populasyon, at sila ay sumasailalim sa kanilang pagsusuri.

Sample mula sa heneralpinagsama-samang
Sample mula sa heneralpinagsama-samang

Maaaring mukhang kumplikado ang mga konseptong ito sa simula. Samakatuwid, upang lubos na maunawaan ang paksa, kailangan mong pag-aralan ang aklat-aralin ni V. E. Gmurman na "Probability Theory at Mathematic Statistics". Kaya, ang isang sampling set o sample ay isang serye ng mga bagay na pinili nang random mula sa pangkalahatang set. Sa mahigpit na mga termino sa matematika, ito ay isang pagkakasunud-sunod ng mga independyente, pantay na ipinamamahagi na mga random na variable, para sa bawat isa kung saan ang distribusyon ay tumutugma sa ipinahiwatig para sa pangkalahatang random na variable.

Mga pangunahing konsepto

Saglit nating isaalang-alang ang ilang iba pang pangunahing konsepto ng mga istatistika ng matematika. Ang bilang ng mga bagay sa pangkalahatang populasyon o sample ay tinatawag na volume. Ang mga sample na halaga na nakuha sa panahon ng eksperimento ay tinatawag na sample na pagsasakatuparan. Upang maging mapagkakatiwalaan ang pagtatantya ng pangkalahatang populasyon batay sa isang sample, mahalagang magkaroon ng tinatawag na representative o representative na sample. Nangangahulugan ito na ang sample ay dapat na ganap na kumakatawan sa populasyon. Magagawa lang ito kung ang lahat ng elemento ng populasyon ay may pantay na posibilidad na mapabilang sa sample.

Pangunahing konsepto
Pangunahing konsepto

Nakikilala ng mga sample ang pagbabalik at hindi pagbabalik. Sa unang kaso, sa nilalaman ng sample, ang paulit-ulit na elemento ay ibinalik sa pangkalahatang hanay, sa pangalawang kaso, hindi. Karaniwan, sa pagsasagawa, ang sampling na walang kapalit ay ginagamit. Dapat ding tandaan na ang laki ng pangkalahatang populasyon ay palaging higit na lumalampas sa laki ng sample. Umiiralmaraming opsyon para sa proseso ng sampling:

  • simple - ang mga item ay random na pinipili nang paisa-isa;
  • typed - ang pangkalahatang populasyon ay nahahati sa mga uri, at isang pagpipilian ang ginawa mula sa bawat isa; isang halimbawa ay isang survey ng mga residente: magkahiwalay na lalaki at babae;
  • mechanical - halimbawa, piliin ang bawat ika-10 elemento;
  • serial - ang pagpili ay ginawa sa serye ng mga elemento.

Statistical distribution

Ayon kay Gmurman, ang probability theory at mathematical statistics ay napakahalagang mga disiplina sa siyentipikong mundo, lalo na sa praktikal na bahagi nito. Isaalang-alang ang istatistikal na pamamahagi ng sample.

Ipagpalagay na mayroon tayong grupo ng mga mag-aaral na sinubok sa matematika. Bilang resulta, mayroon kaming hanay ng mga pagtatantya: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - ito ang aming pangunahing istatistikal na materyal.

Una sa lahat, kailangan nating pag-uri-uriin ito, o magsagawa ng operasyon sa pagraranggo: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - at sa gayon ay makakuha ng variational series. Ang bilang ng mga pag-uulit ng bawat isa sa mga pagtatasa ay tinatawag na dalas ng pagtatasa, at ang kanilang ratio sa laki ng sample ay tinatawag na kamag-anak na dalas. Gumawa tayo ng talahanayan ng istatistikal na pamamahagi ng sample, o isang serye lamang ng istatistika:

ai 1 2 3 4 5
pi 1 1 2 4 3

o

ai 1 2 3 4 5
pi 1/11 1/11 2/11 4/11 3/11

Magkaroon tayo ng random na variable kung saan magsasagawa tayo ng serye ng mga eksperimento at tingnan kung anong halaga ang kinukuha ng variable na ito. Ipagpalagay na kinuha niya ang halaga ng 1 - m1 beses; a2 - m2 beses, atbp. Ang laki ng sample na ito ay magiging m1 + … + mk=m. Ang set na ai, kung saan nag-iiba ang i mula 1 hanggang k, ay isang serye ng istatistika.

Pamamahagi ng pagitan

Sa aklat ni VE Gmurman na "Probability Theory and Mathematical Statistics" ay ipinakita rin ang isang interval statistical series. Ang pagsasama-sama nito ay posible kapag ang halaga ng tampok na pinag-aaralan ay tuloy-tuloy sa isang tiyak na agwat, at ang bilang ng mga halaga ay malaki. Isaalang-alang ang isang pangkat ng mga mag-aaral, o sa halip, ang kanilang taas: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 159, 17, 17 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 mag-aaral sa kabuuan. Malinaw, ang taas ng isang tao ay isang tuluy-tuloy na halaga. Kailangan nating tukuyin ang hakbang ng pagitan. Para dito, ginagamit ang formula ng Sturges.

h= max - min = 190 - 156 = 33 = 5, 59
1+log2m 1+log230 5, 9

Kaya, ang halaga ng 6 ay maaaring kunin bilang laki ng pagitan. Dapat ding sabihin na ang halagang 1+log2m ay ang formula para sapagtukoy ng bilang ng mga agwat (siyempre, na may pag-ikot). Kaya, ayon sa mga formula, 6 na pagitan ang nakuha, ang bawat isa ay may sukat na 6. At ang unang halaga ng paunang agwat ay ang bilang na tinutukoy ng formula: min - h / 2=156 - 6/2=153. Gumawa tayo ng talahanayan na maglalaman ng mga pagitan at ang bilang ng mga mag-aaral na ang paglaki ay nahulog sa loob ng isang tiyak na pagitan.

H [153; 159) [159; 165) [165; 171) [171; 177) [177; 183) [183; 189)
P 2 5 3 9 8 3
P 0, 06 0, 17 0, 1 0, 3 0, 27 0, 1

Siyempre, hindi lang ito, dahil marami pang formula sa mathematical statistics. Ilan lang sa mga pangunahing konsepto ang isinaalang-alang namin.

Iskedyul ng pamamahagi

Mga tsart ng pamamahagi
Mga tsart ng pamamahagi

Ang mga pangunahing konsepto ng mathematical statistics ay kinabibilangan din ng isang graphical na representasyon ng distribusyon, na nakikilala sa pamamagitan ng kalinawan. Mayroong dalawang uri ng mga graph: polygon at histogram. Ang una ay ginagamit para sa isang discrete statistical series. At para sa patuloy na pamamahagi, ayon sa pagkakabanggit, ang pangalawa.

Inirerekumendang: