Ano ang batas sa pamamahagi ng Pearson? Ang sagot sa malawak na tanong na ito ay hindi maaaring maging simple at maigsi. Ang Pearson system ay orihinal na idinisenyo upang magmodelo ng mga nakikitang distorted na obserbasyon. Noong panahong iyon, kilalang-kilala na kung paano mag-tune ng teoretikal na modelo upang tumugma sa unang dalawang pinagsama-samang o mga sandali ng naobserbahang data: anumang pamamahagi ng posibilidad ay maaaring direktang palawakin upang bumuo ng isang pangkat ng mga sukat ng lokasyon.
Ang hypothesis ni Pearson tungkol sa normal na distribusyon ng mga pamantayan
Maliban sa mga pathological na kaso, maaaring gawin ang sukat ng lokasyon upang tumugma sa naobserbahang mean (unang pinagsama-samang) at variance (pangalawang pinagsama-samang) sa isang arbitrary na paraan. Gayunpaman, hindi alam kung paano bumuo ng mga pamamahagi ng probabilidad kung saan ang skewness (standardized third cumulant) at kurtosis (standardized fourth cumulant) ay maaaring makontrol nang pantay-pantay. Ang pangangailangang ito ay naging maliwanag kapag sinusubukang ibagay ang mga kilalang teoretikal na modelo sa naobserbahang data,na nagpakita ng asymmetry.
Sa video sa ibaba makikita mo ang pagsusuri ng chi-distribution ni Pearson.
Kasaysayan
Sa kanyang orihinal na gawa, tinukoy ni Pearson ang apat na uri ng mga pamamahagi (na may bilang na I hanggang IV) bilang karagdagan sa normal na pamamahagi (na orihinal na kilala bilang uri V). Ang pag-uuri ay depende sa kung ang mga distribusyon ay sinusuportahan sa isang limitadong agwat, sa isang semi-axis, o sa buong totoong linya, at kung ang mga ito ay potensyal na skewed o kinakailangang simetriko.
Two omissions was corrected in the second paper: redefined niya ang type V distribution (orihinal ito ay normal distribution lang, pero ngayon ay may inverse gamma) at ipinakilala ang type VI distribution. Magkasama, ang unang dalawang artikulo ay sumasaklaw sa limang pangunahing uri ng sistema ng Pearson (I, III, IV, V, at VI). Sa ikatlong papel, ipinakilala ni Pearson (1916) ang mga karagdagang subtype.
Pagbutihin ang konsepto
Ang
Rind ay nag-imbento ng isang simpleng paraan upang mailarawan ang parameter space ng Pearson system (o ang pamamahagi ng mga pamantayan), na sa kalaunan ay pinagtibay niya. Ngayon, maraming mathematician at statistician ang gumagamit ng pamamaraang ito. Ang mga uri ng mga pamamahagi ng Pearson ay nailalarawan sa pamamagitan ng dalawang dami, karaniwang tinatawag na β1 at β2. Ang una ay ang parisukat ng kawalaan ng simetrya. Ang pangalawa ay ang tradisyunal na kurtosis, o ang ikaapat na standardized na sandali: β2=γ2 + 3.
Ang mga modernong mathematical na pamamaraan ay tumutukoy sa kurtosis γ2 bilang mga cumulants sa halip na mga sandali, kaya para sa isang normaldistribusyon mayroon tayong γ2=0 at β2=3. Narito ito ay nagkakahalaga ng pagsunod sa historical precedent at paggamit ng β2. Ipinapakita ng diagram sa kanan kung anong uri ang isang partikular na pamamahagi ng Pearson (na tinutukoy ng tuldok (β1, β2).
Marami sa mga skewed at/o non-mesokurtic distribution na alam natin ngayon ay hindi pa kilala noong unang bahagi ng 1890s. Ang kilala ngayon bilang beta distribution ay ginamit ni Thomas Bayes bilang posterior parameter ng Bernoulli distribution sa kanyang 1763 na papel sa inverse probability.
Ang beta distribution ay sumikat dahil sa presensya nito sa Pearson system at kilala hanggang noong 1940s bilang Pearson type I distribution. Ang pamamahagi ng Type II ay isang espesyal na kaso ng Type I, ngunit kadalasan ay hindi na ito pinipili.
Ang distribusyon ng Gamma ay nagmula sa sarili niyang gawa at kilala bilang Pearson Type III Normal Distribution bago nito nakuha ang modernong pangalan nito noong 1930s at 1940s. Isang 1895 na papel ng isang scientist ang nagpakita ng Type IV distribution, na naglalaman ng Student's t-distribution, bilang isang espesyal na kaso, bago ang kasunod na paggamit ni William Seely Gosset ng ilang taon. Ang kanyang papel noong 1901 ay nagpakita ng distribusyon na may inverse gamma (type V) at beta primes (type VI).
Isa pang opinyon
Ayon kay Ord, binuo ni Pearson ang pangunahing anyo ng equation (1) batay sa formula para sa derivative ng logarithm ng normal na distribution density function (na nagbibigay ng linear division ng quadraticistraktura). Maraming mga espesyalista ang nakikibahagi pa rin sa pagsubok sa hypothesis tungkol sa pamamahagi ng pamantayan ng Pearson. At pinatutunayan nito ang pagiging epektibo nito.
Sino si Karl Pearson
Karl Pearson ay isang English mathematician at biostatistician. Siya ay kredito sa paglikha ng disiplina ng mga istatistika ng matematika. Noong 1911 itinatag niya ang unang departamento ng istatistika sa mundo sa University College London at gumawa ng makabuluhang kontribusyon sa mga larangan ng biometrics at meteorology. Si Pearson ay isa ring tagasuporta ng panlipunang Darwinismo at eugenics. Siya ang protégé at biographer ni Sir Francis G alton.
Biometrics
Karl Pearson ay naging instrumento sa paglikha ng paaralan ng biometrics, na isang nakikipagkumpitensyang teorya para sa paglalarawan ng ebolusyon at pamana ng mga populasyon sa pagpasok ng ika-20 siglo. Ang kanyang serye ng labing-walong papel na "Mga Kontribusyon sa Matematika sa Teorya ng Ebolusyon" ay nagtatag sa kanya bilang tagapagtatag ng biometric school of inheritance. Sa katunayan Pearson nakatuon marami ng kanyang oras sa panahon ng 1893-1904 sa pagbuo ng mga istatistikal na pamamaraan para sa biometrics. Ang mga pamamaraang ito, na malawakang ginagamit ngayon para sa pagsusuri sa istatistika, ay kinabibilangan ng chi-square test, standard deviation, correlation at regression coefficients.
Ang tanong ng pagmamana
Ang batas ng pagmamana ni Pearson ay nagsasaad na ang germ plasm ay binubuo ng mga elementong minana mula sa mga magulang, gayundin mula sa mas malayong mga ninuno, na ang proporsyon nito ay nag-iiba ayon sa iba't ibang katangian. Si Karl Pearson ay isang tagasunod ni G alton, at bagaman ang kanilangAng mga gawa ay naiiba sa ilang aspeto, gumamit si Pearson ng malaking halaga ng mga istatistikal na konsepto ng kanyang guro sa pagbuo ng isang biometric na paaralan para sa mana, gaya ng batas ng regression.
Mga tampok sa paaralan
Ang biometric na paaralan, hindi tulad ng mga Mendelians, ay hindi nakatuon sa pagbibigay ng mekanismo para sa mana, ngunit sa pagbibigay ng isang matematikal na paglalarawan na hindi sanhi ng kalikasan. Habang iminungkahi ni G alton ang isang hindi nagpapatuloy na teorya ng ebolusyon kung saan ang mga species ay magbabago sa malalaking paglukso sa halip na maliliit na pagbabago na naipon sa paglipas ng panahon, itinuro ni Pearson ang mga kapintasan sa argumentong ito at aktwal na ginamit ang kanyang mga ideya upang bumuo ng isang tuluy-tuloy na teorya ng ebolusyon. Mas gusto ng mga Mendelian ang hindi tuloy-tuloy na teorya ng ebolusyon.
Habang pangunahing nakatuon si G alton sa paggamit ng mga istatistikal na pamamaraan sa pag-aaral ng pagmamana, pinalawak ni Pearson at ng kanyang kasamahan na si Weldon ang kanilang pangangatwiran sa larangang ito, pagkakaiba-iba, mga ugnayan ng natural at sekswal na pagpili.
Pagtingin sa ebolusyon
Para kay Pearson, ang teorya ng ebolusyon ay hindi nilayon na tukuyin ang biyolohikal na mekanismo na nagpapaliwanag sa mga pattern ng pamana, habang ang Mendelian approach ay nagpahayag na ang gene ay ang mekanismo ng pamana.
Binatikos ni Pearson si Bateson at iba pang biologist dahil sa hindi paggamit ng biometric na pamamaraan sa kanilang pag-aaral ng ebolusyon. Kinondena niya ang mga siyentipiko na hindi tumutok saistatistikal na bisa ng kanilang mga teorya, na nagsasabi:
"Bago natin tanggapin ang [anumang dahilan ng progresibong pagbabago] bilang isang salik, hindi lang natin dapat ipakita ang pagiging totoo nito, ngunit, kung maaari, ipakita ang dami nitong kakayahan."
Ang mga biologist ay sumuko sa "halos metapisiko na mga haka-haka tungkol sa mga sanhi ng pagmamana" na pumalit sa proseso ng pagkolekta ng pang-eksperimentong data, na maaaring aktwal na nagpapahintulot sa mga siyentipiko na paliitin ang mga potensyal na teorya.
Mga batas ng kalikasan
Para kay Pearson, ang mga batas ng kalikasan ay naging kapaki-pakinabang para sa paggawa ng mga tumpak na hula at para sa pagbubuod ng mga uso sa naobserbahang data. Ang dahilan ay ang karanasan "na may isang tiyak na pagkakasunod-sunod na nangyari at naulit sa nakaraan."
Kaya, ang pagtukoy sa isang partikular na mekanismo ng genetics ay hindi naging isang karapat-dapat na pagsisikap para sa mga biologist, na sa halip ay dapat tumuon sa mga mathematical na paglalarawan ng empirical na data. Ito ay bahagyang humantong sa isang mapait na hindi pagkakaunawaan sa pagitan ng mga biometrist at Mendelians, kabilang si Bateson.
Pagkatapos tanggihan ng huli ang isa sa mga manuskrito ni Pearson na naglalarawan ng bagong teorya ng pagkakaiba-iba ng mga supling o homotypy, itinatag ni Pearson at Weldon ang kumpanyang Biometrika noong 1902. Bagama't ang biometric na diskarte sa pamana sa kalaunan ay nawala ang pananaw nitong Mendelian, ang mga pamamaraan na kanilang binuo noong panahong iyon ay mahalaga sa pag-aaral ng biology at ebolusyon ngayon.