Bayesian network: kahulugan, mga halimbawa at kung paano gumagana ang mga ito

Talaan ng mga Nilalaman:

Bayesian network: kahulugan, mga halimbawa at kung paano gumagana ang mga ito
Bayesian network: kahulugan, mga halimbawa at kung paano gumagana ang mga ito
Anonim

Ang isang paniniwala, network ng desisyon, modelo ng Bayesian (ian) o modelong acyclic graph na pinaandar ng probabilistikong paraan ay isang variant schema (isang uri ng modelong istatistika) na kumakatawan sa isang hanay ng mga variable at ang mga dependency ng mga ito sa pamamagitan ng nakadirekta na acyclic graph (DAG).).

Halimbawa, ang isang Bayesian network ay maaaring kumatawan sa mga probabilistikong ugnayan sa pagitan ng mga sakit at sintomas. Dahil sa huli, ang network ay maaaring gamitin upang kalkulahin ang posibilidad na magkaroon ng iba't ibang sakit. Sa video sa ibaba, makikita mo ang isang halimbawa ng isang Bayesian na paniniwalang network na may mga kalkulasyon.

Image
Image

Efficiency

Ang mga mahuhusay na algorithm ay maaaring magsagawa ng hinuha at pag-aaral sa mga Bayesian network. Ang mga network na nagmomodelo ng mga variable (gaya ng mga speech signal o mga sequence ng protina) ay tinatawag na mga dynamic na network. Ang mga generalization ng mga Bayesian network na maaaring kumatawan at makalutas ng mga problema sa ilalim ng kawalan ng katiyakan ay tinatawag na influence diagram.

Essence

PormalAng mga network ng Bayesian ay mga DAG na ang mga node ay kumakatawan sa mga variable sa kahulugan ng Bayesian: maaari silang maobserbahan ng mga halaga, mga nakatagong variable, hindi alam na mga parameter, o hypotheses. Dahil ito ay napaka-interesante.

halimbawa ng Bayesian network

Dalawang kaganapan ang maaaring maging sanhi ng pagkabasa ng damo: isang aktibong sprinkler o ulan. Ang ulan ay may direktang epekto sa paggamit ng sprinkler (ibig sabihin, kapag umuulan, ang sprinkler ay karaniwang hindi aktibo). Maaaring i-modelo ang sitwasyong ito gamit ang isang Bayesian network.

Karaniwang formula
Karaniwang formula

Simulation

Dahil ang Bayesian network ay isang kumpletong modelo para sa mga variable nito at sa kanilang mga relasyon, maaari itong magamit upang sagutin ang mga probabilistikong query tungkol sa kanila. Halimbawa, maaari itong magamit upang i-update ang kaalaman tungkol sa estado ng isang subset ng mga variable kapag ang ibang data (mga variable ng ebidensya) ay sinusunod. Ang kawili-wiling prosesong ito ay tinatawag na probabilistic inference.

Ang posteriori ay nagbibigay ng pangkalahatang sapat na istatistika para sa mga application ng pagtuklas kapag pumipili ng mga halaga para sa isang subset ng mga variable. Kaya, ang algorithm na ito ay maaaring ituring na isang mekanismo para sa awtomatikong paglalapat ng Bayes' theorem sa mga kumplikadong problema. Sa mga larawan sa artikulo, makikita mo ang mga halimbawa ng mga network ng paniniwala ng Bayesian.

Praktikal na Bayesian network
Praktikal na Bayesian network

Mga Paraan ng Output

Ang pinakakaraniwang eksaktong paraan ng hinuha ay: variable elimination, na nag-aalis (sa pamamagitan ng integration o summation) ang hindi napapansinmga parameter na hindi query nang paisa-isa sa pamamagitan ng paglalaan ng halaga sa produkto.

I-click ang pagpapalaganap ng isang "puno" na nag-cache ng mga kalkulasyon upang maraming mga variable ang maaaring ma-query nang sabay-sabay at ang mga bagong patunay ay mabilis na maipalaganap; at recursive na pagtutugma at/o paghahanap, na nagbibigay-daan sa mga trade-off sa pagitan ng espasyo at oras at tumutugma sa kahusayan ng variable na pag-aalis kapag sapat na espasyo ang ginamit.

Lahat ng mga pamamaraang ito ay may espesyal na kumplikado na higit na nakadepende sa haba ng network. Ang pinakakaraniwang tinatayang algorithm ng hinuha ay ang mini-segment na pag-aalis, cyclic na pagpapalaganap ng paniniwala, pangkalahatang pagpapalaganap ng paniniwala, at mga variational na pamamaraan.

Mga uri ng network
Mga uri ng network

Networking

Upang ganap na matukoy ang Bayesian network at sa gayon ay ganap na kumakatawan sa magkasanib na pamamahagi ng probability, kinakailangang tukuyin para sa bawat node X ang probability distribution para sa X dahil sa mga magulang ng X.

Ang pamamahagi ng X ayon sa kondisyon ng mga magulang nito ay maaaring magkaroon ng anumang anyo. Karaniwang gumamit ng mga discrete o Gaussian distribution dahil pinapasimple nito ang mga kalkulasyon. Minsan ang mga hadlang sa pamamahagi lamang ang nalalaman. Pagkatapos ay maaari mong gamitin ang entropy upang matukoy ang solong pamamahagi na may pinakamataas na entropy na ibinigay sa mga hadlang.

Katulad nito, sa partikular na konteksto ng isang dynamic na Bayesian network, ang kondisyonal na pamamahagi para sa temporal na ebolusyon ng latentkaraniwang nakatakda ang estado na i-maximize ang entropy rate ng ipinahiwatig na random na proseso.

Bayesian web of trust
Bayesian web of trust

Ang direktang pag-maximize ng probabilidad (o posterior probability) ay kadalasang nakakalito dahil sa pagkakaroon ng mga hindi naobserbahang variable. Ito ay totoo lalo na para sa isang Bayesian decision network.

Classic approach

Ang klasikong diskarte sa problemang ito ay ang expectation maximization algorithm, na nagpapalit-palit sa pag-compute ng mga inaasahang value ng mga hindi naobserbahang variable na nakadepende sa naobserbahang data sa pag-maximize sa kabuuang probabilidad (o posterior value), sa pag-aakalang ang naunang nakalkula na inaasahan tama ang mga halaga. Sa ilalim ng mga kundisyon ng katamtamang regularidad, ang prosesong ito ay nagtatagpo sa maximum (o maximum a posterior) value ng mga parameter.

Ang isang mas kumpletong diskarte sa Bayesian sa mga parameter ay ang tratuhin ang mga ito bilang mga karagdagang hindi naobserbahang variable at kalkulahin ang buong posterior distribution sa lahat ng node na ibinigay sa naobserbahang data, at pagkatapos ay isama ang mga parameter. Maaaring magastos ang diskarteng ito at magreresulta sa malalaking modelo, na ginagawang mas naa-access ang mga diskarte sa pag-tune ng klasikong parameter.

Sa pinakasimpleng kaso, ang isang Bayesian network ay tinukoy ng isang eksperto at pagkatapos ay ginagamit upang magsagawa ng hinuha. Sa ibang mga aplikasyon, ang gawain ng pagtukoy ay masyadong mahirap para sa isang tao. Sa kasong ito, dapat matutunan ang istruktura ng Bayesian neural network at ang mga parameter ng mga lokal na distribusyon sa data.

Mga network ng Bayesian
Mga network ng Bayesian

Alternatibong paraan

Ang isang alternatibong paraan ng structured learning ay gumagamit ng optimization search. Nangangailangan ito ng aplikasyon ng isang function ng pagsusuri at isang diskarte sa paghahanap. Ang karaniwang algorithm ng pagmamarka ay ang posterior probability ng isang structure na ibinigay ng data ng pagsasanay gaya ng BIC o BDeu.

Ang oras na kinakailangan para sa isang kumpletong paghahanap na nagbabalik ng isang istraktura na nagma-maximize sa marka ay superexponential sa bilang ng mga variable. Ang diskarte sa lokal na paghahanap ay gumagawa ng mga incremental na pagbabago upang mapabuti ang pagtatantya ng istraktura. Isinasaalang-alang ni Friedman at ng kanyang mga kasamahan ang paggamit ng mutual na impormasyon sa pagitan ng mga variable upang mahanap ang nais na istraktura. Nililimitahan nila ang hanay ng mga kandidato ng magulang sa k node at masusing hanapin ang mga ito.

Ang isang partikular na mabilis na paraan para sa eksaktong pag-aaral ng BN ay ang isipin ang problema bilang isang problema sa pag-optimize at lutasin ito gamit ang integer programming. Ang mga hadlang sa acyclicity ay idinaragdag sa integer program (IP) sa panahon ng solusyon sa anyo ng pagputol ng mga eroplano. Ang ganitong paraan ay kayang humawak ng mga problema hanggang sa 100 variable.

Mga graph at network
Mga graph at network

Paglutas ng Problema

Upang malutas ang mga problema sa libu-libong variable, kailangan ng ibang diskarte. Ang isa ay pumili muna ng isang order at pagkatapos ay hanapin ang pinakamainam na istruktura ng BN na may kinalaman sa order na iyon. Ito ay nagpapahiwatig ng pagtatrabaho sa espasyo ng paghahanap ng posibleng pag-order, na maginhawa dahil mas maliit ito kaysa sa espasyo ng mga istruktura ng network. Ang ilang mga order ay pinili at sinusuri. Ang pamamaraang ito ay lumabaspinakamahusay na makukuha sa literatura kapag malaki ang bilang ng mga variable.

Ang isa pang paraan ay ang pagtuunan ng pansin ang isang subclass ng mga nabubulok na modelo kung saan sarado ang mga MLE. Pagkatapos ay makakahanap ka ng pare-parehong istraktura para sa daan-daang variable.

Ang pag-aaral ng mga network ng Bayesian na may limitadong lapad ng tatlong linya ay kinakailangan para makapagbigay ng tumpak, mabibigyang-kahulugan na hinuha, dahil ang pinakamasamang kaso ng pagiging kumplikado ng huli ay exponential sa tree length k (ayon sa exponential time hypothesis). Gayunpaman, bilang isang pandaigdigang pag-aari ng graph, lubos nitong pinapataas ang pagiging kumplikado ng proseso ng pag-aaral. Sa kontekstong ito, maaaring gamitin ang K-tree para sa mabisang pag-aaral.

Maikling network
Maikling network

Development

Development of a Bayesian Web of Trust ay madalas na nagsisimula sa paglikha ng isang DAG G na ang X ay nakakatugon sa isang lokal na Markov property na may kinalaman sa G. Minsan ito ay sanhi ng DAG. Tinatantya ang mga distribusyon ng conditional probability ng bawat variable sa mga magulang nito sa G. Sa maraming kaso, lalo na kapag discrete ang mga variable, kung ang pinagsamang distribusyon ng X ay produkto ng mga conditional distribution na ito, ang X ay magiging Bayesian network na may kinalaman sa G.

Ang "knot blanket" ni Markov ay isang hanay ng mga buhol. Ginagawa ng Markov quilt ang node na independyente sa natitirang blangko ng node na may parehong pangalan at sapat na kaalaman upang makalkula ang pamamahagi nito. Ang X ay isang Bayesian network na may paggalang sa G kung ang bawat node ay may kondisyon na independiyente sa lahat ng iba pang mga node, dahil sa Markovian nitokumot.

Inirerekumendang: