Pagsusuri at pagsusuri ng data. Mga pamamaraan ng pagsusuri ng data

Talaan ng mga Nilalaman:

Pagsusuri at pagsusuri ng data. Mga pamamaraan ng pagsusuri ng data
Pagsusuri at pagsusuri ng data. Mga pamamaraan ng pagsusuri ng data
Anonim

As you know, ang XXI century ay tinatawag na century of information technology. Sa katunayan, ang modernong tao ay gumagana sa iba't ibang paraan ng pagkuha at pagproseso ng impormasyon. May mahalagang papel ang Analytics sa proseso ng paggamit ng impormasyon. Ano ang pagsusuri? Anong mga paraan ng pagsusuri ng impormasyon ang umiiral? Magbasa para sa mga sagot sa mga ito at sa iba pang mga tanong.

pagsusuri ng datos
pagsusuri ng datos

Ano ang analytics?

Ang salitang ito ay may pinagmulang Griyego at literal na isinasalin bilang "ang sining ng pagsusuri". Ang terminong ito ay ginamit ni Aristotle upang sumangguni sa pamamaraan ng lohikal na pagmimina ng data.

Ngayon, nagbibigay ang mga siyentipiko ng mas malawak na interpretasyon ng konsepto. Ang analytics sa modernong mundo ay itinuturing na bahagi ng lohika (ang sining ng pangangatwiran), kung saan isinasaalang-alang ang doktrina ng pagsusuri ng data. Ang mga operasyon ng tunay o mental na paghahati ng kabuuan (proseso, representasyon, ugnayan sa pagitan ng mga bagay, atbp.) sa mga bumubuong elemento ay sinisiyasat.

Ano ang pagsusuri ng data? Ang konseptong ito ay mas makitid kaysa sa terminong "analytics". Sa agham, ang pagsusuri ng data ay tinatawag na sangay ng computer science at matematika, kung saan ang pagtatayo at pag-aaral ng pinakapangkalahatang computational algorithm at pamamaraan para sa pagkuha ng kaalaman mula sa impormasyong nakuha sa eksperimentong paraan. Sa madaling salita, pinag-uusapan natin ang tungkol sa isang hanay ng mga diskarte na nauugnay sa mga algorithm sa pagproseso ng impormasyon. Ang pagsusuri ng impormasyon sa makitid na kahulugan ay ang proseso ng pag-aaral, pag-filter, pagbabago (pagmomodelo) upang kunin ang kapaki-pakinabang na data at gumawa ng mga desisyon.

Pag-aaral ng makina

Isinasaalang-alang ngayon ang pinakamakapangyarihan at pinakakaraniwang paraan ng pagsusuri ng impormasyon. Ngayon, sa kasamaang-palad, walang mga machine learning algorithm na nagbibigay ng mahusay na pagproseso ng impormasyon ng higit pa o hindi gaanong arbitrary na kalikasan. Kaugnay nito, ang mga espesyalista ay napipilitang magsagawa ng isang paunang koleksyon at pagproseso ng data upang dalhin ang mga ito sa isang form na angkop para sa paggamit ng algorithm. Bilang panuntunan, ang naturang pagproseso ay tinatawag na featureselect o reprocessing. Karamihan sa mga algorithm ay maaaring gumamit ng mga numero ng nakapirming haba.

Kasabay nito, tumaas ang interes sa mga algorithm batay sa mga neural network. Ang kalamangan ay maaari silang magamit hindi lamang para sa mga numero, kundi pati na rin para sa mga bagay na may karagdagang (karamihan ay geometriko) na mga katangian. Halimbawa, maaari mong pag-aralan ang isang imahe: isinasaalang-alang ng algorithm ang halaga ng mga pixel, pati na rin ang kanilang kamag-anak na posisyon. Sa katulad na paraan, sinusuri ang paunang data ng isang audio track o sequence ng video.

Pagsusuri sa ekonomiya bilang isang agham

Ang pagsusuri sa ekonomiya ng data ay isang sistema ng espesyal na kaalaman batay sa mga pattern ng pag-unlad at paggana ng economic complex, na naglalayongpag-aaral ng metodolohiya ng pagsusuri, diagnostic, pagpaplano at pagtataya ng mga operasyong pinansyal at ekonomiya sa enterprise.

Ang paksa ng pagsusuri sa ekonomiya ay ang pang-ekonomiyang aktibidad ng organisasyon, ang socio-economic na kahusayan at panghuling pagganap sa pananalapi. Ang halaga ng huli ay nabuo sa ilalim ng impluwensya ng subjective at layunin na mga kadahilanan. Ang mga tagapagpahiwatig ng aktibidad sa pananalapi at pang-ekonomiya ay makikita sa sistema ng pag-uulat ng negosyo.

pagsusuri sa datos
pagsusuri sa datos

Layunin ng pagsasaliksik ng impormasyon

Ang pagsusuri ng data sa ekonomiya ay nagbibigay ng kinakailangang bilang ng mga parameter kung saan maaari kang bumuo ng isang layunin na ideya ng kalagayan sa pananalapi ng organisasyon, mga kita nito, pagkalugi, mga pagbabago sa komposisyon ng mga pananagutan at mga ari-arian. Sa tulong ng pagsusuri, matutukoy mo ang pinaka makatuwiran at hindi kumikitang mga lugar ng trabaho, ang pamamahagi ng mga mapagkukunang pinansyal, materyal at paggawa.

Dialectical na paraan

Ang pamamaraang ito ng pagsusuri ng data ay nagsasangkot ng pag-aaral ng mga phenomena at proseso sa kanilang dinamika, iyon ay, sa patuloy na pagbabago. Mula dito sumusunod ang pangunahing tampok ng pamamaraan - ang pangangailangan na ihambing ang ilang mga tagapagpahiwatig. Maaari mong ihambing ang mga halaga sa iba't ibang mapagkukunan: ang mga resulta ng mga nakaraang taon, mga nakaplanong tagapagpahiwatig, mga tagumpay ng mga kakumpitensya, atbp.

Ayon sa teorya ng materyalistikong diyalektika, ang bawat phenomenon ay nakikita bilang isang pagkakaisa at kasabay nito ay isang pakikibaka ng mga magkasalungat. Mula dito ay sumusunod ang pangangailangang pag-aralan ang mga panloob na kontradiksyon, negatibo at positibong aspetobawat proseso.

paunang pagsusuri ng datos
paunang pagsusuri ng datos

Kapag ginagamit ang dialectical na paraan ng pagsusuri ng data, lahat ng interdependencies at relasyon ay isinasaalang-alang. Imposibleng layunin na pag-aralan ang proseso sa paghihiwalay mula sa iba pang mga phenomena at kaganapan. Ang pagtutulungan at pagkakaugnay ng mga operasyong pang-ekonomiya ay nangangailangan ng paggamit ng mga kumplikadong pamamaraan para sa pagsusuri ng aktibidad sa ekonomiya. Tanging isang komprehensibong pag-aaral ng impormasyon ang nagbibigay-daan sa iyong tama na masuri ang mga resulta ng trabaho, ibunyag ang mga reserba.

Deduction at induction

May ugnayang sanhi sa pagitan ng maraming proseso at kaganapan. Nangangahulugan ito na ang isang bagay ay sumusunod sa isa pa. Ang pagtatatag ng ugnayang sanhi ay ang pinakamahalagang gawain sa pagsusuri sa ekonomiya ng data. Bilang resulta, ang pagsusuri ay mas tumpak at layunin. Ito naman ay nagbibigay-daan sa amin na mabilang ang data, upang matukoy ang antas ng impluwensya ng ilang partikular na salik sa gawain ng enterprise.

Ang induction ay kinabibilangan ng pag-aaral ng mga proseso mula sa partikular hanggang pangkalahatan: mula sa mga salik hanggang sa mga konklusyon, mula sa mga sanhi hanggang sa mga resulta. Ang pagbabawas ay isang kabaligtaran na pamamaraan na nagsasangkot ng pananaliksik mula sa pangkalahatan hanggang sa partikular. Sa kasong ito, nagaganap ang isang uri ng "paghiwa-hiwalay" ng phenomenon sa mga elemento.

ano ang analytics
ano ang analytics

Systemacity

Kapag gumagamit ng dialectical na diskarte sa pagsusuri ng data, ang bawat phenomenon, proseso, kaganapan ay dapat isaalang-alang bilang isang set ng maraming bahagi na malapit na nauugnay sa isa't isa. Ang pinakamataas na detalye ay isinasagawa sa panahon ng pagpapatupad ng isang sistematikong diskarte. Kapag naglalarawan ng mga uri ng data,kanilang mga katangian, pagpapasiya ng antas ng impluwensya ng mga salik sa kanila, atbp., ang pinakamahalaga, mahalagang bagay sa bagay na pinag-aaralan ay ipinahayag. Ang isang sistematikong diskarte ay nagbibigay-daan sa iyo na bumuo ng isang tinatayang pamamaraan ng proseso, itatag ang mga pangunahing bahagi nito, ang kanilang subordination, mga pag-andar at, bilang resulta, ihayag ang lohikal at metodolohikal na modelo ng pagsusuri.

Sa pang-ekonomiyang pagtatasa, pagkatapos suriin ang ilang aspeto ng mga aktibidad ng organisasyon, ang kanilang pagtutulungan, subordination, ang mga nakolektang data ay buod. Kasabay nito, ang mga susi at pagtukoy ay pinili mula sa buong dami ng data at mga kadahilanan. Ang mga resulta ng aktibidad sa ekonomiya ay pangunahing nakadepende sa kanila.

Mga modelong pang-ekonomiya

Para sa sistematikong pag-uuri ng data, ang kanilang pagsusuri at pagproseso, kinakailangan na bumuo ng isang pamamaraan na naaayon sa mga gawain at panghuling layunin ng pag-aaral. Depende sa bagay na pinag-aaralan, ang mga modelo ng optimization at equilibrium ay nakikilala. Ang una ay ginagamit upang ilarawan ang pag-uugali ng mga pang-ekonomiyang entidad na nakakamit ang kanilang mga layunin sa mga magagamit na pagkakataon. Ginagamit ang mga modelo ng equilibrium upang matukoy ang resulta ng pakikipag-ugnayan ng isang pangkat ng mga paksa, upang matukoy ang mga kondisyon para sa pagiging tugma ng kanilang mga gawain at layunin.

Mga paraan ng pagsusuri

Ang mga resulta ng pakikipag-ugnayan ng mga entity sa ekonomiya ay magdedepende sa tagal ng panahon kung kailan pinag-aaralan ang kanilang pag-uugali. Alinsunod dito, nakikilala ang mga paraan ng paghahambing na istatistika, istatistika at dinamikong pagsusuri.

Ang una ay ihambing ang mga resulta ng istatistikal na pagsusuri ng mga aktibidad sa iba't ibang yugto ng panahon. Ginagamit ang dinamikong pagsusuri upang matukoy ang kalikasanmga pagbabago sa mga tagapagpahiwatig ng ekonomiya sa pagitan ng mga ibinigay na punto sa oras at pagtukoy sa mga salik na tumutukoy sa mga pagbabagong ito. Ang pagtatasa ng istatistika ay nagsasangkot ng pag-aaral ng mga aksyon sa isang tiyak na sandali. Halimbawa, matutukoy mo kung paano, dahil sa supply at demand, ang halaga ng isang produkto ay nabuo.

Ang pamamaraan ng macroeconomic assessment ay nakabatay sa intersection ng tatlong larangan ng kaalaman: matematika, estadistika at ekonomiya. Ang mga pamamaraang pang-ekonomiya ay: paghahambing, pagpapangkat, graphical at pagtatasa ng balanse.

dami ng datos
dami ng datos

Ang mga diskarte sa matematika ay nahahati sa 3 pangkat:

  1. Economic. Kabilang dito ang mga pamamaraan ng matrix, mga teorya ng balanse ng input-output, mga function ng produksyon.
  2. Mga pinakamainam na diskarte sa programming (nonlinear, linear, dynamic) at economic cybernetics.
  3. Mga paraan para sa pag-aaral ng proseso ng paggawa ng desisyon at mga transaksyon. Ang pangkat na ito ay naglalaman ng mga teorya ng pagpila, mga laro, mga graph.

Comparative analysis

Ang

Paghahambing ay isang paghahambing ng mga sinaliksik na data at katotohanan. Sa pagsasanay ay ginagamit:

  1. Pahalang na pagsusuri. Kinakailangang tukuyin ang mga kamag-anak at ganap na paglihis ng aktwal na halaga ng mga indicator mula sa baseline.
  2. Vertical analysis. Ginagamit ito upang pag-aralan ang istruktura ng mga phenomena.
  3. Pagsusuri ng trend. Ginagamit ito upang pag-aralan ang mga relatibong rate ng paglago ng mga indicator sa loob ng ilang taon kumpara sa antas ng batayang taon.

Pagsusuri ng balanse

Nakalagay itopaghahambing na pagsukat ng dalawang hanay ng mga tagapagpahiwatig na may posibilidad na maging ekwilibriyo. Bilang resulta, tinutukoy ng mananaliksik ang isang bagong - pagbabalanse - indicator.

Halimbawa, kapag tinatasa ang antas ng probisyon ng isang negosyo na may mga hilaw na materyales, inihahambing nila ang mga pangangailangan para dito, ang mga mapagkukunan para sa pagsagot sa mga pangangailangang ito at nagtatakda ng tagapagpahiwatig ng pagbabalanse - isang labis o kakulangan ng mga materyales.

Bilang pantulong na paraan ng balanse, ginagamit ito kapag sinusuri ang resulta ng pagkalkula ng impluwensya ng mga salik sa kabuuang tagapagpahiwatig ng pagganap. Kung ang kabuuan ng epekto ay katumbas ng paglihis mula sa batayang halaga, tama ang mga kalkulasyon.

Extra

Graph ay ginagamit upang sukatin ang mga indicator. Ang mga halaga at ang kanilang pag-asa ay inilarawan sa pamamagitan ng pagbuo ng mga geometric na hugis. Dapat sabihin na ang graphical na pamamaraan sa pagsusuri ng independiyenteng kahalagahan ay hindi mahalaga. Ginagamit lamang ito upang ilarawan ang mga pagbabago.

Ang pagsusuri ng index ay batay sa mga kaugnay na halaga, na nagpapahayag ng ratio ng antas ng phenomenon na isinasaalang-alang sa batayang antas. Ilang uri ng mga indeks ang ginagamit sa mga istatistika: harmonic, arithmetic, aggregate, atbp.

Kung gagamit ka ng mga muling pagkalkula ng index at bubuo ka ng time series na nagpapakita, halimbawa, sa pagpapalabas ng mga produkto sa mga tuntunin ng halaga, maaari mong masuri ang dinamika.

paglalarawan ng mga uri ng data
paglalarawan ng mga uri ng data

Ang mga pamamaraan ng regression (stochastic) at correlation ay ginagamit upang matukoy ang antas ng koneksyon sa pagitan ng mga parameter na gumagana nang hiwalay sa isa't isa. Sa pamamagitan ng ugnayanmaaari kang:

  1. Gumawa ng modelo ng mga kasalukuyang salik.
  2. Bibilangin ang lakas ng koneksyon.

Pagsusuri sa sosyolohiya

Ang paglalarawan ng anumang phenomena ay maaaring isagawa sa iba't ibang paraan. Isa sa pinakakaraniwang paraan ng pagsusuri sa sosyolohiya ay ang pagmamasid. Sa panahon nito, mabibilang mo ang data sa pamamagitan ng:

  1. Psychological scaling. Karaniwan, ang mga marka ay ginagamit upang ibuod ang mga obserbasyon.
  2. Pagsusukat ng oras (timekeeping).

Ang isa pang diskarte ay ang paraan ng time sampling. Kapag ginagamit ito, pinipili ang ilang partikular na yugto ng panahon mula sa isang prosesong pinag-aaralan upang pagsama-samahin ang impormasyon. Itinuturing silang kinatawan ng mas mahabang panahon. Sa tunay na pagsasaliksik, ang dami at husay na paglalarawan ng mga phenomena ay karaniwang isinasagawa nang magkakasama.

Maaaring i-record ang mga quantitative indicator sa panahon ng obserbasyon o gawing pangkalahatan pagkatapos nitong makumpleto, kasama sa isang retrospective na ulat. Ang mga pangkalahatang impresyon ng mananaliksik ay nagsisilbing batayan para sa retrospective na pagsusuri. Para sa pangmatagalang follow-up, maaari nilang, halimbawa, isama ang dalas ng alinman sa mga episode na pinag-aaralan. Ang mga quantitative indicator ay maaaring isama sa mga paghatol sa halaga. Halimbawa, "bihira siyang pumasok sa paaralan", "lagi niyang nakakalimutan ang kanyang aklat-aralin", atbp.

klasipikasyon ng datos
klasipikasyon ng datos

Bilang karagdagan sa evaluative na paglalarawan ng mga kaganapan, maaaring gumamit ang mananaliksik ng point assessment ng kanyang mga impression. Ang mga figure na ito ay sumasalaminkatangian ng pangmatagalang walang kontrol na mga obserbasyon sa pang-araw-araw na buhay. Gaya ng ipinapakita ng ilang pag-aaral, maaaring gamitin ang mga ito bilang isa sa pangunahing o tanging pamantayan para sa kasapatan ng mga sikolohikal na pagsusulit o katangian ng isang indibidwal.

Inirerekumendang: