statistika (njem. Statistik, prema lat. status: stanje), grana primijenjene matematike koja se bavi prikupljanjem, uređivanjem, analizom, sažimanjem, prezentiranjem i tumačenjem velikog broja podataka i donošenjem zaključaka o pojavama i procesima koje ti podatci predočuju. U širem smislu, podatci o različitim prirodnim, društvenim i drugim pojavama i procesima.
Statistika se temelji na podatcima koji predočuju oblike statističkih varijabla (obilježja). Podatci se dobivaju promatranjem, odnosno mjerenjem ili iz statističkoga pokusa. Smatraju se statističkima samo ako su prikupljeni prema određenom planu prikupljanja, odnosno nacrtu statističkoga pokusa. Oni očituju statističku varijabilnost koja proizlazi iz svojstava elemenata statističkoga skupa. Za uočavanje značajki pojava i procesa potrebno je raspolagati dovoljnim brojem podataka kako bi došle do izražaja osobitosti istraživanih pojava, odnosno statističke zakonitosti. Primjerice, državne statističke podatke prikupljaju i objavljuju nacionalni statistički uredi, državne institucije, međunarodna politička i poslovna udruženja, istraživačke i druge ustanove te poslovne jedinice kojima je to predmet djelatnosti: Državni zavod za statistiku glavni je nositelj službene statistike Republike Hrvatske i glavni predstavnik nacionalnoga statističkog sustava u europskim i međunarodnim tijelima nadležnima za statistiku, Eurostat je statistički ured Europske unije koji objavljuje statističke podatke i pokazatelje što omogućuju usporedbe među europskim državama i regijama. Korisnici preuzimaju podatke putem informacijskih mreža – interneta, intraneta ili iz publikacija, bez naknade (javni podatci) ili uz naknadu (komercijalni podatci).
Povijesni razvoj
Statistika se, u jednostavnim oblicima, pojavila u babilonskoj, kineskoj i egipatskoj civilizaciji te u Rimskom Carstvu, a svodila se na popisivanje poljoprivrednih prinosa, stanovništva i materijalnoga bogatstva. U srednjem vijeku prikupljali su se podatci o činjenicama bitnima za političko-gospodarsko stanje političkih entiteta.
U XVII. st. njemački polihistor Hermann Conring (1606–81) i Gottfried Achenwall utemeljili su »sveučilišnu statistiku«, koju definiraju kao znanost o stanju i političkom uređenju države. John Graunt te William Petty su, tražeći pravilnosti koje vladaju u društvu i prirodi na temelju stvarnih podataka, primjenjivali metode koje nazivaju političkom aritmetikom. Za razvoj statistike kao analitičke metode značajni su Blaise Pascal, Wladysław Bortkiewicz, Francis Galton, Carl Friedrich Gauss, Andrej Nikolajevič Kolmogorov, Pierre Simon de Laplace, Ronald Aylmer Fisher i Jerzy Neyman. U XIX. st. su se, uz englesku (koja je zaslužna za razvoj teorije procjenjivanja i testiranja hipoteza), formirale njemačka (koja se bavi teorijom stabilnosti statističkih redova) i ruska (koja je pridonijela razvoju teorije vjerojatnosti i teorije stohastičkih procesa) statistička škola.
Deskriptivna statistika
Skup je postupaka kojima se sažimaju informacije sadržane u podatcima i utvrđuju glavna obilježja, odnosno činjenice o pojavi ili skupini pojava predočenih podatcima. Ona obuhvaća postupke uređivanja (grupiranja) podataka, njihovo tablično i grafičko prikazivanje te utvrđivanje različitih statističko-analitičkih pokazatelja (relativnih brojeva, razlike između najveće i najmanje vrijednosti, prosječnih vrijednosti, mjera disperzije i dr.). Zaključci se odnose isključivo na svojstva elemenata statističkoga skupa za koje su prikupljeni podatci i ne služe poopćavanju, čime se deskriptivna statistika razlikuje od inferencijalne. Metode deskriptivne statistike (numeričke i grafičke) zastupljene su gotovo u svim znanstvenim i stručnim područjima, a dobiveni rezultati često su putokazi pri izboru prikladnih analitičkih modela inferencijalne statistike.
Inferencijalna statistika
Skup je metoda kojima se donosi zaključak o značajkama osnovnoga skupa (populacije) na temelju reprezentativnoga uzorka (manji skup slučajno odabranih elemenata osnovnoga skupa) kao njegova podskupa. Načela inferencijalne statistike izvode se iz teorijske statistike, odnosno teorije vjerojatnosti. Temeljni pojmovi teorijske statistike jesu: vjerojatnost, slučajna varijabla, funkcija vjerojatnosti, odnosno statistički model. Podloga za primjenu metoda inferencijalne statistike vrijednosti su statističkih varijabla jedinica slučajno izabranih elemenata u uzorak iz osnovnoga skupa, vrijednosti mjerenja dobivene u statističkim pokusima ili opažene vrijednosti pojava za koje se pretpostavlja da su realizacije stohastičkih procesa. Uzorci koji se ne temelje na načelima teorije vjerojatnosti (namjerni uzorci) u pravilu se analiziraju metodama deskriptivne statistike. Dva su glavna područja inferencijalne statistike: područje procjena parametara i područje testiranja hipoteza. Parametri su svojstva populacije, tj. funkcije vrijednosti iz osnovnoga skupa (npr. broj elemenata osnovnoga skupa, koeficijent korelacije, standardna devijacija, varijanca). Vrijednosti parametara procjenjuju se s pomoću uzorka i nekoga teorijskog modela (npr. normalna raspodjela) i zato se zaključci o vrijednostima parametara populacije mogu donijeti samo uz određenu razinu pouzdanosti. Pogreška procjene može se brojčano izraziti samo ako se parametri procjenjuju na temelju slučajnog uzorka. Primjenom intervalnoga procjenitelja utvrđuje se raspon u kojem se s nekom vjerojatnosti može očekivati vrijednost parametra, čime se omogućuje donošenje zaključka o preciznosti procjena.
Drugo područje inferencijalne statistike jest područje testiranja hipoteza. Statistička hipoteza tvrdnja je o veličini jednog ili više parametara, o obliku rasporeda varijable, o modelu odnosa više varijabla i sl., vjerodostojnost koje se provjerava s pomoću slučajnog uzorka. U postupku testiranja polazi se od nulte i alternativne hipoteze. Tvrdnje u nultoj i alternativnoj hipotezi proturječne su. Odluka o prihvaćanju pojedine hipoteze temelji se na podatcima iz uzorka, pa se u postupku zaključivanja može pogriješiti – odbaciti nultu hipotezu kao lažnu (iako je istinita) i obratno. Postupak testiranja temelji se na raspodjelama vjerojatnosti i u tijesnoj je vezi sa sadržajem nulte hipoteze, odnosno vrste testa. Zaključak o ishodu statističkoga testa ima obilježje vjerojatnoga suda.
Primjena statistike
Primjenjuju se u gotovo svim znanstvenim i stručnim djelatnostima: astronomiji, biologiji, demografiji, ekonomiji, fizici (npr. boltzmannova statistika; bose-einsteinova statistika; fermi-diracova statistika; kvantna statistika; statistička fizika), kontroli i regulaciji proizvodnih procesa, lingvistici medicini, meteorologiji, održivom razvoju, psihologiji, sociologiji i dr. Skupine specifičnih metoda primjerenih nekomu području oblikuju se u metodološke discipline kao što su biometrija, psihometrija, ekonometrija i dr. Uporabi statističkih metoda pridonio je razvoj statističke programske potpore i informacijskih sustava.