Informativno-zabavni portal
Pretraga sajta

Kako izvesti aritmetički prosek. Kako izračunati aritmetičku sredinu. Prosječna brzina vožnje

Da biste pronašli prosječnu vrijednost u Excel-u (bez obzira da li je u pitanju brojčana, tekstualna, procentualna ili druga vrijednost), postoji mnogo funkcija. I svaki od njih ima svoje karakteristike i prednosti. Zaista, u ovom zadatku se mogu postaviti određeni uslovi.

Na primjer, prosječne vrijednosti niza brojeva u Excelu se izračunavaju pomoću statističkih funkcija. Također možete ručno unijeti vlastitu formulu. Razmotrimo razne opcije.

Kako pronaći aritmetičku sredinu brojeva?

Da biste pronašli aritmetičku sredinu, trebate sabrati sve brojeve u skupu i podijeliti zbir s količinom. Na primjer, ocjene učenika iz informatike: 3, 4, 3, 5, 5. Šta je uključeno u tromjesečje: 4. Pronašli smo aritmetičku sredinu koristeći formulu: =(3+4+3+5+5) /5.

Kako to brzo učiniti koristeći Excel funkcije? Uzmimo za primjer niz nasumičnih brojeva u nizu:

Ili: napravite aktivnu ćeliju i jednostavno unesite formulu ručno: =PROSJEČNO(A1:A8).

Sada da vidimo šta još može učiniti AVERAGE funkcija.


Nađimo aritmetičku sredinu prva dva i zadnja tri broja. Formula: =PROSJEK(A1:B1,F1:H1). rezultat:



Stanje prosečno

Uslov za pronalaženje aritmetičke sredine može biti numerički ili tekstualni kriterijum. Koristit ćemo funkciju: =AVERAGEIF().

Pronađite aritmetičku sredinu brojeva koji su veći ili jednaki 10.

Funkcija: =AVERAGEIF(A1:A8,">=10")


Rezultat korištenja funkcije AVERAGEIF pod uvjetom ">=10":

Treći argument - "Raspon usrednjavanja" - je izostavljen. Prije svega, nije potrebno. Drugo, opseg analiziran od strane programa sadrži SAMO numeričke vrijednosti. Ćelije navedene u prvom argumentu će se pretraživati ​​u skladu sa uvjetom navedenim u drugom argumentu.

Pažnja!

U ćeliji se može odrediti kriterij pretraživanja. I napravite vezu do njega u formuli.

Nađimo prosječnu vrijednost brojeva koristeći tekstualni kriterij. Na primjer, prosječna prodaja proizvoda „stolovi“.

Funkcija će izgledati ovako: =AVERAGEIF($A$2:$A$12,A7,$B$2:$B$12). Raspon – kolona s nazivima proizvoda. Kriterijum za pretragu je veza do ćelije sa rečju „tabele“ (možete umetnuti reč „tabele“ umesto veze A7). Raspon prosjeka – ćelije iz kojih će se uzeti podaci za izračunavanje prosječne vrijednosti.

Pažnja!

Za tekstualni kriterij (uvjet) mora se specificirati raspon prosjeka.

Kako izračunati ponderisanu prosječnu cijenu u Excelu?

Kako smo saznali ponderisanu prosječnu cijenu?


Formula: =SUMPROIZVOD(C2:C12,B2:B12)/SUM(C2:C12).

Koristeći formulu SUMPRODUCT, saznajemo ukupan prihod nakon prodaje cjelokupne količine robe. A funkcija SUM sumira količinu robe. Dijeljenjem ukupnog prihoda od prodaje robe sa ukupnim brojem jedinica robe, dobija se prosječna ponderirana cijena. Ovaj indikator uzima u obzir „težinu“ svake cijene. Njegov udio u ukupnoj masi vrijednosti.

Standardna devijacija: formula u Excelu

Postoji razlika između standardne devijacije za opštu populaciju i za uzorak. U prvom slučaju, ovo je korijen opće varijanse. U drugom, iz varijanse uzorka.


Za izračunavanje ovog statističkog pokazatelja sastavlja se formula disperzije. Iz njega se vadi korijen. Ali u Excelu postoji gotova funkcija za pronalaženje standardne devijacije.

Standardna devijacija je vezana za skalu izvornih podataka. Ovo nije dovoljno za figurativni prikaz varijacije analiziranog raspona. Da bi se dobio relativni nivo rasipanja podataka, izračunava se koeficijent varijacije:

standardna devijacija / aritmetička sredina

Formula u Excelu izgleda ovako:

STDEV (opseg vrijednosti) / AVERAGE (opseg vrijednosti).

Koeficijent varijacije se izračunava kao procenat. Stoga postavljamo format postotka u ćeliji.

Recimo da trebate pronaći prosječan broj dana za različite zaposlenike da završe zadatke. Dodatno, želite da izračunate prosječnu temperaturu za određeni dan u periodu od 10 godina. Izračunavanje prosjeka grupe brojeva može se izvršiti na nekoliko načina.

    Funkcija AVERAGE izračunava srednju vrijednost, koja je centar skupa brojeva u statističkoj distribuciji. Postoje tri najčešća načina za određivanje prosjeka: Prosječna vrijednost

    Ovo je aritmetička sredina koja se izračunava dodavanjem grupe brojeva i njihovim dijeljenjem brojem tih brojeva. Na primjer, prosjek brojeva 2, 3, 3, 5, 7 i 10 je 5, što je rezultat dijeljenja njihovog zbira 30 sa zbirom 6. Medijan

    Srednji broj grupe brojeva. Pola brojeva sadrži vrijednosti veće od medijane, a polovina brojeva sadrži vrijednosti manje od medijane. Na primjer, medijana za brojeve 2, 3, 3, 5, 7 i 10 bi bila 4. Najčešći broj u grupi brojeva. Na primjer, način rada za brojeve 2, 3, 3, 5, 7 i 10 bi bio 3.

Sa simetričnom distribucijom skupa brojeva, sve tri vrijednosti centralne tendencije će se poklopiti. U devijativnoj distribuciji grupe brojeva, oni mogu biti različiti.

Izračunajte prosjek susjednih redova ili kolona

Slijedite dolje navedene korake.

Izračunavanje prosjeka izvan susjednog reda ili kolone

Da biste izvršili ovaj zadatak, koristite funkciju PROSJEČNO. Kopirajte donju tabelu na prazan list papira.

Izračunavanje ponderisanog prosjeka

Da biste izvršili ovaj zadatak, koristite funkcije SUMPRODUCT I Suma. VSIS primjer izračunava prosječne cijene plaćene po jedinici u tri kupovine, svaka za različitu stavku na drugoj jedinici.

Kopirajte donju tabelu na prazan list papira.

U matematici, aritmetička sredina brojeva (ili jednostavno prosjek) je zbir svih brojeva u datom skupu podijeljen sa brojem brojeva. Ovo je najopćenitiji i najrašireniji koncept prosječne vrijednosti. Kao što ste već shvatili, da biste pronašli prosjek, trebate zbrojiti sve brojeve koji su vam dati, a rezultat podijeliti s brojem pojmova.

Šta je aritmetička sredina?

Pogledajmo primjer.

Primjer 1. Dati brojevi: 6, 7, 11. Potrebno je pronaći njihovu prosječnu vrijednost.

Rješenje.

Prvo, pronađimo zbir svih ovih brojeva.

Sada podijelite rezultirajuću sumu sa brojem članova. Pošto imamo tri člana, podelićemo sa tri.

Dakle, prosek brojeva 6, 7 i 11 je 8. Zašto 8? Da, jer će zbir 6, 7 i 11 biti isti kao tri osmice. To se jasno vidi na ilustraciji.

Prosjek je pomalo poput „izjednačavanja“ niza brojeva. Kao što vidite, hrpe olovaka su postale iste razine.

Pogledajmo još jedan primjer kako bismo konsolidirali stečeno znanje.

Primjer 2. Zadati brojevi: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Potrebno je pronaći njihovu aritmetičku sredinu.

Rješenje.

Pronađite iznos.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Podijelite s brojem pojmova (u ovom slučaju - 15).

Stoga je prosječna vrijednost ove serije brojeva 22.

Pogledajmo sada negativne brojeve. Prisjetimo se kako ih sažeti. Na primjer, imate dva broja 1 i -4. Nađimo njihov zbir.

1 + (-4) = 1 – 4 = -3

Znajući ovo, pogledajmo još jedan primjer.

Primjer 3. Pronađite prosječnu vrijednost niza brojeva: 3, -7, 5, 13, -2.

Rješenje.

Pronađite zbir brojeva.

3 + (-7) + 5 + 13 + (-2) = 12

Pošto postoji 5 članova, rezultujući zbir podijelite sa 5.

Dakle, aritmetička sredina brojeva 3, -7, 5, 13, -2 je 2,4.

U našem vremenu tehnološkog napretka mnogo je zgodnije koristiti kompjuterske programe za pronalaženje prosječne vrijednosti. Microsoft Office Excel je jedan od njih. Pronalaženje prosjeka u Excelu je brzo i jednostavno. Štaviše, ovaj program je uključen u softverski paket Microsoft Office. Pogledajmo kratku instrukciju o tome kako pronaći aritmetičku sredinu koristeći ovaj program.

Da biste izračunali prosječnu vrijednost niza brojeva, morate koristiti funkciju AVERAGE. Sintaksa za ovu funkciju je:
= Prosjek(argument1, argument2, ... argument255)
gdje su argument1, argument2, ... argument255 ili brojevi ili reference ćelije (pod ćelijama podrazumijevamo opsege i nizove).

Da bude jasnije, isprobajmo stečeno znanje.

  1. Unesite brojeve 11, 12, 13, 14, 15, 16 u ćelije C1 – C6.
  2. Odaberite ćeliju C7 klikom na nju. U ovoj ćeliji ćemo prikazati prosječnu vrijednost.
  3. Kliknite na karticu Formule.
  4. Odaberite Više funkcija > Statistički da biste otvorili padajuću listu.
  5. Odaberite PROSJEČNO. Nakon toga bi se trebao otvoriti dijaloški okvir.
  6. Odaberite i prevucite ćelije C1 do C6 tamo da biste postavili raspon u dijaloškom okviru.
  7. Potvrdite svoje radnje tipkom "OK".
  8. Ako ste sve uradili ispravno, trebalo bi da imate odgovor u ćeliji C7 - 13.7. Kada kliknete na ćeliju C7, funkcija (=Prosjek(C1:C6)) će se pojaviti u traci formule.

Ova funkcija je vrlo korisna za računovodstvo, fakture ili kada jednostavno trebate pronaći prosjek veoma dugačke serije brojeva. Stoga se često koristi u uredima i velikim kompanijama. To vam omogućava da održavate red u svojoj evidenciji i omogućavate brzo izračunavanje nečega (na primjer, prosječna mjesečna primanja). Također možete koristiti Excel da pronađete prosječnu vrijednost funkcije.

Prosjek

Ovaj izraz ima druga značenja, pogledajte prosječno značenje.

Prosjek(u matematici i statistici) skupovi brojeva - zbir svih brojeva podijeljen njihovim brojem. To je jedna od najčešćih mjera centralne tendencije.

Predložili su ga (zajedno sa geometrijskom sredinom i harmonijskom sredinom) Pitagorejci.

Posebni slučajevi aritmetičke sredine su srednja vrijednost (opća populacija) i uzorkovana sredina (uzorak).

Uvod

Označimo skup podataka X = (x 1 , x 2 , …, x n), tada je srednja vrijednost uzorka obično označena horizontalnom crtom iznad varijable (x ¯ (\displaystyle (\bar (x))), izgovara se " x sa linijom").

Grčko slovo μ koristi se za označavanje aritmetičke sredine cjelokupne populacije. Za slučajnu varijablu za koju je određena srednja vrijednost, μ je prosek verovatnoće ili matematičko očekivanje slučajne varijable. Ako je set X je kolekcija slučajnih brojeva sa vjerovatnoćom srednje vrijednosti μ, tada za bilo koji uzorak x i iz ovog skupa μ = E( x i) je matematičko očekivanje ovog uzorka.

U praksi, razlika između μ i x ¯ (\displaystyle (\bar (x))) je u tome što je μ tipična varijabla jer možete vidjeti uzorak, a ne cijelu populaciju. Stoga, ako je uzorak predstavljen nasumično (u smislu teorije vjerovatnoće), tada se x ¯ (\displaystyle (\bar (x))) (ali ne μ) može tretirati kao slučajna varijabla koja ima distribuciju vjerovatnoće na uzorku ( distribucija vjerovatnoće srednje vrijednosti).

Obje ove količine se izračunavaju na isti način:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\suma _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Ako X je slučajna varijabla, zatim matematičko očekivanje X može se smatrati aritmetičkom sredinom vrijednosti u ponovljenim mjerenjima veličine X. Ovo je manifestacija zakona velikih brojeva. Stoga se srednja vrijednost uzorka koristi za procjenu nepoznate očekivane vrijednosti.

U elementarnoj algebri je dokazano da je srednja vrijednost n+ 1 broj iznad prosjeka n brojevi ako i samo ako je novi broj veći od starog prosjeka, manji ako i samo ako je novi broj manji od prosjeka i ne mijenja se ako i samo ako je novi broj jednak prosjeku. Više n, što je manja razlika između novog i starog prosjeka.

Imajte na umu da postoji nekoliko drugih dostupnih "prosjeka", uključujući srednju snagu, Kolmogorovljevu sredinu, harmonijsku sredinu, aritmetičko-geometrijsku sredinu i različite ponderisane prosjeke (npr. ponderirana aritmetička sredina, ponderirana geometrijska sredina, ponderirana harmonijska sredina).

Primjeri

  • Za tri broja, trebate ih sabrati i podijeliti sa 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Za četiri broja, trebate ih sabrati i podijeliti sa 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Ili jednostavnije 5+5=10, 10:2. Pošto smo sabirali 2 broja, što znači koliko brojeva sabiramo, dijelimo s tim brojem.

Kontinuirana slučajna varijabla

Za kontinuirano distribuiranu veličinu f (x) (\displaystyle f(x)), aritmetička sredina na intervalu [ a ; b ] (\displaystyle ) određuje se kroz određeni integral:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Neki problemi korištenja prosjeka

Nedostatak robusnosti

Glavni članak: Robusnost u statistici

Iako se aritmetičke sredine često koriste kao proseci ili centralne tendencije, ovaj koncept nije čvrsta statistika, što znači da je aritmetička sredina pod velikim uticajem "velikih odstupanja". Važno je napomenuti da za distribucije s velikim koeficijentom asimetrije, aritmetička sredina možda neće odgovarati konceptu „srednje vrijednosti“, a vrijednosti srednje vrijednosti iz robusne statistike (na primjer, medijan) mogu bolje opisati središnji sklonost.

Klasičan primjer je izračunavanje prosječnog prihoda. Aritmetička sredina se može pogrešno protumačiti kao medijana, što može dovesti do zaključka da ima više ljudi s većim primanjima nego što ih zapravo ima. “Prosječni” prihod se tumači tako da većina ljudi ima prihode oko ovog broja. Ovaj “prosječni” (u smislu aritmetičke sredine) prihod je veći od prihoda većine ljudi, budući da visok dohodak sa velikim odstupanjem od prosjeka čini aritmetičku sredinu jako iskrivljenom (nasuprot tome, prosječni prihod na medijani „opire se“ takvom iskošenju). Međutim, ovaj "prosječni" prihod ne govori ništa o broju ljudi blizu srednjeg prihoda (i ne govori ništa o broju ljudi blizu modalnog prihoda). Međutim, ako pojmove “prosjek” i “većina ljudi” shvatite olako, možete izvući pogrešan zaključak da većina ljudi ima prihode veće nego što jesu. Na primjer, izvještaj o "prosječnom" neto prihodu u Medini u Washingtonu, izračunatom kao aritmetički prosjek svih godišnjih neto prihoda stanovnika, dao bi iznenađujuće veliki broj zbog Billa Gatesa. Razmotrite uzorak (1, 2, 2, 2, 3, 9). Aritmetička sredina je 3,17, ali pet od šest vrijednosti je ispod ove sredine.

Složena kamata

Glavni članak: Povrat investicije

Ako su brojevi umnožiti, ali ne fold, trebate koristiti geometrijsku sredinu, a ne aritmetičku sredinu. Najčešće se ovaj incident dešava prilikom izračunavanja povrata ulaganja u finansije.

Na primjer, ako je dionica pala za 10% u prvoj godini i porasla za 30% u drugoj, onda je pogrešno izračunati „prosječan“ porast u te dvije godine kao aritmetičku sredinu (−10% + 30%) / 2 = 10%; tačan prosjek u ovom slučaju je dat složenom godišnjom stopom rasta, koja daje godišnju stopu rasta od samo oko 8,16653826392% ≈ 8,2%.

Razlog tome je što procenti svaki put imaju novu početnu tačku: 30% je 30% od broja manjeg od cijene na početku prve godine: ako je dionica počela na 30 dolara i pala za 10%, ona vrijedi 27 dolara na početku druge godine. Ako bi dionice porasle za 30%, na kraju druge godine vrijedile bi 35,1 dolara. Aritmetički prosjek ovog rasta je 10%, ali pošto je dionica porasla samo za 5,1 USD u 2 godine, prosječan rast od 8,2% daje konačni rezultat od 35,1 USD:

[30 USD (1 - 0,1) (1 + 0,3) = 30 USD (1 + 0,082) (1 + 0,082) = 35,1 USD]. Ako koristimo aritmetički prosjek od 10% na isti način, nećemo dobiti stvarnu vrijednost: [30 USD (1 + 0,1) (1 + 0,1) = 36,3 USD].

Složena kamata na kraju 2 godine: 90% * 130% = 117%, odnosno ukupno povećanje je 17%, a prosječna godišnja složena kamata je 117% ≈ 108,2% (\displaystyle (\sqrt (117\% ))\cca 108,2\%), odnosno prosječno godišnje povećanje od 8,2%.

Upute

Glavni članak: Statistika odredišta

Prilikom izračunavanja aritmetičke sredine neke varijable koja se ciklički mijenja (kao što je faza ili ugao), mora se obratiti posebna pažnja. Na primjer, prosjek od 1° i 359° bi bio 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Ovaj broj je netačan iz dva razloga.

  • Prvo, ugaone mere su definisane samo za opseg od 0° do 360° (ili od 0 do 2π kada se mere u radijanima). Dakle, isti par brojeva može se napisati kao (1° i -1°) ili kao (1° i 719°). Prosječne vrijednosti svakog para će biti različite: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2 ))=0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\ circ )).
  • Drugo, u ovom slučaju, vrijednost od 0° (ekvivalentno 360°) će biti geometrijski bolja prosječna vrijednost, budući da brojevi manje odstupaju od 0° nego od bilo koje druge vrijednosti (vrijednost 0° ima najmanju varijansu). uporedi:
    • broj 1° odstupa od 0° samo za 1°;
    • broj 1° odstupa od izračunatog prosjeka od 180° za 179°.

Prosječna vrijednost za cikličnu varijablu izračunatu korištenjem gornje formule bit će umjetno pomjerena u odnosu na stvarni prosjek prema sredini numeričkog raspona. Zbog toga se prosek izračunava na drugačiji način, odnosno kao prosečna vrednost se bira broj sa najmanjom varijansom (centralna tačka). Također, umjesto oduzimanja, koristi se modularna udaljenost (tj. obodna udaljenost). Na primjer, modularna udaljenost između 1° i 359° je 2°, a ne 358° (na krugu između 359° i 360°==0° - jedan stepen, između 0° i 1° - također 1°, ukupno - 2°).

Ponderisani prosjek - šta je to i kako ga izračunati?

U procesu izučavanja matematike, školarci se upoznaju sa pojmom aritmetičke sredine. Kasnije u statistici i nekim drugim naukama studenti se suočavaju sa izračunavanjem drugih prosječnih vrijednosti. Šta mogu biti i po čemu se razlikuju jedni od drugih?

Prosjeci: značenje i razlike

Tačni pokazatelji ne daju uvijek razumijevanje situacije. Da bi se procijenila određena situacija, ponekad je potrebno analizirati ogroman broj brojki. A onda prosjeci priskaču u pomoć. Oni nam omogućavaju da procijenimo situaciju u cjelini.


Od školskih dana mnogi odrasli pamte postojanje aritmetičke sredine. Vrlo je jednostavno izračunati - zbir niza od n članova podijeljen je sa n. Odnosno, ako trebate izračunati aritmetičku sredinu u nizu vrijednosti 27, 22, 34 i 37, tada morate riješiti izraz (27+22+34+37)/4, budući da su 4 vrijednosti se koriste u proračunima. U ovom slučaju, potrebna vrijednost će biti 30.

Geometrijska sredina se često proučava kao dio školskog predmeta. Izračunavanje ove vrijednosti zasniva se na izdvajanju n-tog korijena proizvoda n članova. Ako uzmemo iste brojeve: 27, 22, 34 i 37, onda će rezultat izračuna biti jednak 29,4.

Harmonska sredina obično nije predmet proučavanja u srednjim školama. Međutim, koristi se prilično često. Ova vrijednost je inverzna od aritmetičke sredine i izračunava se kao količnik n - broja vrijednosti i zbira 1/a 1 +1/a 2 +...+1/a n. Ako opet uzmemo isti niz brojeva za izračun, onda će harmonik biti 29,6.

Ponderisani prosek: karakteristike

Međutim, sve gore navedene vrijednosti se ne mogu svugdje koristiti. Na primjer, u statistici, kada se izračunavaju određeni prosjeki, "težina" svakog broja koji se koristi u proračunima igra važnu ulogu. Rezultati su indikativniji i tačniji jer uzimaju u obzir više informacija. Ova grupa veličina se općenito naziva “ponderisani prosjek”. Oni se ne uče u školi, pa ih vrijedi detaljnije pogledati.

Prije svega, vrijedi reći šta se podrazumijeva pod „težinom“ određene vrijednosti. To je najlakše objasniti konkretnim primjerom. U bolnici se dva puta dnevno mjeri tjelesna temperatura svakom pacijentu. Od 100 pacijenata na različitim odeljenjima bolnice, 44 će imati normalnu temperaturu - 36,6 stepeni. Još 30 će imati povećanu vrijednost - 37,2, 14 - 38, 7 - 38,5, 3 - 39, a preostala dva - 40. A ako uzmemo aritmetički prosjek, onda će ova vrijednost općenito za bolnicu biti veća od 38 stepeni! Ali skoro polovina pacijenata ima potpuno normalnu temperaturu. I ovdje bi bilo ispravnije koristiti ponderirani prosjek, a "težina" svake vrijednosti bila bi broj ljudi. U ovom slučaju, rezultat izračuna će biti 37,25 stepeni. Razlika je očigledna.

U slučaju izračunavanja ponderisanog prosjeka, „težina“ se može uzeti kao broj pošiljki, broj ljudi koji rade u datom danu, općenito, sve što se može izmjeriti i uticati na konačni rezultat.

Sorte

Ponderisani prosek je povezan sa aritmetičkom sredinom o kojoj se govori na početku članka. Međutim, prva vrijednost, kao što je već spomenuto, također uzima u obzir težinu svakog broja korištenog u proračunima. Pored toga, postoje i ponderisane geometrijske i harmonijske vrednosti.

Postoji još jedna zanimljiva varijacija koja se koristi u brojevnim serijama. Ovo je ponderisani pokretni prosek. Na osnovu toga se izračunavaju trendovi. Osim samih vrijednosti i njihove težine, tu se koristi i periodičnost. A prilikom izračunavanja prosječne vrijednosti u nekom trenutku, u obzir se uzimaju i vrijednosti ​​​​za prethodne vremenske periode.

Izračunavanje svih ovih vrijednosti nije tako teško, ali u praksi se obično koristi samo obični ponderirani prosjek.

Metode proračuna

U doba raširene kompjuterizacije, nema potrebe da se ponderisani prosjek izračunava ručno. Međutim, bilo bi korisno znati formulu izračuna kako biste mogli provjeriti i, ako je potrebno, prilagoditi dobivene rezultate.

Najlakši način je razmotriti izračun koristeći poseban primjer.

Potrebno je saznati kolika je prosječna plata u ovom preduzeću, uzimajući u obzir broj radnika koji primaju jednu ili drugu platu.

Dakle, ponderisani prosjek se izračunava pomoću sljedeće formule:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Na primjer, izračun bi bio ovakav:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Očigledno, nema posebnih poteškoća u ručnom izračunavanju ponderisanog prosjeka. Formula za izračunavanje ove vrijednosti u jednoj od najpopularnijih aplikacija s formulama - Excelu - izgleda kao funkcija SUMPRODUCT (serija brojeva; niz pondera) / SUM (serija pondera).

Kako pronaći prosjek u excelu?

kako pronaći aritmetičku sredinu u excelu?

Vladimir09854

Lako kao pita. Da biste pronašli prosjek u Excelu, potrebne su vam samo 3 ćelije. U prvom ćemo napisati jedan broj, u drugom - drugi. I u treću ćeliju ćemo unijeti formulu koja će nam dati prosječnu vrijednost između ova dva broja iz prve i druge ćelije. Ako se ćelija br. 1 zove A1, ćelija br. 2 se zove B1, tada u ćeliju s formulom trebate napisati ovo:

Ova formula izračunava aritmetičku sredinu dva broja.

Da bi naši proračuni bili ljepši, ćelije možemo istaknuti linijama, u obliku ploče.

U samom Excel-u postoji i funkcija za određivanje prosječne vrijednosti, ali ja koristim starinski način i unosim formulu koja mi je potrebna. Dakle, siguran sam da će Excel izračunati tačno onoliko koliko je meni potrebno, i da neće smisliti neko svoje zaokruživanje.

M3sergey

Ovo je vrlo jednostavno ako su podaci već uneseni u ćelije. Ako vas zanima samo broj, samo odaberite željeni raspon/opsege, a vrijednost zbroja ovih brojeva, njihove aritmetičke sredine i njihovog broja pojavit će se u donjem desnom uglu statusne trake.

Možete odabrati praznu ćeliju, kliknuti na trokut (padajuća lista) "AutoSum" i tamo odabrati "Prosjek", nakon čega ćete se složiti s predloženim rasponom za izračun ili odabrati svoj.

Konačno, formule možete koristiti direktno klikom na "Umetni funkciju" pored trake formule i adrese ćelije. Funkcija AVERAGE nalazi se u kategoriji “Statistički” i uzima kao argument i brojeve i reference ćelija, itd. Tu možete odabrati i složenije opcije, na primjer, AVERAGEIF - izračunavanje prosjeka prema uvjetu.

Pronađite prosječnu vrijednost u Excelu je prilično jednostavan zadatak. Ovdje morate razumjeti da li želite da koristite ovu prosječnu vrijednost u nekim formulama ili ne.

Ako trebate samo dobiti vrijednost, tada samo odaberite traženi raspon brojeva, nakon čega će Excel automatski izračunati prosječnu vrijednost - ona će biti prikazana u statusnoj traci, naslovom "Prosjek".

U slučaju kada želite koristiti rezultat u formulama, možete učiniti sljedeće:

1) Zbrojite ćelije pomoću funkcije SUM i podijelite sve s brojem brojeva.

2) Ispravnija opcija je korištenje posebne funkcije koja se zove AVERAGE. Argumenti ovoj funkciji mogu biti brojevi navedeni uzastopno ili raspon brojeva.

Vladimir Tikhonov

Zaokružite vrijednosti koje će učestvovati u proračunu, kliknite na karticu „Formule“, tamo ćete vidjeti na lijevoj strani „AutoSum“, a pored njega trokut koji pokazuje prema dolje. Kliknite na ovaj trokut i odaberite "Medium". Voila, gotovo) na dnu kolone vidjet ćete prosječnu vrijednost :)

Ekaterina Mutalapova

Krenimo od početka i redom. Šta znači prosjek?

Srednja vrijednost je vrijednost koja je aritmetička sredina, tj. izračunava se dodavanjem skupa brojeva, a zatim dijeljenjem cijelog zbroja brojeva njihovim brojem. Na primjer, za brojeve 2, 3, 6, 7, 2 bit će 4 (zbir brojeva 20 podijeljen je sa njihovim brojem 5)

U Excel tabeli, meni lično, najlakši način je bio da koristim formulu = PROSEK. Da biste izračunali prosječnu vrijednost, potrebno je da unesete podatke u tabelu, upišete funkciju =AVERAGE() ispod stupca podataka i naznačite raspon brojeva u ćelijama u zagradama, istaknuvši stupac sa podacima. Nakon toga pritisnite ENTER ili jednostavno kliknite lijevom tipkom miša na bilo koju ćeliju. Rezultat se pojavljuje u ćeliji ispod kolone. Izgleda neshvatljivo opisano, ali u stvari je to pitanje minuta.

Avanturist 2000

Excel je raznolik program, tako da postoji nekoliko opcija koje će vam omogućiti da pronađete prosjek:

Prva opcija. Jednostavno zbrojite sve ćelije i podijelite s njihovim brojem;

Druga opcija. Upotrijebite posebnu naredbu, napišite formulu "= PROSJEČAN (i ovdje navedite raspon ćelija)" u traženu ćeliju;

Treća opcija. Ako odaberete željeni raspon, imajte na umu da je na donjoj stranici prikazana i prosječna vrijednost u ovim ćelijama.

Dakle, postoji mnogo načina za pronalaženje prosjeka, samo trebate odabrati najbolji za sebe i stalno ga koristiti.

U Excelu možete koristiti funkciju AVERAGE za izračunavanje jednostavnog aritmetičkog prosjeka. Da biste to učinili, morate unijeti određeni broj vrijednosti. Pritisnite jednako i odaberite Statistički u kategoriji, među kojima odaberite funkciju PROSJEČNO



Takođe, koristeći statističke formule, možete izračunati ponderisanu aritmetičku sredinu, koja se smatra tačnijom. Da bismo ga izračunali, potrebne su nam vrijednosti indikatora i učestalost.

Kako pronaći prosjek u Excelu?

Ovo je situacija. Tu je sljedeća tabela:

Kolone zasjenjene crvenom bojom sadrže numeričke vrijednosti ocjena u predmetima. U koloni "Prosječna ocjena" morate izračunati njihov prosjek.
Problem je sljedeći: ukupno ima 60-70 stavki, a neke od njih su na drugom listu.
Pogledao sam u drugi dokument i prosjek je već izračunat, a u ćeliji je formula kao
="ime lista"!|E12
ali to je uradio neki programer koji je otpušten.
Molim vas recite mi ko ovo razumije.

Hector

U liniju funkcija ubacujete “PROSJEČAN” od predloženih funkcija i birate odakle ih treba izračunati (B6:N6) za Ivanova, na primjer. Ne znam zasigurno za susjedne listove, ali vjerovatno je sadržano u standardnoj pomoći za Windows

Reci mi kako da izračunam prosječnu vrijednost u Wordu

Recite mi kako da izračunam prosječnu vrijednost u Wordu. Naime, prosječna vrijednost ocjena, a ne broj ljudi koji su dobili ocjene.


Julia Pavlova

Word može puno učiniti s makroima. Pritisnite ALT+F11 i napišite makro program..
Pored toga, Insert-Object... će vam omogućiti da koristite druge programe, čak i Excel, za kreiranje lista sa tabelom unutar Word dokumenta.
Ali u ovom slučaju, trebate zapisati svoje brojeve u kolonu tabele i unijeti prosjek u donju ćeliju iste kolone, zar ne?
Da biste to učinili, umetnite polje u donju ćeliju.
Insert-Field... -Formula
Sadržaj polja
[=PROSJEK (IZNAD)]
daje prosjek zbira ćelija iznad.
Ako odaberete polje i kliknete desnim gumbom miša, možete ga ažurirati ako su se brojevi promijenili,
pogledajte kod ili vrijednost polja, promijenite kod direktno u polju.
Ako nešto krene po zlu, izbrišite cijelo polje u ćeliji i ponovo ga kreirajte.
PROSJEČNO znači prosjek, IZNAD - oko, odnosno broj ćelija koje se nalaze iznad.
Ni sam sve ovo nisam znao, ali sam to lako otkrio u HELP-u, naravno, uz malo razmišljanja.

Prosečna plata... Prosečan životni vek... Skoro svaki dan čujemo ove fraze kojima se opisuje skup sa jednim jedinim brojem. Ali koliko je čudno, "prosječna vrijednost" je prilično podmukao koncept koji često dovodi u zabludu prosječnu osobu, neiskusnu u matematičkoj statistici.

Šta je problem?

Prosječna vrijednost najčešće označava aritmetičku sredinu koja uvelike varira pod uticajem pojedinačnih činjenica ili događaja. I nećete dobiti pravi osjećaj o tome kako su vrijednosti koje proučavate raspoređene.

Pogledajmo klasičan primjer prosječne plate.

Neka apstraktna kompanija ima deset zaposlenih. Njih devet prima platu od oko 50.000 rubalja, a jedan prima platu od 1.500.000 rubalja (čudnom koincidencijom, on je i generalni direktor ove kompanije).

Prosječna vrijednost u ovom slučaju će biti 195.150 rubalja, što je, složićete se, netačno.

Koje metode za izračunavanje prosjeka postoje?

Prvi način je izračunavanje već spomenutog aritmetička sredina, što je zbir svih vrijednosti podijeljen s njihovim brojem.

  • x – aritmetička sredina;
  • x n – specifično značenje;
  • n – broj vrijednosti.
  • Dobro radi s normalnom raspodjelom vrijednosti u uzorku;
  • Lako izračunati;
  • Intuitivno jasno.
  • Ne daje pravu ideju o raspodjeli vrijednosti;
  • Nestabilna količina koja je lako podložna izvanrednim vrednostima (kao u slučaju generalnog direktora).

Drugi način je izračunavanje moda, odnosno vrijednost koja se najčešće pojavljuje.

  • M 0 – mod;
  • x 0 – donja granica intervala koji sadrži mod;
  • n – vrijednost intervala;
  • f m – frekvencija (koliko puta se određena vrijednost javlja u nizu);
  • f m-1 – frekvencija intervala koji prethodi modalnom;
  • f m+1 – frekvencija intervala nakon modalnog.
  • Odlično za stjecanje osjećaja javnog mnijenja;
  • Dobro za nenumeričke podatke (boje sezone, najprodavaniji, ocjene);
  • Lako razumeti.
  • Moda možda jednostavno ne postoji (bez ponavljanja);
  • Može postojati nekoliko načina (multimodalna distribucija).

Treći način je izračunavanje medijane, odnosno vrijednost koja naručeni uzorak dijeli na dvije polovine i leži između njih. A ako ne postoji takva vrijednost, tada se kao medijan uzima aritmetička sredina između granica polovica uzorka.

  • M e – medijan;
  • x 0 – donja granica intervala koja sadrži medijanu;
  • h – vrijednost intervala;
  • f i – frekvencija (koliko puta se određena vrijednost javlja u nizu);
  • S m-1 – zbir frekvencija intervala koji prethode medijani;
  • f m – broj vrijednosti u srednjem intervalu (njegova frekvencija).
  • Pruža najrealističniju i najreprezentativniju procjenu;
  • Otporan na emisije.
  • Teže je izračunati, jer se uzorak mora naručiti prije izračunavanja.

Pogledali smo glavne metode za pronalaženje prosječne vrijednosti, tzv mjere centralne tendencije(zapravo ih ima više, ali ovi su najpopularniji).

Sada se vratimo na naš primjer i izračunajmo sve tri opcije za prosjek koristeći posebne Excel funkcije:

  • AVERAGE(broj1;[broj2];…) – funkcija za određivanje aritmetičke sredine;
  • MODE.ONE(broj1;[broj2];...) - funkcija režima (u starijim verzijama Excela korišćen je MODE(broj1;[broj2];...));
  • MEDIAN(broj1;[broj2];...) – funkcija za pronalaženje medijane.

A evo i vrijednosti koje smo dobili:

U ovom slučaju, mod i medijan mnogo bolje karakterišu prosječnu platu u kompaniji.

Ali šta učiniti kada uzorak ne sadrži 10 vrijednosti, kao u primjeru, već milione? Ovo se ne može izračunati u Excel-u, ali u bazi podataka u kojoj su pohranjeni vaši podaci, nema problema.

Izračunavanje aritmetičke sredine u SQL-u

Ovdje je sve prilično jednostavno, budući da SQL pruža posebnu agregatnu funkciju AVG.

A da biste ga koristili, samo napišite sljedeći upit:

Izračunavanje mode u SQL-u

U SQL-u ne postoji posebna funkcija za pronalaženje moda, ali možete je brzo i jednostavno napisati sami. Da bismo to učinili, moramo saznati koja se plaća najčešće ponavlja i odabrati najpopularniju.

Napišimo zahtjev:

/* SA VEZAMA se mora dodati u TOP() ako je set multimodalan, odnosno skup ima nekoliko modova */ ODABIR VRH(1) SA VRATAMA platu KAO "Mod plaće" OD zaposlenika GRUPA PO plati RED PO BROJU(* ) DESC

Izračunavanje medijane u SQL-u

Kao i kod načina rada, SQL nema ugrađenu funkciju za izračunavanje medijane, ali ima generičku funkciju za izračunavanje percentila, PERCENTILE_CONT.

Sve to izgleda ovako:

/* U ovom slučaju, percentil je 0,5 i bit će medijan */ SELECT TOP(1) PERCENTILE_CONT(0,5) UNUTAR GRUPE (RED PO plati) PREKO() KAO "srednja plaća" OD zaposlenih

Bolje je pročitati više o radu funkcije PERCENTILE_CONT u pomoći za Microsoft i Google BigQuery.

Koju metodu da koristim?

Iz navedenog proizilazi da je medijana najbolji način za izračunavanje prosjeka.

Ali nije uvijek tako. Ako radite s prosjekom, onda se čuvajte multimodalne distribucije:

Grafikon prikazuje bimodalnu distribuciju sa dva vrha. Ova situacija može nastati, na primjer, prilikom glasanja na izborima.

U ovom slučaju, aritmetička sredina i medijan su vrijednosti koje su negdje u sredini i neće reći ništa o tome što se zapravo događa i bolje je odmah prepoznati da imate posla s bimodalnom distribucijom tako što ćete prijaviti dva načina.

Još bolje, podijelite uzorak u dvije grupe i prikupite statističke podatke za svaku.

zaključak:

Prilikom odabira metode za pronalaženje prosjeka, potrebno je uzeti u obzir prisustvo odstupanja, kao i normalnost distribucije vrijednosti u uzorku.

Konačan izbor mjere centralne tendencije uvijek leži na analitičaru.

U većini slučajeva podaci su koncentrisani oko neke centralne tačke. Dakle, da bi se opisali bilo koji skup podataka, dovoljno je navesti prosječnu vrijednost. Razmotrimo sekvencijalno tri numeričke karakteristike koje se koriste za procjenu prosječne vrijednosti distribucije: aritmetičku sredinu, medijan i mod.

Prosjek

Aritmetička sredina (koja se često naziva jednostavno sredinom) je najčešća procjena srednje vrijednosti distribucije. To je rezultat dijeljenja zbroja svih promatranih numeričkih vrijednosti njihovim brojem. Za uzorak koji se sastoji od brojeva X 1, X 2, …, Xn, srednja vrijednost uzorka (označena sa ) jednako = (X 1 + X 2 + … + Xn) / n, ili

gdje je srednja vrijednost uzorka, n- veličina uzorka, Xi– i-ti element uzorka.

Preuzmite bilješku u formatu ili, primjere u formatu

Razmislite o izračunavanju aritmetičkog prosjeka petogodišnjih prosječnih godišnjih prinosa 15 vrlo rizičnih investicijskih fondova (Slika 1).

Rice. 1. Prosječni godišnji prinosi 15 vrlo rizičnih investicijskih fondova

Srednja vrijednost uzorka se izračunava na sljedeći način:

Ovo je dobar prinos, posebno u poređenju sa prinosom od 3-4% koji su štediše banke ili kreditne unije primili u istom vremenskom periodu. Ako sortiramo prinose, lako je uočiti da osam fondova ima prinose iznad prosjeka, a sedam - ispod prosjeka. Aritmetička sredina deluje kao tačka ravnoteže, tako da fondovi sa niskim prinosima balansiraju sredstva sa visokim prinosima. Svi elementi uzorka su uključeni u izračunavanje prosjeka. Nijedna od drugih procjena srednje vrijednosti raspodjele nema ovo svojstvo.

Kada treba izračunati aritmetičku sredinu? Pošto aritmetička sredina zavisi od svih elemenata u uzorku, prisustvo ekstremnih vrednosti značajno utiče na rezultat. U takvim situacijama, aritmetička sredina može iskriviti značenje numeričkih podataka. Stoga, kada se opisuje skup podataka koji sadrži ekstremne vrijednosti, potrebno je navesti medijan ili aritmetičku sredinu i medijan. Na primjer, ako iz uzorka uklonimo prinose fonda RS Emerging Growth, prosjek uzorka od 14 fondova se smanjuje za skoro 1% na 5,19%.

Ovo je aritmetička sredina koja se izračunava dodavanjem grupe brojeva i njihovim dijeljenjem brojem tih brojeva. Na primjer, prosjek brojeva 2, 3, 3, 5, 7 i 10 je 5, što je rezultat dijeljenja njihovog zbira 30 sa zbirom 6.

Medijan predstavlja srednju vrijednost uređenog niza brojeva. Ako niz ne sadrži ponavljajuće brojeve, tada će polovina njegovih elemenata biti manja od, a polovina veća od medijane. Ako uzorak sadrži ekstremne vrijednosti, bolje je koristiti medijanu umjesto aritmetičke sredine za procjenu srednje vrijednosti. Da bi se izračunao medijan uzorka, prvo se mora naručiti.

Ova formula je dvosmislena. Njegov rezultat ovisi o tome da li je broj paran ili neparan n:

  • Ako uzorak sadrži neparan broj elemenata, medijan je (n+1)/2-th element.
  • Ako uzorak sadrži paran broj elemenata, medijan leži između dva srednja elementa uzorka i jednak je aritmetičkoj sredini izračunatoj za ova dva elementa.

Da biste izračunali medijan uzorka koji sadrži prinose 15 vrlo rizičnih investicijskih fondova, prvo morate sortirati neobrađene podatke (Slika 2). Tada će medijan biti suprotan broju srednjeg elementa uzorka; u našem primjeru br. 8. Excel ima posebnu funkciju =MEDIAN() koja radi i sa neuređenim nizovima.

Rice. 2. Medijan 15 fondova

Dakle, medijan je 6,5. To znači da prinos na jednu polovinu veoma rizičnih fondova ne prelazi 6,5, a na drugu polovinu je veći. Imajte na umu da medijan od 6,5 nije mnogo veći od srednje vrijednosti 6,08.

Ako iz uzorka izuzmemo prinos fonda RS Emerging Growth, onda se medijan preostalih 14 fondova smanjuje na 6,2%, odnosno ne toliko značajno kao aritmetička sredina (Slika 3).

Rice. 3. Medijan 14 fondova

Srednji broj grupe brojeva. Pola brojeva sadrži vrijednosti veće od medijane, a polovina brojeva sadrži vrijednosti manje od medijane. Na primjer, medijana za brojeve 2, 3, 3, 5, 7 i 10 bi bila 4.

Termin je prvi skovao Pearson 1894. Moda je broj koji se najčešće pojavljuje u uzorku (najmoderniji). Moda dobro opisuje, na primjer, tipičnu reakciju vozača na signal semafora da se zaustavi. Klasičan primjer korištenja mode je izbor veličine cipela ili boje tapeta. Ako distribucija ima nekoliko načina, onda se kaže da je multimodalna ili multimodalna (ima dva ili više „vrhova“). Multimodalnost distribucije pruža važne informacije o prirodi varijable koja se proučava. Na primjer, u sociološkim istraživanjima, ako varijabla predstavlja sklonost ili stav prema nečemu, onda multimodalnost može značiti da postoji nekoliko izrazito različitih mišljenja. Multimodalnost takođe služi kao indikator da uzorak nije homogen i da zapažanja mogu biti generisana dvema ili više „preklapajućih“ distribucija. Za razliku od aritmetičke sredine, outliers ne utiču na mod. Za kontinuirano distribuirane slučajne varijable, kao što je prosječni godišnji prinos investicijskih fondova, modus ponekad uopće ne postoji (ili nema smisla). Budući da ovi indikatori mogu poprimiti vrlo različite vrijednosti, ponavljajuće vrijednosti su izuzetno rijetke.

Kvartili

Kvartili su metrika koja se najčešće koristi za procjenu distribucije podataka kada se opisuju svojstva velikih numeričkih uzoraka. Dok medijan dijeli uređeni niz na pola (50% elemenata niza je manje od medijane, a 50% veće), kvartili dijele uređeni skup podataka na četiri dijela. Vrijednosti Q 1 , medijana i Q 3 su 25., 50. i 75. percentil, redom. Prvi kvartil Q 1 je broj koji dijeli uzorak na dva dijela: 25% elemenata je manje od, a 75% veće od prvog kvartila.

Treći kvartil Q 3 je broj koji također dijeli uzorak na dva dijela: 75% elemenata je manje od, a 25% veće od trećeg kvartila.

Da biste izračunali kvartile u verzijama Excel-a prije 2007. godine, koristite funkciju =QUARTILE(niz,dio). Počevši od Excel 2010, koriste se dvije funkcije:

  • =QUARTILE.ON(niz,dio)
  • =QUARTILE.EXC(niz,dio)

Ove dvije funkcije daju malo različite vrijednosti (slika 4). Na primjer, kada se izračunavaju kvartili uzorka koji sadrži prosječne godišnje prinose 15 vrlo rizičnih investicijskih fondova, Q 1 = 1,8 ili –0,7 za QUARTILE.IN i QUARTILE.EX, respektivno. Inače, funkcija QUARTILE, koja se ranije koristila, odgovara modernoj funkciji QUARTILE.ON. Za izračunavanje kvartila u Excelu koristeći gornje formule, niz podataka ne mora biti uređen.

Rice. 4. Izračunavanje kvartila u Excel-u

Da još jednom naglasimo. Excel može izračunati kvartile za univarijantu diskretne serije, koji sadrži vrijednosti slučajne varijable. Izračun kvartila za distribuciju zasnovanu na frekvenciji dat je u nastavku u odjeljku.

Geometrijska sredina

Za razliku od aritmetičke sredine, geometrijska sredina vam omogućava da procenite stepen promene varijable tokom vremena. Geometrijska sredina je korijen n stepena iz rada n količine (u Excelu se koristi funkcija =SRGEOM):

G= (X 1 * X 2 * … * X n) 1/n

Sličan parametar - geometrijska srednja vrijednost stope profita - određuje se formulom:

G = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,

Gdje R i– profitna stopa za i th vremenski period.

Na primjer, pretpostavimo da je početna investicija 100.000 dolara Do kraja prve godine, ona pada na 50.000 dolara, a do kraja druge godine se vraća na početni nivo od 100.000 dolara -godišnji period je 0, pošto su početni i konačni iznosi sredstava međusobno jednaki. Međutim, aritmetički prosjek godišnjih stopa prinosa je = (–0,5 + 1) / 2 = 0,25 ili 25%, budući da je stopa prinosa u prvoj godini R 1 = (50.000 – 100.000) / 100.000 = –0.5 , a u drugom R 2 = (100.000 – 50.000) / 50.000 = 1. Istovremeno, geometrijska srednja vrijednost profitne stope za dvije godine jednaka je: G = [(1–0,5) * (1+ 1 )] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Dakle, geometrijska sredina preciznije odražava promjenu (tačnije, izostanak promjena) u obimu ulaganja u periodu od dvije godine od aritmetičku sredinu.

Zanimljivosti. Prvo, geometrijska sredina će uvijek biti manja od aritmetičke sredine istih brojeva. Osim u slučaju kada su svi uzeti brojevi međusobno jednaki. Drugo, razmatranjem svojstava pravokutnog trougla, možete razumjeti zašto se srednja vrijednost naziva geometrijskom. Visina pravokutnog trokuta, spuštenog na hipotenuzu, je prosječna proporcionalna između projekcija kateta na hipotenuzu, a svaka kateta je prosječna proporcionalna između hipotenuze i njene projekcije na hipotenuzu (slika 5). Ovo daje geometrijski način da se konstruiše geometrijska sredina dva (dužina) segmenta: potrebno je da konstruišete kružnicu na zbiru ova dva segmenta kao prečnik, zatim visinu koja se vraća od tačke njihove veze do preseka sa kružnicom će dati željenu vrijednost:

Rice. 5. Geometrijska priroda geometrijske sredine (slika sa Wikipedije)

Drugo važno svojstvo numeričkih podataka je njihovo varijacija, karakterišući stepen disperzije podataka. Dva različita uzorka mogu se razlikovati i u srednjim vrijednostima i u varijacijama. Međutim, kao što je prikazano na sl. 6 i 7, dva uzorka mogu imati iste varijacije, ali različita sredina, ili ista sredina i potpuno različite varijacije. Podaci koji odgovaraju poligonu B na Sl. 7, mijenjaju se mnogo manje od podataka na kojima je konstruiran poligon A.

Rice. 6. Dvije simetrične distribucije u obliku zvona sa istim širenjem i različitim srednjim vrijednostima

Rice. 7. Dvije simetrične distribucije u obliku zvona sa istim srednjim vrijednostima i različitim širinama

Postoji pet procjena varijacije podataka:

  • obim,
  • interkvartilni raspon,
  • disperzija,
  • standardna devijacija,
  • koeficijent varijacije.

Obim

Raspon je razlika između najvećeg i najmanjeg elementa uzorka:

Raspon = XMaks – XMin

Opseg uzorka koji sadrži prosječne godišnje prinose 15 vrlo rizičnih investicijskih fondova može se izračunati korištenjem uređenog niza (vidi sliku 4): Raspon = 18,5 – (–6,1) = 24,6. To znači da je razlika između najvećeg i najnižeg prosječnog godišnjeg prinosa veoma rizičnih fondova 24,6%.

Raspon mjeri ukupnu rasprostranjenost podataka. Iako je raspon uzorka vrlo jednostavna procjena ukupnog širenja podataka, njegova slabost je u tome što ne uzima u obzir kako su podaci raspoređeni između minimalnih i maksimalnih elemenata. Ovaj efekat je jasno vidljiv na sl. 8, koja ilustruje uzorke koji imaju isti raspon. Skala B pokazuje da ako uzorak sadrži barem jednu ekstremnu vrijednost, raspon uzorka je vrlo neprecizna procjena širenja podataka.

Rice. 8. Poređenje tri uzorka istog opsega; trokut simbolizira oslonac vage, a njegova lokacija odgovara srednjoj vrijednosti uzorka

Interkvartilni raspon

Interkvartil, ili prosjek, raspon je razlika između trećeg i prvog kvartila uzorka:

Interkvartilni raspon = Q 3 – Q 1

Ova vrijednost nam omogućava da procijenimo raspršivanje 50% elemenata i ne uzimamo u obzir utjecaj ekstremnih elemenata. Interkvartilni raspon uzorka koji sadrži prosječne godišnje prinose 15 vrlo rizičnih investicijskih fondova može se izračunati korištenjem podataka na slici 1. 4 (na primjer, za funkciju QUARTILE.EXC): Interkvartilni raspon = 9,8 – (–0,7) = 10,5. Interval omeđen brojevima 9,8 i -0,7 često se naziva srednjom polovinom.

Treba napomenuti da vrijednosti Q 1 i Q 3 , a samim tim i interkvartilni raspon, ne zavise od prisutnosti outliera, jer njihov proračun ne uzima u obzir nijednu vrijednost koja bi bila manja od Q 1 ili veća nego Q 3 . Zbirne mjere kao što su medijan, prvi i treći kvartil i interkvartilni raspon na koje ne utječu outliers nazivaju se robusne mjere.

Iako raspon i interkvartilni raspon daju procjene ukupnog i prosječnog širenja uzorka, nijedna od ovih procjena ne uzima u obzir tačno kako se podaci distribuiraju. Varijanca i standardna devijacija su lišene ovog nedostatka. Ovi indikatori vam omogućavaju da procenite stepen do kojeg podaci fluktuiraju oko prosečne vrednosti. Varijanca uzorka je aproksimacija aritmetičke sredine izračunate iz kvadrata razlika između svakog elementa uzorka i srednje vrijednosti uzorka. Za uzorak X 1, X 2, ... X n, varijansa uzorka (označena simbolom S 2 data je sljedećom formulom:

Općenito, varijansa uzorka je zbir kvadrata razlika između elemenata uzorka i srednje vrijednosti uzorka, podijeljen s vrijednošću jednakom veličini uzorka minus jedan:

Gdje - aritmetička sredina, n- veličina uzorka, X i - i element selekcije X. U Excelu prije verzije 2007, funkcija =VARIN() se koristila za izračunavanje varijanse uzorka od verzije 2010. koristi se funkcija =VARIAN().

Najpraktičnija i najprihvaćenija procjena širenja podataka je uzorak standardne devijacije. Ovaj indikator je označen simbolom S i jednak je kvadratnom korijenu varijanse uzorka:

U programu Excel prije verzije 2007, funkcija =STDEV.() se koristila za izračunavanje standardne devijacije uzorka od verzije 2010. koristi se funkcija =STDEV.V(). Za izračunavanje ovih funkcija, niz podataka može biti neuređen.

Ni varijansa uzorka ni standardna devijacija uzorka ne mogu biti negativni. Jedina situacija u kojoj indikatori S 2 i S mogu biti nula je ako su svi elementi uzorka međusobno jednaki. U ovom potpuno nevjerovatnom slučaju, raspon i interkvartilni raspon su također nula.

Numerički podaci su inherentno varijabilni. Svaka varijabla može poprimiti mnogo različitih vrijednosti. Na primjer, različiti zajednički fondovi imaju različite stope povrata i gubitka. Zbog varijabilnosti numeričkih podataka, veoma je važno proučavati ne samo procjene srednje vrijednosti, koje su sumarne prirode, već i procjene varijanse koje karakteriziraju širenje podataka.

Disperzija i standardna devijacija vam omogućavaju da procijenite širenje podataka oko prosječne vrijednosti, drugim riječima, odredite koliko je elemenata uzorka manje od prosjeka, a koliko veće. Disperzija ima neka vrijedna matematička svojstva. Međutim, njegova vrijednost je kvadrat mjerne jedinice - kvadratni postotak, kvadratni dolar, kvadratni inč itd. Stoga je prirodna mjera disperzije standardna devijacija, koja se izražava u uobičajenim jedinicama procenta prihoda, dolarima ili inčima.

Standardna devijacija vam omogućava da procenite količinu varijacije elemenata uzorka oko prosečne vrednosti. U gotovo svim situacijama, većina promatranih vrijednosti leži u rasponu plus ili minus jedne standardne devijacije od srednje vrijednosti. Prema tome, poznavajući aritmetičku sredinu elemenata uzorka i standardnu ​​devijaciju uzorka, moguće je odrediti interval kojem pripada najveći dio podataka.

Standardna devijacija prinosa za 15 vrlo rizičnih investicijskih fondova je 6,6 (Slika 9). To znači da se profitabilnost najvećeg dijela fondova razlikuje od prosječne vrijednosti za najviše 6,6% (tj. varira u rasponu od – S= 6,2 – 6,6 = –0,4 do +S= 12,8). U stvari, petogodišnji prosječni godišnji prinos od 53,3% (8 od 15) fondova leži u ovom rasponu.

Rice. 9. Standardna devijacija uzorka

Imajte na umu da kada se zbrajaju kvadratne razlike, stavkama uzorka koje su dalje od srednje vrijednosti pridaje se veća težina nego stavkama koje su bliže srednjoj vrijednosti. Ovo svojstvo je glavni razlog zašto se aritmetička sredina najčešće koristi za procjenu sredine distribucije.

Koeficijent varijacije

Za razliku od prethodnih procjena raspršenosti, koeficijent varijacije je relativna procjena. Uvijek se mjeri kao postotak, a ne u jedinicama originalnih podataka. Koeficijent varijacije, označen simbolima CV, mjeri disperziju podataka oko srednje vrijednosti. Koeficijent varijacije jednak je standardnoj devijaciji podijeljenoj s aritmetičkom sredinom i pomnoženoj sa 100%:

Gdje S- standardna devijacija uzorka, - prosjek uzorka.

Koeficijent varijacije vam omogućava da uporedite dva uzorka čiji su elementi izraženi u različitim mjernim jedinicama. Na primjer, menadžer službe za dostavu pošte namjerava da obnovi svoj vozni park. Prilikom utovara paketa, potrebno je uzeti u obzir dva ograničenja: težinu (u funtama) i zapreminu (u kubnim stopama) svakog paketa. Pretpostavimo da je u uzorku koji sadrži 200 vreća srednja težina 26,0 funti, standardna devijacija težine 3,9 funti, srednja zapremina vreće je 8,8 kubnih stopa, a standardna devijacija zapremine je 2,2 kubna stopa. Kako uporediti varijacije u težini i zapremini pakovanja?

Pošto se jedinice mjere za težinu i zapreminu razlikuju jedna od druge, menadžer mora uporediti relativnu širinu ovih veličina. Koeficijent varijacije težine je CV W = 3,9 / 26,0 * 100% = 15%, a koeficijent varijacije zapremine je CV V = 2,2 / 8,8 * 100% = 25%. Dakle, relativna varijacija u zapremini paketa je mnogo veća od relativne varijacije u njihovoj težini.

Obrazac za distribuciju

Treće važno svojstvo uzorka je oblik njegove distribucije. Ova raspodjela može biti simetrična ili asimetrična. Da bismo opisali oblik distribucije, potrebno je izračunati njenu srednju vrijednost i medijan. Ako su te dvije iste, varijabla se smatra simetrično raspoređenom. Ako je srednja vrijednost varijable veća od medijane, njena distribucija ima pozitivnu asistenciju (slika 10). Ako je medijan veći od srednje vrijednosti, distribucija varijable je negativno iskrivljena. Pozitivna asimetrija se javlja kada se srednja vrijednost poveća na neuobičajeno visoke vrijednosti. Negativna iskrivljenost nastaje kada se srednja vrijednost smanji na neobično male vrijednosti. Varijabla je simetrično raspoređena ako ne uzima ekstremne vrijednosti ni u jednom smjeru, tako da se velike i male vrijednosti varijable međusobno poništavaju.

Rice. 10. Tri vrste distribucija

Podaci prikazani na skali A su negativno iskrivljeni. Ova slika prikazuje dugačak rep i iskošenje ulijevo uzrokovano prisustvom neobično malih vrijednosti. Ove izuzetno male vrijednosti pomiču prosječnu vrijednost ulijevo, čineći je manjom od medijane. Podaci prikazani na skali B raspoređeni su simetrično. Lijeva i desna polovina distribucije su same sebe zrcalne slike. Velike i male vrijednosti balansiraju jedna drugu, a srednja vrijednost i medijan su jednaki. Podaci prikazani na skali B su pozitivno iskrivljeni. Ova slika prikazuje dugačak rep i iskošenje udesno uzrokovano prisustvom neobično visokih vrijednosti. Ove prevelike vrijednosti pomiču srednju vrijednost udesno, čineći je većom od medijane.

U Excelu se deskriptivna statistika može dobiti pomoću dodatka Paket analiza. Prođite kroz meni PodaciAnaliza podataka, u prozoru koji se otvori odaberite liniju Deskriptivna statistika i kliknite Uredu. U prozoru Deskriptivna statistika obavezno naznačite Interval unosa(Sl. 11). Ako želite da vidite deskriptivnu statistiku na istom listu kao i originalni podaci, izaberite radio dugme Izlazni interval i odredite ćeliju u koju treba postaviti gornji lijevi ugao prikazane statistike (u našem primjeru, $C$1). Ako želite da izbacite podatke na novi list ili novu radnu svesku, samo treba da izaberete odgovarajući radio dugme. Označite polje pored Zbirna statistika. Po želji možete i birati Nivo težine,kth najmanji ikth najveći.

Ako je na depozit Podaci u oblasti Analiza ne vidite ikonu Analiza podataka, prvo morate instalirati dodatak Paket analiza(vidi, na primjer,).

Rice. 11. Deskriptivna statistika petogodišnjih prosječnih godišnjih prinosa sredstava sa vrlo visokim nivoom rizika, izračunata korištenjem dodatka Analiza podataka Excel programi

Excel izračunava brojne statistike o kojima je bilo riječi: srednja vrijednost, medijana, mod, standardna devijacija, varijansa, raspon ( interval), minimalna, maksimalna i veličina uzorka ( provjeriti). Excel takođe izračunava neke statistike koje su nam nove: standardnu ​​grešku, eksces i iskrivljenost. Standardna greška jednaka standardnoj devijaciji podijeljenoj s kvadratnim korijenom veličine uzorka. Asimetrija karakterizira odstupanje od simetrije distribucije i predstavlja funkciju koja ovisi o kocki razlike između elemenata uzorka i prosječne vrijednosti. Kurtosis je mjera relativne koncentracije podataka oko srednje vrijednosti u poređenju sa repovima distribucije i ovisi o razlikama između elemenata uzorka i srednje vrijednosti podignute na četvrtu potenciju.

Izračunavanje deskriptivne statistike za populaciju

Srednja vrijednost, širenje i oblik distribucije o kojoj smo gore raspravljali su karakteristike određene iz uzorka. Međutim, ako skup podataka sadrži numerička mjerenja cjelokupne populacije, njegovi parametri se mogu izračunati. Takvi parametri uključuju očekivanu vrijednost, disperziju i standardnu ​​devijaciju populacije.

Očekivana vrijednost jednak zbroju svih vrijednosti u populaciji podijeljen s veličinom populacije:

Gdje µ - očekivana vrijednost, Xi- i th posmatranje varijable X, N- obim opšte populacije. U Excelu, za izračunavanje matematičkog očekivanja, koristi se ista funkcija kao i za aritmetički prosjek: =AVERAGE().

Varijanca stanovništva jednak zbiru kvadrata razlika između elemenata opće populacije i mat. očekivanja podijeljena sa veličinom populacije:

Gdje σ 2– disperzija opšte populacije. U Excelu prije verzije 2007, funkcija =VARP() se koristi za izračunavanje varijanse populacije, počevši od verzije 2010 =VARP().

Standardna devijacija stanovništva jednak kvadratnom korijenu varijanse populacije:

U Excelu prije verzije 2007, funkcija =STDEV() se koristi za izračunavanje standardne devijacije populacije, počevši od verzije 2010 =STDEV.Y(). Imajte na umu da se formule za varijansu populacije i standardnu ​​devijaciju razlikuju od formula za izračunavanje varijanse uzorka i standardne devijacije. Prilikom izračunavanja statistike uzorka S 2 I S imenilac razlomka je n – 1, te prilikom izračunavanja parametara σ 2 I σ - obim opšte populacije N.

Pravilo

U većini situacija, veliki dio opažanja koncentrisan je oko medijane, formirajući klaster. U skupovima podataka s pozitivnom asimetrijom, ovaj klaster se nalazi lijevo (tj. ispod) matematičkog očekivanja, a u skupovima s negativnom asimetrijom, ovaj klaster se nalazi desno (tj. iznad) matematičkog očekivanja. Za simetrične podatke, srednja vrijednost i medijan su isti, a opažanja se grupišu oko srednje vrijednosti, formirajući distribuciju u obliku zvona. Ako distribucija nije jasno iskrivljena i podaci su koncentrirani oko centra gravitacije, pravilo koje se može koristiti za procjenu varijabilnosti je da ako podaci imaju distribuciju u obliku zvona, onda je otprilike 68% opservacija unutar jedna standardna devijacija očekivane vrijednosti približno 95% zapažanja nije više od dvije standardne devijacije od matematičkog očekivanja, a 99,7% zapažanja nije više od tri standardne devijacije od matematičkog očekivanja.

Dakle, standardna devijacija, koja je procjena prosječne varijacije oko očekivane vrijednosti, pomaže da se razumije kako se opservacije distribuiraju i da se identifikuju odstupnici. Opće pravilo je da se za distribucije u obliku zvona samo jedna vrijednost od dvadeset razlikuje od matematičkog očekivanja za više od dvije standardne devijacije. Dakle, vrijednosti su izvan intervala µ ± 2σ, mogu se smatrati izvanrednim. Osim toga, samo tri od 1000 opservacija razlikuju se od matematičkog očekivanja za više od tri standardne devijacije. Dakle, vrijednosti su izvan intervala µ ± 3σ su skoro uvek van granica. Za distribucije koje su jako nakrivljene ili nisu u obliku zvona, može se primijeniti Bienamay-Chebyshev pravilo.

Prije više od stotinu godina, matematičari Bienamay i Chebyshev su nezavisno otkrili korisno svojstvo standardne devijacije. Otkrili su da je za bilo koji skup podataka, bez obzira na oblik distribucije, postotak opažanja koji se nalaze na udaljenosti od k standardne devijacije od matematičkih očekivanja, ne manje (1 – 1/ k 2)*100%.

Na primjer, ako k= 2, Bienname-Chebyshev pravilo kaže da najmanje (1 – (1/2) 2) x 100% = 75% opservacija mora ležati u intervalu µ ± 2σ. Ovo pravilo važi za sve k, preko jednog. Bienamay-Chebyshev pravilo je vrlo općenito i vrijedi za distribucije bilo kojeg tipa. Određuje minimalni broj posmatranja, udaljenost od koje do matematičkog očekivanja ne prelazi određenu vrijednost. Međutim, ako je distribucija u obliku zvona, pravilo palca preciznije procjenjuje koncentraciju podataka oko očekivane vrijednosti.

Izračunavanje deskriptivne statistike za distribuciju zasnovanu na frekvenciji

Ako originalni podaci nisu dostupni, distribucija frekvencija postaje jedini izvor informacija. U takvim situacijama moguće je izračunati približne vrijednosti kvantitativnih pokazatelja distribucije, kao što su aritmetička sredina, standardna devijacija i kvartili.

Ako su podaci uzorka predstavljeni kao distribucija frekvencije, aproksimacija aritmetičke sredine može se izračunati uz pretpostavku da su sve vrijednosti unutar svake klase koncentrisane na sredini klase:

Gdje - prosjek uzorka, n- broj zapažanja ili veličina uzorka, With- broj časova u distribuciji frekvencija, m j- sredina j razred, fj- odgovara frekvenciji j-th class.

Za izračunavanje standardne devijacije od distribucije frekvencije, također se pretpostavlja da su sve vrijednosti unutar svake klase koncentrisane na srednjoj tački klase.

Da biste razumeli kako se kvartili serije određuju na osnovu učestalosti, razmotrite izračun donjeg kvartila na osnovu podataka za 2013. o raspodeli ruskog stanovništva prema prosečnom monetarnom dohotku po glavi stanovnika (slika 12).

Rice. 12. Udio ruskog stanovništva sa prosječnim novčanim prihodima po glavi stanovnika mjesečno, rublje

Da biste izračunali prvi kvartil niza intervalnih varijacija, možete koristiti formulu:

gdje je Q1 vrijednost prvog kvartila, xQ1 je donja granica intervala koji sadrži prvi kvartil (interval je određen akumuliranom frekvencijom koja prva prelazi 25%); i – vrijednost intervala; Σf – zbir frekvencija cijelog uzorka; vjerovatno uvijek jednako 100%; SQ1–1 – akumulirana frekvencija intervala koji prethodi intervalu koji sadrži donji kvartil; fQ1 – frekvencija intervala koji sadrži donji kvartil. Formula za treći kvartil se razlikuje po tome što na svim mjestima trebate koristiti Q3 umjesto Q1 i zamijeniti ¾ umjesto ¼.

U našem primeru (Sl. 12), donji kvartil je u opsegu 7000,1 – 10 000, čija je akumulirana frekvencija 26,4%. Donja granica ovog intervala je 7000 rubalja, vrednost intervala je 3000 rubalja, akumulirana učestalost intervala koji prethodi intervalu koji sadrži donji kvartil je 13,4%, učestalost intervala koji sadrži donji kvartil je 13,0%. Dakle: Q1 = 7000 + 3000 * (¼ * 100 – 13,4) / 13 = 9677 rub.

Zamke povezane s deskriptivnom statistikom

U ovom postu smo pogledali kako opisati skup podataka koristeći različite statistike koje procjenjuju njegovu srednju vrijednost, širenje i distribuciju. Sljedeći korak je analiza i interpretacija podataka. Do sada smo proučavali objektivna svojstva podataka, a sada prelazimo na njihovu subjektivnu interpretaciju. Istraživač se suočava s dvije greške: pogrešno odabranim predmetom analize i pogrešnom interpretacijom rezultata.

Analiza prinosa 15 vrlo rizičnih investicijskih fondova prilično je nepristrasna. Doveo je do potpuno objektivnih zaključaka: svi zajednički fondovi imaju različite prinose, raspon prinosa fondova kreće se od -6,1 do 18,5, a prosječan prinos je 6,08. Objektivnost analize podataka je osigurana pravilnim izborom zbirnih kvantitativnih indikatora distribucije. Razmotreno je nekoliko metoda za procjenu srednje vrijednosti i raspršenosti podataka, te su naznačene njihove prednosti i nedostaci. Kako odabrati pravu statistiku za pružanje objektivne i nepristrasne analize? Ako je distribucija podataka malo iskrivljena, treba li odabrati medijanu umjesto srednje vrijednosti? Koji indikator preciznije karakterizira širenje podataka: standardna devijacija ili raspon? Treba li isticati pozitivnu iskrivljenost distribucije?

S druge strane, interpretacija podataka je subjektivan proces. Različiti ljudi dolaze do različitih zaključaka kada tumače iste rezultate. Svako ima svoje gledište. Ukupne prosječne godišnje prinose 15 fondova sa vrlo visokim nivoom rizika neko smatra dobrim i prilično je zadovoljan primljenim prihodima. Drugi mogu smatrati da ova sredstva imaju preniske prinose. Dakle, subjektivnost treba nadoknaditi iskrenošću, neutralnošću i jasnoćom zaključaka.

Etička pitanja

Analiza podataka je neraskidivo povezana sa etičkim pitanjima. Trebali biste biti kritični prema informacijama koje šire novine, radio, televizija i internet. S vremenom ćete naučiti da budete skeptični ne samo prema rezultatima, već i prema ciljevima, predmetu i objektivnosti istraživanja. Čuveni britanski političar Benjamin Disraeli je to najbolje rekao: “Postoje tri vrste laži: laži, proklete laži i statistika”.

Kao što je navedeno u bilješci, etička pitanja se javljaju prilikom odabira rezultata koji bi trebali biti predstavljeni u izvještaju. Treba objaviti i pozitivne i negativne rezultate. Osim toga, prilikom izrade izvještaja ili pisanog izvještaja, rezultati moraju biti prikazani iskreno, neutralno i objektivno. Treba napraviti razliku između neuspješnih i nepoštenih prezentacija. Da biste to učinili, potrebno je utvrditi koje su bile namjere govornika. Ponekad govornik izostavlja važne informacije iz neznanja, a ponekad je to namjerno (na primjer, ako koristi aritmetičku sredinu za procjenu prosjeka jasno iskrivljenih podataka kako bi dobio željeni rezultat). Takođe je nepošteno potiskivati ​​rezultate koji ne odgovaraju gledištu istraživača.

Korišteni su materijali iz knjige Levin i dr. Statistika za menadžere. – M.: Williams, 2004. – str. 178–209

Funkcija QUARTILE je zadržana radi kompatibilnosti s ranijim verzijama Excela.