Vidējais pret vidējo un režīmu
Vidējais, vidējais un režīms ir centrālās tendences primārie mēri, ko izmanto aprakstošajā statistikā. Tie ir pilnīgi atšķirīgi viens no otra, un arī gadījumi, kad tos izmanto datu apkopošanai, ir atšķirīgi.
Nozīmē
Aritmētiskais vidējais ir datu vērtību summa, kas dalīta ar datu vērtību skaitu, ti
Ja dati ir no izlases vietas, to sauc par vidējo paraugu (
), kas ir izlases aprakstoša statistika. Lai gan tas ir paraugam visbiežāk izmantotais aprakstošais pasākums, tā nav stabila statistika. Tas ir ļoti jutīgs pret ārējiem un svārstībām.
Piemēram, ņem vērā konkrētās pilsētas iedzīvotāju vidējos ienākumus. Tā kā visas datu vērtības tiek summētas un pēc tam sadalītas, ārkārtīgi turīga cilvēka ienākumi būtiski ietekmē vidējo. Tāpēc vidējās vērtības ne vienmēr labi atspoguļo datus.
Arī mainīga signāla gadījumā strāva, kas iet caur elementu, periodiski mainās no pozitīvā virziena uz negatīvo virzienu un otrādi. Ja mēs ņemam vidējo strāvu, kas iet caur elementu vienā periodā, tas dos 0, kas nozīmē, ka caur elementu nav izgājusi strāva, kas acīmredzami nav taisnība. Tāpēc arī šajā gadījumā vidējais aritmētiskais nav labs rādītājs.
Aritmētiskais vidējais ir labs rādītājs, kad dati ir vienmērīgi sadalīti. Normālam sadalījumam vidējais ir vienāds ar režīmu un mediānu. Tam ir arī vismazākie atlikumi, ņemot vērā vidējo kvadrāta kļūdu; tāpēc labākais aprakstošais pasākums, ja datu kopai ir jāatspoguļo viens skaitlis.
Mediāna
Vidējā datu punkta vērtības pēc visu datu vērtību sakārtošanas augošā secībā tiek definētas kā datu kopas mediāna. Mediāna ir 2. kvartile, 5. decile un 50. procentile.
• Ja novērojumu (datu punktu) skaits ir nepāra, tad mediāna ir novērojums tieši sakārtotā saraksta vidū.
• Ja novērojumu (datu punktu) skaits ir vienāds, tad mediāna ir vidējais no diviem vidējiem novērojumiem sakārtotajā sarakstā.
Mediāna sadala novērojumu divās grupās; ti, grupa (50%) vērtību augstāka un grupa (50%) vērtību zemāka par vidējo. Mediānas tiek īpaši izmantotas šķībajos sadalījumos, un tās atspoguļo datus diezgan labāk nekā vidējais aritmētiskais.
Režīms
Režīms ir visvairāk novērojumu kopas. Datu kopas režīmu aprēķina, atrodot katra kopas elementa biežumu.
• Ja neviena vērtība nenotiek vairāk kā vienu reizi, datu kopai nav režīma.
• Pretējā gadījumā jebkura vērtība, kas notiek ar vislielāko frekvenci, ir datu kopas režīms.
Komplektā var būt vairāk nekā 1 režīms; tāpēc režīms nav unikāla datu kopas statistika. Vienotā sadalījumā ir viens režīms. Diskrētā varbūtības sadalījuma režīms ir punkts, kurā varbūtības masas funkcija sasniedz augstāko punktu. Veicot interpretācijas no augšas, mēs varam teikt, ka globālie maksimumi ir režīmi.
Apsveriet visu trīs pasākumu piemērošanu šādai datu kopai.
DATI: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Vidējais = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25 = 8.12
Mediāna = 9 (13. elements)
Režīms = 9 (9 = 5 biežums)
Kāda ir atšķirība starp vidējo, vidējo un režīmu?
• Aritmētiskais vidējais ir vērtību (novērojumu) summa, kas dalīta ar novērojumu skaitu. Tā nav stabila statistika un ir ļoti atkarīga no normālā sadalījuma rakstura aplūkotajā sadalījumā. Atsevišķs novirze var izraisīt ievērojamas vidējās izmaiņas, dodot salīdzinoši maldinošas vērtības. Jēdzienu var attiecināt uz ģeometrisko vidējo, harmonisko vidējo, svērto vidējo un tā tālāk.
• Mediāna ir novērojumu kopas vidējās vērtības, un to salīdzinoši mazāk ietekmē ārējie rādītāji. Tas var dot labu novērtējumu kā apkopojošo statistiku ļoti novirzītos gadījumos.
• Režīms ir visbiežāk novērotās datu kopas vērtības. Ja sadalījums ir pozitīvs, tad režīms paliek atstāts mediānai, un, ja tas ir negatīvs, režīms atrodas tieši pret mediānu.
• Ja pozitīvi tiek novirzīts, vidējais ir pareizs pret mediānu; ja negatīvi novirzītais vidus ir pa kreisi no mediānas.
• Normālā sadalījumā visi trīs, vidējais, režīms un mediāna ir vienādi.