Matematika | Statisztika » Statisztika jegyzet, 2001

Alapadatok

Év, oldalszám:2001, 38 oldal

Nyelv:magyar

Letöltések száma:987

Feltöltve:2006. augusztus 08.

Méret:224 KB

Intézmény:
-

Megjegyzés:

Csatolmány:-

Letöltés PDF-ben:Kérlek jelentkezz be!



Értékelések

11110 igor 2011. február 03.
  Tiszta és érthető, jól meg van írva, sajnos nem látszanak a képletek (beillesztett képek).

Tartalmi kivonat

Statisztika jegyzet Alapfogalmak, statisztika leírása. Magyarországon 1884-től van statisztika, messze vissza lehet menni a kutatásban. Statisztikai havi kiadványok manapság havonta jelennek meg, melyek egymásra épülő információt tartalmaznak. A statisztika más tudományokkal is kapcsolatban áll: - matematikai módszerek - managertudományok - pénzügyi-tudománya - marketing (piackutatás) Statisztika: tömegesen előforduló jelenségekre, folyamatokra vonatkozó számszerű információk összegyűjtésének, leírásának, elemzésének, értékelésének és közlésének tudományos módszertana. A definícióban igen fontos hangsúlyt kap a tömeges jelző, ugyanis a statisztika csak nagy számban előforduló jelenségek, folyamatok vizsgálatából tud levonni következtetést. Három ága van: 1.) leíró statisztika: alapvetően a numerikus információk összegyűjtése, az információk összegzése, egyszerűbb számítások, elemzéseket

készítünk. 2.) Következtetéses statisztika: a jövőre mutató információk előrejelzése Segítségével a jelenségekre, folyamatokra vonatkozóan olyan megállapításokat tehetünk, amelyek nem csak a közvetlen megfigyelésen alapulnak. 3.) Statisztikai döntéselmélet: a véletlen környezet által bekövetkező események figyelembevétele mellett, több lehetséges cselekvési lehetőség közül az optimálisnak vélt kiválasztáshoz ad számszerű információkat. Matematikai módszerek, segítő tudományág. Statisztikai sokaság Statisztikai sokaság: a statisztikai megfigyelés tárgyát képező egyedek összessége. Amit éppen megfigyelünk (pl.: magyar lakosság) Mindig az a sokaság, amit vizsgálunk. A sokaság legkisebb egyedeit egységeknek nevezzük. A sokaság lehet: - álló, azaz eszmei időpontra vonatkozó érték, állapotot fejez ki, élőlényekből, tárgyakból, szervezetekből állhat. Az adatok időpontra vonatkoztatva

értelmezhetőek. - mozgó, intervallumot foglal magába, folyamatot fejez ki. Az álló és a mozgó sokaság nem függetlenek egymástól. A sokaság tartalmazhat véges és végtelen számosságú egyedeket: - Véges, akkor, ha megszámlálható, tehát ha területileg és időben pontosan körülhatárolhatók a sokaságok. - Végtelen, abban az esetben fordul elő, amikor valaminek sokféle vége lehet. A sokaságot vizsgálhatjuk úgy is, ha minden egyedét figyelembe vesszük, de vizsgálhatjuk bizonyos részét: - Alap, ez egy teljeskörű megfigyelés. Pl: a pécsi egyetemi hallgatók = alapsokaság. Teljes körű megfigyelést hajtunk végre - Rész, ez pedig egy mintát jelöl. FEEFI hallgatók = részsokaság A megfigyelés a sokaságnak csak meghatározott egyedeire terjed ki, azaz részleges megfigyelés. Statisztikai ismérv Statisztikai ismérv (tulajdonság): A sokaság egységeinek tulajdonsága, jellemzője. Azokat az ismérveket, amelyek a statisztikai

sokaság valamennyi egyedére jellemzőek, definiálják a sokaságot, közös ismérveknek nevezzük. Azokat az ismérveket, amelyek szerint az egyedek különböznek egymástól megkülönböztető ismérveknek nevezzük. Az ismérvek megjelölésére gyakran a változó kifejezést használják. Ismérv típusai: 1.) időbeli = a sokaságot időbeli tulajdonság alapján vizsgálom (különböző időpontokban. 2.) Területi = összehasonlítom, hogy különböző megyékben hányan élnek 3.) Minőségi = férfiak/nők, kisteljesítményű/nagyteljesítményű (milyenség) minőségi jegyekkel, fogalmakkal jellemzi. 4.) Mennyiség = darabszám alapján vizsgáljuk az adatokat, számszerű adatok 5.) Alternatív ismérv = ha két lehetséges ismérv közül tudunk csak választani (férfi/nő) harmadik nincs. Ismérvek kapcsolata: ha az egyik ismérv egyértelműen meghatározza a másik ismérv egy konkrét változatához való tartozást, függvényszerű kapcsolatról

beszélünk. a.) függetlenség, ha semmiféle összefüggést nem vélünk felfedezni, pl: autótípus ez egy ismérv és sikerül-e a nyelvvizsga ⇒ függetlenek egymástól. b.) függvényszerű, ha két ismérv között egy összefüggés függvényszerűen felírható. c.) Sztochasztikus kapcsolat valószínűségi jelleggel megy végbe, ami azt jelenti, hogy az egyik ismérvből következik a másik. (pl: ha valaki tanul a vizsgára, akkor valószínű, hogy átmegy). A sztochasztikus kapcsolatnak 3 formája van, attól függ, hogy milyen ismérvek vannak benne: - asszociációs kapcsolat (az ok és az okozat is minőségi ismérv) Pl.: valaki volt külföldön vagy nem, illetve van-e nyelvvizsgája, avagy nincs. Azaz a minőségi ismérvek kapcsolata - Vegyes kapcsolat (az ok minőségi, az okozat mennyiségi ismérv) pl: minőségi=férfi vagy nő, mennyiségi= mennyi a fizetése. - Korrelációs kapcsolat ( az ok és az okozat is mennyiségi ismérv) pl: ok=áruház

alapterülete, okozat=áruház forgalma. Azaz a kapcsolatot mennyiségi ismérvek közvetítik. Adat, mutatószám, modell A statisztika számadatokkal dolgozik, melyekhez számlálás, mérés útján jutunk. Statisztikai adat: statisztikai ismérvvel definiált szám. Olyan tapasztalati, empirikus szám, amely mérés, vagy számlálás útján keletkezik. A statisztikai adat a sokaság valamilyen számszerű jellemzője.Azt mondom, hogy 50=szám, ha 50 hallgató, akkor ez már egy adat. A statisztikai adatok között megkülönböztetünk abszolút és származtatott adatokat. Az abszolút adatok számlálás, mérés útján jönnek létre. A származtatott adatokhoz az abszolút adatokkal végzett műveletek segítségével juthatunk. Statisztikai mutatószám: Nem minden adat mutatószám, de minden mutatószám adat. A rendszeresen elemzésére, ismétlődő jellemzésére társadalmi, szolgáló gazdasági statisztikai jelenségek mérőszámokat

statisztikai mutatószámoknak nevezzük. Származtatott szám, két adatból származtatjuk, a mindennapi életben előforduló adatok. Pl: inflációs ráta = mutatószám A valóság leképzése, a valóság mása. Egy vállalat működését is lehet Modell: modellezni. A valóság formalizált, szimbolikus ábrázolását a statisztikai modellekben egyenletek, egyenletrendszerek segítségével adjuk meg. A statisztikai adatoknak minőségi követelményeknek is meg kell felelni: - pontosság - áttekinthetőség - gazdaságosság - gyorsaság Ezek a követelmények jellemzők a mutatószámra és a modellre is egyaránt. Adatokat, mutatószámokat különböző skálákon lehet mérni: - Nominális (név szerinti). A számok csak az azonosítást szolgálják, amelyek segítségével elvégezhető a jelenségek, folyamatok osztályozása. Nominális skálát alkalmazunk tipikusan a minőségi ismérv szerinti megfigyeléseknél. Pl: nemek, hajszín, rendszám

stb. - Ordinális (itt már rangsor van a dolgok között). Sorrendiségre vonatkozó relációk alapján rangsorba rendezzük a megfigyelt objektumokat, egyedeket. - Intervallum-skála (alsó-felső határa van a dolgoknak, pl.: hőmérséklet) Tartalmazza azokat a számértékeket, amelyek jellemzik az egyes egyedek értékeit. Nem rendelkezik igazi zéró ponttal, ez azt jelenti, hogy a zéró pont meghatározása önkényes. - Arányskála (amikor valamihez viszonyítunk, pl: fizetés összehasonlítása) Az adatokat célszerű csoportosítani, illetve összehasonlítani egymással. Csoportosításról akkor beszélünk, ha valamilyen tulajdonság alapján csoportosítunk. Fontos a besorolhatóság és az egyértelműség. - statisztikai sorok, melyeket jellemezhetünk idő, minőség, mennyiség szerint is. Beszélhetünk területi sorról is. - statisztikai táblák Összehasonlítás: - különbség: kivonjuk őket egymásból - hányados: elosztjuk őket

egymással. Leíró statisztika Statisztikai sor: a statisztikai adatok valamely szempont szerinti felsorolása. Fajtái: - egy sokaságra vonatkozó (pl.: munkanélküliség alakulása) - az ismérv fajtája szerint: a.) idő (állapot/tartam) pl: nyilvántartott munkanélküliek 1996-ban az egyes hónapok alapján. b.) területi pl: a munkanélküli ellátásban részesültek száma megyénként 1996 december 31-én. c.) minőségi pl: nappali tagozaton végzettek oktatási szintenként 1995-ben d.) mennyiségi (diszkrét és folytonos ismérv), pl: családok száma a gyermekek száma szerint 1996. január 01-jén - keletkezési mód szerint: (összehasonlító/csoportosító) - több sokaságra vonatkozó: leíró (pl.: bp-i könyvtárak jellemzői) Statisztikai tábla: ha két sort összefésülünk, abból tábla lesz. A statisztikai sorok összefüggő rendszere. A tábla fontos formai elemei: - cím (mi van a táblában) - forrás (honnan vettük) - magyarázó

szöveg - dimenziószám jellemzi a táblákat A statisztikai táblának három típusa van: 1.) egyszerű, ha nincs összesítő rész, azaz összeadás 2.) csoportosító, ha az egyik sornak summa rovata van, azaz csak az egyik ismérv szempontjából végeztünk csoportosítást. 3.) kombinációs, ha minden sort össze lehet adni, azaz amelyekben az adatokat legalább két ismérv alapján csoportosítjuk. A viszonyszámok A statisztikai elemző munkában gyakorta kell élnünk a származtatott számok használatával, amelyek képesek az arányok szemléltetésére, a változások, különbségek relatív nagyságának kimutatására. Viszonyszám: Két egymással kapcsolatban álló statisztikai adat hányadosa. A viszonyszám általános definíciója: V = viszonyszám. A = viszonyított adat B = viszonyítási alap V= Ötféle viszonyszámot ismerünk: 1.) megoszlási, amely mindig részadatot viszonyít a teljes sokasághoz Az egyes csoportok elemszámának a

teljes sokaság nagyságához viszonyított aránya. A megoszlási viszonyszám a sokaság belső szerkezetének, struktúrájának kimutatására, elemzésére alkalmas származtatott számérték. Pl: az egyes megyék lakosságát viszonyítom a főváros lakosságához. n = mindig az elemek száma, azaz az összesen rovat adata 2.) koordinációs viszonyszám: részsokaságot részsokasághoz hasonlít Amennyiben az egyes csoportok elemszámát nem a teljes sokasághoz, hanem valamelyik csoport nagyságához viszonyítjuk, akkor koordinációs viszonyszámot számítunk. Pl.: 1000 férfira jutó nők, vagy 1000 nőre jutó férfiak száma azaz Baranya megye lakossága Budapest lakosságának 20%-a. 3.) Dinamikus viszonyszámok, melyek két időszak vagy időpont adatainak hányadosai, fontos szerepet töltenek be a statisztikai elemző munkában. A viszonyítás alapját képező időpontot, időszakot bázisidőszaknak, míg a viszonyítás tárgyát tárgyidőszaknak

szokták nevezni. Amennyiben kettőnél több időszak vagy időpont adataival rendelkezünk, a viszonyítás alapja lehet állandó és változó. Ha a viszonyítás alapja állandó, akkor bázisviszonyszámról beszélünk. Amennyiben változó a viszonyítás alapja, abban az esetben mindig a megelőző időszak (időpont) adatát tekintjük viszonyítási alapnak, ebben az esetben láncviszonyszámot számítunk. A bázisviszonyszám a változás relatív mérésére, míg a láncviszonyszám a változás üzemének nyomon követésére nyújt alapot. GYAKORISÁGI SOROK A mennyiségi ismérvek nagy szerepet játszanak a statisztikai gyakorlati tevékenységben és módszertanában egyaránt. A mennyiségi ismérvek folytonos és diszkrét változók lehetnek - a folytonos ismérvek bármilyen értéket felvehetnek - a diszkrét ismérv változatai csak meghatározott (véges számú) számértékek, elkülönített számok lehetnek. A mennyiségi ismérvnek

formalizált kifejezését is adhatjuk. Egy n elemű sokaság egyedei x1, x2, x3 . xn mennyiségi ismérveket vehetnek fel Szemléltető példa egy cég napi ügyfélforgalmának 30 egymás után következő munkanapon mért adatsora. A jelenség megismerésében az első lépés, ha a csoportosítatlan adatokat valamilyen szempont szerint rendezzük. A legegyszerűbb ilyen rendezés egy rangsor felállítása lehet Mégpedig rendezzük növekvő sorrendbe a naponta mért ügyfélforgalmat. A példában kis elemszám esetén még könnyű a sorbarendezés, azonban nagyobb sokaság esetén – amely a statisztikában gyakoribb – nem tesz lehetővé gyors értékelést. A mennyiségi ismérvek alapján végzett adatrendezés, adat-tömörítés legelterjedtebb módja a gyakorisági sorok képzése. Az előfordulások gyakorisága: fi A gyakorisági sor a mennyiségi ismérv változatainak a gyakoriságok segítségével történt felírása. A gyakoriságokból számíthatunk

megoszlási viszonyszámokat, amiket relatív gyakoriságoknak (jele: gi) nevezünk. Segítségükkel felírt mennyiségi sort relatív gyakorisági sornak hívjuk. Az előzőekben bemutatott ügyfélforgalmi adatokból gyakorisági sort készítünk. Ez a gyakorisági sor már tömörebb formában reprezentálja az információkat. Amennyiben nagyszámú ismérvértékkel rendelkezünk, célszerű osztályközök kialakítása, amelyek jól tömörítik információveszteséget. a jelenség információtartalmát, de nem eredményeznek Az osztályközök számának meghatározása: Ahol: k – az osztályközök száma n – a sokaság elemszáma Az osztályközök számának ismeretében az egyes osztályközök hosszát az alábbi módon közelíthetjük: Ahol: h – az osztályköz hossza Xmax – a legnagyobb ismérvérték Xmin – a legkisebb ismérvérték Az osztályközös gyakorisági sorok készítésénél fokozott figyelmet igényel a

osztályközhatárok megállapítása is. Nagyon fontos, hogy a határok tegyék lehetővé az egyértelmű besorolást. Kifejezésre kell juttatni, hogy egy adott határérték mely osztályközbe tartozik. A leírt gyakorisági sorban az alsó és a felső intervallum ún. nyitott intervallum A nyitott intervallumokat úgy kezeljük, mintha zártak lennének, tehát az első intervallumot ugyanolyan hosszúságúnak tételezzük fel, mint az őt követőt. A gyakorisági sorok szemléltetése: háromféle grafikus ábrát használhatunk. 1.) Hisztogram, az a grafikus ábra, mely derékszögű koordinátarendszerben hézag nélküli oszlopdiagramm segítségével szemlélteti a gyakorisági sorokat. Egyenlő hosszúságú osztályközök esetén az ábrázolás nem okoz gondot, mivel csupán az oszlopok magasságára kell figyelni. 2.) Gyakorisági poligon: folytonos ismérvértékek alapján készült gyakorisági sort vonaldiagrammal is lehet ábrázolni. Ez a gyakorisági poligon

mindig elkészíthető, ha osztályközös gyakorisági sorról van szó. 3.) gyakorisági görbe: abban az esetben használjuk, amikor igen nagy elemszámú sokaság nagyszámú osztályközét tekintve a poligon és a hisztogram tovább finomítható. A megoszlási viszonyszámok segítségével relatív gyakorisági sor is készíthető. Mind a gyakorisági sor, és mind a relatív gyakorisági sor értékei halmozottan összegezthetők. Kumulált gyakoriságot képezünk így, melynek jele: , amely azt mutatja, hogy az adott osztályköz felső határának megfelelő vagy annál kisebb ismérvérték hányszor fordul elő, vagyis hány esetben teljesül az egyenlőtlenség. Az így készült sort alulról kumulált sornak nevezzük. Fordított esetben is van ennek létjogosultsága, amit felülről történő kumulálásnak nevezünk. A kumulált gyakorisági illetve relatív gyakorisági értékeket is ábrázolhatjuk hisztogram segítségével. Mennyiségi ismérvek

segítségével előállítható még egy mennyiségi sor típus az ún. értékösszegsor. Az értékösszegsor tartalmazza a mennyiségi ismérv változatait, számértékek vagy osztályközök formájában (xi), valamint a hozzájuk rendelhető értékek összegeit (si). KÖZÉPÉRTÉKEK Az adatok rendezése, csoportosítása megkönnyíti a megértést. A számszerű információk azt is lehetővé teszik, hogy tömör jellemzést adjunk, egyetlen számadatba sűrítsük őket. Ezt a számadatot középértéknek nevezzük. Középérték = az azonos fajta adatok tömegének számszerű jellemzője. Egy sokaságot egy értékkel fejezünk ki A középértéknek két nagy csoportját különböztetjük meg: 1.) számított középértékek (átlagok) - számtani átlag - harmonikus átlag - mértani átlag - négyzetes átlag 2.) helyzeti középértékek - módusz - médián 1.) Számított középértékek (átlagok) Számtani átlag: A számtani átlag az a

szám, amelyet az átlagolandó értékek helyébe téve azok összege azonos marad. A számtani átlag a megfigyelt értékek összegének és az elemek számának hányadosa. A számtani átlag közepes értéket vesz fel, szemléletes és jól értelmezhető A számtani átlagtól mért eltérések algebrai összege zéró. A gyakorlatban sokszor kell gyakorisági sorból számtani átlagot számítani. A számtani átlag nagyságát két tényező határozza meg: 1.) az átlagolandó értékek (abszolút) nagysága 2.) a súlyok viszonylagos nagysága, más szóval a súlyarányok Harmónikus átlag: Harmónikus átlag az a szám, amelyet az átlagolandó értékek helyébe téve, azok reciprokainak összege változatlan marad. Ez egy fordított arányosság A harmónikus átlagot elsősorban olyan esetekben alkalmazzuk, ha értelmezhető az átlagolandó értékek reciprok értékeinek összege. A gyakorisági sor adataiból harmónikus átlagot általában akkor számítunk, ha

az átlagolandó értékeket az értékösszegekkel súlyozzuk, mivel közvetlenül ezek állnak rendelkezésünkre. Mértani átlag: A mértani vagyis geometriai átlag az a szám, amelyet az átlagolandó számértékek helyébe téve azok szorzata változatlan marad. Az eredeti értékek helyére írva, a szorzatok összege nem változik. A mértani átlagot elsősorban akkor használjuk, ha az átlagolandó értékek között szorzatszerű viszony van. Négyzetes átlag: A négyzetes, azaz kvadratikus átlag az a szám, amelyet az átlagolandó számértékek helyébe téve azok négyzetösszege változatlan marad. A négyzetes átlagot meghatározhatjuk úgy is, ha az átlagolandó értékek négyzeteinek számtani átlagából négyzetgyököt vonunk. A négyzetes átlagnak kifejezetten nagy szerepe van a szórás számítása során. 2.) Helyzeti középértékek Medián: Medián = közepes érték. A medián a mennyiségi ismérvnek azon értéke, amelynél ugyanannyi

kisebb, mint amennyi nagyobb érték fordul elő. A medián meghatározásához az összes megfigyelt értéket figyelembe vesszük. Ha az összes xi értéket ismerjük, akkor első lépésként, ahhoz, hogy meghatározzuk a medián értékét, a számértékeket rangsorba rendezzük: - ha n páratlan, akkor az (n+1)/2 sorszámú egyed ismérvváltozatának értéke lesz a medián, - ha n páros, akkor az n/2 és (n/2)+1 egyed ismérvváltozatainak egyszerű számtani átlaga lesz a medián. A mediánt osztályközös gyakorisági sorból csak becsülni tudjuk, ennek számítási módja: A fenti becslés az osztályköz arányos osztását jelenti. Módusz: A módusz az ismérvértékek tipikus, leginkább jellemző értékét jelöli. - Diszkrét értékekkel rendelkező mennyiségi ismérv módusza a sokaságban leggyakrabban előforduló ismérvérték. Gyakorisági sorban nem jár különösebb nehézséggel a módusz meghatározása, csak le kell olvasni a leggyakrabban

előforduló ismérvértékeket. - Folytonos mennyiségi ismérv módusza az az érték, amely körül az előforduló értékek legjobban sűrűsödnek, ahol a gyakorisági görbe maximuma van. A módusz meghatározására osztályközös gyakorisági sor esetén nincs mód, értékét csak közelítőlegesen határozhatjuk meg, illetve csak becsülni lehet. - Az osztályközös gyakorisági sor esetében a módusz becslése az ún. modális osztályköz meghatározásával kezdődik. A modális osztályközt csak egyenlő hosszúságú osztályközök esetén tudjuk rögtön meghatározni. Ha az osztályközök nem egyenlők, akkor korrekciókat kell végezni, azaz át kell számolni a gyakoriságokat azonos hosszúságú osztályközre. - A modális osztályköz kijelölése után azt az értéket kell meghatározni az intervallumon belül, amely az értékek sűrűsödési helyének tekinthető. Ehhez segítséget adnak a modális osztályközzel szomszédos

osztályközök gyakoriságai. - A móduszt megbecsülhetjük, ha a modális osztályköz hosszát a gyakoriságok különbségei alapján arányos osztással felosztjuk és az így kapott értéket a modális osztályköz alsó határához hozzáadjuk. A becslés képlete: KVANTILISEK A kvantilis értékek a mennyiségi ismérv értékeinek rendezésére szolgálnak, számszerű információk alapján segíti az eligazodást. A kvantilisek nem tartoznak szorosan a középértékekhez, de egyik nevezetes kvantilis érték a medián. Ha egy rangsorba rendezett sokaságot 2,3,4.k sokaságot egyenlő részre osztjuk, az osztópontoknak megfelelő ismérvértékeket kvantilisnek hívjuk. Fontosabb kvantilis érték, amelyeknek sajátos elnevezése van: - Medián Me - Tercilis Tj - Kvartilis Qj - Kvintilis Kj - Decilis Dj - Percentilis Pj A kvantilis értékek közül gyakran találkozunk a kvartilis (Qj) értékkel. A kvartilisek használata során általában a felső

kvartilisre (Q3), illetve az alsó kvartilisre (Q1) gondolunk, mivel Q2 = Me. Ezek szerint a kvartiliseket a mediánnál kisebb, illetve nagyobb értékek mediánjaiként is felfoghatjuk. A kvantilisek meghatározásának módszere azonos a mediánnál megismert eljárással. Amennyiben a sorszám nem egész szám, a két szomszédos adat egyszerű számtani átlaga a kvantilis érték. SZÓRÓDÁSI MÉRŐSZÁMOK Az előzőekben megismerkedtünk a középértékekkel és láttuk, hogy segítségükkel a sokaságot tömören jellemezhetjük. Mivel a valóságot tükröző számadatok általában különböznek egymástól és eltérnek a jellemzésükre használt középértékektől, ezért ezt a különbséget is vizsgálni kell. Szóródásnak nevezzük a statisztikában az adatok (általában a mennyiségi ismérvértékek) eltérését egymástól, vagy a sokaság egészét jellemző értéktől. A statisztikában fontos helyet foglal el a szóródás vizsgálata. Az

egymástól eltérő, tehát szóródó adatok egy-egy középértéktől, így a számtani átlagtól, mint közepes értéktől is eltérnek. A szóródás hiánya esetén megfogalmazódik az a követelmény, hogy a szóródást mérő mutatószám értéke nulla legyen, a szóródás megléte esetén nullától különböző számérték legyen. 1.) szóródás terjedelme: (T) 2.) interkvartilis terjedelem: (TQ) 3.) Átlagos eltérés (δ) (kis delta) és variancia (szórásnégyzet) (σ2) 4.) Szórás (σ) 5.) Relatív szórás (V) A szóródás terjedelme: Maga a szóródás terjedelme az előforduló legnagyobb és legkisebb érték különbsége: T = xmax - xmin Az ügyfélforgalmi példában a szélső értékek 25 fő/nap és 78 fő/nap volt, így T = 78-25 = 53 fő/nap. Amennyiben osztályközös gyakorisági sorral dolgozunk, és az alsó illetve a felső intervallumok nyitottak, a legnagyobb és a legkisebb osztályközepet használhatjuk fel. A szóródás

terjedelme mérésének hátránya, hogy csak a szélső értékekre épít, így egy-egy kiugró érték esetén nagyságát a véletlen szerepe számottevően befolyásolhatja. Interkvartilis terjedelem: Az interkvartilis terjedelem mutatója azt próbálja meg kiküszöbölni, hogy a szóródás terjedelménél említett egy-egy kiugró érték számottevően ne befolyásolja az érték nagyságát. Az interkvartilis terjedelem azt az intervallumot jelöli, ahol az összes érték középső 50%-a helyezkedik el. Az interkvartilis terjedelem képlete: TQ = Q3 – Q1 Az ügyfélforgalmi példában a megfigyelt napok 75%-ában 61 főnél kevesebb ügyfél, míg a napok 25%-ában 41 főnél kevesebb ügyfél jelent meg a cégnél. Az interkvartilis terjedelem: TQ = 61-41=20 fő/nap Átlagos eltérés: Az átlagos (abszolút) eltérés épít arra a gondolatmenetre, hogy a számértékeknek egy középértéktől való eltéréseiből következtetni tudunk a szóródás

nagyságára. Az értékeknek a számtani átlagtól mért eltérése közvetlenül nem használható, mivel azok összege nulla, Σ (xi - ) = 0 Ezért csak az eltérések abszolút értékeiből számított átlagnak van értelme: Átlagos eltérést gyakorisági sor adataiból és osztályközös gyakorisági sorból is számíthatunk. Szórás: Az egyes értékek számtani átlagtól való eltéréseinek négyzetes átlagát szórásnak nevezzük. Ha a gyakorisági sorból számítjuk a szórást, a mutatószám súlyozott formáját kell alkalmazni. A szórás négyzetét varianciának nevezzük. Önálló tartalommal bír, bizonyos statisztikai eljárásokban fontos szerepet tölt be. Szinte valamennyi összetett statisztikai módszer épít erre a mérőszámra. A szórás mutatószáma a szóródás mérésének elsőrendű fontossággal bíró eszköze. Nem szabad összekeverni a szóródás és a szórás fogalmát! A szórás kiszámításához szintén az

ügyfélforgalmi példát vesszük alapul. Relatív szórás: A szóródás eddig megismert mérőszámai a mennyiségi ismérv mértékegységében fejezik ki a szóródás nagyságát. Viszont sok esetben szükség van arra, hogy a mértékegységektől függetlenül összehasonlíthatóvá tegyük a különböző jelenségek, különböző mértékegységben kifejezett szóródását (pl: a teljesítmények szóródását összevethessük a bérek szóródásával egy adott gazdasági egységnél. A megoldást az adja, ha a szóródási mérőszámot egy középértékhez, általában a számtani átlaghoz viszonyítjuk. A leggyakrabb a relatív szórást használja az informatika. Képlete: Tehát a relatív szórás kifejezi azt, hogy az egyes értékek átlagosan hány %-kal térnek el az átlagtól. EMPIRIKUS ELOSZLÁSTÍPUSOK, ASZIMMETRIA MÉRÉSE A gyakorisági sorok formája igen fontos információt szolgáltat a vizsgált jelenségről. Ha a gyakorisági sorokat

ábrázoljuk, akkor megállapítható, hogy a görbék igen változatosak lehetnek. Rendkívül nagy jelentősége van azoknak a görbéknek, amelyek valamelyik ismert elméleti eloszlás empirikus megfelelői. Az eligazodást nagymértékben segíti, ha az osztályok főbb típusait megismerjük. Az empirikus eloszlást két nagyobb csoportba soroljuk: 1.) egymóduszú eloszlás - szimmetrikus - aszimmetrikus 2.) többmóduszú eloszlás - U alakú eloszlás - M alakú eloszlás Tehát az egymóduszú gyakorisági sorok lehetnek szimmetrikusak és aszimmetrikusak. A szimmetrikus eloszlások esetén: A grafikus ábrája a módusz értékénél felvehető tengely körül szimmetrikus. Szimmetrikus eloszlásoknál a módusz, a medián és számtani átlag egyenlő egymással. Szimmetrikus eloszlású pl: a felnőtt férfiak és nők testmagasság szerinti megoszlása, vagy egy adott munkahelyen a teljesítménybérben dolgozók egyéni teljesítményének eloszlása.

Aszimmetrikus eloszlások esetén: A módusz valamely szélső értékhez esik közelebb. A három alapvető középérték nagyságrendje jellemzi a ferdeséget. Megkülönböztetünk bal oldali asszimetriát, ahol: és jobb oldali asszimetriát, ahol a nagyságrendi reláció: A görbék két típusa: A ferde, aszimmetrikus eloszlások közül a gazdasági életben a jobb oldali a gyakoribb, pl.: a vállalatok nagyság szerinti eloszlása, továbbá a keresetek, jövedelmek eloszlása A bal oldali aszimmetria esetén a viszonylag magasabb értékek nagyobb gyakorisággal fordulnak elő, pl.: halálozások életkor szerinti megoszlása Egymóduszú gyakorisági sorok esetén az aszimmetria mérése: Többféle mutatószámot használnak, de ezeknek vannak közös jellemzőik: - értékük nulla legyen, ha az eloszlás szimmetrikus, - jobboldali aszimmetria esetén pozitív, míg ellenkező esetben negatív értéket vegyenek fel, - dimenzió nélküliek legyenek. Az

aszimmetria mérőszáma: (jele: A) A mutatószám azon a tényen alapul, hogy szimmetrikus eloszlásoknál a számtani átlag és a módusz értéke biztosan megegyezik. Szimmetrikus eloszlás esetén a mutató értéke nulla, jobboldali aszimmetriánál pozitív, baloldali aszimmetria esetén negatív az előjele. A KONCENTRÁCIÓ MÉRÉSE Koncentráción a gazdasági életben lévő tömörüléseket, összpontosulásokat értjük. Maga a koncentráció a gazdasági folyamatokat és azok eredményeként létrejött állapotokat jellemzi. Beszélhetünk pl: a termelés, a forgalom, a beruházások koncentrációjáról, de a jövedelmek, a vagyon, a munkavállalói létszám koncentrációjáról is beszélhetünk. A koncentrációt a gyakorisági, a mennyiségi sorok alapján mérhetjük. Amennyiben a relatív gyakoriságok nagy értékeihez alacsony relatív értékösszegek tartoznak (és fordítva) a koncentráció meglétéről beszélünk. A koncentráció jelenléte:

Erről gyorsan tájékozódhatunk, ha a sokaságot egy mennyiségi ismérv szerint csoportosítjuk és egy statisztikai táblán helyezzük el a kumulált relatív gyakoriságokat és a kumulált relatív értékösszegeket. Ugyanis a kumulált gyakoriságok és értékösszegek szemléletesen fejezik ki a koncentráció létét. Nagyfokú a koncentráció, ha a sokaság nagy hányadához a teljes értékösszeg kis hányada tartozik. A koncentráció ábrázolására és elemzésére szolgáló speciális grafikus ábrát, megalkotójáról, Lorenz-görbének hívjuk. A Lorenz-görbe egységoldalú négyzetben elhelyezett ábra, amely a kumulált relatív gyakoriságok (gi) függvényében ábrázolja a kumulált relatív értékösszegeket (zi). Amennyiben a kumulált relatív gyakoriságok és a kumulált relatív értékösszegek rendre megegyeznek (gi = zi), akkor a koncentráció hiányáról beszélünk. Ebben az esetben a négyzet átlója egybeesik a görbével. Teljes

koncentráció esetén a görbe egybeesik a koordinátatengelyekkel. Ábra: CSOPORTOSÍTOTT ADATOK ÁTLAGA, SZÓRÁSA Az előzőekben megismert viszonyszámok, középértékek és szóródási mérőszámok számításának módszeréből következik, hogy a sokaság homogén. Azonban az ember a gyakorlatban többször találkozik olyan problémával, amikor a vizsgálandó sokaság heterogén, azaz összetett. Az általánosságban heterogénnek nevezzük a sokaságot, ha valamilyen ismérv alapján viszonylag homogén részekre (csoportokra) bontható. A foglalkoztatottak vizsgálata során gyakran észlelhetjük, hogy a foglalkoztatottak keresetük szerint nem egységes, homogén sokaságot alkotnak. Például szakképzettség vagy a nemek szerint csoportosítva a keresetek szempontjából homogénebb, egyneműbb csoportok képezhetők A számtani átlag és szórás számítási sajátossága csoportosított sokaság esetén: Fontos információkat szolgáltatnak a csoportok

mérőszámai, amelyeket a már megismert módszerekkel határozhatunk meg. Az átlag és a szórás számítását egy példa segítségével tudjuk illusztrálni. Egy népességcsoportban (2000 főt megkérdezve) vizsgálták a televíziózás szokásait, egy kereskedelmi televíziónál. A napi TV-nézés időtartamára az alábbi adatokat kapták: A homogénebb csoportokban (férfi, nő = részsokaságokban) a számtani átlagot és a szórásokat is a korábban megismert módon számították ki. Ebben a példában a nemek csoportképző ismérvek. Ezek segítségével homogén csoportok jöttek létre, és ezen csoportok átlagos értékei ugyanúgy kezelhetők, mintha egy mennyiségi ismérv értékei lennének, azaz a számtani átlag számításának szabályai szerint átlagolhatók. A főátlag a csoportátlagok számtani átlaga A csoportosított sokaságban a teljes sokaságra vonatkozóan kiszámítható szórás nem közvetlenül származtatható a részsokaságok

szórásaiból. A heterogén (teljes) sokaság egy-egy megfigyelt számadata (pl.: adott egyén TVnézésének időtartama) eltérhet a saját csoportjának átlagától és egyben a főátlagtól is A csoportok átlagai is eltérnek a főátlagtól. Az eltérések képlete: A csoportokon belüli szórások (egyes megfigyelt értékek átlagos eltérései saját csoportátlaguktól) milyen nagyságrendűek: Ezt a belső szórás vagy a belső szórásnégyzet (variancia) mutatójával számszerűsíthetjük. A belső szórásnégyzet meghatározható a csoportok szórásnégyzetének átlagaként. Képlet: A belső szórás – mivel csak a csoportokon belüli eltéréseket fejezi ki – nem egyezik meg a teljes szórással. A heterogén sokaság esetén az adatok szóródásában számolni kell a csoportok átlagainak szóródásával is, amit a külső szórás illetve külső szórásnégyzet (variancia) fejez ki. Képlet: A kétféle megközelítéssel mért szórás

lehetőséget ad arra, hogy az egész sokaság szórását a teljes szórást is meghatározzuk. Tehát a teljes szórásnégyzet egyenlő a belső szórásnégyzet és a külső szórásnégyzet összegével: STANDARDIZÁLÁS Az előzőekben láthattuk, hogy a főátlagot a részátlagok súlyozott számtani átlagaként is meghatározhatjuk. Tehát a főátlag nagyságát két tényező határozza meg: 1.) a részátlagok nagysága 2.) részsokaságok súlyaránya A csoportosított sokaság esetén szükségünk lehet két főátlag összehasonlítására. Az összehasonlítás történhet térben és időben. - térbeni összehasonlítás esetén a főátlagok különbözőségét - időbeni összehasonlítás esetén a főátlagok változását vizsgáljuk. A főátlagot az átlagolandó értékek nagysága és a súlyarányok határozzák meg, időbeni és térbeni összehasonlítás esetén ezeknek a tényezőknek a hatását számszerűsítjük. Pl: egy cégnél

dolgozók átlagos keresetének alakulása függ a különféle szakképzettségű, beosztású dolgozók tényleges keresetének változásától, de ugyancsak függvénye a fősokaság összetételének. A főátlagok összehasonlítása során, a nagyságukat befolyásoló tényezők hatásának számszerűsítésére szolgáló módszert standardizálásnak nevezzük. A térbeni összehasonlítást a főátlagok különbségével, az időbeli összehasonlítást a főátlagok hányadosával végezzük el. A főátlagok hányadosát indexszámnak hívjuk Az indexszám valamilyen szempontból együvé tartozó adatok együttes relatív átlagos változását (különbözőségét) mutatja meg. A főátlagok összehasonlításánál a két tényező hatását is indexekkel mutatjuk ki, és ezen indexek együttesét, standardizáláson alapuló indexkörnek szokás nevezni. Az indexkör tagjai: - főátlagindex - részátlagindex - összetételindex A főátlagindex: A

standardizálás alkalmazása során az egyes csoportokra jellemző viszonyszámokat átlagoljuk. A főátlagindex jele: I Képlet: A részátlagindex: A részátlagok megváltozásának hatását úgy mutatjuk ki, hogy ismételten kiszámítjuk mindkét időszakban a főátlagokat, de súlyként azonos standard összetételt alkalmazunk. A részátlagindex jele: I’. Képlete: Az összetételindex: Az összetételhatás kimutatására ismételten ki kell számítani a főátlagokat, tényleges összetétellel, de standard részátlagokkal. Az összetételindex jele: I” Képlete: Ha ismerjük a főátlagindexet és a részátlagindexet, akkor ezek osztásával számszerűsíthetjük az összetétel-változás hatását: Indexszámítás Az indexszám a valamilyen szempontból összetartozó változók időbeli vagy térbeli összehasonlítását segítő mérőszám, azaz egy összetett összehasonlító viszonyszám. A klasszikus indexszámítás: Elsőként meg kell

említeni a gazdasági jelenségek elemzése során kiemelkedő fontossággal bíró azonosságot: BEVÉTEL = ÁR x MENNYISÉG Az árat jelöljük: p-vel A mennyiséget jelöljük: q-val A szorzatukat, az értéküket: v-vel, akkor v=pxq Ha az azonosság bármely elemének dinamikus változását, dinamikus viszonyszám segítségével jellemezhetjük. Ezeket a dinamikus viszonyszámokat az indexszámítás fogalomkörében egyedi indexeknek nevezzük. Az összehasonlítandó időszakokat: - bázisidőszakot nullával (0) - tárgyidőszakot egyessel (1) jelöljük. Ezzel különböztetjük meg őket egymástól Egyedi árindex: Egyedi volumenindex: Egyedi értékindex: Egy-egy termék, szolgáltatás, fogyasztási cikk stb. értékének, árának, volumenének változását az egyedi indexek segítségével jól jellemezhetjük. Különböző piaci árszínvonalak, fogyasztási árak összehasonlítása egy-egy összetett indexszám segítségével oldható meg

eredményesen. 1.) Értékindex: Az eljárás során a termékek (árucikkek) bevételeit számítjuk ki (az ár és a mennyiség szorzataként), majd ezeket összegezve, összesített értékadatokat ún. aggregátumokat hoztunk létre. A két aggregátum hányadosaként összesített indexet ún értékindexet kapunk. Képlet: Az értékindex több termék együttes, átlagos értékváltozását mutatja. Az értékindex számításához szükséges adatok általában minden gazdasági szinten közvetlenül rendelkezésre állnak. 2.) Az árindex: több termék együttes átlagos árváltozását fejezi ki Ahhoz, hogy az árak együttes átlagos változását számszerűsítsük, kiindulhatunk az értékindexből. Alapvetően két megoldás között választhatunk: a.) a tárgyidőszaki volumen adatokat (q1), b.) a bázisidőszaki volumen adatokat (q0) tekintjük állandónak Ezek alapján az árindex két alapvető típusát határozhatjuk meg: a.) tárgyidőszaki súlyozású

ún Paasche-árindexet: b.) bázissúlyozású ún Laspeyres-árindexet: Pl.: A Laspeyres- és Paasche- index fentiekben bemutatott formái között csak abban találunk különbséget, hogy más-más időszak mennyiségi adatai (q) szerepelnek súlyként. Ha a termékek, áruk árai egyik időszakról a másikra jelentősen, és eltérően változnak, a kétféle számítás eredménye élesen különbözhet. A különböző súlyozású indexek értékének nagyobb eltérése esetén jó eredményt ad a két alapforma mértani átlagaként előállított keresztezett formula, a Fischer-féle árindex: 3.) A volumenindex: a termékek bizonyos körére vonatkozóan, nem egynemű több termék együttes, átlagos volumenváltozását fejezi ki. A volumenindex is kétféle szemléletben írható fel: a.) tárgyidőszaki súlyozású, Paasche-volumenindex: b.) bázissúlyozású, Laspeyres-volumenindex: Természetesen a kétféle szemléletű volumenindex is eltérő eredményt ad,

így kézenfekvő itt is a keresztezett Fisher-volumenindex kiszámítása: Egyes termékekre vonatkozóan az ár és a mennyiség szorzataként a bevételt kapjuk eredményül: Ez a multiplikatív összefüggés az ellentétes súlyozású indexek, illetve a Fisher-indexek között áll fenn. Kapcsolat az indexek között: Az egyes termékek ár és volumenváltozása nem független egymástól, azaz az egyedi ár- és volumenindexek között sztochasztikus kapcsolat van. a.) Negatív sztochasztikus kapcsolat: ha egy árucikk árnövekedése jelentős volumencsökkenéssel jár együtt, az árak és volumenek változása között ellentétes irányú, azaz negatív sztochasztikus (korrelációs) kapcsolat van. Ilyen esetben a bázis súlyozású index értéke nagyobb, mint a tárgyidőszaki súlyozású indexé. Negatív irányú kapcsolat általában a piacgazdaság viszonyai között várható. b.) Pozitív sztochasztikus kapcsolat: az árak és a volumenek

változásai között pozitív irányú a kapcsolat, a különféle súlyozású indexek nagyságrendi relációja fordított: Az ilyen jellegű kapcsolatra erősen monopolisztikus piac esetén számíthatunk. Deflálás: A gyakorlatban sokszor alkalmazzák az indexek összefüggését. Ha ismerjük az értékindexet és az árindexet, akkor ezek hányadosaként kiszámítható a volumenindex. Ezt az eljárást, illetve az árváltozások hatásának kiszűrését deflálásnak nevezzük. Reprezentatív árindex: Számos esetben az árindex a termékek, árucikkek sokfélesége, a választék és az ármozgások különbözősége miatt teljeskörűen nem határozható meg. Ilyen esetben reprezentatív árindexet számítanak. Tipikus példája a fogyasztói árindex, amely a bázis-súlyozású árindex. A fogyasztói árindex a lakosság által vásárolt fogyasztási cikkek árainak átlagos változását méri. Maga az árindex felfogható az infláció mérőszámaként, de

felhasználható a reáljövedelmek vizsgálatához is. Az indexszámítás módszertana nemcsak időbeli, hanem területi vizsgálatokra is alkalmas. Területi árindexet a nemzetközi összehasonlításban, a valuták vásárlóerő arányainak kvantifikálása. Fontos felhasználási területe az árindexeknek az árarányok változásának vizsgálata. Különböző, de egymással összefüggő területek árindexeinek összehasonlításával árollókat számíthatunk. Egyik legfontosabbika az agrárolló, amely a mezőgazdaság inputjainak (vásárolt ipari termékek) árindexét az output (értékesítések) árindexeivel méri össze. Idősorok elemzése A gazdasági-társadalmi folyamatok számszerűsíthető értékei kedvező lehetőséget teremtenek az időbeni összehasonlításokra, az időbeli változások vizsgálatára. Módot teremtenek arra, hogy az elmúlt időszak összefüggéseinek feltárásával jobban megismerjük a jelenségek természetét és egyben

alapul szolgálnak a jövő várható eredményeihez. Az idősor értékei tapasztalati adatokból épülnek fel. Elméleti idősornak tekinthetjük egy gyermek súlyának növekedését. Amennyiben a kisgyermek súlyát hetente megmérjük, és az adatokat feljegyezzük, konkrét tapasztalati idősort kapunk, amely alkalmas további számítások elvégzésére. Az idősorok elemzésének egyik feladata, hogy az egyes összetevők (tényezők) hatását elkülönítve számszerűsítse. A klasszikus idősorelemzés abból a feltételezésből indul ki, hogy az idősort egy tartós, hosszú távú tendencia (trend), szabályos hullámmozgások, periodikus ingadozások határozzák meg és ezektől eseti, egyenként nem jelentős eltérítő hatást vált ki a véletlen ingadozás. Az idősorelemzés egyszerűbb eszközei: - grafikus ábrázolás - a bázis-, és láncviszonyszámok, mint igen egyszerűen meghatározható mutatószámok jól alkalmazhatóak az idősorok elemzésére.

- az indexszámok is fontos eszközei, - a speciális átlagok, melyek közül fontos információkat szolgáltat a tartamidősorok gyors vizsgálata során a számtani átlag: - Az állapotidősor átlagos értékének meghatározásához a kronológikus átlagot kell használni. Az állapotidősor értékei egy-egy időpontra értendőek Sokszor nincs lehetőség arra, hogy az időpontok gyakrabban ismétlődjenek, csak nagy időintervallumokkal tudunk számolni.: Az idősorok összetevői: Az idősorban rejlő változásokat többféle tényező határozza meg. Ezek közül a statisztikai elemzés három tényezőt szokott megragadni: 1.) Trend vagy alapirányzat, amely egy határozottan jelentkező tendencia, az idősor alakulásának fő iránya. 2.) Periodikus ingadozás egy rendszeresen ismétlődő hullámmozgás Amennyiben a hullámzás állandó periódushosszúságú és a periódushossz egy év vagy annál rövidebb, akkor szezonális ingadozásról

beszélünk (pl.: idegenforgalom alkulása, elektromos energia fogyasztása). Ha a periódushossz változó, akkor konjukturális ingadozásról beszélünk. 3.) Véletlen ingadozás, az idősorban fellelhető szabálytalan mozgás, amely nem mutat szisztematikusságot. Az idősor elemzésnek egy hagyományos feladata az egyes komponensek (trend, szezonalítás és véletlen) hatásának elkülönítése. A komponensekre való bontást az ún dekompozíciós módszerek segítségével végezhetjük el. Az egyes komponensek kapcsolódását kétféle modell segítségével végezhetjük el: - additív kapcsolat - multiplikatív kapcsolat. Trendelemzés: Az idősorban érvényesülő tendencia, a trend meghatározása igényli, hogy a szezonális tényező és a véletlen komponens hatását kiszűrjük. A trend meghatározása az idősor kisimítását jelenti. A trendszámítás módszerei: a.) a mozgó átlagok módszere: ez a módszer a trendet az idősor speciális, dinamikus

átlagaként állítja elő. A véletlen tényező tompítását az átlagolás segítségével lehet megvalósítani, de a szezonális hatás kiszűrését is megoldja az átlagszámítás a tagszám megfelelő megválasztásával. b.) analitikus trendszámítás: az analitikus trendszámítás az idősorban lévő alapirányzatot valamilyen ismert matematikai függvénnyel fejezi ki. Itt modellezzük a vizsgált jelenség megfigyelt értékei (yt), és az idő hatását kifejező (t) természetes számokból álló kapcsolatot. Elsőként azt kell megállapítani, hogy milyen függvény (egyenes vagy görbe) jellemzi, majd ezután kerülhet sor a függvény paramétereinek a meghatározására. A trend megállapítására a következő függvényeket alkalmazzák: 1.) lineáris (egyenes) függvény, melyet akkor alkalmazzuk, ha az idősorban a szomszédos időszakok közötti változás növekedés vagy csökkenés állandóságot mutat. 2.) exponenciális függvény, akkor

alkalmazunk, ha a változás relatív nagyságánál, üteménél tapasztalunk állandóságot, azaz a relatív változás állandó. 3.) másodfokú polinom, ha a folyamat változásának iránya megváltozik (pl: növekedés – stagnálás – csökkenés), illetve a változás nagysága nem állandó és a jelenség nagyságával sem arányos. 4.) logisztikus görbe (növekedési görbe), alkalmazása során az idősorban három fejlődési szakaszt különböztethetünk meg, az eleinte lassú növekedést erőteljes növekedés követi, mely később lassul. A lineáris trend meghatározása: A linearitás az idősorban azt jelenti, hogy egységnyi idő alatt a jelenség azonos mértékben növekszik vagy csökken. A lineáris trendfüggvény: A trendfüggvény meghatározása a b0 és b1 paraméterek becslését jelenti az idősorból. Ezt az ún. legkisebb négyzetek módszerével tudjuk kiszámolni Pl: A szezonális hullámzás mérése: Ez általában szabályos

hullámzás, ezért nagyon fontos jelenlétének és mértékének kimutatása, vizsgálata. A szezonális hullámzás (idényszerű ingadozás) állandó periódushosszúságú ingadozás, ahol a periódus hossza egy év, vagy annál rövidebb időszak. A szezonalitás bizonyos természeti jelenségekkel magyarázható, amely napi, havi, évszakonkénti változásokban ölt testet. A szezonalitás megismerése és számszerűsítése során informálódunk arról, hogy a szezonalítás a periódus egyes szakaszaiban milyen mértékben, vagy arányban téríti el az idősor értékét az alapirányzattól vagy trendtől. A szezontényező meghatározása megkívánja először is a trendértékek meghatározását, majd ezek birtokában lehetőség nyílik: - a trendhatás leválasztására és - a véletlen hatás kiszűrésére. A szezonalítás hatásának számszerűsítésére kétféle módszert alkalmazhatunk: a.) szezonális eltérés számítása b.) szezonindex

számítása a.) szezonális eltérés számítása:szezonális eltérést additív modell feltételezése mellett használunk, abban az esetben, ha a szezonális hatás abszolút nagysága, a hullámzás amplitúdója állandó, nem függ az idősor értékének nagyságától. A trendhatás kiszűrésének módja: A véletlen hatást oly módon szűrhetjük ki, ha a megfelelő szezonokra vonatkoztatva, a trendhatásttól már megtisztíott elemeket átlagoljuk: A kapott értéket a nyers szezonális eltérésnek nevezzük, mivel nem minden esetben teljesül, hogy a szezonális eltérések összege, illetve átlaga nulla legyen. Ilyen esetben az eltéréseket korrigálni kell, amelynek során a nyers szezonális eltérések átlagát képezzük, majd ezt az átlagot rendre levonjuk az egyes nyers szezonális eltérésekből. A korrigált szezonális eltérés: A szezonindex számítása: Multiplikatív modell esetén a szezonális hullámzás a vizsgált jelenség, a hullámzás

amplitúdója nem állandó csak relatíve mutat stabilitást. Az ilyen típusú szezonalítás mérésére a szezonindexet használuk. Az így képzett szezonindexek ún. nyers szezonindexek, mivel a módszer közvetlenül nem garantálja, hogy átlaguk 1 legyen, ezért a tisztított szezonindexekhez úgy jutunk, hogy a nyers szezonindexeket elosztjuk rendre saját átlagukkal. Kapcsolatvizsgálatok A társadalmi gazdasági jelenségek és folyamatok egymással összefüggő rendszert alkotnak. A jelenségeket és folyamatokat ismérvek segítségével azonosíthatjuk, jellemezhetjük. Az ismérvek kapcsolatai: Az ismérvek lehetnek egymástól függetlenek, állhatnak egymással sztochasztikus kapcsolatban, illetve lehetnek determinisztikusak. A statisztika elsősorban a sztochasztikus kapcsolatokat vizsgálja. Sztochasztikus kapcsolaton a statisztikai ismérvek között tendencia-szerűen, valószínűségi jelleggel érvényesülő kapcsolatot értünk.

Csoportosítása: - asszociációs kapcsolat (mindkét ismérv minőségi) - vegyes kapcsolat (az ok szerepét minőségi, az okozat szerepét mennyiségi ismérv tölti be) - korrelációs kapcsolat (mind az ok, mind az okozat mennyiségi ismérv) Mindhárom típusú kapcsolatot valamilyen mutatószám segítségével célszerű számszerűsíteni. Fontos mérőszám a kapcsolat intenzitását kifejező mutatószám, melynek jele: T. 0≤T≤1 A kapcsolat negatív vagy pozitív irányát mutatja meg az előjel, amely lehet negatív és pozitív. A mutatószámok értelmezése mindig szoros függvénye az adott problémának: - ha T=0, akkor nincs kapcsolat az ismérvek között - ha 0 < T < 0,3 akkor gyenge a kapcsolat - ha 0,3 < T < 0,7 akkor közepes szorosságú a kapcsolat - ha 0,7 < T < 0 akkor erős a kapcsolat - ha T=1 akkor a kapcsolat függvényszerű vagy determinisztikus