Matematika | Statisztika » Statisztika elmélet

Alapadatok

Év, oldalszám:2001, 9 oldal

Nyelv:magyar

Letöltések száma:439

Feltöltve:2009. május 10.

Méret:252 KB

Intézmény:
-

Megjegyzés:

Csatolmány:-

Letöltés PDF-ben:Kérlek jelentkezz be!



Értékelések

Nincs még értékelés. Legyél Te az első!


Tartalmi kivonat

Statisztika Statisztika jegyzet Lineáris korreláció A hiba lehet: Standard hiba Becsült értékek szóródnak az elméleti értékek körül. Jelölése: S b0 , S b1 X és Y között valószínűségi kapcsolat van. S b0 Hibák mérése: Standard hiba: Sb1 = Se n i=1 Se = n ∑ e i2 i=1 ∑ dx2 n b1 dx = x i - x n ∑ xi Sb0 = Se S b1 b0 n-2 i=1 1 e = yi - ŷi n ∑ dx2 i=1 Relatív hiba: Ve = Se / Y 10% alatt: jó volt a becslés Nem lineáris regresszió - exponenciális - logaritmikus - hatványkitevős - parabolikus Exponenciális regresszió Ŷ = β 0 ∙β 1 x A független változónak az egységgel történő változásának hatására a függő változó nem abszolút, hanem %-os értékben relatív módon ugyanannyival változik. log Ŷ = log β 0 + x∙log β 1 log β 0 = β 0 * log β 1 = β 1 * log Ŷ = β 0 * + β 1 x ∑ log Y = n∙β 0 * + β 1 ∑x ∑ x∙log Y = β 0 *∑x + β 1 ∑x2 β 0 = 10 β0* β 1 = 10 β1* Korrelációs

index A nem lineáris korreláció esetében megmutatja a görbétől való eltérést (a kapcsolat szorosságát) ∑(Y – Ŷ)2 I= 1∑(Y – Y)2a 0<I<1 1. oldal Statisztika A kapcsolat irányát nem méri. Ha közel van az 1-hez a kapcsolat szoros Ha közel van 0-hoz a kapcsolat gyenge. (0,6-0,7 közepesen szoros, 0,4-0,5 közepesen gyenge a kapcsolat) β 1 > 1: + 0 < β 1 < 1: - Többváltozós korrelációszámítás Y = β 0 + β1x1 + β2x2 + ε ∑d 1 dy = β 1 ∙∑d 1 2 + β 2 ∙∑d 1 d 2 ∑d 2 dy = β 1 ∙∑d 1 d 2 + β 2 ∙∑d 2 2 ε: hiba tényező β0 = Y - β1X1 - β2X2 Ha az x 2 értéke állandó, akkor x 1 egységnyi változása pontosan β 1 -gyel változtatja a függő változó értékét. A háromváltozós lineáris korreláció szorosságának mérése Y x1 x2 Y 1 r y1 r y2 x1 r y1 1 r 12 x2 r y2 r 12 1 Többváltozós korrelációs együttható Két változó együttesen milyen szoros kapcsolatban van a függő változóval.

Jelölése: R y12 r y1 2 + r y2 2 - 2∙r y1 ∙r y2 ∙r 12 Ry.12 = 1-r 12 2 Értéke: 0 < R y.12 < 1 Csak a kapcsolat szorossága mérhető. 0-hoz közel a kapcsolat gyenge, 1-hez közel a kapcsolat szoros. ∑d 2 dy ∑d 2 dy ∑d 1 d 2 ry2 = ry1 = r12 = √∑d 2 2∑dy2 √∑d 1 2∑dy2 √∑d 1 2∑d 2 2 Parciális korrelációs együttható Olyan mutatószám, ami megmutatja, hogy egyes magyarázó változók (x 1 ,x 2 ,x 3 ) milyen kapcsolatban állnak az eredményváltozóval, úgy, hogy közben a másik változó hatását állandónak tekintjük. Parciális determinációs együttható Az adott változó hány százalékban magyarázza meg a függő változó (eredményváltozó) szórását. A parciális korrelációs együttható négyzete r y1 -r y2 r 12 r y2 -r y1 r 12 ry1.2 = ry2.1 = (1 − r y2 2 )(1 − r 12 2 ) (1 − r y1 2 )(1 − r 12 2 ) két magyarázó változó hatása egymásra, nem értelmezhető. -1≤r≤1 r2 = egy változó hatása hány

százalékban határozza meg az Y változását. Multikolinearitás A többváltozós lineáris korreláció egyes magyarázó változói korrelálnak. A β 1 becslését változtatja meg. Elaszticitás (rugalmasság) Megmutatja, hogy az egyik mennyiségi ismérv 1%-os változása a másik tényezőnek hány százalékos változását idézi elő. (százalékos változást állít szembe százalékos változással) Lehet mindkét irányban, pozitív és negatív is. - azonos irányú változás: az egyik nő, a másik is vagy fordítva - ellentétes irányú változás: az egyik csökken, a másik nő vagy fordítva Esetei: |E| = 1 mindkét mennyiségi ismérv 1%-kal változik |E| < 1 egyik ismérv 1%-os változása kisebb, mint 1%-os változást idéz elő (rugalmatlan termékek) |E| > 1 egyik ismérv 1%-kal változik, ennek hatására a másik több, mint egy százalékkal változik r 12.y 2. oldal Statisztika Fajtái: Kereslet jövedelemrugalmassága: a jövedelem 6%-kal

nő, az eladott mennyiség 8%-kal:E =8/6=1,3 Kereslet árrugalmassága: Direkt árrugalmasság: Forgalom Egységár Bázis időszak 100 10 Tárgy időszak 70 11 70-100 11-10 E= : = -0,3 100 10 1%-kal növelve az árat 0,3%-kal csökken a forgalom, ha minden más tényező változatlan. Kereszt-árrugalmasság: - egy termék árváltozásának, egy másik termék forgalmára gyakorolt hatását vizsgálja Bor ára Sör forgalma Bázis időszak 80 100 Tárgy időszak 100 140 140-100 100-80 E= : = 1,6 100 80 Idősorok vizsgálata Idősor létrejötte, és fajtái Időbeli ismérv szerinti csoportosítással jön létre. Például a Magyar népesség adott év január 1-én Állapot idősor: az adatot adott időponthoz rendeli hozzá, az értékek nem összeadhatóak Tartam idősor: időszakra vonatkoznak az adatai, amik összeadhatóak (pl. Magyarország kőolaj termelése 1999-ben) A független változó szerepét az idő tölti be (t – tempus) Idősor alapirányzatának (TREND)

meghatározása (Ŷ) - idősorban megnyilvánuló tartós tendencia Periodikus ingadozás (s) - rendszeresen ismétlődő hullámzás, okai szerint lehet: - szezonális ingadozás (évszakváltozással összefüggő, állandó periódushossz jellemzi) - konjunkturális ciklus (nem állandó a hossza) Véletlen tényező (E) - nem tudatos emberi cselekedetek következményeként jön létre Természeti csapások Additív és multiplikatív hatások az idősorban Additív hatás: Y = Ŷ+s+E Multiplikatív hatás: y= Ŷ∙s∙E Idősorok vizsgálatának eszközei: - viszonyszám (lánc-, és bázis) - ha egy mozgó sokaságra flow típusú mutatót akarunk konstruálni: számtani átlag - kronologikus átlag akkor alkalmazzuk, ha időponti (stock) adatokból időszaki (flow) adatokat akarunk kiszámítani: x x1 + x2 + x3 + . + n x 1 +x 2 x 2 +x 3 x 3 +x 4 x n-1 +x n 2 2 2 2 2 = 2 n −1 n-1 Átlagos abszolút változás mutatója xn - x1 D= n-1 Csak akkor alkalmazható, ha az idősorban a

változás körülbelül ugyanakkora. β 1 hasonló tartalommal bír, mint D 3. oldal Statisztika Átlagos relatív változás mutatója l= n −1 xn = x1 x2 x3 x4 x + + + . + n x1 x 2 x 3 x n −1 Akkor alkalmazható, ha a változás üteme nagyjából egyforma. A változás exponenciális lesz Trend számítás - az idősor egészében megnyilvánuló tendencia, alapirányzatok - módszerei: - mozgóátlagolás - analitikus trendszámítás - félátlagok módszere (USA: az idősort elfelezik, a fél idősorokból egy átlagot számítanak, ezeket a pontokat összekötik, így kapják meg a trendegyenest, problémái: - önkényes az elosztás, miért középen, miért nem negyedelik, hatodolják; adatvesztés: a trendegyenes két pontjából feltételezik, hogy az idősor feleiben megnyilávánuló tendencia ugyanolyan) Mozgóátlagolás - a trend értékeit az eredeti adatok dinamikus átlagaként határozzuk meg - lépései: - mozgótrendek tagszámának

meghatározása (egyet elhagyunk, egyet hozzáveszünk) – egyszerű és gyors - hátránya: nincsen olyan analitikus képlet, melynek segítségével az idősor egészéről lehetne valamit mondani, adatelhagyás is történik, az első értékhez nem kerül semmi - ha a mozgóátlag tagszáma páros annyi adat veszik el, amennyi a periódus száma (centrírozás: kiszámoljuk az átlagot, elhagyjuk az első adatot, bevesszük a következőt, kiszámoljuk az átlagát, a két átlagot átlagoljuk, és a kapott értéket a harmadik értékhez írjuk be), ha a mozgóátlag tagszáma páratlan k-1 adatot vesztünk el - a tagszám megválasztása: egyezzen meg az idősorból következtethető hullámzással (pl. év: 3-as tagszám) - ha jól választjuk meg a periódus hosszát a periódikus ingadozás kiszűrhető - ha az idősor hosszú kilöki a véletlen hatást, de rövid idősorban bennmarad Analitikus trendszámítás - célja a trend meghatározása olyan módon, hogy matematikai

törvényszerűséget keres az adatok között (a regressziószámítás speciális esete, t-t használunk x helyett), fajtái: - lineáris trend - exponenciális trend Lineáris trend - egy idősorban nagyjából ugyanakkora a változás, vagy nagyjából ugyanannyival csökkennek, vagy nőnek az idősor adatai - a trend alapegyenlete: Ŷ t =β 0 +β 1 t β0: t=0 időszakhoz tartozó függvényérték β1: meredekség, a cél, hogy (Y t -Ŷ t )2 a lehető legkisebb legyen: ΣY=Σβ 0 n+β 1 Σt ΣtY= β 0 Σt+β 1 Σt2 - β 0 és β 1 meghatározása: - normál egyenlettbe való behelyettesítéssel - kinullázással: legyen Σt=0: - ha páratlan az idősor hossza: középre 0-t írunk, mint kódot - ha páros az idősor hossza: a középső két érték –1 és 1, és 2-vel változnak a kódok; de a β 1 -re kapott értéket kettővel meg kell szorozni 4. oldal Statisztika Például: ΣY t =539506 Évek 1975 1976 1977 1984 1994 Y 20465 22049 23401 Σt=0 β0= t -19

-17 -15 -1 19 ∑Y n β1= ∑ tY ∑ t2 ΣtY t =6044715 Exponenciális trend - ha az idősorban ugyanakkora %-kal történik a változás, ugyanannyival nő, vagy csökken - a trend alapegyenlete: Ŷ t =β 0 ∙β 1 t logŶ=logβ 0 +logβ 1 logβ 0 =B 0 logβ 1 =B 1 logY= B 0 ∙n+ B 1 ∙Σt t∙logY= B 0 ∙Σt + B 1 ∙Σt2 β1: β 0 = 10 B0 β1 = 10 B1 Megmutatja, hogy átlagosan hány százalékkal változik a függő változó az idősorban. Szezonális eltérés Szezonális hatás kimutatása Ŷt - Yt - átlagos szezonális eltérés: Sj = - korrigált szezonális eltérés: ( ˆ ∑ Yij − Y ij ) 2 t ~ Sj = S j − S Szezonindex - egyedi szezonindex: Egyes értékek Trendérték - az egyedi szezonindexek mértani átlaga kiszűri a véletlen hatást Például: Forgalom E db 4 tagú mozgóátlag Centírozás (trendérték) 272,875 1990 1 982 276,250 2 100 173 3 4 527 1991 1 301 2 108 3 258 4 606 249 1993 1 2 94 3 268 4 908 5. oldal Statisztika Évek

1 2 3 -99,875 1990 1991 +13,125 1992 -16,875 1993 -51,375 -55,125 -627,75 -177,31 ∑ Nyers -18,375 -209,042 -59,292 Korrekciós tényező = Jelentése: 4 -250,75 808,0 269,33 − 18,375 − 209,042 − 59,292 + 269,33 =-4,34 4 az adott időszakban átlagosan mennyivel tért el a forgalom a trend alapján elvárhatótól, a szezonális ingadozás miatt Szezonindex jelentése: az adott időszakban átlagosan hány százalékkal tért el a forgalom a trend alapján elvárhatótól, a szezonális ingadozás miatt Reziduális variancia - megmutatja, hogy a trend értékei átlagosan mennyivel térnek el az eredeti értéktől n 2 e S = ∑ (y t =1 A közbülső értékek megbecsülésének módjai: - behelyettesítés az egyenletbe - függvénygörbéből megbecsül - interpoláció t − yˆt ) n extrapolációval alapvető tendencia megbecsülhető, előrejelzés készíthető, de meg kell vizsgálni, hogy a tendencia, ami a meglévő adatokra érvényes, érvényesülnek-e

Kisimító eljárások - az idősor végének adatai jobban befolyásolják a tendenciát, nagyobb súllyal kell szerepelni, mint az idősor végén lévő adatoknak 1975 20465 ∑t=210 20βˆ0 + 210βˆ1 = 539506 1976 22049 ∑t2=2870 210βˆ0 + 2870βˆ1 = 6044715 1977 23401 1978 25554 ty t =644715 βˆ0 = 20976,8 1974-hez tartozó trendérték ∑y t =539506 βˆ1 = 571,3 éves átlagos növekedés 1993 36368 1994 33364 ˆ = 20976,8 + 571,3 ⋅ t 1995-re előrejelzés: Y t ˆ = 32947,1 Y 1995 Asszociációs kapcsolatok vizsgálata - minőségi ismérvek közötti kapcsolat lehet: - függvényszerű (egyik változóhoz tartozás egyértelműen meghatározza a másik változóhoz tartozást) - teljes függetlenség - sztochasztikus, valószínűségi kapcsolat van (egyik változóhoz tartozás nagy mértékben meghatározza a másik változóhoz tartozást) Kontingencia tábla függvényszerű esetben I. gyilkosság, gyilkossági kísérlet I II ∑ II. egyéb bűncselekmény A

20 - 20 A. férfi - 30 30 B B. nő ∑ 20 30 50 Belső gyakoriság peremgyakoriság 6. oldal Statisztika Kontingenciatábla sztochasztikus esetben I. gyilkosság, gyilkossági kísérlet I II ∑ II. egyéb bűncselekmény A 18 2 20 A. férfi B 5 25 30 B. nő ∑ 23 27 50 Kontingenciatábla függetlenség esetében I. gyilkosság, gyilkossági kísérlet I II ∑ II. egyéb bűncselekmény A 16 4 20 A. férfi B 24 6 30 B. nő ∑ 40 10 50 A nemhez való tartozás nem befolyásolja a bűncselekmény típuság Kontingenciatábla feltöltése y1 y2 yj yc Elméleti gyakoriság (mikor függetlenség): x1 f 11 f 12 f 1j f 1c f 1• x2 f 21 f 22 f 2j f 2c f 2• f i• ⋅ f • j f ij* = xi f i1 f i2 f ij f ic f i• N xb f b1 f b2 f bj f bc f b• f •1 f •2 f •j f •c ∑∑ (f b χ2 = c i =1 i =1 ij − f ij* lenne ) 2 f ij* χ2 teljes függetlenség esetén nulla, minél nagyobb, annál szorosabb az összefüggés. Például: I II ∑ I II ∑ 20 ⋅ 23 = 9,2 A 18

2 20 A 9,2 10,8 20 50 B 5 25 30 B 13,8 16,2 30 20 ⋅ 27 ∑ 23 27 50 = 10,8 ∑ 23 27 50 C (Crammer)-mutató 30 ⋅ 23 = 13,8 50 C= 27 ⋅ 30 = 16,2 50 50 χ2 N min{(b − 1), (c − 1) 0,6 fölött viszonylag szoros az asszociációs kapcsolat. T (Csuprov)-mutató T= χ2 N (b − 1) ⋅ (c − 1) Mintavétel a statisztikában - teljeskörű adatgyűjtés (népszámlálás, állatszámlálás) - részleges adatgyűjtés - reprezentatív adatgyűjtés (valamilyen módon mintát vesz a sokaságból, ez alapján von le következtetéseket az egész sokaságról) Alapsokaság: amire nézve végső következtetést vonunk le, amiből kiválasztjuk a reprezentatív mintát - véges sokaság: megszámlálható mennyiség - végtelen (pl. Duna vízmennyisége) n: mintasokaság elemszáma N: az alapsokaság elemszáma 7. oldal Statisztika Mintavétel okai - olcsóság, költségeket takarít meg - sokszor nincs lehetőség teljeskörű adatfelvételre Követelmények a

mintavétellel szemben - pontos legyen - olcsó legyen - Lesley Kish-féle Kish mintás mintavétel megfelel a követelményeknek A minta kiválasztása - visszatevéssel független a minta - visszatevés nélkül nem független a minta Kis minta: Nagy minta: Hiba - mintavételi: 100 alatt 100 fölött (N-től függ) abból adódik, hogy nem az egész sokaságot vizsgálja, ha valamilyen paramétert becsülünk standard hiba - nem mintavételi: nem volt jó a keret, mértékére nézve nem mindig lehet következtetésre jutni, nagyságának becslésére nincs egzakt módszer Mintavételi módok - véletlen mintavétel - egyszerű véletlen mintavétel (homogén, véges elemszámú sokaságból visszatevés nélküli kiválasztást végzek el, hogy minden elem egyforma valószínűséggel kerüljön be a mintába - szisztematikus kiválasztás (a sokaság sorba rendezése után k=N/n, az első k elemből kiválaszt egyet, majd minden k-adik kerül be a mintába) - rétegzett

mintavétel (ha az alapsokaság eléggé strukturált sokféle ismérv alapján csoportosítható: - rétegzés kérdései: - hogyan jeleníthetem meg az egyes csoportokat a listában, lehetőség szerint homogén, minél kisebb szórású csoportokat alkossunk - csoportok a teljes sokaságot kiadják - minden elem csak egy csoportba tartozhat - réteg megjelenése a mintában (milyen súllyal jelenjen meg a mintában) - arányos rétegzés: minden csoport ugyanolyan arányban jelenik meg a mintában, mint az alapsokaságban - nem arányos rétegzés - csoportos mintavétel - csoportokat, rétegeket képez az alapsokaságban véletlen kiválasztással kivesz egy csoportot, majd a csoport minden tagját megfigyeli - többlépcsős mintavétel - kombinált mintavétel (különböző módokat keverik egymással, a gyakorlatban általában ezt alkalmazzák - nem véletlen mintavétel - szisztematikus kiválasztás: a sokaságnak időben és térben egyenlő távolságra lévő egyedei

kerülnek a mintába (pl. minden 20) - kvóta szerinti kiválasztás (az alapsokaságot kiválasztják, a mintavevőnek a minta elemszámát megadják, és rábízzák, hogy szedi össze) - koncentrált kiválasztás (a legjellemzőbb egyedet választják ki) 8. oldal Statisztika Gazdaságstatisztikai ismeretek A statisztika csoportjai - általános statisztika: alaptételek, melyeket a gyakorlati statisztikában alkalmazni lehet - szakstatisztika: területei gazdasági, társadalmi statisztika Társadalmi statisztika - a társadalmi rétegződést, mobilitást vizsgálja (mobilitási mátrix) - szülők hovatartozása hogy befolyásolja a gyerek életét - demográfia (népesség száma, összetétel, vándorlás, migráció), az egyik legrégebbi szakstatisztika fajta - oktatás, műveltség vizsgálata (tanulók, tanulók száma) - egészségügyi statisztika - szegénység vizsgálat Gazdasági statisztika - nemzetközi standardok, hogy össze lehessen hasonlítani az

országokat (ENSZ irányadó) 1. Nemzeti elszámolások, számlák SNA mutatók, a gazdaság teljesítményét ezzel mérjük (GDP, GNP, GNI) 2. Árak vizsgálata (termelői árak vizsgálata is) 3. Foglalkoztatottság (munkabérek, munkaerő költségek) 4. Gazdasági szervezetek megfigyelése 5. Háztartások jövedelme és fogyasztása 6. Pénzügyi statisztika (államháztartás teljes statisztikai rendszere, társadalombiztosítási alapok, elkülönített alapok (nukleáris, munkaügyi), központi költségvetés, helyi önkormányzatok) A gazdasági statisztika szereplői - regisztrált szervezetek, cégbíróságon be vannak jelentve, jogilag létezik, adószámmal rendelkezik, akik ellen csődeljárás, végelszámolás, felszámolás van folyamatban - működésükről a tárgy évben, vagy az ezt megelőző évben adóbevallást nyújtottak be - külföldi érdekeltségű szervezetek: akinek a jegyzett tőkéjében 10% fölött van a külföldi tőke - jogi szempontok

szerint is szokták osztályozni - gazdasági szervezetek még: - költségvetési intézmények, államháztartás - háztartások - statisztikai számjel célja, hogy a statisztikai nyilvántartásban mindenki egyszer szerepeljen Nemzeti számlák rendszere - a gazdaság teljesítményét méri - Feller Frigyes próbálta először megmérni, hogy mekkora az ország gazdasági teljesítménye, potenciája, a nemzeti vagyont - a nemzeti vagyon: legszélesebb körű: természeti erőforrások, ingó és ingatlanvagyon, népesség, munkaerő, gazdasági potenciál 9. oldal