Antal Éva - Bayes típusú problémák

Alapadatok

Év, oldalszám:2010, 48 oldal

Nyelv:magyar

Letöltések száma:104

Feltöltve:2011. január 30.

Méret:597 KB

Intézmény:
-

Megjegyzés:

Csatolmány:-

Letöltés PDF-ben:Kérlek jelentkezz be!

A doksi online olvasásához kérlek jelentkezz be!

A doksi online olvasásához kérlek jelentkezz be!

Értékelések

Nincs még értékelés. Legyél Te az első!

Mit olvastak a többiek, ha ezzel végeztek?

Tartalmi kivonat

http://www.doksihu Szakdolgozat Bayes típusú problémák Antal Éva Matematikai elemz® szakirány Témavezet®: Dr. Vancsó Ödön, egyetemi adjunktus Matematikatanítási és Módszertani Központ Eötvös Loránd Tudományegyetem, Természettudományi Kar Eötvös Loránd Tudományegyetem Természettudományi Kar 2010 http://www.doksihu Tartalomjegyzék 1. Bayes-tétel történelmi háttere 4 2. Mi is az a Bayes-tétel? 7 2.1 Urnás feladat 7 2.2 Bayes-tétel kimondása 13 3. Bayes-elv, avagy döntést nyerni bizonytalanságban 14 3.1 Bayes-elv egy példán keresztül 14 3.2 A Bayes-tétel és Bayes-elv összekapcsolása 17 4. Folytonos eseménytér esete 19 4.1 A Bayes-tétel folytonos eseménytérre 19 4.2 Bayes-elv folytonos eseménytérre 20 4.3 Példa feladat folytonos eseménytéren 21 5. Bayes-statisztika alkalmazása

különböz® területeken 5.1 5.2 5.3 5.4 Gazdasági feladat . Ipari feladat . Biológiai feladat . Bayes-tétel alkalmazása a világban . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6. Bayes és a klasszikus statisztika összehasonlítása . . . . . . . . 23 . . . . . . . . . . . . . . . . . . . . 23 26 26 28 29 6.1 A klasszikus felfogás 29 6.2 Példa klasszikus- és Bayes-módszer tárgyalásával 30 6.3 Viszonyuk és jelentésük 34 2 http://www.doksihu 7. Visual Bayes 7.1 7.2 7.3 7.4 35 Visual Bayes-r®l . Visual Bayes használata . Példa megoldása diszkrét feladatnál Visual Bayes segítségével . Példa megoldása folytonos feladatnál Visual Bayes segítségével 8. Összefoglalás 35 35 39 42 45 3 http://www.doksihu 1. fejezet Bayes-tétel történelmi háttere Bayes-tétel az egyik

leggyakrabban használt valószín¶ségszámítási tétel, úgyis nevezhetjük másképp, hogy az "okok valószín¶ségi tétele". A tétel, az életében matematikusként alig ismert Thomas Bayes(1702-1761) angol paptól származik. Maga Bayes a tételt nem hozta nyilvánosságra, 1763ban tette közzé Richard Price, aki a barátja volt Úgy gondolom, ha már a Bayes-tétellel foglalkozunk annyit megérdemel, hogy a tétel felfedez®jét megismerjük. Thomas Bayes[1]: 1.1 ábra Thomas Bayes 1702-ben született Londonban, Angliában. Apja egyike volt az els® hat nonkonformista miniszternek. Szülei magánúton taníttatták, többek között tanítója volt de Moivre. Aki egy híres francia matematikus, 4 http://www.doksihu leginkább a de Moivre-képletr®l ismert, mely összekapcsolja a komplex számokat a trigonometriával, illetve nevezetesek még a normáleloszlással kapcsolatos munkái. Bayes édesapja akaratára tanulmányait teológián folytatta az

Edinburgh-i egyetemen. Tanulmányai után el®ször apját segítette Holnbornban, majd kicsivel kés®bb miniszteri pozícióba került Tunbridge Wells-i presbiteriánusi kápolnában Miniszteri munkáját 1752-ig folytatta Visszavonulva is Tunbrigeben élt élete végéig, 1761 április 17-ig Sírja Bunhill Fields temet®ben Londonban található Bayes-t egész élete során érdekelte a matematika, pontosabban a valószín¶ségszámítás és a statisztika területe, így hozta létre a valószín¶ségszámítás egyik fontos tételét, a Bayes-tételt. A bayes-i nézet teljesen új szemléletet adott a statisztika tudományágának. Bayesnek jelent®s munkássága volt, de élete során csak Divine Providence and Government Is the Happiness of His Creatures (1731) és An Introduction to the Doctrine of Fluxions, and a Defense of the Analyst (1736) cím¶ m¶vei jelentek meg. Az utóbbi munkájában Newton logikai nézeteit védte meg Berkeley püspök ellen, és ezzel nyert

felvételt a Királyi Természettudományos Akadémiára. A legismertebb m¶ve a Essay Towards Solving a Problem in the Doctrine of Chances (Kísérlet a valószín¶ségelmélet egy problémájának megoldására), ami Essay Towards Solving a Problem in the Doctrine of Chances-ben 1764ben jelent meg, de ekkor ® már nem élt. Egyik barátja Richard Price talált rá erre a munkájára a holmiai között, halála után. Ez írja le a bayes-i statisztikát, más néven a bayes-i becslést, melyek el®zetes becslések alapján megmutatják a bekövetkezés valószín¶ségét. Kés®bbiekben Boole megkérd®jelezte Bayes munkásságát, melyet egy tanulmányban a Laws of Thought címmel jelentett meg. A 19 században többen részt vettek a vitában, mint például Gauss, Laplace A 20 század elején a bayes-i szemléletet gyelmen kívül hagyták a statisztikusok, legalábbis a ma klasszikusnak nevezett irányzat képvisel®i: Pearson, Neyman 5 http://www.doksihu és Fisher.

Utóbbi kés®bb, az 50-es években közeledett a bayes-i felfogáshoz De Harold Jereys zikus és Arthur Bowley közgazdász továbbra is szorgalmazta a bayes-i ötleteket. Segítségükkel és mások közrem¶ködésével az 1950-es években újra el®térbe kerül, és sok híres tudós, mint például L. Jimmy Savage, Buno do Finetti, Dennis Lindley, és Jack Kiefer szorgalmazta a Bayes-statisztika használatát. A vita a szubjektív valószín¶ségi fogalom körül alakult ki, mely napjainkban is tart. Objektív valószín¶ség, vagyis tömegjelenségek esetén használja a klasszikus statisztika is Napjainkban számos területen használják Bayes-tételt, mind tudományokban, mind m¶szaki területen. 6 http://www.doksihu 2. fejezet Mi is az a Bayes-tétel? A Bayes-tétel tulajdonképpen egy olyan formula, amely lehet®vé teszi, hogy A esemény bekövetkezéséb®l következtessünk B1 , B2 , B3 ,. , Bn események (vagy hipotézisek) valószín¶ségére Megmutatja,

hogy az A esemény mennyire támaszt alá vagy befolyásol hipotéziseket. Ehhez ismernünk kell az eredeti valószín¶ségeket. Valójában ezek az értékek sokszor nem ismertek számunkra és ebb®l adódóan ismereteink alapján adunk értéket neki A klasszikus statisztika objektív elméletre törekszik, ezért csak abban az esetben használják, ha valódi véletlent®l függenek a hipotézisek és ismertek a valószín¶ségiek. Nézzünk egy urnás feladatot, melyen keresztül bevezethetjük a Bayes-tételt. 2.1 Urnás feladat Urnás feladat [2] alapján: Tegyük fel, hogy van négy urnánk, melyek nevei a következ®k: U1 , U2 , U3 , U4 . Legyen mindegyik urnában ugyanannyi golyó például, 100 db. A golyók legyenek kétfélék: pirosak és kékek. A golyók színeinek aránya más és más urnánként. Legyen az els® urnában a piros golyók aránya p1 = 03, a második urnában p2 = 0.4, a harmadik urnában p3 = 05 és a negyedikben pedig p4 = 0.6 7

http://www.doksihu A játék a következ®: el®ször valaki kiválaszt egy urnát és húz bel®le, majd miel®tt visszateszi a golyót, elmondja milyen szín¶t húzott. A húzást n-szer ismétli meg a választott urnából. Akik pedig nem látják melyik urnából húzta, azoknak ki kell találniuk, melyik urnából származnak a golyók. Ha tudjuk, hogy mindegyik urnát egyenl® eséllyel választja (ezt a klasszikus valószín¶ségszámítás is így használja), akkor P0 (p1 ) = P0 (p2 ) = P0 (p3 ) = P0 (p4 ) = 14 . A kísérlet el®tti becslést, melyet priori eloszlásnak nevezünk, jelöljük: P0 (pj )vel. A kísérletünk után, mikor már megtudjuk, hogy k db pirosat húztunk ki n húzás során visszatevéssel, azt poszteriori eloszlásnak nevezzük, ezt jelöljük: P (pj |kn ). Annak a valószín¶sége, hogy n húzásból k darab pirosat húzunk: PB (kn |pj ) = n k pkj (1 − pj )n−k . (2.1) Legyen a húzások száma 10 és a kísérlet után a húzott

pirosak száma 4, vagyis jelöléssel n = 10 és k = 4. Ez az esemény négyféle úton jöhet létre, ugyanis négy urnánk van, azt is tudjuk, hogy ezek az utak kizárják egymást, mivel egyszerre csak egy urnából húzhatunk. Az utak neve legyen r1 , r2 , r3 , r4 Tudjuk, hogy mivel az utak függetlenek, ezért igaz, hogy r1 ∪ r2 ∪ r3 ∪ r4 = S4 j=1 rj . Annak a valószín¶sége, hogy 4 db piros golyót húzunk ki kísérlet el®tt: P (k = 4) = 4 X j=1 8 P (rj ). (2.2) http://www.doksihu Kísérletünk elvégzése után tudjuk, hogy k = 4, most már csak azt kellene tudnunk, hogy egyes utakon mekkora a bekövetkezés valószín¶sége. Az els® esemény az, hogy 4 piros golyót húzunk ki, ezt jelöljük E1 -el. A másik esemény, amit gyelembe kell venni legyen E2 , ami azt jelképezi, hogy az esemény a j -ik úton következik be. Mivel egymást kizáró eseményekr®l beszélünk, ezért a következ® számolási módot használjuk: P (E2 |E1 ) = a mi

feladatunkra: P (rj |k = 4) = P (E2 ) , P (E1 ) P (rj ) . P (k = 4) (2.3) Ez utóbbi a poszteriori eloszlás. Ha megvizsgáljuk jobban a 23-es képletet, láthatjuk, hogy a bal oldala azt jelenti, mikor már bekövetkezett a 4 piros golyó kihúzása és ezek után a j -edik út áll fent. Itt a keresett valószín¶ség 9 http://www.doksihu P (rj |k = 4). Ha pedig a jobb oldalát vizsgáljuk meg, akkor az el®z®nek éppen a fordítottja valósul meg, tehát az, hogy Uj a választott urna és ekkor P (rj ) k = 4 következik be, itt a P (k=4) valószín¶ség áll fent. Ahhoz, hogy P (rj ) -re tudjuk valamit mondani egy tételre lesz szükségünk. 1. Tétel (Szorzás vagy produktum tétel) P (E1 ∩E2 ) = P (E1 )P (E2 |E1 ), annak a valószín¶ségét adja meg, hogy egyenl® E1 valószín¶ségének és E2 E1 esemény és E2 együtt bekövetkeznek; ez E1 feltétel melletti valószín¶sé- gének szorzatával. A tétel segítségével (2.4) P (rj ) = P (pj )P (k

= 4|pj ) P (pj )P (k = 4|pj ) P (rj ) = . P (k = 4) P (k = 4) A képletet általánosítva a következ®t kapjuk: P (pj |k) = P (pj )PB (k|pj ) . P (k) Felhasználtuk a 2.2-et: P (k) = k X (2.5) P (rj ), j=1 ebb®l következik, hogy P (k) = k X (2.6) P (pj )PB (k|pj ). j=1 Ezt a 2.5-ben behelyettesítve: P (pj )PB (k|pj ) P (pj |k) = Pk . j=1 P (pj )PB (k|pj ) (2.7) A feladatunkra nézve, a végs® képletben behelyettesítve a következ®t kapjuk: n = 10, k = 4, P (pj ) = 41 értékekre: 1 P (pj |k = 4) = P44 PB (k = 4|pj ) 1 j=1 4 PB (k 10 = 4|pj ) . http://www.doksihu Itt a 2.1-ben behelyettesítve, vagyis a képletben a nevez®t kiszámolva a következ®t kapjuk: X1 PB (k = 4|pj ) = 4 X 1 n = pkj (1 − pj )n−k = 4 k 1 10 1 10 4 6 = 0.3 (1 − 03) + 0.44 (1 − 04)6 + 4 4 4 4 1 10 1 10 4 6 0.5 (1 − 05) + 0.64 (1 − 06)6 = + 4 4 4 4 1 = · (0.2 + 025 + 0205 + 0111) = 4 = 0.1915 Ez az érték azt jelenti, hogy a húzás el®tt mennyi a

valószín¶sége annak, hogy 10 húzásból 4 piros golyó húzása következik be, ha minden urnát egyforma eséllyel válaszhatunk. Ezek után kiszámoljuk, hogy mennyi az egyes urnák valószín¶sége az el®z® eredményt felhasználva: 1 4 10 4 P (p1 |k = 4) = = 0.34 (1 − 03)6 0.1915 = 0.05 = 0.261 0.1915 Ugyanezzel a számolással számolom ki a következ®ket: P (p2 |k = 4) = 0.062 = 0.327 0.1915 0.051 = 0.266 0.1915 0.027 = 0.14 P (p4 |k = 4) = 0.1915 P (p3 |k = 4) = Látható, hogy a második urna esélye 0.25-r®l 0327-re n®tt, míg ezzel ellentétesen a negyedik urna valószín¶sége éppen ellenkez®leg változott, majdnem a 11 http://www.doksihu felére csökken 0.25-r®l 014-re Az els® és harmadik urna esélye alig változott az eredeti valószín¶ségekhez képest, mindkett® egy picit n®tt. Látható, hogy az el®zetes becsléshez képest a fenti eredmény egy új valószín¶ség eloszlást ad. 12 http://www.doksihu 2.2 Bayes-tétel

kimondása A példán láttuk mi történik, ha 4 urna közül választunk, melyik a legvalószín¶bb, de azt, hogy melyik következik be ténylegesen azt nem tudjuk. Vagyis, ha 10 húzásnál 4 következik be, annak a valószín¶ségét a P (k = 4, pj ) adja meg. Nézzük meg általánosan, ha nem tudjuk az adatokat, természetesen ez csak objektív esetben lehetséges A húzások száma legyen n, k pedig a kedvez® esetek száma (el®z® feladatban a piros golyók száma volt), az urnák száma pedig R. Tehát a bekövetkezett utak 1, 2, R lehet, amik kizárják egymást Legyen általánosítva α = αr |1 ≤ r ≤ R, a végrehajtás el®tti eloszlás P (αr ). k érték pedig legyen, amelyet K valószín¶ségi változó a C kiséretében felvesz. A k valószín¶sége, amikor αr a tényleges állapot, a P (k|αr ) kísérleti eloszlással adott A végrehajtás utáni eloszlás a P (αr |k), k meggyelése után. A 26 képlet segítségével: P (k) = R X P (αr )P (k|αr ).

r=1 Ebb®l adódik P (αr |k) = P (αr )P (k|αr ) P (αr )P (k|αr ) = PR P (k) r=1 P (αr )P (k|αr ) összefüggés, ami maga a Bayes-tétel. 13 (2.8) http://www.doksihu 3. fejezet Bayes-elv, avagy döntést nyerni bizonytalanságban 3.1 Bayes-elv egy példán keresztül Pénz feldobásos példán kereszül vezessük be a fogalmakat[2]. Tudjuk, hogy a pénz feldobás során kétféle esemény lehetséges, legyen E1 esemény, ha fej és E2 esemény, ha írás következik be. Feltételezzük, hogy mindkét esemény egyforma valószín¶séggel következik be P (E1 ) = P (E2 ) = 0.5 Jelen pédánkban a játékot két ember játsza, mégpedig úgy, hogy egyik a fejre, másik az írásra fogad, amelyikük veszít, az zet a másiknak egy eurot. Jelöljük a nyereséget g -vel, így a nyereség várható értéke ε · g . ε · g = g1 · P (E1 ) + g2 · P (E2 ). Feladatunkban ez nagyon egyszer¶: ε · g = g1 · P (E1 ) + g2 · P (E2 ) = = 1 · 0.5 + −1 · 05 = 0, mivel

bárki nyer, abban az esetben az egyik nyereség függvénye g1 = 1, a másik játékosé pedig g2 = −1. Mivel a nyereség várható értéke 0, ezért ezt a játékot fair játéknak nevezzük. Ha szerencsejátékokról beszélünk, akkor a vételárat(G) úgy határozzuk meg, 14 http://www.doksihu hogy g1 = 1 és g2 = 0 lesz, ebb®l ε · g = g1 · P (E1 ) + g2 · P (E2 ) = 1 · P (E1 ) + 0 · P (E2 ) = G. Ha az el®z® feltétel teljesül, akkor fair játéknak nevezzük. Ha pedig ε · g < G, akkor azt a játékot kockázatosnak, illetve ε · g > G akkor pedig kockázatkerül® játéknak nevezzük. Természetesen a lottó, a tottó és a többi hasonló szerencsejátékok kockázatosak. Az el®z® fejezetünkben egy urnás feladaton keresztül vezettük be a Bayestételt, ennek a példának a segítségével vezessük be a Bayes-elvet. A várható értékünk: J X ε · gi = g(Ej )P (Ej ), (3.1) j=1 ahol J X P (Ej ) = 1. j=1 Ennél a feladatnál a

mintavétellel meg tudjuk becsülni a poszteriori eloszlást, amit Bayes-tétel segítségével kapunk meg. Ezért, ha a Bayes-elvet alkalmazzuk, akkor cseréljük a P (Ej )-t P (Ej |x)-re Így a 3.1 képletünk megváltozik a következ® módon: ε · gi = J X g(Ej )P (Ej |x), j=1 ahol J X P (Ej |x) = 1. j=1 Az urnákat U1 , U2 , U3 , U4 -nek neveztük az el®z® fejezet feladatában. Mindegyik urnában ugyanannyi golyó volt, 100 db A golyók kétfélék voltak: pirosak és kékek. A golyók színeinek aránya más és más urnánként Az els® urnában a piros golyók aránya p1 = 0.3, a második urnában p2 = 04, a harmadik urnában p3 = 05 és a negyedikben pedig p4 = 06 volt A feladatunk a következ®: El kell döntenünk megvesszük-e az urnát, ha minden urna 100 euroba kerül és minden piros golyót tovább tudunk adni 2 euroért, míg kékek 15 http://www.doksihu értéktelenek. Megvásárlás esetén legyen az esemény neve I1 , ha elutasítjuk a vásárlást

akkor I2 . Nyereségünk megvásárlás estén urnánként: U1 nyeresége g1 (p1 ) = 0.3 · 100 · 2 − 100 = −40; U2 nyeresége g1 (p2 ) = 0.4 · 100 · 2 − 100 = −20; U3 nyeresége g1 (p3 ) = 0.5 · 100 · 2 − 100 = 0; U4 nyeresége g1 (p4 ) = 0.6 · 100 · 2 − 100 = +20 Tehát egyedül az U4 urna lenne nyereséges. Vizsgáljuk meg, hogy n = 10 visszatevéssel húzunk golyót és k = 4 piros golyót húztunk ki. Látjuk, hogy 4 = 0.4, ez igazából a második urna valószín¶ségéhez van legközelebb, de 10 nézzük meg számolással is. P (pj |x) = P (Ej |k) A 2.6 képlet szerint: P (pj |x) = P (pj |4) == 1 PB (k = 4|pj ) . P44 1 j=1 4 PB (k = 4|pj ) 4 X 1 1 n pkj (1 − pj )n−k = PB (k = 4|pj ) = 4 4 k j=1 10 1 10 0.44 (1 − 04)6 + = 0.34 (1 − 03)6 + 4 4 4 10 10 0.64 (1 − 06)6 = 0.54 (1 − 05)6 + + 4 4 1 = (0.2 + 025 + 0205 + 0111) = 4 = 0.1915 P (p1 |k = 4) = 0.261; P (p2 |k = 4) = 0.327; P (p3 |k = 4) = 0.266; P (p4 |k = 4) = 0.14

értékek lesznek a 2.1 fejezet végén lév® poszteriori eloszlás miatt Több, mint 30% az esélye, hogy a második urnából húztunk. Egyes urnákra a nyereségfüggvény, ha megvesszük az adott urnát(vagyis I1 esemény következik 16 http://www.doksihu be): U1 urnára ε · g1 (p1 ) = 0.261 · −40 = −1044; U2 urnára ε · g1 (p2 ) = 0.327 · −20 = −654; U3 urnára ε · g1 (p3 ) = 0.266 · 0 = 0; U4 urnára ε · g1 (p4 ) = 0.14 · +20 = 28 ε · g1 = −1.044 − 654 + 0 + 28 = −4784 Ha nem vásároljuk meg, természetesen a nyereségfüggvényünk 0 lesz, vagyis ε · g2 = 0. Látszik ε · g2 > ε · g1 Tehát nem célszer¶ az urna megvétele 3.2 A Bayes-tétel és Bayes-elv összekapcsolása A Bayes vizsgálat alapjait megismertük a példák alapján. Els®ként minden feladatnak van egy bemen® priori eloszlása, mellyel a kísérlet el®tti ismereteinket fejezzük ki valószín¶ségeloszlás formájában Például az urnás feladatoknál úgy

feltételeztük, hogy minden urnából egyenl® eséllyel húznak. Ezt neveztük el P0 (pj )-nek. A következ® információ a poszteriori eloszlás, vagyis P (pj |x)-t a Bayes-tétel segítségével kaptuk meg. A mintavételen nyert információ szerint megkaptuk az x értékét. Az x-et felhasználva a Bayes-tétel meghatározza, hogy hogyan válik a priori eloszlásunk poszteriori becsléssé(P (pj |x)). Ezzel megtudjuk milyen valószín¶séggel következik be az adott esemény. Ezek után még egy adatra szükségünk volt a döntéshozásban, mégpedig a nyereségfüggvényre, g -re. A nyereségfüggvény és a poszteriori eloszlás segítségével döntünk az adott kérdésben Tehát Bayes-tétel alkalmazása után a Bayes-elvet használva döntésre juthatunk a bizonytalan helyzetekben. A döntés végeredménye legyen az a eljárás. 17 http://www.doksihu A következ® ábra szemlélteti a folyamatot: 18 http://www.doksihu 4. fejezet Folytonos eseménytér esete 4.1

A Bayes-tétel folytonos eseménytérre El®ször vezessük be a s¶r¶ségfüggvény fogalmát[2,3,5]: Deníció. Egy ξ valószín¶ségi változó s¶r¶ségfüggvényének nevezzük az f (x) függvényt, ha ezzel a ξ valószín¶ségi változó F (x) eloszlásfüggvénye így Rx adható meg: F (x) = −∞ f (t)dt. Ha ξ -nek létezik s¶r¶ségfüggvénye, akkor F (x) folytonos, ilyenkor ξ -t folytonos valószín¶ségi változónak nevezzük. Fennáll: F 0 (x) = f (x) f (x) s¶r¶ségR∞ függvény tulajdonságai: f (x) ≥ 0 és −∞ f (x)dx = 1. Legyen R darab lehetséges egymást kizáró állapot. θ = {θ1 , , θR } ; ahol θ maga a valószín¶ségi változó paraméter vektora és x a meggyelések véletlen vektora, amit az adott kísérletben felvesz. Meghatározzuk a P (θ)P (x|θ)-t, vagyis amikor θ áll fent és x következik be. P (x|θ) annak a valószín¶sége, hogy x bekövetkezik, mikor θ állapot áll fent. A P (θ)-ról tudjuk, hogy 0-val egyenl®.

Az f (θ) a valószín¶ségi változó s¶r¶ségfüggvénye, tehát F (θ) eloszlásfüggR vény deriváltja. Azt is tudjuk, hogy F (b) − F (a) = ab f (θ)d(θ) annak a valószín¶sége, hogy θ az [a, b] intervallumba esik, az integrál a d(θ) szélesség¶ és f (θ) alatti területsávot jelenti. f (θ)d(θ) annak a valószín¶sége, hogy θ a dθba esik Meg kell adnunk, hogy mennyi a valószín¶sége, hogy θ dθ-ban van 19 http://www.doksihu és x következik be, ezt pedig a f (θ)dθP (x|θ)-val tudjuk megadni. Folytonos esetben az el®zetes valószín¶ségeket, hogy mely útikötegben következett be a következ® integrállal tudjuk megadni: Z f (θ)P (x|θ)dθ. P (x) = (4.1) θ Miután bekövetkezett az x a berajzolt útköteg esetén. 4.1 ábra f (θ|x)dθ = f (θ)P (x|θ)dθ . P (x) (4.2) Áttérünk a innitezimális valószín¶ségekr®l a s¶r¶ségfüggvényekre, így felírható a poszteriori s¶r¶ségfüggvény, amely maga a Bayes-tétel: f

(θ|x) = R 4.2 f (θ)P (x|θ) . (θ)f (θ)P (x|θ)dθ (4.3) Bayes-elv folytonos eseménytérre Bayes-elv tárgyalásánál diszkrét esetben néztük meg, hogyan is kell a döntéshozásig eljutni, itt is ugyanaz a helyzet, hiszen a maximális nyereségre 20 http://www.doksihu szeretnénk szert tenni. Itt a változás az, hogy ε · gi = J X g(Ej )P (Ej |x) j=1 helyett nem az összegüket vizsgáljuk, hanem az eseménytérben az integráljukat, tehát: Z ε · gi = g(θ)f (θ|x), (4.4) θ ahol Z f (θ|x)dθ = 1. θ Ebben az esetben gi (θ) lesz az i-dik cselekvés nyereségfüggvénye. 4.3 Példa feladat folytonos eseménytéren Feladatunk legyen a következ®[2]: Egy vállalatnak lehet®sége van egy olyan árucikk vásárlására, melyb®l 300 db van és az összérték 3000 euro. A megvásárlás után a kifogástalan darabokat 12 euroért tudják értékesíteni tovább. Egyes darabok θ valószín¶séggel hibásak, a θ∈Θ ismeretlen és θ ∈ [0, 1]. Mivel

maga a θ ismeretlen, ezért nincsenek el®ismereteink, azonban a cégnek jogában áll a döntés meghozása el®tt mintavételre. Ebben az esetben n = 60 darabot vizsgálnak meg és ennek segítségével döntenek. A vizsgálat eredményeként x = 6 darab selejtet találnak. Ezek után kétféle esemény következhet be: a1 : átveszik az árut a2 : elutasítják az áru átvételét. A feladat kérdése, hogy a∗ = a1 vagy a∗ = a2 (ahol az a∗ a döntés)? El®ször is írjuk fel a két esemény nyereségfüggvényét: g1 (p) = 300 · 12 · (1 − θ) − 3000 = 600 − 3600 · θ. g2 (p) = 0. Tudjuk, hogy P (θ) = R θ∈Θ f (θ)dθ = 1. 21 http://www.doksihu Els®, amit tudunk ebb®l f (θ) = 1. Második pedig, hogy x = 6 db hibásat találtak a vizsgálat alatt n = 60-ból. Tehát f (θ)P (x|θ) f (θ)P (x|θ) θ n f (θ) θx (1 − θ)n−x x , f (θ|x) = R1 n x f (θ) θ (1 − θ)n−x dp 0 x f (θ|x) = R f (θ|x) = R 1 0 mivel f (θ) = 1. Tudjuk, hogy mi

feladatunkra R1 0 f (θ|6) = θx (1 − θ)n−x θx (1 − θ)n−x dp xa (1 − x)b dx = , a!b! , (a+b+1)! ebb®l következik a 61! · θ6 (1 − θ)54 . 6! · 54! Harmadiknak, pedig a nyereségfügvényeket tudjuk: 1 Z gi (θ)f (θ|6)dθ εgi = 0 Z 1 600 − 3600θ)f (θ|6)dθ = εg1 = 0 Z = 600 · 1 Z f (θ|6)dθ − 3600 · 0 1 θ · f (θ|6)dθ 0 Z 1 61! = 600 · 1 − 3600 · θ7 (1 − θ)54 = 6!54! 0 61! 7!54! 600 − 3600 · · = 6!54! 62! 7 = 600 − 3600 · = 62 = 193, 54. εg2 = 0, ebb®l látszik a helyes döntés, mégpedig hogy εg1 > εg2 . Tehát érdemes megvenni az árut a fenti mintaeredmény alapján. 22 http://www.doksihu 5. fejezet Bayes-statisztika alkalmazása különböz® területeken 5.1 Gazdasági feladat Példa feladat[4] Egy város szélén felfedeztek egy nagyon értékes h®forrást. Az Üdül®igazgatóságnak lehet®sége van a h®forrás környékén lév® néhány telket megvenni, a telkek ára 140 Milló forint.

Az ÜI (Üdül®igazgatóság) itt fürd®telepet létesítene, de ehhez szükségük lenne beköt® útra A város tervezi az út építését, de arról még nem döntöttek, hogy pontosan a h®forrás felé vezet-e majd az út. Err®l 1 hónap múlva lesz eredmény A telek megvételér®l azonban 10 napon belül döntenie kell az ÜI-nek. A feladatunk, hogy segítsünk a helyes döntésben. Három lehetséges eseménnyel számolunk. Kett® esemény következhet be, ha a telket megvásárolják: Az út megépül és hatalmas nyeresége lesz az ÜI-nek, méghozzá 10% . Azonban, ha nem fog megépülni az út, akkor a telek elértéktelenedik, méghozzá évente 1%-al csökken a telek értéke. Harmadik lehet®ség, hogy ÜI nem fekteti be a pénzét a telek vásárlásába, ekkor bankba teszi, ahol az éves kamat 5%. 23 http://www.doksihu Lehetséges események: E1 : Megveszi a cég 140 Millió forintért a telket, E2 : Bankba helyezi a pénzét az ÜI. I1 : Megépül az új út a

h®forrás mellett, I2 : Az új út nem ott épül meg. Nyereségek alakulása: g(E1 , I1 ) = 140M · 0.1 = 14000000; g(E1 , I2 ) = −140M · 0.01 = 1400000; g(E2 , I1 ) = 140M · 0.05 = 7000000; g(E2 , I2 ) = 140M · 0.05 = 7000000; A döntéshez az ÜI igazgatója olyan információval rendelkezik, hogy az út építésének valószín¶sége a h®forrás felé 60%. Tehát a priori valószín¶ségek: P (I1 ) = 0.6 és P (I2 ) = 04 A várható értékek a következ®képpen alakulnak: εg(E1 ) = 0.6 · 14000 + 04 · (−1400) = 7840 εg(E2 ) = 0.6 · 7000 + 04 · (7000) = 7000 A nyereség várható értékéb®l az látszik, hogy érdemes megvenni a telket. Az ÜI úgy döntött, hogy kikéri a Városi Tanács véleményét, melyek el®rejelezik, hogy az út szerintük merre fog vezetni. Ha azt állítják, hogy el®reláthatólag a h®forrás felé fog épülni az út, akkor a kjelentésük 70%-ban megbízható. Ha pedig azt állítják, hogy nem arra épül az út, azt 80%-os

biztonsággal állíthatják. Ezek után a Bayes-tételt alkalmazva döntsük el, hogyan válasszon az ÜI azok alapján, amit a Városi Tanács el®rejelez. Itt is kétféle esemény következhet be: K1 : A Városi Tanács el®rejelzése szerint az út a h®forrás felé épül meg, K2 : A Városi Tanács el®rejelzése szerint az út nem a h®forrás felé épül meg. A valószín¶ségek a következ®képpen alakulnak: P (I1 ) = 0.6; P (I2 ) = 0.4; 24 http://www.doksihu P (K1 |I1 ) = 0.7; P (K2 |I1 ) = 1 − P (K1 |I1 ) = 1 − 0.7 = 03; P (K2 |I2 ) = 0.8; P (K1 |I2 ) = 1 − P (K2 |I2 ) = 1 − 0.8 = 02 A Bayes-tétel felhasználásával következtetni tudunk P (Kj |Il ) és P (Il ) segítségével P (Il |Kj )-re. Bayes-tétel (2.8 tétel): P (Il )P (Kj |Il ) P (Il |Kj ) = P . P (Il )P (Kj |Il ) behelyettesítve: 0.6 · 07 P (I1 )P (K1 |I1 ) = P (I1 |K1 ) = P = 0.84; P (I1 )P (K1 |I1 ) 0.6 · 07 + 04 · 02 P (I2 )P (K1 |I2 ) 0.4 · 02 = 0.16; = P (I2 |K1 ) = P 0.6 · 07 + 04

· 02 P (I2 )P (K1 |I2 ) P (I1 )P (K2 |I1 ) 0.6 · 03 P (I1 |K2 ) = P = = 0.36; P (I1 )P (K2 |I1 ) 0.6 · 03 + 04 · 08 P (I2 )P (K2 |I2 ) 0.4 · 08 P (I2 |K2 ) = P = = 0.64 P (I2 )P (K2 |I2 ) 0.6 · 03 + 04 · 08 Várható pénzértékek egyes esetekben: g(I1 |K1 )P (I1 |K1 ) + g(I1 |K2 )P (I1 |K2 ) = 0.84 · 14000 + 016 · −1400 = 11536; g(I2 |K1 )P (I2 |K1 ) + g(I2 |K2 )P (I2 |K2 ) = 0.84 · 7000 + 016 · 7000 = 7000; g(I1 |K1 )P (I1 |K1 ) + g(I1 |K2 )P (I1 |K2 ) = 0.36 · 14000 + 064 · −1400 = 4144; g(I1 |K1 )P (I1 |K1 ) + g(I1 |K2 )P (I1 |K2 ) = 0.36 · 7000 + 064 · 7000 = 7000 A döntésünk így könnyen megszületik. Láható, ha K1 eseményt jelzik el®re az ÜI számára, akkor I1 esemény mellett döntsön, vagyis, ha azt állítják 70%-os biztonsággal, hogy az út arra felé fog haladni, akkor a telket vegye meg a cég. Ha pedig K2 eseményt valószín¶sítik, akkor mindenképpen I2 -t cselekedje az ÜI. Tehát, ha 80%-os biztonsággal állítják, hogy az utat

nem a h®forrás felé vezetik, akkor a 140 Millió forintot a bankba tegyék be. Bayes-tétel segítségével sikerült döntést hoznunk. 25 http://www.doksihu 5.2 Ipari feladat [3]Egy gyárban készült áru min®ségellen®rzésen esik át, miel®tt a piacra kerülne. Kétféle szempont alapján vizsgálják meg a terméket, az els® szempont, hogy a tömegszabványnak megfeleljen, a másik, hogy formailag megfelel® legyen A tömegszabványnak az áru 92%-a felel meg Azt is tudjuk, hogyha súlyra megfelel®, akkor 96%, hogy alakra is jó. Ha pedig tömege nem volt megfelel®, akkor azok 7%-a megfelel formailag. Mennyi annak a valószín¶sége, hogy egy szabadon választott terméket megvizsgálva alakra jónak találunk és ezek után a tömegszabványnak is meg fog felelni? Ezt Bayes-tétellel nagyon egyszer¶ megoldani. Legyen A az az esemény, hogy a termék formailag megfelel és B jelezze azt az eseményt, amikor tömegre szabályos az árunk. Tehát a következ®ket

tudjuk: P (B) = 0.92, ebb®l következik, hogy P (B) = 008 A következ® feltételes valószín¶ségekr®l van még információnk: P (A|B) = 0.96 és P (A|B) = 007 A következ®re vagyunk kiváncsiak, hogy mennyi a P (B|A)? Erre a feladatra Bayes-tétele a következ®képpen néz ki: P (B|A) = = P (A|B)P (B) = P (A|B)P (B) + P (A|B)P (B) 0.96 · 092 0.8832 = ≈ 0.96 · 092 + 007 · 008 0.8888 ≈ 0.994 Tehát annak a valószín¶sége, hogyha kiválasztok egy árudarabot és az megfelel formailag, akkor ezek után a tömegszabványnak 99.4%, hogy meg fog felelni. 5.3 Biológiai feladat [3]Egy biológiai osztályzás során 200 rovart 4 csoportba osztanak szét, mégpedig: kártev® rovarok; betegséget terjeszt® rovarok; semleges rovarok; 26 http://www.doksihu és hasznos rovarok. Kártev® csoportba 40 egyedet, a betegséget terjeszt®khöz 55-t, a semlegeshez 70-et, a hasznoshoz 35 egyedet csoportosítottunk Ezeket a csoportokat külön tárolják, majd beoltják ®ket,

melynek hatására megváltoznak. Az oltás után megvizsgálva ®ket a kártev® csoportból 11, a betegséget terjeszt® csoportból 7, a semlegesb®l 25, a hasznos rovarok közül pedig 11-nek volt hatásos az oltás, rajtuk ment keresztül változás. Ezek után összeengedték a csoportokat. Az a kérdés merült fel, hogyha kiválasztunk találomra egy rovart és azt mutatja a vizsgálat, hogy változáson ment keresztül, akkor mennyi a valószín¶sége, hogy ez a rovar betegséget terjeszt®k közül való? Fel tudjuk írni a következ® valószín¶ségeket: Bj jelölje, hogy melyik csoportba tartozik az egyed, legyen j := 1, 2, 3, 4. P (B1 ) = P (B2 ) = P (B3 ) = P (B4 ) = 40 200 55 200 70 200 35 200 = 0.2; = 0.275; = 0.35; = 0.175 Az A esemény jelelölje, hogy az egyed keresztül megy változáson: P (A|B1 ) = P (A|B2 ) = P (A|B3 ) = P (A|B4 ) = 10 40 7 55 25 70 11 35 = 0.25; ≈ 0.127; ≈ 0.357; ≈ 0.314 A kérdésre a választ a Bayes-tétel adja meg, mégpedig,

hogy B2 esemény teljesül A esemény mellett: P (A|B2 )P (B2 ) P (B2 |A) = P4 = j=1 P (A|Bj )P (Bj ) = 0.2 · 10 40 7 0.275 · 55 7 + 0.275 · 55 + 0.35 · = 25 70 + 0.175 · 11 35 = 0.035 = 0.132 0.265 Tehát 13.2% a valószín¶sége annak, hogyha kiválasztunk egy rovart és változást észlelünk rajta, akkor az a rovar betegséget terjeszt® 27 http://www.doksihu 5.4 Bayes-tétel alkalmazása a világban Látható volt a példákból, hogy a Bayes-statisztika nagyon hasznos a mindennapokban.[5,6] A számítógép-tudományokban: a szakért®i rendszerek, a keres®programok (köztük a Google) is visszavezethet® Bayes nevéhez. A zikában is nagyon sokat használják, például a nyaláb-menti elektrons¶r¶ség meghatározásához, különböz® mérések alapján, illetve gravitációs hullámoknál. Nagyon ismertek a Bayes-hálók is, melyeket diagnosztikában, el®rejelz® rendszereknél, pénzügy, telekommunikációs, kockázati el®rejelzéseknél,

adatbányászatban egyaránt haszálnak. A valószín¶ségi megközelítésben bizonytalan tudásunkat sztochasztikus változók együttes eloszlásával reprezentáljuk Például a kép- és hangfeldolgozásnál az eloszlások modellezésére els®dleges eszközként ma a Bayes-hálókat alkalmazzák. A gazdaság területén döntéshozásnál igen hasznos a tétel, például az ismert conjoint analízis, ami egy fogyasztói preferencia vizsgálati módszer,de ugyanígy használják kockázat el®rejelzéseknél is. Az élet minden területén hasznos tétel a Bayes-tétel 28 http://www.doksihu 6. fejezet Bayes és a klasszikus statisztika összehasonlítása 6.1 A klasszikus felfogás Az alábbiakban [7]-as irodalmat használtam fel. A Bayes és a klasszikus statisztika összehasonlításához ismerjük meg jobban a klasszikus felfogást, hiszen a bayes-ir®l már sokat tudtunk meg az el®z® fejezetekb®l. Az 1920-as és 30-as években alakult ki és Sir Ronald Aymler

Fisher, Jerzy Neyman és Egon Pearson nevéhez köt®dik a klasszikus felfogás megalkotása. A klasszikus felfogás alapja a véletlen mintavétel, R.A Fisher vezette be Lényegi gondolata, hogy meghatároz egy tartományt, melyben meghatározott hipotézisek mellett egy el®írt valószín¶séggel a kísérlet eredményének esnie kell. Ha nem esik ebbe a meghatározott tartományba, akkor a hipotézisünket elvetjük, másnéven az eredményt szignikásnak mondjuk Ha az eredményünk nem szignikáns, akkor ez helyett az eredményünk értéktelen. A szignikancia-teszt arra ad választ, hogyha a hipotézis igaz, akkor az eredmény mennyire valószín¶ vagy valószín¶tlen. A legfontosabbak a hipotézis és a szignikancia-szint meghatározása. A szignikancia-szintet el®re kell rögzíteni a teszt lefolyása el®tt Ez általában 5% Két fontos fogalmat kell bevezetnünk még amit els®-, illetve másodfajú hibá29 http://www.doksihu nak nevezünk (ezeket a fogalmakat

Neyman és Pearson vezették be). El®ször a nullhipotézisünk mellé vezették be az alternatív hipotézis fogalmát is, mely a nullhipotézissel szembenálló egy vagy több hipotézis. Els®fajú hibának nevezzük, amikor a nullhipotézist elvetjük, pedig igaz, de a kísérletek után mégis elutasítjuk. Abban az esetben beszélünk másodfajú hibáról, ha megtartjuk a nullhipotézist, pedig az alternatív hipotézis lenne a helyes Nagyon fontos fogalom még a kondencia-intervallum, mely azon paraméter értékek összessége, amelyre nem szignikáns az eredmény, azaz nem vethet® el, hogy ennyi lenne a paraméter valódi értéke. Szoros kapcsolatban van tehát a fogalom a Fisher-féle szignikancia-teszttel, de annak egy más megfogalmazása. Az interpretációjuk is teljesen más Fisher szerint a nem szignikáns eredményb®l nem lehet következtetést levonni, hiszen ezzel nem a hipotézist igazoltuk, csupán az elvethet®ségét nem sikerült igazolni a

statisztikánkkal. Vagyis ez közömbös eredmény, semmilyen következtetést nem vonhatunk le. Neyman mégis éppen azon értékek halmazát, amelyeket nem lehet elvetni, egy kitüntetett tartománynak nevezi, amelyre a kondencia-intervallum elnevezést vezette be. 6.2 Példa klasszikus- és Bayes-módszer tárgyalásával Feladatunk[7]: Nézzük meg, hogy egy dobókockával dobásnál mennyire lehetünk biztosak, hogy egy szám valószín¶sége 61 . Ezt utólagos következtetéssel nézzük meg, például 1-est mondjuk 11-dik dobásra dobunk, akkor mennyire is valószín¶ ez az 16 ? Megvizsgáljuk a feladatot Bayes-módszerrel és klaszikus módszerrel is, mindkett®vel pontbecslést és intervallum-becslést is elvégzünk. Pontbecslésnek nevezzük azt az eljárást, amikor egy ismeretlen paraméterre egyetlen becsült értéket adunk meg. Intervallum-becslésnek pedig, ha a becsült értékek egy tartományt, intervallumot határoznak meg Pontbecslés esetén a poszteriori

eloszlás maximuma lesz a becslésünk. 30 http://www.doksihu El®ször nézzük meg a probléma megoldását Bayes-módszerrel: Tegyük fel, hogy az 1-es dobás a k-dik dobásra jön ki. Ha nem tudunk semmit a dobókockáról, akkor ezt Bayes priori egyenletes eloszlással modellezné Melynél θ = 0, 1 és tudjuk, hogy P (egyes dobás)= θ. A s¶r¶ségfüggvénye a Bayes-tétel szerint(4.3 képlet): g(θ|x) = R f (θ)P (x|θ) θ(1 − θ)k−1 = R1 = k(k + 1)θ(1 − θ)k−1 k−1 f (θ)P (x|θ)dθ θ(1 − θ) dθ θ 0 1 (felhasználtam, hogy a nevez®ben lév® integrál értéke k(k−1) ). Így megkaptuk a poszteriori eloszlást, mely k-tól függ. Pontbecslés Bayes-módszerrel: A függvény maximumának meghatározásához, csak a θ(1 − θ)k−1 maximumát kell meghatározni. Ez közepek közötti egyenl®ség segítségével írható fel Méghozzá számtani és mértani közepek közötti összefüggéssel. Ahol felhasználunk egy darab (k−1)θ és k−1 darab

(1−θ) számot, így a köveztkez®képpen alakul: k−1 (k − 1)θ(1 − θ) (k − 1)θ + (k − 1)(1 − θ) k ≤ = k k−1 k k , ez akkor áll fent, ha k tényez® egyenl®, vagyis (k − 1)θ = (1 − θ), ebb®l látszik, hogy θ = k1 . Intervallum-becslés Bayes-módszerrel: Keresünk a legsz¶kebb intervallumot, amiben p valószín¶ség várhatóan beleesik. Láthattuk, hogy poszteriori eloszlás k(k + 1)p(1 − p)k−1 (k db egyes dobás volt). Olyan [p1 , p2 ] intervallumot keresek, amelyre teljesül, hogy p1 és p2 távolsága minimális, illetve Z p2 k(k + 1)p(1 − p)k−1 ≥ 1 − α. (6.1) p1 1 − α-t a legs¶r¶bb Bayes-tartománynak nevezzük, ha az el®z® feltételek teljesülnek. Az ezzel való számolásokat nézzük most meg: ha α = 005 és k = 31 http://www.doksihu 1, 2, 3 esetén, hogyan alakulnak az értékek. A 61 képletbe behelyettesítve a köveketkez®t kapjuk: k = 1, R p2 p1 1 · 2p(1 − p)0 dp ≥ 0.95, itt vegyük, hogy

p1 -t®l nézzük p2 = 1-ig. Tehát Z 1 1 · 2p(1 − p)0 dp ≥ 0.95 p1 Z 1 2pdp ≥ 0.95 p1 p2 2 2 1 dp ≥ 0.95 p1 1 p1 2 − ≥ 0.475 2 2 p1 2 0.025 ≥ 2 0.233 ≥ p1 Intervallum tehát [0.233, 1] Ha k = 2, akkor arra kell törekednünk, hogy p1 (1 − p1 ) = p2 (1 − p2 ), ebb®l adódik, hogy p2 = 1 − p1 . Integrálásnál tehát Z p2 2 · 3p(1 − p)1 dp ≥ 0.95 p1 p2 p3 6 − 2 3 1−p1 = p1 4p1 3 + 6p1 2 + 0.05 = 0 ennek a megoldása p1 = 0.094, p2 = 0906, vagyis a [0094, 0906] intervallumban lesz Ha k = 3, akkor pedig p1 (1 − p1 )2 = p2 (1 − p2 )2 , ebb®l adódik p2 értéke, p mégpedig p2 = 1 − p21 − p1 (1 − 0.75p1 ) Integrálás a következ®: Z p2 3 · 4p(1 − p)2 dp ≥ 0.95 p1 32 http://www.doksihu p4 2p3 p2 12 − + 4 3 2 p 2 = p1 = 3p2 4 − 8p2 3 + 6p2 2 − (3p1 4 − 8p1 3 + 6p1 2 ) ≥ 0.95 Ebb®l kiszámolható, hogy p1 = 0.043,p2 = 0775, így az intervallum [0043, 0775] A feladat megoldása

Klasszikus-módszerrel: Pontbecslés: Keressük a P (X = k|p = θ) valószín¶séget. Éppen θ(1 − θ)k−1 függvény maximumának meghatározása kell. Ezt láttuk, hogy k1 Intervallum-becslés: Ha ismert lenne számunkra a p értéke, mely az egyes dobás esélye, akkor meg tudnánk adni a legkisebb olyan [1; K(p)] intervallumot, amelyben 1 − α eséllyel beleesik az els®ként dobott 1-es sorszáma. Ehhez a következ® egyenl®tlenséget meg kell oldani: K X p(1 − p)k−1 ≥ 1 − α. k=1 (k függ p-t®l és α-tól). A mértani sorozat összegképletét használva a következ®t kapjuk: p 1 − (1 − p)K = 1 − (1 − p)K , 1 − (1 − p) K -ra igaz kell, hogy legyen: (1 − p)K ≥ α, innen látszik, hogy p>1− √ K α. Az el®bbiek szerint [0; p(K)] intervallum lesz, ezek alapján igaz, hogy p(K) = √ 1 − K α. Ebb®l a módszerb®l annyit tudtunk lesz¶rni, hogy 16 -nál nem lesz nagyobb az esélye az 1-es dobásnak. Nézzük meg k = 1, 2, 3 -ra

milyen intervallumokat kapunk k=1 p(K) = 1− √ K √ α = 1− 1 0.05 = 095, tehát [0; 095] a kondencia-intervallum, k=2 33 http://www.doksihu p(K) = 1 − k=3 p(K) = 1 − √ √ K α = 1 − 2 0.05 = 095, tehát [0; 0776] √ √ K α = 1 − 3 0.05 = 0632, tehát [0; 0632] Bayes-intervallumok és a klasszikus-intervallumok összevetését az alábbi tábázat adja: 6.1 ábra A táblázat azt sejteti, hogy minél nagyobb a k értéke, annál jobban közelít egymáshoz a két intervallum-becslés. 6.3 Viszonyuk és jelentésük Látható a példánkból, hogy miben is különbözik a két becslés fajta. A Bayes-statisztikában láható volt, hogy a legfontosabb szerepet a priori eloszlás feltételezése kapta. Vagyis ennek megválasztásától függ minden eredmény Tehát, ha nem jól válasszuk meg a priori eloszlást, akkor akár helytelen eredményre is juthatunk. Nagyon fontos a megfelel® priori-eloszlás, melyb®l kés®bb a poszteriori eloszlást nyerjük,

melynek segítségével határoztuk meg az intervallumunkat. A klasszikus felfogás ezzel szemben a valószín¶ségeket objektívnek tekinti, egy véletlent létrehozó rendszer sajátosságaként (pl: dobókocka, lottó). Ebb®l látszik, hogy itt nem használható fel a mért tudásunk, mint a priori eloszlás a Bayes-statisztikában. 34 http://www.doksihu 7. fejezet Visual Bayes 7.1 Visual Bayes-r®l A Visual Bayes bemutatásához Dieter Wickman Visual Bayes-r®l szól könyvét használtam fel [8]. Röviden tanulmányoztam a programot, melyhez az irodalom is, illetve maga a program is német nyelv¶. Tudni kell err®l a programról magyarul semmiféle használati útmutató vagy kézikönyv nem született még. Úgy gondolom a program nagyon hasznos és érdekes, f®leg azoknak, akiket ez a téma megragadott. 7.2 Visual Bayes használata Visual Bayes program egy német nyelv¶ program, melynek m¶ködéséhez be kell szerzeni egy DERIVE 5 vagy DERIVE 6 nev¶

demoprogramot. Ennek a programnak a segítségével m¶ködik a Visual Bayes nev¶ programunk 35 http://www.doksihu A programunkból el®ször is a VORPLOT ikont indítjuk el. A következ® lesz látható: Els®ként meg kell adni, hogy diszkrét vagy folytonos eseményekr®l beszélünk. Ez a következ®képpen adható meg, az ábra jelzi: Az u, o, a, s számokat úgy adhatjuk meg, ha tizedes számok, hogy tizedes pontot rakunk közéjük. Az u, o jelképezi az alsó-, illetve fels® intervallumhatárát a θ-nak Az a, s segítségével adhatjuk meg az abcissza beosztását Ahol a a kezd®pontja és s a beosztás. Ami a következ®képpen néz ki: 36 http://www.doksihu Legyen az els® példánk: Diszkrét eset: θ[0, 5], a = 0; s = 1. Második példa: Folytonos eset: θ[0, 1], a = 0; s = 0.05 Az egér segítségével tudunk az orinátán változtatni, az Optionen > Gleichverteilung opcióra rákattintva tehetjük ezt meg, ezek után az ábrára rákattintva szabadon

mozgathatók az értékek. Miután szabadon megváltoztattuk az értékeket, elmenthetjük, még hozzá az Optionen > Vorverteilung für Derive speichern opcióra rákattintva, fontos a mentési nevünk a valami.dfw formátumú legyen. Ezek után az Optionen > VorPlot beenden nev¶ paranccsal kiléphetünk a VORPLOT-ból Miután az eloszlásainkat megrajzoltuk és elmentettük, kezdhetünk neki a feladat megoldásának. Nyissuk meg a DERIVE 5 vagy DERIVE 6 nev¶ 37 http://www.doksihu programunkat és kezd®dhet a megoldás. Megnyitva a DERIVE programban a valami.dfw nev¶ el®z®leg elmentett fájlunkat A következ® parancsok láthatóak: A LOAD paranccsal beolvasom a diskret.mth, illetve kontinuummth-ot, attól függ, hogy a VORPLOT-ban mit adtam meg. A program kiírja az u, o étékeket Az ablak legalsó sorban van lehet®ségünk parancsokat megadni Els® parancsunk a berechne vor, mely el®zetes eloszlást számolja ki. A programunk a következ®t írja ki Die

Vorverteilung steht in vor, ezt követ®en a vor nev¶ paranccsal kiírathatjuk az el®zetes-, vagyis priori eloszlási értékeket, kirajzoltatni ezt a balkengraph(vor,u,o) paranccsal tehetjük meg. A függvényt a következ® versuch (θ ) paranccsal adjuk meg. Mégpedig diszkrét esetben hipergeometriai eloszlásnál a következ® kifejezést kell megadni N −θ θ · n−x x P (x|θ) = , N n ez a kifejezés a következ®képpen adható meg parancsként: versuch (θ ) :=comb (θ ,x)· comb (N- θ ,x)/comb(N,n). Binomiális eloszlásnál pedig a következ® áll fent: P (x|θ) = n x · θx · (1 − θ)n−x , ez a DERIVE programban alábbi módon néz ki: versuch (θ ):= θ x · (1- θ )n−x . Majd megadjuk az n,x értékeket, ezt követ®en meghívjuk a bayes nev¶ parancsot. A következ®t kapjuk: Die Nachverteilung steht in nach Majd diszkrét esetben nach beírásával megkapjuk a poszteriori eloszlást és balkengraph(nach, u, o) paranccsal kirajzoltatjuk

a függvényt. Folytonos esetben pedig a következ® paracsot írjuk be a nach helyett DIM(nach), verteilungssumme(nach, u, o) és MAX(nach). Kirajzoltatni pedig a kurvengraph(nach, u, o) parancssorral lehet. 38 http://www.doksihu 7.3 Példa megoldása diszkrét feladatnál Visual Bayes segítségével Nézzük meg egy diszkrét feladat megoldást, mégpedig a 2.1-es urna feladatot oldjuk meg El®ször is tudjuk, hogy 10-szer húztunk és abból 4-szer lett piros golyónk. Tegyük fel a húzások eredményeit, legyen a sorrend a következ® színek szerint P,P,K,K,K,P,K,P,K,K. VORPLOTON ez a következ®képpen néz ki: Majd az ábrát az egér segítségével a következ® módon állítsuk be: 39 http://www.doksihu A DERIVE programban az alábbiak szerint dolgozzunk: 40 http://www.doksihu Els® részben versuch (θ):= θx · (10- θ)n−x paranccsal megadjuk a függvényt, majd az x,n érték megadásával, a bayes meghívásával, végül a nach segítségével

kiíratjuk az eloszlásokat. Az ezt követ® ciklusok mind hasonlók Fontos, hogy mindig az el®z® poszteriori eloszlást egyenl®vé teszem a priori eloszlással, a következ® parancs segítségével: vor:=nach. Látszik, hogy x:=0 lett, ha a kéket és x:=1, ha piros golyót húztunk ki. Mivel 10 húzásunk volt, ezért 10 ilyen ciklusunk lesz, attól függ®en, hogy kék golyót vagy piros golyót sikerült 41 http://www.doksihu húznunk. A végeredményünk a következ® lesz: 0.26074, 032680, 026720, 014524 Összehasonlítva az eredeti, illetve ezt a végeredményt, akkor látszik, hogy ugyanazt az megoldást kaptuk. 7.4 Példa megoldása folytonos feladatnál Visual Bayes segítségével Folytonos esetre oldjuk meg a 4.3-as feladatot Kezdeti értékeknél állítsuk be a következ®képpen a VORPLOT ablakot: 42 http://www.doksihu Ennél a feladatnál a megoldását a DERIVE programban mutatom be, hogy láthassuk a kezel®felület: 43 http://www.doksihu A feladatunk

végén a nyereségfüggvény megadásánál az alábbi parancsokra is szükségesünk volt: gewinn(θ):=300 · (1- θ)· 12-3000; és gewinnerwartung(nach). Itt is látható, hogy az eredeti megoldással azonos megoldás született. 44 http://www.doksihu 8. fejezet Összefoglalás A dolgozat során megismerkedtünk a Bayes-tétellel és Bayes-statisztikával részletesen, mindenféle irányból megvizsgálva. El®ször is a tétel feltalálójával Thomas Bayes-el ismerkedtünk meg, aki ezt a nagyon hasznos tételt hagyta ránk. A tételt mind diszkrét esetben, mind folytonos esetben levezettem és példákon keresztül illusztráltam. Megmutattam a tétel és a Bayes-elv kapcsolatát, mellyel egy képet kaptunk a Bayes-statisztikáról Kiemeltem, hogy a Bayes-statisztika fontos szerepet kap az élet minden területén. Látható volt a gazdasági, ipari, biológiai feladatokon, de még számtalan példa segítségével illusztrálni tudtam volna a hasznosságát Megemlítettem

tudományterületeket, ahol nagyon is hasznos a tételünk, illetve statisztikánk Nagyon fontos szerepet kapott, hogy lássuk mi a különbség a klasszikus statisztika és a bayes-i szemlélet között, ezt egy újabb példán keresztül szemléltettem. A diplomamunkám végén egy teljesen új, vagyis inkább alig ismert programot ismerhetünk meg. Látható, hogy a programmal nem csak pontos értékeket, de kiváló diagrammokat is nyertünk. Nem bonyolult és nem is nehéz használni Akit egy picit is jobban érdekel a Bayes-statisztika, annak érdemes megismerkednie ezzel a programmal. Látható, hogy egy tétel, elv vagy maga egy statisztika rengeteg téren hoz 45 http://www.doksihu szolgálatot nekünk és mennyi mindenre használható. Illetve, hogy mennyire sok szempontból vizsgálható meg. A Bayes-tétel, vagy statisztika is ilyen sokoldalú. 46 http://www.doksihu Irodalomjegyzék [1] http://www.bayesianorg/resources/bayeshtml [2] Dieter Wieckman (1999)

Bayes-statisztika [3] Solt György: Valószín¶ségszámítás kiadó Budapest (1997) ELTE Eötvös Kiadó, Budapest - (IV.-V fejezet) M¶szaki Könyv- [4] Szentpéteri Szabolcsné Gazdasági döntések bizonytalanság esetén fejezet) Közgazdasági és Jogi Könyvkiadó Budapest (1989) [5] Ketskeméty László Valószín¶ségszámítás Kiadó Kft Budapest (2007) tömören - (30.oldal) - (3. AULA [6] http://home.mitbmehu/ milli [7] Vancsó Ödön Klasszikus és Bayes statisztika a matematikadidaktikában - (3.-4 fejezet) PhD disszertáció Debrecen (2005) [8] Dieter Wieckman Visual Bayes- Ein Rechnerprogam zur Einführung die Bayes- Statistik Verlag Fraubecker Hildesheim, Berlin (2006) 47 in http://www.doksihu Köszönetnyilvánítás Ezúton szeretnék köszönetet mondani témavezet®mnek, Vancsó Ödönnek, aki mindig szakított id®t konzultációra és a szakdolgozatom alapos áttekintésére. Észrevételei és tanácsai nagyban hozzájárultak a szakdolgozatom

elkészüléséhez. 48

Gazdasági Ismeretek | Döntéselmélet » Antal Éva - Bayes típusú problémák

Alapadatok

Értékelések

Mit olvastak a többiek, ha ezzel végeztek?

Valószínűségszámítás és matematikai statisztika

Dr. Németh Anikó - Adatelemzés statisztikai módszerekkel

Dr. Sebők Miklós - Statisztikai adatok és elemzés a Big Data korában

Kun Imre Zoltán - Klinikai endocrinologia

Tartalmi kivonat

Cikkajánló

Verseghy Ferenc

Doksiajánló

Tartalmak

Navigáció

Gazdasági Ismeretek | Döntéselmélet » Antal Éva - Bayes típusú problémák

Alapadatok

Doksi olvasó beágyazása

Értékelések

Mit olvastak a többiek, ha ezzel végeztek?

Valószínűségszámítás és matematikai statisztika

Dr. Németh Anikó - Adatelemzés statisztikai módszerekkel

Dr. Sebők Miklós - Statisztikai adatok és elemzés a Big Data korában

Kun Imre Zoltán - Klinikai endocrinologia

Tartalmi kivonat

Cikkajánló

Verseghy Ferenc

Doksiajánló

Tartalmak

Navigáció