Annak ellenére, hogy a görbe ugyanolyannak tűnik, mi a különbség Cauchy és Gauss eloszlás között?


Válasz 1:

A cauchy nem tűnik normálisnak. A Cauchy kinézete pontosan az Ön által használt paraméterektől függ, de nem tűnik normálisnak.

pl

set.seed (1234) #Véletlen számú magot ad x1 <- rcauchy (1000, 0, 1) x2 <- rnorm (1000, átlag (x1), sd (x1)) plot (sűrűség (x1)) plot (sűrűség) (x2))

Egyáltalán nem néz ki ugyanaz. És x1 -178-tól 702-ig terjed, míg x2 -76-tól 71-ig.


Válasz 2:

Mint láthatja, a két görbe hasonlóan néz ki, mivel mindkettőnek egyetlen „ütközése” van, és minél szélesebbre oszlanak meg, minél távolabb kerülnek. Ezek abban különböznek abban, hogy a Cauchy-nak szűkebb csúcsa van és lassabban terjed - sokkal nagyobb a valószínűsége, hogy a csúcstól távol eső értékeket kap a normál eloszláshoz képest. Ez a különbség matematikai szempontból sok különböző következménnyel jár - például a Cauchy-nak, amelynek nincs pontosan meghatározott középértéke, és sajátos mintavételi eloszlása ​​van, ahol a „nagy számok törvénye” nem vonatkozik.


Válasz 3:

Annak ellenére, hogy a görbe ugyanolyannak tűnik, mi a különbség Cauchy és Gauss eloszlás között?

Felületesen hasonlóak. De mutasson nekem egy eloszlás sűrűségfüggvényének grafikonját, és mondja meg, hogy Cauchy vagy Gauss-féle, tudnám, melyik (feltételezve, hogy valójában ezek egyike). A Cauchynak sokkal hosszabb farka van.

Ha egy ismeretlen paraméterekkel rendelkező disztribúciókkal rendelkezik, meg akarjuk becsülni ezeket a paramétereket.

  • A Gauss-eloszlásnak két paramétere van: az átlag és a szórás. Ehelyett más paramétereket is használhatunk, például a medián (ami megegyezik az átlaggal) és a félig intervartilis tartományt (ami kb.
  • 0.67450.6745
  • A szórás átlaga)). A Cauchy-eloszlás átlaga nem létezik, de a szimmetria középpontja a medián. A szórás sem létezik, de a mediánhoz képest négyzetes eltérések átlaga végtelen.

Szóval ez a fő különbség. Bármely eloszlás paramétereit medián és félig intervartilis tartománynak tekinthetjük, de a Cauchy esetében nem használhatjuk az átlagot és a szórást, mivel ezek nem léteznek.

Amikor egy mintát veszünk az eloszlás paramétereinek becsléséhez, kiszámoljuk a statisztikákat, például a minta értékek átlagát és szórását. Ezeknek a statisztikáknak megoszlása ​​van. A minta statisztikájának eloszlása ​​mintázási eloszlása.

  • Ha a populáció eloszlása ​​Gauss, a mintavételi eloszlás (a mintavételi eloszlás) szintén Gaussian és sokkal kisebb szórással rendelkezik, tehát egy nagy minta pontosabb becsléseket ad, mint csupán egy megfigyelés. Ha az eloszlás Cauchy, akkor a A minta átlagának Cauchy-eloszlása ​​is van, de pontosan megegyezik a medián és a félig intervartilis tartományban, mint az eredeti eloszlás. A minta átlagának meghatározásakor nincs haszna.

Szóval ez egy másik különbség. A Gaussian mintájának átlaga hasznos az átlag (vagy a medián) becsléséhez; a Cauchy mintájának átlaga haszontalan a medián becslésére. Sokkal jobb, ha a minta mediánját használja, amely pontosabb becsléseket ad.

Hasonló érvek vonatkoznak mindkét eloszlás terjedésének becslésére (bármit meg is határozhatsz). A Gauss-eloszlás szokásos becslései nem működnek a Cauchy-eloszlás esetén.

A valódi különbség a sűrűség matematikai képletében van. Szabványos formában a Gaussian sűrűsége van

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

és a Cauchy sűrűsége van

1π(1+z2)\frac1{\pi(1+z^2)}

.

Vegye figyelembe, hogy a kettő

zz

s különböznek. Az első esetben a szórás:

11

, a második esetben a felső kvartilis

11

.

Az eloszlási függvény (annak valószínűsége, hogy

ZzZ\le z

) nem rendelkezik tiszta zárt formával a Gauss-disztribúcióhoz, de a Cauchy-nak van

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

.

Ha az eloszlást az ugyanazon tengelyen szeretné ábrázolni, hogy megnézze a különbséget, akkor meg kell egyeznie a paraméterekkel. Tehát szabványosítanám a Gaussian-t úgy, hogy az alsó és a felső kvartilis legyen

0.6745-0.6745

és

0.67450.6745

, azaz a szórást egyenlővé kell tenni

1.48261.4826

és használja a Cauchy szabványos nyomtatványát. A grafikonok alatt levő területeknek egyenlőnek kell lenniük, tehát a középpont magasságait megfelelő módon kell méretezni (

0.2690.269

a Gauss és a

0.3180.318

a cauchy esetében: a cauchy közepesen magasabb és a farok magasabb).