|
| Spredning Fra : saneman |
Dato : 16-05-08 11:16 |
|
Spredning svarer til afvigelsen fra middelværdien. Men kan spredning også
forstås som at det er indenfor denne afvigelse at det meste data befinder
sig?
Hvis man fx har en vektor v = [1, 9, 10, 11, 100] så bliver middelværdien E:
E = 26.2
og spredningnen S:
S = 41.4451 (kvadratroden af variansen)
Dvs at det meste data ligger fra:
[26.2 - 41.4451 : 41.4451 + 26.2 ] = [-15.2451 : 67.6451]
Dog undre det mig at intervallet kan blive negativt.
| |
Carsten Svaneborg (16-05-2008)
| Kommentar Fra : Carsten Svaneborg |
Dato : 16-05-08 20:14 |
|
saneman wrote:
> Spredning svarer til afvigelsen fra middelværdien. Men kan spredning
> også forstås som at det er indenfor denne afvigelse at det meste
> data befinder sig?
Yeps. Hvis dine data er fordelt efter en gaussisk fordeling
P(x) ~ exp(- (x-a)^2/2s^2), så vil ca. 68% af dataene ligge
inden for intervallet [a-s:a+s], hvor s er spredningen.
MEN det bygger på antagelsen om at fordelingen er gaussisk,
og derfor også at negative tal forekommer. Hvis f.eks. dataene
er fordelt efter P(x) ~ exp(-ax) x>=0 så giver ovenstående
interval ikke nogen mening, men kan så give et andet interval
hvor en vis procentdel af fordelingen findes.
--
Mvh. Carsten Svaneborg
http://gauss.ffii.org softwarepatent database
| |
Torben Ægidius Mogen~ (19-05-2008)
| Kommentar Fra : Torben Ægidius Mogen~ |
Dato : 19-05-08 10:52 |
|
"saneman" <asd@ad.com> writes:
> Spredning svarer til afvigelsen fra middelværdien.
Stort set, men det er ikke gennemsnittet af afstanden fra
middelværdien. Det kaldes (såvidt jeg husker) middelafvigelse.
> Men kan spredning også
> forstås som at det er indenfor denne afvigelse at det meste data befinder
> sig?
Ikke altid. Hvis du f.eks. har værdierne
-201,-200,-199,-100,100,199,200,201, så er middelværdien 0,
spredningen ca. 180, men kun to værdier ud af otte ligger indenfor
middelværdien +/- spredningen.
Torben
| |
Poul E Hansen (19-05-2008)
| Kommentar Fra : Poul E Hansen |
Dato : 19-05-08 13:56 |
|
On 19 Maj, 11:51, torb...@pc-003.diku.dk (Torben Ægidius Mogensen)
wrote:
> "saneman" <a...@ad.com> writes:
> > Spredning svarer til afvigelsen fra middelværdien.
>
> Stort set, men det er ikke gennemsnittet af afstanden fra
> middelværdien. Det kaldes (såvidt jeg husker) middelafvigelse.
>
> > Men kan spredning også
> > forstås som at det er indenfor denne afvigelse at det meste data befinder
> > sig?
>
> Ikke altid. Hvis du f.eks. har værdierne
> -201,-200,-199,-100,100,199,200,201, så er middelværdien 0,
> spredningen ca. 180, men kun to værdier ud af otte ligger indenfor
> middelværdien +/- spredningen.
Ja.
Men hvis det er den samme ting man måler, men (pga. usikkerhed) får
forskellige værdier, vil man med stor sandsynlighed få flere målinger
der ligger tæt på middelværdien end langt fra den - modsat ovenstående
datasæt.
| |
Lasse Reichstein Nie~ (20-05-2008)
| Kommentar Fra : Lasse Reichstein Nie~ |
Dato : 20-05-08 06:07 |
|
Poul E Hansen <ook@ofir.dk> writes:
> Men hvis det er den samme ting man måler, men (pga. usikkerhed) får
> forskellige værdier, vil man med stor sandsynlighed få flere målinger
> der ligger tæt på middelværdien end langt fra den - modsat ovenstående
> datasæt.
Ja, hvis dine data er normal-fordelt, så vil en stor del (ca. 69%)
ligge inden for +/- en spredning fra gennemsnit.
/L
--
Lasse Reichstein Nielsen - lrn@hotpop.com
DHTML Death Colors: <URL: http://www.infimum.dk/HTML/rasterTriangleDOM.html>
'Faith without judgement merely degrades the spirit divine.'
| |
Poul E Hansen (21-05-2008)
| Kommentar Fra : Poul E Hansen |
Dato : 21-05-08 04:54 |
|
On 20 Maj, 07:07, Lasse Reichstein Nielsen <l...@hotpop.com> wrote:
> Poul E Hansen <o...@ofir.dk> writes:
>
> > Men hvis det er den samme ting man måler, men (pga. usikkerhed) får
> > forskellige værdier, vil man med stor sandsynlighed få flere målinger
> > der ligger tæt på middelværdien end langt fra den - modsat ovenstående
> > datasæt.
>
> Ja, hvis dine data er normal-fordelt, så vil en stor del (ca. 69%)
> ligge inden for +/- en spredning fra gennemsnit.
I det fleste logisk 'oplagte fordelinger vil de fleste målinger ligge
inden for det interval.
Apropos normalfordeling - hvis man tager en skoleklasse og måler
elvernes højde (som så ikke er målinger af den 'samme ting'), skulle
tallene man får være tæt på normalfordelt.
Man kunne sagtens forestille sig, at fordelingen bliver ikke- eller
mindre normalfordelt hvis man istedet måler på en aldersgruppe fra
mennesker af alle folk. Hvis vi fx. har to folkeslag,, hvor personerne
i en givet aldergruppe har nomalfordelt højde, men hvor de to gruppers
middelværder afviger betragteligt fra hinanden, kan den samlede gruppe
jo ikke også være nomalfordelt; fx. vil spredningen være større.
| |
Poul E Hansen (21-05-2008)
| Kommentar Fra : Poul E Hansen |
Dato : 21-05-08 12:49 |
|
On 21 Maj, 12:53, Poul E Hansen <o...@ofir.dk> wrote:
> On 20 Maj, 07:07, Lasse Reichstein Nielsen <l...@hotpop.com> wrote:
>
> > Poul E Hansen <o...@ofir.dk> writes:
> Hvis vi fx. har to folkeslag,, hvor personerne
> i en givet aldergruppe har nomalfordelt højde, men hvor de to gruppers
> middelværder afviger betragteligt fra hinanden, kan den samlede gruppe
> jo ikke også være nomalfordelt; fx. vil spredningen være større.
- hvilket selvfølgelig ikke gør at tallene ikke er normalfordelt; men
værdierne vil i højere grad koncentrere sig borte fra middelværdien,
og færre end 67% vil ligge indenfor spredningsintervallet.
| |
Torben Ægidius Mogen~ (22-05-2008)
| Kommentar Fra : Torben Ægidius Mogen~ |
Dato : 22-05-08 09:30 |
|
Poul E Hansen <ook@ofir.dk> writes:
> On 21 Maj, 12:53, Poul E Hansen <o...@ofir.dk> wrote:
>> On 20 Maj, 07:07, Lasse Reichstein Nielsen <l...@hotpop.com> wrote:
>>
>> > Poul E Hansen <o...@ofir.dk> writes:
>
>
>> Hvis vi fx. har to folkeslag,, hvor personerne
>> i en givet aldergruppe har nomalfordelt højde, men hvor de to gruppers
>> middelværder afviger betragteligt fra hinanden, kan den samlede gruppe
>> jo ikke også være nomalfordelt; fx. vil spredningen være større.
>
> - hvilket selvfølgelig ikke gør at tallene ikke er normalfordelt;
Summen af to normalfordelinger med forskellig middelværdi giver ikke
en normalfordeling.
> men værdierne vil i højere grad koncentrere sig borte fra
> middelværdien, og færre end 67% vil ligge indenfor
> spredningsintervallet.
En normalfordeling vil, uanset hvor flad den er, have ca. 68% af
værdierne indenfor en standardafvigelse (spredning) af middelværdien
-- hvis du gør kurven fladere flytter du også spredningen længere ud.
Se evt.
http://en.wikipedia.org/wiki/Normal_distribution#Standard_deviation_and_confidence_intervals
Torben
| |
Poul E Hansen (22-05-2008)
| Kommentar Fra : Poul E Hansen |
Dato : 22-05-08 09:21 |
|
On 22 Maj, 10:29, torb...@pc-003.diku.dk (Torben Ægidius Mogensen)
wrote:
> Poul E Hansen <o...@ofir.dk> writes:
>
> > On 21 Maj, 12:53, Poul E Hansen <o...@ofir.dk> wrote:
> >> On 20 Maj, 07:07, Lasse Reichstein Nielsen <l...@hotpop.com> wrote:
>
> >> > Poul E Hansen <o...@ofir.dk> writes:
>
> >> Hvis vi fx. har to folkeslag,, hvor personerne
> >> i en givet aldergruppe har nomalfordelt højde, men hvor de to gruppers
> >> middelværder afviger betragteligt fra hinanden, kan den samlede gruppe
> >> jo ikke også være nomalfordelt; fx. vil spredningen være større..
>
> > - hvilket selvfølgelig ikke gør at tallene ikke er normalfordelt;
>
> Summen af to normalfordelinger med forskellig middelværdi giver ikke
> en normalfordeling.
Hvad jeg heller ikke skrev; men at de tallene har en større spredning
er ikke grunden til at de ikke er normalfordelt.
>
> > men værdierne vil i højere grad koncentrere sig borte fra
> > middelværdien, og færre end 67% vil ligge indenfor
> > spredningsintervallet.
>
> En normalfordeling vil, uanset hvor flad den er, have ca. 68% af
> værdierne indenfor en standardafvigelse (spredning) af middelværdien
> -- hvis du gør kurven fladere flytter du også spredningen længere ud..
Ja.
| |
|
|