/ Forside / Karriere / Uddannelse / Højere uddannelser / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Højere uddannelser
#NavnPoint
Nordsted1 1588
erling_l 1224
ans 1150
dova 895
gert_h 800
molokyle 661
creamygirl 610
berpox 610
jomfruane 570
10  3773 570
Statistik: opdeling af x-akse på søjlediag~
Fra : Leif Neland


Dato : 24-02-04 03:16

Givet et datasæt af et vist antal besvarelser af spørgsmål som "hvor mange
æg lagde hver høne sidste år", skal der laves et søjlediagram.
Men hvordan opdeler man automatisk x-aksen, så man får en graf, der
afspejler fordelingen fornuftigt?

F.ex. har man datasættet 10,10,10,30,31,32,33,34 får man med intervallet 1
en graf, der væltet ser således ud:

***

*
*
*
*
*


Mens et interval på 5 giver
***

*****

Den ene måde antyder at hovedparten ligger i venstre del af grafen, den
anden i højre del.
Der er ingen menneskelig indblandning, der kan justere til en fornuftig
opløsning; grafen skal dannes af webserveren efterhånden som der indlæses
data.

Eller er det bedre at lave grafen således at den for en given x viser % af
samples er <= x, altså så grafen går fra 0 til 100%

***
***
***
****
*****
******
*******
********
********
********

Leif



 
 
Jakob Møbjerg Nielse~ (25-02-2004)
Kommentar
Fra : Jakob Møbjerg Nielse~


Dato : 25-02-04 16:00

Leif Neland wrote:

> Men hvordan opdeler man automatisk x-aksen, så man får en graf, der
> afspejler fordelingen fornuftigt?

Med en blyant? Vi ved ikke hvilket program du snakker om.

Desuden findes der grupper specielt beregnede til disse programmer (fx
<news:dk.edb.programpakker.ms-office>, hvis du bruger Excel). Denne
grupper er under alle omstændigheder ikke det rigtige sted at spørge.

--
Jakob Møbjerg Nielsen | "Nine-tenths of the universe is the
jakob@dataloger.dk | knowledge of the position and direction
http://www.jakobnielsen.dk/ | of everything in the other tenth."
| -- Terry Pratchett, Thief of Time


Leif Neland (27-02-2004)
Kommentar
Fra : Leif Neland


Dato : 27-02-04 07:28


"Jakob Møbjerg Nielsen" <jakob@dataloger.dk> skrev i en meddelelse
news:c1ida1$on1$1@sunsite.dk...
> Leif Neland wrote:
>
> > Men hvordan opdeler man automatisk x-aksen, så man får en graf, der
> > afspejler fordelingen fornuftigt?
>
> Med en blyant? Vi ved ikke hvilket program du snakker om.

Hvem taler om et program?
Jeg taler om statistik. Om grafen skal laves med blyant eller med gdlib er
irrelevant. Når jeg først har grupperet tallene, skal jeg nok få dem vist.

> Desuden findes der grupper specielt beregnede til disse programmer (fx
> <news:dk.edb.programpakker.ms-office>, hvis du bruger Excel). Denne
> grupper er under alle omstændigheder ikke det rigtige sted at spørge.

Er der en gruppe for matematik/statistik ud over denne?

Leif



Jeppe Stig Nielsen (27-02-2004)
Kommentar
Fra : Jeppe Stig Nielsen


Dato : 27-02-04 17:03

Leif Neland wrote:
>
> Givet et datasæt af et vist antal besvarelser af spørgsmål som "hvor mange
> æg lagde hver høne sidste år", skal der laves et søjlediagram.
> Men hvordan opdeler man automatisk x-aksen, så man får en graf, der
> afspejler fordelingen fornuftigt?
>[...]

Der kan ikke rigtigt gives noget svar på dit spørgsmål. Det du spørger
om, er i hvilke intervaller man bør gruppere observationerne med henblik
på at lave et stolpediagram hvor hver stolpes højde afspejler antallet
af observationer inden for et enkelt »gruppeinterval«.

Det må komme an på et skøn og en æstetisk vurdering. Hvis der er meget
få observationer, vil man blot angive deres placering på en tallinje.
Hvis der er mange observationer, grupperer man dem i intervaller sådan
at der er et pænt antal (mere end to-tre?) i de fleste intervaller.

Måske skal du overveje at bruge et histogram i stedet for et søjledia-
gram. Når man skal lave et histogram inddeler man også observationerne
i grupper (intervaller), men i stedet for at lave en søjle med en
passende højde, laver man et rektangel hvis *areal* er et mål for
antallet af observationer i intervallet. Rektanglets grundlinje er på
en tallinje således at grundlinjen udgør det aktuelle interval. Det vil
sige at rektanglerne »rører« hinanden.

Lidt svært at forklare, men den type histogram jeg mener, kan ses her:
http://www.mapleapps.com/languageApps/Spanish/html/images/Estadistica/Estadistica32.gif

Andenaksen er lidt arbitrær fordi den bare er lavet sådan at det samlede
areal er 1 (dvs. 100 %). Bemærk altså at det *ikke* er højden af rekt-
anglet, men arealet af det, som fortæller hvor mange observationer der
er i intervallet.

--
Jeppe Stig Nielsen <URL:http://jeppesn.dk/>. «

"Je n'ai pas eu besoin de cette hypothèse (I had no need of that
hypothesis)" --- Laplace (1749-1827)

Søg
Reklame
Statistik
Spørgsmål : 177560
Tips : 31968
Nyheder : 719565
Indlæg : 6408943
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste