Ord og uttrykk i folkehelseprofilene og i oppvekstprofilene
Artikkel
|Oppdatert
Her finner du forklaringer på begreper som er benyttet i folkehelseprofilene og i oppvekstprofilene. I tillegg finner du informasjon om hvilke personvernhensyn som tas i arbeidet med profilene.
Forventet levealder
Forventet levealder ved fødselen er basert på dødeligheten ved forskjellige aldre slik den har vært de siste årene. Beregningen sier hvor lenge et nyfødt barn kan forvente å leve hvis dødeligheten fortsetter å være slik den var i perioden som er brukt som beregningsgrunnlag.
I folkehelseprofilene er beregningen av forventet levealder basert på dødeligheten over den siste 15-årsperioden. Dette er lenger enn hva som ofte brukes. Vi må bruke en så lang periode for å gi noenlunde pålitelige estimater for enkeltkommuner. Mer om forventet levealder:
Glidende gjennomsnitt
Glidende gjennomsnitt brukes når tallgrunnlaget er lite og gjelder ofte gjennomsnitt for siste tre eller fem år. Antallet som oppgis er gjennomsnittlig årlig antall for de siste tre eller fem årene. Uttrykket "glidende" betyr at tidsperiodene det regnes gjennomsnitt av, overlapper hverandre. Grunnen til at glidende gjennomsnitt ofte benyttes er for at små kommuner skal få tall og for å dempe effekten av tilfeldige år- til år-svingninger i litt større kommuner. For noen indikatorer, som trivsel, mobbing og vaksinasjonsdekning finnes årlige tall i tillegg til tall over flere år.
Indikator
Indikator betyr et kjennetegn eller mål på noe. En indikator er av og til et presist mål, andre ganger mer upresist og indirekte. Hvor mange som bruker tabletter for diabetes i kommunen, kan for eksempel være en indikator for antall personer med type 2 diabetes og kan brukes hvis vi ikke har mer direkte mål.
P90/P10
P90/ P10 beskriver inntektsulikheten og angir forholdet mellom inntekten til den personen som befinner seg på 90-prosentilen med den som befinner seg på 10-prosentilen (engelsk: percentile).
Sagt på en annen måte: Om man sorterer 100 personer stigende etter inntekt, er P90/P10 forholdet mellom inntektene til person nummer 90 (den tiende høyeste) og person nummer 10 (den tiende laveste).
I Kommunehelsa statistikkbank under fanen «Definisjoner» finner du utfyllende informasjon om P90/P10. I statistikkbanken finner du også et annet mål på inntektsulikhet, Gini-koeffisienten.
Medianinntekt
Medianinntekt er det inntektsbeløpet som er på midten når inntekten er sortert stigende (eller synkende). Det er like mange personer som har inntekt over som under medianinntekten. Med inntekt menes yrkesinntekter, kapitalinntekter, skattepliktige og skattefrie overføringer i en husholdning i løpet av kalenderåret.
Median husholdningsinntekt benyttes ofte som grense for å beregne blant annet andelen som bor i lavinntektshusholdninger. I kommunehelsa statistikkbank finner du ulike mål på lavinntekt, blant annet inntekt under 50 og 60 prosent av median husholdningsinntekt i Norge. Det finnes også en indikator hvor kommunal median er brukt som grense for lavinntekt
Rate
Det brukes to typer rater:
For å beskrive forekomst: I folkehelseprofilene, oppvekstprofilene og i statistikkbankene er rate som regel ensbetydende med forekomst, for eksempel andelen røykere, andel med overvekt og fedme eller andelen med hjerte- og karsykdommer i en befolkning. Slike rater kalles prevalensrater (prevalens = forekomst).
For å beskrive hyppighet av hendelser: Den andre typen rater er de som representerer hyppighet av hendelser, for eksempel antall utleveringer av antibiotika på apotek i løpet av et år sett i forhold til innbyggertallet. Denne typen rater kalles insidensrater (insidens = hendelse). Dødelighetsrater, fødselsrater og nye krefttilfeller er andre eksempler på insidensrater.
Rater uttrykkes ofte i prosent, altså antall tilfeller per 100 innbyggere. Dersom prosent-tallene blir svært små, uttrykkes raten i stedet som antall per 1000 eller 100 000.
Med standardiserte rater menes at ratene er blitt justert for kommunens aldersstruktur og/eller kjønnssammensetning. Hensikten er å kunne sammenligne kommuneverdiene med landstall uten at kommunens aldersfordeling eller kjønnssammensetning påvirker sammenligningen.
Standardiseringsmetoden som benyttes er indirekte standardisering.
Signifikant
I et datamateriale vil det alltid være variasjoner som skyldes tilfeldigheter. Målet med å beregne statistisk signifikans er å finne ut om et "funn" er framkommet ved tilfeldigheter.
I folkehelseprofilene og i oppvekstprofilene er forskjellene mellom kommunene og landet testet for statistisk signifikans. 5 prosent signifikansnivå er benyttet for hovedtrekkene side 1 og barometeret side 4. At en forskjell er signifikant kan leses slik: vi kan regne med at forskjellen mellom kommune og land skyldes en tilfeldighet i mindre enn 5 prosent av tilfellene, det vil si i mindre enn ett av 20 tilfeller.
Fem prosent signifikansnivå er et vanlig brukt signifikansnivå og betyr at forskjellen mellom kommunen og landet kan betegnes som ”rimelig sikkert”. Tallene er oftere signifikante i større enn i mindre kommuner fordi større datamateriale "visker ut" variasjoner som er rene tilfeldigheter.
Hvis en verdi er vurdert til "ikke signifikant", sier vi at det er "usikkert" om det er forskjell mellom kommune og land. Forskjellen som sees, skyldes en tilfeldighet i 5 prosent eller flere av tilfellene.
Signifikanstestingen - hvordan gjøres den?
For en gitt kommune foregår den statistiske testingen av en forekomst (f.eks. andel fødte med lav fødselsvekt) i to trinn:
- Vi tar først for oss telleren og nevneren i den aktuelle forekomsten i det aktuelle året, og beregner konfidensintervallet for den underliggende forekomsten under antakelse av binomisk fordeling*.
- Den statistiske testen for om kommunen ligger under eller over landsgjennomsnittet (eller ingen av delene) avhenger av om tallene er standardiserte** eller ikke;
- Ustandardiserte tall. Her gjøres den statistiske testen ved å sammenligne konfidensintervallet fra pkt. 1 med landstallet.
- Standardisert tall**. Først omregnes konfidensintervallet i pkt. 1 til et konfidensintervall for telleren (ved å multiplisere med nevneren). Deretter gjøres den statistiske testen ved å sammenligne dette nye konfidensintervallet for observert antall tilfeller med forventet antall tilfeller**.
Metodene er basert på en antakelse om at landstallet for ustandardiserte tall og det forventede antallet for standardisert tall er så godt som uten statistisk usikkerhet. Signifikansnivået er 5 %.
*) Unntaksvis er det ikke snakk om forekomster, men om såkalte insidensrater. I så fall beregnes konfidensintervall under antakelse om poisson-fordeling
**) Med «standardiserte tall» menes at tallene er korrigerte for kommuneforskjeller i aldersstruktur og/eller kjønnssammensetning. Standardiseringsmetoden som benyttes er indirekte standardisering. Den innebærer å sammenligne det observerte antall «tilfeller» (f.eks. antall fødte med lav fødselsvekt) med forventet antall tilfeller (basert på antall mødre i hver aldersgruppe i kommunen, og sammenheng mellom andel fødte med lav fødselsvekt og mors alder, hentet fra landstallene).
Personvernhensyn
Til arbeidet med folkehelseprofiler, oppvekstprofiler og tilhørende statistikkbanker mottas store mengder detaljert informasjon fra en rekke datakilder. Noen av dataene som mottas er av en slik karakter at det kan være mulig å identifisere enkeltpersoner, dataene er såkalt «indirekte personidentifiserbare». En viktig del av arbeidet med dataene som mottas til arbeidet med profilene og de tilhørende statistikkbankene er dermed å sørge for riktig oppbevaring og behandling av dataene. Alle dataene som mottas oppbevares på forsvarlig måte og før publisering går tallene gjennom nøye prosedyrer for skjuling med tanke på personvern.
Følgende prosedyre er fulgt ved behandling av data i statistikkbanken og i profilene:
Trinn 1: Statistikk basert på svært få tilfeller skjules av personvernhensyn. Det konkrete kriteriet varierer mellom 3 og 5 tilfeller, avhengig av statistikktema. Det samme gjelder dersom befolkningssegmentet som tilfellene er hentet fra, er mindre enn 10. Eksempel: Tall på trivsel på skolen publiseres ikke dersom det er færre enn 3 som trives, eller færre enn 10 som har svart på undersøkelsen om trivsel på skolen (elevundersøkelsen).
Trinn 2: Statistikk for en undergruppe skjules dersom tallet for denne undergruppen, sammen med tallet for overgruppen, kunne vært brukt til å utlede et tall som var blitt skjult i Trinn 1.
Trinn 3: Hele tidsserien skjules for en kommune dersom mer enn 20 prosent av tallene i tidsserien er skjult av personvernhensyn. Dette er fordi skjuling selektivt etterlater de høyeste tallene i en tidsserie og således skaper et skjevt inntrykk av situasjonen i kommunen.
Trinn 4: Hele tidsserien for en kommune skjules dersom den jevnt over er basert på et spinkelt tallgrunnlag. Kriteriet for «spinkelt tallgrunnlag» er at mer enn 50 prosent av tallene i tidsserien er basert på færre enn 6 tilfeller. Disse tidsseriene skjules fordi de er sterkt påvirket av tilfeldige svingninger og derfor gir statistikk som lett kan mistolkes.
I Kommunehelsa statistikkbank under fanen «Definisjoner» finner du utfyllende informasjon om hvilke skjulingsprosedyrer som er benyttet for hver enkelt indikator.