Slik gjør du grunnleggende dataanalyse i Excel

Slik gjør du grunnleggende dataanalyse i Excel

Mesteparten av tiden når du kjører statistikk, vil du bruke statistisk programvare. Disse verktøyene er bygget for å gjøre beregninger som t -tester, chi-square-tester, korrelasjoner og så videre. Excel er ikke ment for dataanalyse. Men det betyr ikke at du ikke kan gjøre det.





Dessverre er ikke Excels statistiske funksjoner alltid intuitive. Og de gir deg vanligvis esoteriske resultater. Så i stedet for å bruke statistikkfunksjoner, kommer vi til å bruke go-to Excel-statistikktillegget: the Dataanalyse Toolpak.





Toolpak, til tross for den ganske uheldig stavemåten, inneholder et bredt spekter av nyttig statistikkfunksjonalitet. La oss se hva vi kan gjøre med Excel -statistikk.





Legger til Excel Data Analysis Toolpak

Mens du kan gjøre statistikk uten Data Analysis Toolpak, det er mye lettere med det. For å installere Toolpak i Excel 2016, gå til Fil> Alternativer> Tillegg .

Klikk ved siden av 'Administrer: Excel-tillegg.'



Merk av i boksen ved siden av i vinduet som vises Analyse Toolpak og klikk deretter OK .

Hvis du har lagt til dataanalyseverktøypakken riktig i Excel, ser du en Dataanalyse -knappen i Data kategorien, gruppert i Analyse seksjon:





Hvis du vil ha enda mer strøm, må du sjekke ut de andre tilleggene i Excel.

Beskrivende statistikk i Excel

Uansett hvilken statistisk test du kjører, vil du sannsynligvis først få Excels beskrivende statistikk. Dette vil gi deg informasjon om midler, medianer, varians, standardavvik og feil, kurtosis, skjevhet og en rekke andre tall.





Det er enkelt å kjøre beskrivende statistikk i Excel. Klikk Dataanalyse Velg Data i kategorien Data Beskrivende statistikk, og velg inndataområdet. Klikk på pilen ved siden av inndatafeltet, klikk og dra for å velge dataene dine, og trykk på Tast inn (eller klikk på den tilsvarende pil ned), som i GIF -en nedenfor.

Etter det må du fortelle Excel om dataene dine har etiketter, om du vil ha utdataene i et nytt ark eller på det samme, og om du vil ha sammendragsstatistikk og andre alternativer.

Etter det, slå OK , og du får din beskrivende statistikk:

Studentens t-test i Excel

De t -test er en av de mest grunnleggende statistiske testene, og det er enkelt å beregne i Excel med Toolpak. Klikk på Dataanalyse og bla ned til du ser t -testalternativer.

Du har tre valg:

  • t-Test: Paret to prøver for midler skal brukes når målingene eller observasjonene dine ble paret. Bruk dette når du tok to målinger av de samme emnene, for eksempel måling av blodtrykk før og etter en intervensjon.
  • t-Test: To-prøve antar like avvik bør brukes når målingene dine er uavhengige (som vanligvis betyr at de ble gjort på to forskjellige faggrupper). Vi diskuterer delen om like forskjeller om et øyeblikk.
  • t-test: to-prøve antar ulik variasjon er også for uavhengige målinger, men brukes når avvikene dine er ulik.

For å teste om avvikene til de to prøvene dine er like, må du kjøre en F-test. Finne F-test to-prøve for variasjoner i listen Analyseverktøy, velg den og klikk OK .

Skriv inn de to datasettene i boksene for inndataområde. La alfa -verdien ligge på 0,05 med mindre du har grunn til å endre den - hvis du ikke vet hva det betyr, er det bare å la være. Til slutt klikker du OK .

Excel gir deg resultatene i et nytt ark (med mindre du valgte Utgangsområde og en celle i det nåværende arket):

Du ser på P-verdien her. Hvis det er mindre enn 0,05, har du det ulik avvik . Så å kjøre t -test, du bør bruke alternativet ulik varians.

Å kjøre a t -test, velg den aktuelle testen fra vinduet Analyseverktøy og velg begge settene med dataene dine på samme måte som du gjorde for F-testen. La alfa -verdien ligge på 0,05, og slå OK .

Resultatene inkluderer alt du trenger å rapportere for a t -test: midler, frihetsgrader (df), t-statistikk og P-verdier for både en- og tohale tester. Hvis P-verdien er mindre enn 0,05, er de to prøvene signifikant forskjellige.

Hvis du ikke er sikker på om du skal bruke en- eller tohale t -test, sjekk ut denne forklareren fra UCLA .

ANOVA i Excel

Excel Data Analysis Toolpak tilbyr tre typer variansanalyse (ANOVA). Dessverre gir det deg ikke muligheten til å kjøre de nødvendige oppfølgingstestene som Tukey eller Bonferroni. Men du kan se om det er et forhold mellom noen få forskjellige variabler.

Her er de tre ANOVA -testene i Excel:

  • ANOVA: Single Factor analyserer varians med en avhengig variabel og en uavhengig variabel. Det er å foretrekke fremfor å bruke flere t -tester når du har mer enn to grupper.
  • ANOVA: To-faktor med replikasjon er lik den sammenkoblede t -test; det innebærer flere målinger på enkeltemner. 'To-faktor' -delen av denne testen indikerer at det er to uavhengige variabler.
  • ANOVA: To-faktor uten replikasjon innebærer to uavhengige variabler, men ingen replikasjon i måling.

Vi skal gå over enkeltfaktoranalysen her. I vårt eksempel ser vi på tre sett med tall, merket 'Intervensjon 1', 'Intervensjon 2' og 'Intervensjon 3.' Klikk på for å kjøre en ANOVA Dataanalyse , og velg deretter ANOVA: Single Factor .

Velg inndataområdet, og sørg for å fortelle Excel om gruppene dine er i kolonner eller rader. Jeg har også valgt 'Etiketter i første rad' her, slik at gruppenavnene vises i resultatene.

Etter å ha slått OK får vi følgende resultater:

Vær oppmerksom på at P-verdien er mindre enn 0,05, så vi har et betydelig resultat. Det betyr at det er en signifikant forskjell mellom minst to av gruppene i testen. Men fordi Excel ikke gir tester for å bestemme hvilken grupper er forskjellige, det beste du kan gjøre er å se på gjennomsnittene som vises i sammendraget. I vårt eksempel ser Intervensjon 3 ut som det er sannsynligvis den som er forskjellig.

Dette er ikke statistisk forsvarlig. Men hvis du bare vil se om det er en forskjell, og se hvilken gruppe som sannsynligvis forårsaker det, vil det fungere.

To-faktor ANOVA er mer komplisert. Hvis du vil lære mer om når du skal bruke tofaktormetoden, kan du se denne videoen fra Sophia.org og ' uten replikasjon 'og' med replikasjon 'eksempler fra ekte statistikk.

Korrelasjon i Excel

Å beregne korrelasjon i Excel er mye enklere enn t -test eller en ANOVA. Bruke Dataanalyse for å åpne vinduet Analyseverktøy og velg Sammenheng .

Velg inndataområdet, identifiser gruppene dine som kolonner eller rader, og fortell Excel om du har etiketter. Etter det, slå OK .

Du vil ikke få noen mål av betydning, men du kan se hvordan hver gruppe er korrelert med de andre. En verdi på en er en absolutt korrelasjon, som indikerer at verdiene er nøyaktig de samme. Jo nærmere en korrelasjonsverdien er, desto sterkere er korrelasjonen.

Regresjon i Excel

Regresjon er en av de mest brukte statistiske testene i industrien, og Excel pakker overraskende mye strøm til denne beregningen. Vi kjører en rask multiple regresjon i Excel her. Hvis du ikke er kjent med regresjon, sjekk ut HBRs guide til bruk av regresjon for virksomheten .

La oss si at vår avhengige variabel er blodtrykk, og våre to uavhengige variabler er vekt og saltinntak. Vi vil se hvilken som er en bedre prediktor for blodtrykk (eller om de begge er gode).

Klikk Dataanalyse og velg Regresjon . Du må være forsiktig når du fyller ut inndataboksene denne gangen. De Inngang Y -område boksen skal inneholde din enkeltavhengige variabel. De Inngang X -område boksen kan inneholde flere uavhengige variabler. For en enkel regresjon, ikke bekymre deg for resten (men husk å fortelle Excel hvis du valgte etiketter).

Slik ser beregningen vår ut:

Etter å ha slått OK får du en stor liste over resultater. Jeg har fremhevet P-verdien her for både vekt og saltinntak:

Som du kan se, er P-verdien for vekt større enn 0,05, så det er ingen signifikant sammenheng der. P-verdien for salt er imidlertid under 0,05, noe som indikerer at det er en god prediktor for blodtrykk.

Hvis du planlegger å presentere regresjonsdataene dine, må du huske at du kan legge til en regresjonslinje til en scatterplot i Excel. Det er en flott visuell hjelp for denne analysen.

Excel -statistikk: Overraskende dyktig

Selv om Excel ikke er kjent for sin statistiske kraft, inneholder den faktisk noen veldig nyttige funksjoner, for eksempel PowerQuery -verktøyet , som er praktisk for oppgaver som å kombinere datasett. (Lær hvordan du genererer ditt første Microsoft Power Query-skript.) Det er også statistisk tillegg for Data Analysis Toolpak, som virkelig får frem noen av Excel beste funksjoner. Jeg håper du har lært hvordan du bruker Toolpak, og at du nå kan leke på egen hånd for å finne ut hvordan du bruker flere av funksjonene.

beste foto -app for Windows 10

Med dette nå under beltet, ta Excel -ferdighetene dine til neste nivå med våre artikler om ved hjelp av Excels målsøk -funksjon for mer dataknusing og søker etter verdier med vlookup . På et tidspunkt vil du kanskje også lære å importere Excel -data til Python.

Dele Dele kvitring E -post Slett disse Windows -filene og mappene for å frigjøre diskplass

Trenger du å tømme diskplass på Windows -datamaskinen? Her er Windows -filer og mapper som trygt kan slettes for å frigjøre diskplass.

Les neste
Relaterte temaer
  • Produktivitet
  • Regneark
  • Microsoft Excel
Om forfatteren Deretter Albright(506 artikler publisert)

Dann er en innholdsstrategi og markedsføringskonsulent som hjelper bedrifter med å generere etterspørsel og kundeemner. Han blogger også om strategi og innholdsmarkedsføring på dannalbright.com.

Mer fra Dann Albright

Abonner på vårt nyhetsbrev

Bli med i vårt nyhetsbrev for tekniske tips, anmeldelser, gratis ebøker og eksklusive tilbud!

Klikk her for å abonnere