Innehåll
Analysen av huvudkomponenterna reducerar en uppsättning variabler som är korrelerade med en mindre uppsättning okorrelerade variabler, vilket förenklar en komplex dataset för senare analys. Denna komplexa statistiska procedur kan utföras av många program för dataanalys eller tilläggsprogram som utökar förmågan hos samma och lägger till nya funktioner.
Kalkylarksprogram som Excel kan utföra större komponentanalys med hjälp av en förlängning (Bild av Flickr.com, med tillstånd av Casey Serin)
Förenkla en dataset
Analysen av huvudkomponenterna är en teknik för undersökning och minskning av data. En analytiker kan använda tekniken för att extrahera relevant information från en stor och förvirrande uppsättning data. Tekniken används vanligen när antalet observerade variabler är mycket stort och korrelationerna mellan dem gör det svårt att analysera data direkt. Till exempel kan korrelationen mellan variablerna i vissa fall skapa ett felaktigt intryck av data redundans, göra teknisk analys svår eller kompromissa med utvärderingen av data. Analysen av huvudkomponenterna förenklar de variabler som uttrycker dem som en funktion av ett mindre antal element, huvudkomponenterna, som representerar majoriteten av variationerna i mätningarna av data.
Använd i programmet
Komplexiteten att analysera huvudkomponenterna kräver användning av ett specifikt program. Det finns ett stort antal statistiska program och de flesta av dem kan utföra denna teknik. De mest populära programmen är SAS, Stata och SPSS. Universitet, forskningscentra, konsultorganisationer och andra forskare använder dessa specifika program. Alla tre kan utföra större komponentanalys av en dataset som är införd i ett arbetsblad, där raderna representerar de enskilda observationerna och kolumnerna representerar de separata variablerna.
karaktär
De flesta större komponentanalysprogram, inklusive SAS, Stata och SPSS, kommer att presentera resultaten i form av tabeller som innehåller egna värden eller förklarade mått av varians. Många program ger också den visuella visningen av resultaten i form av en scree-plot.
överväganden
Huvudkomponentanalysen är ofta förvirrad med factorialanalys, en annan metod för datareduktion som förklarar korrelerade observationer när det gäller underliggande faktorer. De två är faktiskt separata förfaranden, även om stor komponentanalys är ett steg med faktoranalys. Men många paket kombinerar de båda procedurerna.
Ett annat viktigt övervägande är att specialprogram som SAS, SPSS och Stata är dyra. Därför kan dessa program inte vara användbara för personer som inte planerar att genomföra statistiska analyser ofta.
Excel
Personer som behöver utföra viss statistisk analys, men föredrar att inte köpa ett specialiserat program, kan fråga sig om de ofta använda kalkylarksprogrammen, till exempel Excel, kan utföra en viktig komponentanalys. Svaret är ja och nej. Även om Excel har några dataanalysverktyg som kan vara tillgängliga från installationen av ett statistiskt analyspaket, är programmet inte avsett att vara ett statistiskt analysprogram. Huvudkomponentanalys och faktoranalys ingår inte i dataanalysverktyget.
Förebyggande / lösning
Det finns ett program som användare kan ladda ner och installera för att förbättra funktionerna i Excel som ett dataanalysverktyg. Addinsoft, ett mjukvaruföretag specialiserat på analysprogram, har skapat XLSTAT. Detta program tillåter Excel att utföra större komponentanalys och andra statistiska förfaranden. Det har också användarvänliga procedurer, så att användaren kan välja data för analys genom att helt enkelt klicka och dra en cell genom de obligatoriska fälten. Användare kan köpa och ladda ner XLSTAT från Addinsoft webbplats. Det finns också en gratis version som användarna kan försöka innan de bestämmer sig för att köpa den.