Cum de a găsi Coeficientul de corelare cu Excel
Unul dintre cele mai simple și mai comune statistici Excel Excel Cum să calculați statisticile de bază în Excel: Un ghid pentru începători Cum se calculează statisticile de bază în Excel: Un ghid pentru începători Microsoft Excel poate face statistici! Puteți calcula procentajele, mediile, deviația standard, eroarea standard și testele T ale elevului. Citește mai mult pe care le-ai putea face este corelația. Este o statistică simplă, dar poate fi foarte informativă atunci când doriți să vedeți dacă sunt legate două variabile. Dacă cunoașteți comenzile corecte, găsiți coeficientul de corelație în Excel este extrem de ușor.
Vom analiza ce corelație este să vă oferim o idee despre informațiile pe care vi le oferă. Apoi vom continua să găsim coeficientul de corelație în Excel folosind două metode și un grafic bun pentru analizarea corelațiilor. În cele din urmă, vă voi oferi o introducere foarte rapidă în regresia liniară, o altă funcție statistică care s-ar putea dovedi utilă atunci când vă uitați la corelații.
Ce este corelația?
Înainte de a începe, să discutăm definiția corelației. Este o măsură simplă a modului în care sunt legate lucrurile. Să aruncăm o privire la două variabile care nu au nici o corelație.
Aceste două variabile (una reprezentată pe axa X, una pe Y) sunt total aleatorii și nu sunt strâns legate.
Cele două variabile de mai jos, însă, sunt corelate:
În general, pe măsură ce o variabilă crește, la fel și cealaltă. Aceasta este corelația. (Rețineți că poate fi și invers; în cazul în care unul merge în sus și altul coboară, aceasta este o corelație negativă.)
Înțelegerea coeficientului de corelare
Coeficientul de corelație vă arată cum sunt două variabile asociate. Coeficientul este între -1 și 1. Un coeficient de corelație de 0 înseamnă că nu există nici o corelație între două variabile. Aceasta este ceea ce ar trebui să obțineți atunci când aveți două seturi de numere aleatorii.
Un coeficient de -1 înseamnă că aveți o corelație negativă perfectă: pe măsură ce o variabilă crește, cealaltă scade proporțional. Un coeficient de 1 este o corelație pozitivă perfectă: pe măsură ce o variabilă crește, cealaltă crește proporțional.
Orice număr între acestea reprezintă o scară. O corelație de .5, de exemplu, este o corelație pozitivă moderată.
După cum puteți vedea în graficul de mai jos, corelația doar caută o relație liniară. Două variabile pot fi strâns legate într-un alt mod și au un coeficient de corelație de zero:
Cum de a găsi Coeficient de corelare în Excel utilizând CORREL
Există o funcție integrată pentru corelarea în Excel. Funcția CORREL are o sintaxă foarte simplă:
= CORREL (array1, array2)
array1 este primul grup de numere și array2 este al doilea grup. Excel va scuipa un număr și acesta este coeficientul de corelație. Să ne uităm la un exemplu.
În această foaie de calcul, avem o listă de mașini, cu model și an, și valorile acestora. Am folosit funcția CORREL pentru a vedea dacă anul și valoarea modelului au fost corelate:
Există o corelație pozitivă foarte slabă; astfel încât anul crește, la fel și valoarea vehiculului. Dar nu foarte mult.
Graphing Correlations
Când executați corelații, este o idee bună să utilizați un grafic pentru a obține o înțelegere vizuală a modului în care sunt asociate seturile dvs. de date. Mergi la Diagrame> Scatter pentru a vedea cum arată datele dvs.:
Puteți vedea că în aceste date, anul mașinii nu afectează foarte mult valoarea. E a ușor pozitiv, dar este slab. Asta am găsit cu funcția noastră CORREL.
Un alt element util într-un scatterplot este o linie de trend, care arată astfel:
Linia de trend poate fi utilă atunci când doriți să faceți o corelație clară în scatterplot. În Windows, faceți clic pe Instrumente diagramă> Design> Adăugați elementul de diagramă și selectați Trendline. Pe un Mac, va trebui să mergeți la Diagrama grafică sau Grafică, în funcție de ediția Excel.
Și nu uitați să verificați ghidul nostru de a face diagrame excelente în Excel Cum să creați grafice puternice și diagrame în Microsoft Excel Cum să creați grafice puternice și diagrame în Microsoft Excel Un grafic bun poate face diferența între a obține punctul dvs. de-a lungul sau plecarea toata lumea se opreste. Vă vom arăta cum să creați grafice puternice în Microsoft Excel care să vă angajeze și să vă informeze publicul. Citește mai mult înainte de a prezenta constatările!
Corelarea variabilelor multiple cu ajutorul Instrumentului de analiză a datelor
Dacă aveți numeroase seturi diferite de numere și doriți să găsiți corelații între ele, trebuie să executați funcția CORREL pentru fiecare combinație. Cu ajutorul Instrumentului de analiză a datelor, cu toate acestea, puteți selecta un număr de seturi de date și puteți vedea unde se află corelațiile.
Nu sunteți sigur dacă aveți instrumentul de analiză a datelor? Check out our walkthrough of the basics Cum se face Analiza datelor de bază în Excel Cum se face Analiza datelor de bază în Excel Excel nu este destinat analizei datelor, dar poate încă să se ocupe de statistici. Vă vom arăta cum să utilizați add-in-ul Tool Analysis Tool pentru a rula statisticile Excel. Citiți mai multe pentru a descărca și pentru a obține agățat de ea.
Pentru a aprinde Toolpak-ul, mergeți la Date> Analiza datelor. Veți vedea o listă de opțiuni:
Selectați Corelație și lovit O.K.
În fereastra care rezultă, selectați toate seturile de date din Intervalul de intrare caseta și spuneți Excel unde doriți să plasați rezultatele:
Iată ce veți obține când loviți O.K:
În imaginea de mai sus, am realizat corelații pe patru seturi de date diferite: anul, populația lumii și două seturi de numere aleatorii.
Corelația fiecărui set de date cu ea însăși este 1. Anul și populația lumii au o corelație extrem de puternică, în timp ce există corelații foarte slabe în altă parte, așa cum ne-am fi așteptat cu numere aleatorii.
Corelație vs. regresie liniară în Excel
Corelația este o măsură simplă: cât de apropiate sunt două variabile? Această măsură, cu toate acestea, nu are nici o valoare predictivă sau cauzală. Doar pentru că două variabile sunt corelate nu înseamnă că una provoacă schimbări în cealaltă. Este un lucru crucial să înțelegem corelația.
Dacă sunteți interesat să faceți o reclamație despre cauzalitate, va trebui să utilizați regresia liniară. De asemenea, puteți accesa acest lucru prin intermediul Instrumentului de analiză a datelor. (Acest articol nu va acoperi detaliile despre modul în care funcționează regresia liniară, dar există o mulțime de resurse gratuite de statistici Aflați statistici gratis cu aceste 6 resurse Aflați statistici gratis cu aceste 6 resurse Statisticile au o reputație a unui subiect greu de înțeles Dar învățarea de la resursa potrivită vă va ajuta să înțelegeți în cel mai scurt timp rezultatele sondajului, rapoartele electorale și atribuțiile de clasă ale statisticii dvs. Citiți mai multe care vă pot ajuta să vedeți elementele de bază.)
Deschideți Instrumentul de analiză a datelor, selectați regresiune, și faceți clic pe O.K.
Umpleți intervalele X și Y (valoarea X este variabila explicativă, iar valoarea Y este valoarea pe care încercați să o preziceți). Apoi selectați locul în care doriți să mergeți și dați clic pe O.K din nou.
Numărul pe care doriți să vă concentrați aici este valoarea p pentru variabila dvs. explicativă:
Dacă este mai mică de 0,05, aveți un argument puternic că modificările variabilei dvs. X cauzează modificări în variabila dvs. Y. În imaginea de mai sus, am arătat că anul este un predictor semnificativ al populației lumii.
Regresia liniară este de asemenea utilă pentru că poate privi la mai multe valori. Aici, am folosit regresia pentru a vedea dacă anul și populația sunt predictori semnificativi ai prețului țițeiului:
Ambele valori ale p sunt mai mici de 0,05, astfel încât putem concluziona că atât populația anterioară, cât și cea mondială sunt predictori semnificativi ai prețului țițeiului. (Deși corelațiile puternice dintre variabilele X pot cauza propriile probleme.)
Din nou, aceasta este o explicație foarte simplistă a regresiei liniare și dacă sunteți interesat de cauzalitate, trebuie să citiți câteva tutoriale statistice.
Dar acum aveți o idee despre cum să depășiți corelația simplă dacă căutați mai multe informații statistice!
Obțineți date mai bune din Excel
Înțelegerea funcțiilor statistice de bază din Excel vă poate ajuta să obțineți mai multe informații utile din datele dvs. Corelarea este o măsură simplă, dar poate fi un mare ajutor atunci când încercați să faceți revendicări cu privire la numerele din foaia de calcul.
Desigur, puteți executa o mulțime de alte măsuri mai complicate. Dar, dacă nu vă simțiți confortabil cu statisticile, veți dori să începeți cu elementele de bază 8 Sfaturi pentru cum să învățați Excel rapid 8 Sfaturi pentru cum să învățați Excel rapid Nu este la fel de confortabil cu Excel așa cum ați dori? Începeți cu sfaturi simple pentru a adăuga formule și a gestiona date. Urmați acest ghid și veți fi rapidi în cel mai scurt timp. Citeste mai mult .
Folosiți în mod regulat funcționalitatea corelației Excel? Ce alte funcții statistice doriți să aflați despre?
Explorați mai multe despre: Microsoft Excel.