Cum se face Analiza datelor de bază în Excel
De cele mai multe ori când executați statistici, doriți să utilizați programe statistice. Aceste instrumente sunt construite pentru a face calcule cum ar fi T-teste, teste chi-pătrat, corelații și așa mai departe. Excel nu este destinat analizei datelor. Dar asta nu înseamnă că nu poți să faci asta.
Din nefericire, funcțiile statistice ale Excel nu sunt întotdeauna intuitive. Și de obicei vă dau rezultate esoterice. Deci, în loc să folosim funcții statistice, vom folosi extensia de statistici Excel pentru Excelența datelor: Data Analysis Toolpak.
Toolpak, în ciuda ortografiei sale nefericite, include o gamă largă de funcții statistice utile. Să vedem ce putem face cu statisticile Excel.
Adăugarea Instrumentului de analiză a datelor Excel
In timp ce tu poate sa nu statistici fără Data Analysis Toolpak, este mult mai ușor cu ea. Pentru a instala Toolpak în Excel 2016, mergeți la Fișier> Opțiuni> Suplimente.
Clic Merge lângă “Gestionați: Suplimente Excel.”
În fereastra care rezultă, bifați caseta de lângă Instrument de analiză apoi faceți clic pe O.K.
Dacă ați adăugat corect Toolkit Data Analysis to Excel, veți vedea a Analiza datelor buton în Date tab, grupate în Analiză secțiune:
Dacă doriți mai multă putere, asigurați-vă că ați verificat celelalte programe Excel Power Up Excel cu 10 add-ins pentru a procesa, analiza și vizualiza datele ca un Pro Power Up Excel cu 10 add-ins pentru procesarea, analizarea și vizualizarea datelor Ca un Pro Vanilla Excel este uimitor, dar puteți face chiar mai puternic cu add-ins. Indiferent de datele de care aveți nevoie pentru a procesa, șansele sunt cineva a creat o aplicație Excel pentru ea. Iată o selecție. Citeste mai mult .
Statistici descriptive în Excel
Indiferent de testul statistic pe care îl executați, probabil că doriți să obțineți mai întâi statisticile descriptive ale Excel. Acest lucru vă va oferi informații despre mijloace, mediane, variații, deviații standard și erori, kurtoză, șiretură și o varietate de alte figuri.
Executarea statisticilor descriptive în Excel este ușoară. Clic Analiza datelor în fila Date, selectați Statisticile descriptive, și selectați intervalul de intrare. Dați clic pe săgeata de lângă câmpul pentru intervalul de introducere, dați clic și trageți pentru a selecta datele și apăsați introduce (sau faceți clic pe săgeata corespunzătoare în jos), ca în GIF de mai jos.
După aceea, asigurați-vă că spuneți Excel dacă datele dvs. au etichete, dacă doriți ieșirea într-o foaie nouă sau pe aceeași pagină și dacă doriți statistici sumare și alte opțiuni.
După aceea, loviți O.K, și veți obține statisticile dvs. descriptive:
Studiul t-Test în Excel
T-testul este unul dintre cele mai de bază teste statistice și este ușor de calculat în Excel cu Toolpak. Apasă pe Analiza datelor și derulați în jos până când vedeți T-opțiuni de testare.
Aveți trei opțiuni:
- t-Test: a cuplat două exemple pentru mijloace ar trebui să fie utilizate atunci când măsurătorile sau observațiile dvs. au fost asociate. Utilizați acest lucru atunci când ați efectuat două măsurători ale acelorași subiecți, cum ar fi măsurarea tensiunii arteriale înainte și după o intervenție.
- t-Test: Două probe presupunând variante egale trebuie utilizate atunci când măsurătorile sunt independente (ceea ce înseamnă, de obicei, că au fost efectuate pe două grupuri de subiecte diferite). Vom discuta “variante egale” o parte dintr-un moment.
- t-Test: două exemple presupunând variații inegale este, de asemenea, pentru măsurători independente, dar este folosit atunci când variațiile dvs. sunt inegale.
Pentru a testa dacă varianțele celor două eșantioane sunt egale, va trebui să executați un test F. Găsi Test F-două probe pentru variații din lista Instrumente de analiză, selectați-o și faceți clic pe O.K.
Introduceți cele două seturi de date în casetele pentru intervalul de intrare. Lăsați valoarea alfa la 0,05 dacă nu aveți motive să o schimbați - dacă nu știți ce înseamnă asta, plecați. În cele din urmă, faceți clic pe O.K.
Excel vă va oferi rezultatele într-o foaie nouă (dacă nu ați selectat Domeniul de ieșire și o celulă în foaia curentă):
Te uiți la valoarea P aici. Dacă este mai mică de 0,05, aveți diferențe inegale. Deci, pentru a rula T-test, ar trebui să utilizați opțiunea de diferențe inegale.
Pentru a rula a T-test, selectați testul corespunzător din fereastra Instrumente de analiză și selectați ambele seturi de date în același mod ca și în cazul testului F. Lăsați valoarea alfa la 0,05 și apăsați O.K.
Rezultatele includ tot ce trebuie să faceți pentru a T-test: mijloacele, gradele de libertate (df), t statistice și valorile P pentru testele cu unul și două teste. Dacă valoarea P este mai mică de 0,05, cele două eșantioane sunt semnificativ diferite.
Dacă nu sunteți sigur (ă) dacă doriți să utilizați unul sau două coadă T-test, verificați acest explicator de la UCLA.
ANOVA în Excel
Excel Data Analysis Toolpak oferă trei tipuri de analiză a varianței (ANOVA). Din păcate, nu vă oferă posibilitatea de a efectua testele de urmărire necesare, cum ar fi Tukey sau Bonferroni. Dar puteți vedea dacă există o relație între câteva variabile diferite.
Iată cele trei teste ANOVA din Excel:
- ANOVA: Factor unic analizează varianța cu o variabilă dependentă și o variabilă independentă. Este de preferat să utilizați mai multe T-teste când aveți mai mult de două grupuri.
- ANOVA: Două factori cu replicare este similar cu cel asociat T-Test; implică mai multe măsurători pe subiecți singuri. “cu doi factori” o parte din acest test indică faptul că există două variabile independente.
- ANOVA: Două factori fără replicare implică două variabile independente, dar nici o replicare în măsurare.
Vom trece aici analiza cu un singur factor. În exemplul nostru, vom examina trei seturi de numere, etichetate “Intervenția 1,” “Intervenția 2,” și “Intervenție 3.” Pentru a rula un ANOVA, faceți clic pe Analiza datelor, apoi selectați ANOVA: Factor unic.
Selectați intervalul de intrare și asigurați-vă că spuneți Excel dacă grupurile dvs. se află în coloane sau rânduri. De asemenea, am selectat “Etichete în primul rând” aici, astfel încât numele de grup să fie afișate în rezultate.
După lovire O.K, obținem următoarele rezultate:
Rețineți că valoarea P este mai mică de 0,05, deci avem un rezultat semnificativ. Aceasta înseamnă că există o diferență semnificativă între cel puțin două dintre grupurile din test. Dar deoarece Excel nu oferă teste pentru a determina care grupurile diferă, cel mai bun lucru pe care îl puteți face este să vă uitați la valorile medii afișate în rezumat. În exemplul nostru, Intervenția 3 arată ca atare probabil cel care diferă.
Acest lucru nu este solid din punct de vedere statistic. Dar dacă doriți doar să vedeți dacă există o diferență și să vedeți care dintre grupuri probabil o provoacă, va funcționa.
ANOVA cu două factori este mult mai complicată. Dacă doriți să aflați mai multe despre momentul utilizării metodei cu două factori, consultați acest videoclip de la Sophia.org și “fără replicare” și “cu replicare” exemple din statisticile reale.
Corelație în Excel
Calculul corelației în Excel este mult mai simplu decât T-test sau ANOVA. Folosește Analiza datelor pentru a deschide fereastra Instrumente de analiză și selectați Corelație.
Selectați intervalul de intrare, identificați grupurile ca coloane sau rânduri și spuneți Excel dacă aveți etichete. După aceea, loviți O.K.
Nu veți primi nici o măsură de semnificație, dar puteți vedea cum fiecare grup este corelat cu ceilalți. O valoare a unuia este o corelație absolută, indicând faptul că valorile sunt exact aceleași. Cu cât valoarea de corelație este mai apropiată, cu atât este mai puternică corelația.
Regresie în Excel
Regresia este unul dintre cele mai frecvent utilizate teste statistice din industrie, iar Excel folosește o cantitate surprinzătoare de putere pentru acest calcul. Vom face o regresie rapidă multiplă în Excel aici. Dacă nu sunteți familiarizat cu regresia, consultați ghidul HBR pentru utilizarea regresiei pentru afaceri.
Să presupunem că variabila noastră dependentă este tensiunea arterială, iar cele două variabile independente sunt greutatea și aportul de sare. Vrem să vedem care este un predictor mai bun al tensiunii arteriale (sau dacă ambele sunt bune).
Clic Analiza datelor și selectați regresiune. Trebuie să fii atent atunci când completezi casetele pentru intervalul de intrare de data asta. Intervalul de intrare Y caseta trebuie să conțină variabila dependentă unică. Intervalul de intrare X caseta poate include mai multe variabile independente. Pentru o regresie simplă, nu vă faceți griji pentru restul (deși nu uitați să spuneți Excel dacă ați selectat etichete).
Iată cum arată calculul nostru:
După lovire O.K, veți obține o listă mare de rezultate. Am subliniat valoarea P aici atât pentru consumul de greutate cât și pentru cantitatea de sare:
După cum puteți vedea, valoarea P pentru greutate este mai mare de 0,05, deci nu există o relație semnificativă acolo. Valoarea P pentru sare, cu toate acestea, este sub 0,05, ceea ce indică faptul că este un predictor bun al tensiunii arteriale.
Dacă intenționați să prezentați datele de regresie, amintiți-vă că puteți adăuga o linie de regresie la un scatterplot în Excel. Este un mare ajutor vizual Cum să vizualizați analiza datelor dvs. cu uneltele electrice Excel Cum să vizualizați analiza datelor dvs. cu Power Tools Excel Excel o ucide cu caracteristicile avansate de gestionare a datelor. Odată ce ați folosit unul dintre instrumentele noi, le veți dori pe toate. Deveniți un maestru al analizei datelor dvs. cu unelte electrice! Citiți mai multe pentru această analiză.
Statistici Excel: Surprinzător de capabil
În timp ce Excel nu este cunoscut pentru puterea sa statistică, de fapt, ea îmbină unele funcționalități cu adevărat utile. Mai ales odată ce descărcați programul de analiză a datelor Analysis Toolpak add-in. Sper că ați învățat cum să utilizați Toolpak-ul și că acum puteți juca pe cont propriu pentru a afla cum să utilizați mai multe funcții.
Cu acest lucru acum sub centura dvs., luați-vă abilitățile Excel la nivelul următor cu articolele noastre cu privire la utilizarea funcției de căutare a obiectivului Excel pentru mai multe date de criptare, stăpânirea instrucțiunilor IF în Excel și adăugarea listelor derulante ca celule în Excel.
Am, de asemenea, legat de alte site-uri care au tutoriale statistice bune în care trebuia să ignorăm conceptele confuze. Asigurați-vă că pentru a verifica ghidul nostru pentru resurse gratuite de statistici Aflați statistici pentru gratuit cu aceste 6 Resurse Aflați Statistici gratuit cu aceste 6 Resurse Statisticile are o reputație de un subiect care este greu de înțeles. Însă învățarea din resursele potrivite vă va ajuta să înțelegeți în cel mai scurt timp rezultatele sondajului, rapoartele electorale și alocările de clasă pentru statistici. Citește mai mult.
Explorați mai multe despre: Microsoft Excel, Foaie de calcul.