Cum să împărțiți o foaie de calcul excelentă CSV Excel în fișiere separate
Excel este excelent la atât de multe sarcini de zi cu zi. Dar din când în când, întâmpinați unul dintre deficiențele sale: dimensiunea unei foi de calcul. Dacă trebuie să știți cum să creați o foaie de calcul Excel mai mică sau cum să împărțiți un CSV mare, vă acoperiți.
Atingerea limitei rândului de foi de calcul este o sarcină destul de serioasă în sine. Limita curentă a rândurilor din tabelul Excel este 1,048,576. Așa e - peste 1 milion de rânduri, și același număr de coloane.
Dar lovirea acestei limite este, de fapt, incredibil de ușoară, în timpul anumitor sarcini. Dacă comercializați prin e-mail, este posibil să importați un fișier CSV Cum să importați date în foile de calcul Excel Cum vă puteți importa date în foi de calcul Excel Cum ați implantat sau exportat date în o foaie de calcul? Acest tutorial vă va ajuta să stăpânești arta de a muta date între Microsoft Excel, CSV, HTML și alte formate de fișiere. Citiți mai multe conținând milioane de adrese de e-mail. Singura problemă este cum gestionați de fapt o foaie de calcul în care sunt incluse multe adrese? În plus, dacă cineva vă trimite un CSV care este deja peste limită (de la un alt program)?
Ei bine, am să vă arăt cum să distrugeți acest CSV enorm în bucăți ușor de gestionat.
(Nu aveți un CSV mare la îndemână? Există câteva seturi de date CSV destul de mari disponibile 15 Baze de date online masive pe care ar trebui să le cunoașteți despre 15 baze de date online masive pe care trebuie să le cunoașteți despre Internetul documentelor. enciclopediile online sau bazele de date - intrebarea este, stii despre cele mai bune? Citeste mai mult la data.gov .I urmez sa folosesc lista de 260.000 de spitale de comparatie pentru a putea folosi acelasi fisier.)
1. Folosiți un program
Există o serie de programe utile de divizare CSV acolo. Îți arăt două dintre cele mai bune.
CSV Chunker
CSV Chunker este un splitter CSV cu sursă deschisă. Se poate ocupa de fișiere masive, împărțind-le rapid în bucăți alese de dvs. A fost nevoie de aproximativ 3 secunde pentru a diviza Spitalul nostru Comparați CSV-ul în 106 de bucăți, conținând câte 2.500 rânduri fiecare.
CSV Splitter
CSV Splitter este al doilea instrument. Oferă aceeași funcționalitate a CSV Chunker, deși are un design ușor mai elegant. CSV Splitter a durat aproximativ 4 secunde pentru a diviza Spitalul nostru Comparați CSV-ul în 106, din nou conținând câte 2.500 de rânduri.
2. Utilizați un fișier lot
În continuare, un fișier batch programabil Cum se scrie un fișier simplu BAT (BAT) Cum se scrie un fișier Batch Batch (BAT) Batch poate automatiza sarcini de zi cu zi ale computerului. Iată cum funcționează fișierele batch și cum să scrieți primul script batch. Citeste mai mult . Putem folosi un fișier batch pentru a procesa CSV-ul în bucăți mai mici, personalizând fișierul pentru a livra bucăți diferite.
Deschideți un nou document Text. Copiați și lipiți următoarele:
@echo off setlocal ENABLEDELAYEDEXPANSION REM Editați această valoare pentru a schimba numele fișierului care are nevoie de divizare. Includeți extensia. SET BFN = HCAHPSHospital.csv REM Modificați această valoare pentru a modifica numărul de linii per fișier. SET LPF = 2500 REM Editați această valoare pentru a modifica numele fiecărui fișier scurt. Acesta va fi urmat de un număr care indică locul în care se află în listă. SET SFN = HosptialSplitFile REM Nu schimbați dincolo de această linie. Setați SFX =% BFN: ~ -3% SET / A LineNum = 0 SET / A FileNum = 1 Pentru / F "delims ==" %% l in (% BFN%) Do (SET / A LineNum + = 1 echo% l >>% SFN%! FileNum!% SFX% ifLineNum! EQU! LPF! (SET / A LineNum = 0 SET / A FileNum + = 1)
Va trebui să configurați fișierul batch înainte de a fi rulat. Vă voi spune ce face fiecare comandă și puteți să o modificați pentru a se potrivi cu dimensiunea fișierului dvs. lot, precum și cu rezultatul necesar.
- “SET BFN =” ar trebui să indice CSV-ul pe care trebuie să-l descompuneți
- “SET LPF =” este numărul de rânduri în care doriți să vă limitați fișierul nou
- “SET SFN =” este noua schemă de denumire pentru fișierele dvs. divizate
Odată ce ați introdus variabilele dvs., mergeți la Fișier> Salvare ca. Alegeți numele fișierului și selectați Salvați. Apoi, selectați fișierul text nou salvat și apăsați F2 pentru ao redenumi. Înlocuiți extensia TXT cu BAT și apăsați O.K când apare avertizarea. Acum puteți să vă împărțiți CSV-ul mare!
Vă avertizez că această metodă durează ceva timp. Probabil că e mai bine să folosiți unul dintre distribuitorii menționați mai sus.
Scenariul original și firul pot fi găsite aici.
3. Utilizați un script PowerShell
Fișierele batch sunt la îndemână. Le puteți folosi pentru o gamă largă de sarcini de zi cu zi. Dar scripturile PowerShell sunt mult mai rapide, mai ales pentru acest tip de procesare și divizare.
Următorul script va reduce rapid CSV-ul dvs. mare în fișiere mai mici. Din nou, am folosit Spitalul Compara CSV pentru exemplul meu. A durat aproximativ 3 secunde pentru ca comanda să ruleze. Deschideți Windows PowerShell ISE. Dacă nu știți cum să faceți acest lucru, tastați puterea este în căutarea în meniul Start și selectați opțiunea corespunzătoare. Când PowerShell ISE este deschis, selectați Afișați scriptul săgeată, aflată în colțul din dreapta sus (evidențiată în roșu în imaginea de mai jos).
Copiați și inserați următoarea comandă în panoul script, în partea de sus a ecranului.
$ I = 0; Obțineți conținut C: \ Utilizatori \ Gavin \ Descărcări \ Spital_Revised_Flatfiles \ HCAHPSHospital.csv -ReadCount 2500 | % $ I ++; $ _ | Out-File C: \ Utilizatori \ Gavin \ Descărcări \ Spital_Revised_Flatfiles \ split \ splitfile_ $ i.csv
În primul rând, trebuie să modificați locația fișierului de intrare. În al doilea rând, trebuie să specificați câte rânduri ar trebui să conțină fișierele de ieșire. În cele din urmă, specificați locația fișierului de ieșire. Mi-am lăsat căile de fișiere acolo pentru a ilustra situația. Mai mult, numele fișierului de ieșire trebuie avut “_ $ I.csv”sufixul meu de potrivire. În caz contrar, fișierele de ieșire nu vor fi numerotate corect.
Când ați editat fișierul cu propriile date, apăsați CTRL + S pentru a salva scriptul.
Scriptul original poate fi găsit aici.
4. Încărcați-l într-un model de date
Soluția noastră finală nu este de fapt divizarea CSV-ului mare în părți mai mici. Veți vedea, Jose Barreto, membru al echipei OneDrive, a ilustrat recent cum puteți încărca un fișier CSV mare în Excel. În acest caz, mijloace mari depășesc limita de 1,048,567 rânduri. El explică într-un tutorial că, în locul încărcării efective a fișierului, Excel 2016 poate crea o legătură de date către fișierul CSV.
Datele din CSV-ul original vor fi disponibile utilizatorului în cadrul unui model de date. Barreto a creat o masă pivot utilizând “până la 8,5 milioane de rânduri fără nici o problemă.” Imaginea de mai sus este luată de pe blogul lui Barreto (legat mai jos), prezentând un total de 2 milioane de rânduri în Excel. (Aflați cum să utilizați o tabelă pivot pentru analiza datelor Cum se utilizează o tabelă Pivot Excel pentru analiza datelor Cum se utilizează o tabelă Pivot Excel pentru analiza datelor Tabela pivot este unul dintre cele mai puternice instrumente din repertoriul Excel 2013. Este frecvent utilizate pentru analiza datelor mari. Urmați demonstrația pas cu pas pentru a afla mai multe despre aceasta.
Dacă aceasta este soluția care vă convine, urmați tutorialul detaliat al lui Jose Barreto chiar aici. Amintiți-vă că acest lucru nu este divizarea CSV-ului, dar aceasta înseamnă că puteți manipula datele dvs. în anumite instrumente Excel Cum să vizualizați analiza datelor dvs. cu Power Tools Power Tools Cum să vă vizualizați analiza datelor cu Power Tools Excel Excel o ucide cu avansat caracteristici de gestionare a datelor. Odată ce ați folosit unul dintre instrumentele noi, le veți dori pe toate. Deveniți un maestru al analizei datelor dvs. cu unelte electrice! Citeste mai mult . În cazul în care accesați datele dvs. pentru a interacționa cu acestea direct, aceasta ar putea fi o încercare.
Spargeți-o!
Am enumerat patru soluții pentru a vă descompune fișierele CSV masive, inclusiv două instrumente diferite.
Dintre cele patru soluții, fișierul batch este probabil cel mai lent 5 motive pentru care ar trebui să utilizați PowerShell în loc de scriere batch 5 motive pentru care ar trebui să utilizați PowerShell în loc de scriere batch PowerShell este ceea ce ați obține dacă ați trecut linia de comandă cu batch scripting în unele caracteristici suplimentare, și l-au lovit cu totul mai multe crestături. Iată câteva motive pe care ar trebui să le încercați. Citeste mai mult . Scriptul PowerShell este rapid și ușor de personalizat, în timp ce cele două aplicații sunt ușor de utilizat din cutie. În sfârșit, aveți opțiunea de a importa direct datele dvs. în Excel, cu ajutorul a milioane de rânduri.
Ce metodă alegi? Și aveți alte sfaturi? Vă rugăm să ne comunicați în comentarii!
Credit de imagine: lucadp / Depositphotos
Explorați mai multe despre: Microsoft Excel, Foaie de calcul.