DataWrangler a Visual Studio Code: když neradi Excel, ale radši Python

Poměrně často pracuji s nejrůznějšími exporty do CSV a následně mám data nějakým způsobem zpracovávat nebo interpretovat. Excel není s většinou CSV zrovna kamarád, takže jsem uvítal doplněk do Visual Studio Code, který umí s CSV pracovat podobně. Jmenuje se Data Wrangler.

Visual Studio Code netřeba představovat. CSV samozřejmě umí otevírat samo o sobě, hodí se, pokud chcete v datovém souboru rychle něco zeditovat, zvláště pro hromadné úpravy. Na rozdíl třeba od PhpStorm si poradí i s opravdu velkými datovými soubory a nevytuhne.

Tip: pokud si chcete zpříjemnit editaci CSV jako takovou, přidejte si do Visual Studio Code doplněk Rainbow CSV. Pak budete mít datové soubory hezky barevné a odlišíte jednotlivé „sloupečky“.

Image
Visual Studio Code s barevným zvýrazněním dat v CSV
Visual Studio Code s barevným zvýrazněním dat v CSV

CSV má v Excelu problém, že pokud nemá ty správné oddělovače a kódování, otevře se to zcela rozsypané a někdy ani nelze roztřídit data do sloupců. Proto mám v systému s CSV asociované Numbers od Apple, bez problémů je otevírání těchto souborů také v Libre Office.

Co umí Data Wrangler?

Data Wrangler zpřístupňuje rychlou statistiku nad sloupci dat v CSV. Po otevření souboru v tomto rozšíření uvidíte pohled připomínající Excel nebo jiný tabulkový program a nad sloupci ihned jednoduchou statistiku v podobě jedinečných hodnot. Tzn. třeba počet jedinečných mailů v seznamu s objednávkami z e-shopu.

Co je však to hlavní, Data Wrangler nabízí celou škálu funkcí pro práci s daty. V bočním sloupci se seznamem operací najdete rychlé volby pro pročištění dat od duplicitních záznamů nebo prázdných hodnot. Naopak chybějící data snadno hromadně doplníte.

V nabídce operací je formátování, rozdělování textů i práce s datem. Nechybí zaokrouhlování a jiné číselné úpravy. Všechny sloupečky lze samozřejmě dle libosti filtrovat.

Image
Datový soubor zobrazený v rozšíření Data Wrangler
Datový soubor zobrazený v rozšíření Data Wrangler

Když předvolené operace nestačí

Pro pokročilou práci s daty vám zřejmě výchozí operace ale ani tak stačit nebudou. Visual Studio s Data Wranglerem to řeší jednoduše. V promptu je automaticky naplněna proměnná df, datový rámec. Jakmile jej změníte, změny se barevně zvýrazní v náhledu na data.

Můžete s ním pak samozřejmě libovolně pracovat, stačí si osvěžit znalosti Pythonu, sáhnout po AI nebo ideálně oboje, jako jsem s tím začal já.

Image
Práce s daty pomocí Pythonu v Data Wrangleru
Práce s daty pomocí Pythonu v Data Wrangleru
Tagy

Buďme ve spojení, přihlaste se k newsletteru

Odesláním formuláře souhlasíte s podmínkami zpracováním osobních údajů. 
Více informací v Ochrana osobních údajů.

Autor článku: Jan Polzer

Tvůrce webů z Brna se specializací na Drupal, WordPress a Symfony. Acquia Certified Developer & Site Builder. Autor několika knih o Drupalu.
Web Development Director v Lesensky.cz. Ve volných chvílích podnikám výlety na souši i po vodě. Více se dozvíte na polzer.cz a mém LinkedIn profilu.

Komentáře k článku

Přidat komentář

Odesláním komentáře souhlasíte s podmínkami Ochrany osobních údajů

reklama
Moje kniha o CMS Drupal

 

Kniha 333 tipů a triků pro Drupal 9


Více na KnihyPolzer.cz

Poslední komentáře