Python: Pandas

Polish

  1. Biblioteki używane w analizie numerycznej i Data Science:

    • SciPy: wprowadzenie do ekosystemu narzędzi

    • Jupyter: instalacja, uruchamianie, korzystanie, LaTeX, zaawansowane opcje

    • Markdown: krótkie wprowadzenie do składni i możliwości

  2. Pandas i obróbka danych:

    • Konfiguracja biblioteki oraz wyświetlania

    • Import i export danych: obsługiwane formaty, serializacja, łączenie, wyciąganie danych ze stron www

    • Typy danych: Series, DataFrame, SparseArray, Interval, Categorical

    • Indeksy: numeryczne, alfabetyczne, szeregi czasowe

    • Daty i szeregi czasowe: frequency, Timestamp, strefy czasowe, Timedelta, DateOffset, Date Ranges

    • Series: tworzenie, atrybuty, indeksy, slice, wypełnianie, podmiana, usuwanie, arytmetyka, sampling, tasowanie

    • DataFrame podstawy: tworzenie, indeksy, kolumny, slice, wybieranie wartości, locate, at, sampling, tasowanie

    • DataFrame zaawansowane: statystyki, grupowanie, agregacje, join, wykresy

    • Architektura i plany rozwoju Pandas

  3. Matplotlib i wizualizacja:

    • Rodzaje wykresów i podstawianie danych

    • Stylowanie wykresów

    • Wykresy i podwykresy

    • Export do różnych formatów

    • Alternatywy do Matplotlib (Bokeh, Seaborn, Plot.ly)

    • Integracja Matplotlib z Pandas

    • Złożoność obliczeniowa, notacja wielkiego O

    • Techniki pracy z danymi większymi niż ilość RAMu

    • Triki zwiększające wydajność

  4. Case Study:

    • COVID-19

    • dane sportowe

    • dane finansowe

    • sensory IoT