8. Python in Machine Learning

Warning

Przed szkoleniem proszę o instalację i konfigurację środowiska zgodnie z Installing Python

8.1. Description

Temat Machine Learning i Data Science staje się coraz bardziej popularny a Python stał się de facto standardem w tych dziedzinach. Zapraszam na szkolenie wprowadzające do technik analizy danych, dostosowywania modelu matematycznego oraz wykorzystania narzędzi tj. scikit-learn, numpy, pandas i jupyter.

Szkolenie nie jest dedykowane Machine Learning i Data Science, a wykorzystaniu narzędzi, bibliotek i środowiska Python w tych tematach. Nie mniej podczas szkolenia uczestnik również zapozna się z różnymi zagadnieniami i algorytmami wykorzystywanymi w ML i DS łącznie z tematami konstrukcji sieci neuronowych.

Tip

If you’re interested in this training course, please email me at matt@astrotech.io

8.2. Agenda

8.3. Survey before workshop

  1. Znajomość zagadnień związanych z statystyką matematyczną:

    • nie znam
    • miałem / miałam zajęcia na studiach
    • wykorzystuję w pracy
    • pracuję z zagadnieniami na co dzień
  2. Machine Learning:

    • nie znam
    • miałem / miałam zajęcia na studiach
    • wykorzystuję w pracy
    • pracuję z zagadnieniami na co dzień
  3. Znajomość algorytmów ML (skala: nie znam / słyszałem(-am) / korzystałem(-am) / wykorzystuję na co dzień):

    • Decision Tree
    • k Nearest Neighbors
    • Bayes
    • Linear Regression
    • Logistic Regression
    • Support Vector Machines
    • Clustering
    • Principal Component Analysis (PCA)
    • Neural Network
    • Convolutional Neural Network
  4. Praca z dużymi zbiorami danych:

    • nie pracuję
    • pracuję z niewielkimi bazami (do miliona rekordów)
    • pracuję ze zbiorami danych liczonymi w milionach rekordów
    • pracuję ze zbiorami danych liczonymi w miliardach rekordów
    • pracuję ze jeszcze większymi zbiorami danych
  5. Znajomość języka Python:

    • nie znam tego języka
    • tworzę pomniejsze skrypty lub programy
    • znam język i jego ekosystemem
    • umiem wykorzystywać gotowe biblioteki oraz tworzyć własne, wiem jak tworzyć bazy danych i znam zasady programowania obiektowego
    • jestem zaawansowanym programistą
  6. Znajomość języka R:

    • nie znam tego języka
    • tworzę pomniejsze skrypty lub programy
    • znam język i jego ekosystemem
    • umiem wykorzystywać gotowe biblioteki oraz tworzyć własne, wiem jak tworzyć bazy danych i znam zasady programowania obiektowego
    • jestem zaawansowanym programistą
  7. Znajomość programów Statistica, SPSS, SAS lub alternatyw:

    • nie znam tych programów
    • umiem stworzyć bazę danych i wykreślić podstawowe statystki opisowe dla wielu zmiennych
    • wiem jak stworzyć wykresy ramka-wąsy (ang. box-plot), dostosować zakres błędów i przypadków odstających
    • umiem korzystać z programu na poziomie średnio-zaawansowanym
    • znam opcje zaawansowane, umiem tworzyć sieci neuronowe i wykorzystywać inne algorytmy

8.4. Certificate

Szkolenie obejmowało 16 godzin wykładów oraz warsztatów. Zagadnienia poruszone na szkoleniu:

  • tworzenie i korzystanie ze struktur danych,
  • biblioteki do zastosowań naukowych i inżynieryjnych: scipy i inne
  • biblioteki do zastosowań numerycznych: numpy, pandas
  • biblioteki do wizualizacji danych: plotly, matplotlib, jupyter, superset
  • przegląd algorytmów ML z i bez nadzoru
  • wykorzystanie scikit-learn przy: Decision Tree, k Nearest Neighbors, Bayes, Linear Regression, Logistic Regression, Support Vector Machines, Clustering, Principal Component Analysis (PCA)
  • wykorzystanie keras, tensor-flow oraz pytorch przy Neural Network, Convolutional Neural Network