Kurs jest przeznaczony dla wszystkich, którzy chcą bliżej poznać specjalistyczne metody data mining, tak aby móc wydobyć z danych maksymalnie dużo użytecznej wiedzy. W trakcie kursu prezentowane są wybrane techniki data mining (m.in. drzewa klasyfikacyjne i regresyjne, sieci neuronowe). Kurs "Data mining II - modele i metody" jest kontynuacją i rozwinięciem kursu "Data mining I - kurs podstawowy".
Wymagania: umiejętność obsługi komputera w środowisku Windows, znajomość podstaw data mining i systemu STATISTICA Data Miner. Zalecamy wcześniejszy udział w kursie
Data mining I - kurs podstawowy.
Kontynuacją mogą być np. kursy:
Data mining III - STATISTICA Data Miner dla zaawansowanych,
Metodyki data mining,
Prognozowanie i analiza szeregów czasowych,
Analizy wielowymiarowe,
Metody statystyczne w marketingu i badaniach rynku,
Badanie satysfakcji i wartości klienta,
Prognozowanie sprzedaży w przedsiębiorstwie,
STATISTICA dla medyków - metody zaawansowane,
Sieci neuronowe,
STATISTICA Visual Basic,
Prognozowanie metodami data mining
Terminy: 03-04-05.12.2008, 06-07-08.04.2009
Program kursu
- Drzewa klasyfikacyjne i regresyjne
- Drzewa klasyfikacyjne CART w pakiecie STATISTICA Data Miner
- Drzewa klasyfikacyjne CHAID w pakiecie STATISTICA Data Miner
- Rodzina algorytmów drzewkowych z rodziny AID (Automatic Interaction Detection)
- CHAID w pakiecie STATISTICA Data Miner
- Drzewa regresyjne w pakiecie STATISTICA Data Miner
- Regresyjne właściwości algorytmu CART
- Sieci neuronowe
- Wprowadzenie w problematyką sieci neuronowych
- Funkcjonowanie neuronu
- Budowa i funkcjonowanie sztucznych sieci neuronowych
- Rodzaje sztucznych sieci neuronowych
- Klasyfikacja problemów rozwiązywanych za pomocą modeli neuronowych
- Neuronowe metody rozwiązywania problemów regresyjnych
- Charakterystyka przykładowego problemu
- Tworzenie modelu regresyjnego wykorzystującego sieć perceptronową
- Tworzenie modelu regresyjnego wykorzystującego sieć o radialnych funkcjach bazowych (sieć RBF)
- Tworzenie modelu regresyjnego wykorzystującego liniową sieć neuronową
- Metody uruchamiania modeli regresyjnych
- Łączne wykorzystanie modeli (zespoły modeli)
- Poszukiwanie najlepszego modelu regresyjnego
- Rozwiązywanie problemów z zakresu klasyfikacji wzorcowej
- Charakterystyka przykładowego problemu
- Definicja modelu opartego na sieci MLP
- Ocena jakości modelu klasyfikacyjnego
- MARSplines
- Wprowadzenie
- Koncepcja metody
- Uogólnione modele addytywne i metoda MARS
- Krzywe sklejane (splines)
- Algorytm
- Moduł Inne Metody Uczenia Maszyn oraz zespoły modeli
- Metoda wektorów wspierających (Support Vector Machines - SVM)
- Idea SVM
- SVM dla zadań regresyjnych
- Metoda SVM w systemie STATISTICA Data Miner
- Naiwny klasyfikator Bayesa
- Opis metody
- Naiwny klasyfikator Bayesa w STATISTICA Data Miner
- Metoda k najbliższych sąsiadów
- Zespoły modeli
- Ogólne wprowadzenie
- Bagging i Losowy las (Random Forest)
- Drzewa ze wzmacnianiem (Boosted Trees)