Kurs jest przeznaczony dla wszystkich, którzy chcą bliżej poznać specjalistyczne metody data mining, tak aby móc wydobyć z danych maksymalnie dużo użytecznej wiedzy. W trakcie kursu prezentowane są techniki data mining należące do grupy metod bezwzorcowych (unsupervised learning). Kurs jest kontynuacją i rozwinięciem kursu "Data mining I - kurs podstawowy"
Wymagania: umiejętność obsługi komputera w środowisku Windows, znajomość podstaw data mining i systemu STATISTICA Data Miner. Zalecamy wcześniejszy udział w kursie
Data mining I - kurs podstawowy.
Kontynuacją mogą być np. kursy:
Data mining II b - modele i metody,
Data mining III - STATISTICA Data Miner dla zaawansowanych,
Metodyki data mining,
Analizy wielowymiarowe,
STATISTICA Visual Basic,
Prognozowanie metodami data mining
Terminy: 27-28.11.2008, 18-19.02.2009
Program kursu
- Analiza koszykowa, sekwencji i połączeń
- Wprowadzenie
- Cel analizy koszykowej
- Źródła danych
- Transakcyjna baza danych
- Hurtownia danych
- Arkusz danych STATISTICA
- Postać reguł asocjacyjnych
- Rodzaje reguł asocjacyjnych
- Reguły oparte na zmiennych jakościowych i ilościowych
- Liczba wymiarów uwzględnianych w regułach asocjacyjnych
- Reguły dotyczące danych zagregowanych i surowych
- Miary jakości uzyskanych reguł
- Reguły asocjacyjne - ujęcie algorytmiczne
- Analiza sekwencji
- Analiza połączeń
- Analiza skupień uogólnioną metodą EM i k-średnich
- Wprowadzenie
- Skale pomiarowe, miary odległości i podobieństwa obiektów
- Algorytmy w klasyfikacji
- Metoda k-średnich i uogólniona metoda k-średnich
- Metoda Expectation Maximization i uogólniona metoda EM
- Metoda głównych składowych (Principal Component Analysis) i niezależnych składowych (Independent Component Analysis)
- Wstęp
- Metoda głównych składowych (PCA)
- Wprowadzenie
- Przygotowanie danych
- Wyodrębnianie głównych składowych
- PCA z wykorzystaniem algorytmu NIPALS
- Metoda niezależnych składowych (ICA)
- Wprowadzenie
- Entropia jako miara informacji zawartej w sygnale
- Eksploracyjna analiza graficzna
- Stany przypadków
- Analiza grupami
- Aktualizacja wykresów i graficzna eksploracja danych (wyróżnianie)