Kursy

 
Inne usługi

 




Data mining II a - metody bez nauczyciela

Opis kursu:

Kurs jest przeznaczony dla wszystkich, którzy chcą bliżej poznać specjalistyczne metody data mining, tak aby móc wydobyć z danych maksymalnie dużo użytecznej wiedzy. W trakcie kursu prezentowane są techniki data mining należące do grupy metod bezwzorcowych (unsupervised learning). Kurs jest kontynuacją i rozwinięciem kursu "Data mining I - kurs podstawowy"

Wymagania: umiejętność obsługi komputera w środowisku Windows, znajomość podstaw data mining i systemu STATISTICA Data Miner. Zalecamy wcześniejszy udział w kursie Data mining I - kurs podstawowy.

Kontynuacją mogą być np. kursy: Data mining II b - modele i metody, Data mining III - STATISTICA Data Miner dla zaawansowanych, Metodyki data mining, Analizy wielowymiarowe, STATISTICA Visual Basic, Prognozowanie metodami data mining

Terminy: 27-28.11.2008, 18-19.02.2009

Program kursu

  • Analiza koszykowa, sekwencji i połączeń
    • Wprowadzenie
    • Cel analizy koszykowej
    • Źródła danych
      • Transakcyjna baza danych
      • Hurtownia danych
      • Arkusz danych STATISTICA
    • Postać reguł asocjacyjnych
    • Rodzaje reguł asocjacyjnych
      • Reguły oparte na zmiennych jakościowych i ilościowych
      • Liczba wymiarów uwzględnianych w regułach asocjacyjnych
      • Reguły dotyczące danych zagregowanych i surowych
    • Miary jakości uzyskanych reguł
    • Reguły asocjacyjne - ujęcie algorytmiczne
    • Analiza sekwencji
    • Analiza połączeń
  • Analiza skupień uogólnioną metodą EM i k-średnich
    • Wprowadzenie
    • Skale pomiarowe, miary odległości i podobieństwa obiektów
    • Algorytmy w klasyfikacji
    • Metoda k-średnich i uogólniona metoda k-średnich
    • Metoda Expectation Maximization i uogólniona metoda EM
  • Metoda głównych składowych (Principal Component Analysis) i niezależnych składowych (Independent Component Analysis)
    • Wstęp
    • Metoda głównych składowych (PCA)
      • Wprowadzenie
      • Przygotowanie danych
      • Wyodrębnianie głównych składowych
    • PCA z wykorzystaniem algorytmu NIPALS
    • Metoda niezależnych składowych (ICA)
      • Wprowadzenie
      • Entropia jako miara informacji zawartej w sygnale
  • Eksploracyjna analiza graficzna
    • Stany przypadków
    • Analiza grupami
    • Aktualizacja wykresów i graficzna eksploracja danych (wyróżnianie)