Opis kursu:
Kurs poświęcony jest zagadnieniom prognozowania technikami data mining. Jest on ukierunkowany na praktyczne aspekty tego procesu i na problemy, które mogą wystąpić w trakcie modelowania.
Wymagania:
umiejętność obsługi komputera w środowisku Windows, podstawy obsługi oprogramowania STATISTICA (zalecany wcześniejszy udział w kursie STATISTICA kurs podstawowy lub Statystyka dla niestatystyków, pomocna będzie też znajomość graficznego środowiska tworzenia projektów STATISTICA Data Miner
Zaleca się wcześniejszy udział w kursach: Analizy wielowymiarowe, Sieci neuronowe, inne kursy proponowane w cyklu data mining
Termin: 3-4.06.2008
Program kursu
- Metody przygotowania i wstępnej obróbki danych (data pre-processing)
- Klasyfikacja zbiorów danych (dane przekrojowe, szeregi czasowe)
- Wizualizacja danych
- Identyfikacja obserwacji nietypowych
- Skalowanie, standaryzacja, normalizacja
- Metody wstępnej analizy szeregów czasowych: dekompozycja szeregu, wahania sezonowe, problem "dni roboczych" i "świątecznych", periodyzacja szeregów czasowych
- Problem redukcji wymiaru danych wejściowych w przypadku danych przekrojowych i szeregów czasowych
- Klasyfikacja metod redukcji wymiaru (wybór zmiennych, przekształcenie do nowego zbioru)
- Metody wyboru zmiennych (metody krokowe, algorytm genetyczny)
- Metody przekształcenia do nowego zestawu zmiennych (analiza głównych składowych)
- Funkcje straty
- Walidacja modeli
- Metody łączenia modeli
- Wykorzystanie informacji jakościowych w modelowaniu
- Wykorzystanie informacji tekstowych w modelowaniu i prognozowaniu