Bevezetés az adatbányászatba (Introduction to Data Mining könyv fordítása)
Szerző
- Pang-Ning Tan, Michael Steinbach, Vipin Kumar
Jogtulajdonos
- Addison-Wesley
Típus
- könyv
Fordító, szerkesztő, felelős
- Ispány Márton
Elektronizálás módja
- DocBook XML és LaTeX-PDF
Terjedelem
- 50 ív
Digitális elemek
- 90 kép
Tartalom
A könyv fejezetei
- Bevezetés. Mi az adatbányászat. Motiváló kihívások. Az adatbányászat eredete. Adatbányászati feladatok A könyv témája és felépítése.
- Az adatok. Adattípusok. Adatminőség. Az adatok előfeldolgozása. Hasonlósági és távolság mérőszámok.
- Feltárás. Az Iris adatállomány. Összegző statisztikák. Vizualizáció. OLAP és többdimenziós adatelemzés.
- Osztályozás: Alapfogalmak, döntési fák és modellek kiértékelése. Előismeretek. Az osztályozási feladat általános megoldása. Döntési fák. Modellek túlillesztése. Osztályozók hatékonyságának kiértékelése. Osztályozók összehasonlítása.
- Osztályozás: További módszerek. Szabály-alapú osztályozók. Legközelebbi-társ osztályozók. Bayes-osztályozók. Mesterséges neurális hálók. Támasz vektor gépek. Ensemble módszerek. Az osztályok közötti kiegyensúlyozatlanság problémája. Többszörös osztályozás.
- Társítási szabályok: Alapfogalmak és alapvető algoritmusok. A feladat megfogalmazása. Gyakori tételcsoport előállítása. Szabály-generálás. Gyakori tételcsoportok kompakt előállítása. Gyakori tételcsoportok előállításának további módszerei. FP-növekedési algoritmus. Kapcsolati mintázatok kiértékelése. A ferde támasz eloszlás hatása.
- Társítási szabályok: Haladott módszerek. Kategorikus változók kezelése. Folytonos változók kezelése. A hierarchia fogalma. Szekvenciális mintázatok. Részgráf mintázatok. Ritka mintázatok.
- Klaszterelemzés: Alapfogalmak és alapvető algoritmusok. Áttekintés. K-közép módszer. Összevonó hierarchikus klasztererezés. DBSCAN. A klaszterezési kiértékelése.
- Klaszterelemzés: További témák és algoritmusok Az adatok, a klaszterek és a klaszterezési módszerek jellemzői. Prototípus alapú klaszterezés. Sűrűség alapú klaszterezés. Gráf alapú klaszterezés. Skálázható klaszterezési algoritmusok. Melyik módszert válasszuk.
- Rendellenesség keresés. Előzmények. Statisztikus megközelítés. Hasonlóság alapú kilógó elemek. Sűrűség-alapú kilógó elemek. Klaszterezésen alapuló módszerek.
- Függelék. Lineáris algebra. Dimenziócsökkentés. Valószínűségszámítás és statisztika. Regresszió. Szélsőérték-keresés. Minden fejezetet irodalomjegyzék és a fejezethez kapcsolódó feladatok zárnak. Kurzus: Adatbányászat, Adatbányászati alkalmazások
Legutóbbi frissítés:
2023. 01. 26. 17:51