Kelet-Magyarországi Informatika Tananyag Tárház - A4 Tananyag

Bevezetés az adatbányászatba (Introduction to Data Mining könyv fordítása)

HTML
Digitális Tankönyvtár

Szerző

  • Pang-Ning Tan, Michael Steinbach, Vipin Kumar

Jogtulajdonos

  • Addison-Wesley

Típus

  • könyv

Honlap

Fordító, szerkesztő, felelős

  • Ispány Márton

Elektronizálás módja

  • DocBook XML és LaTeX-PDF

Terjedelem

  • 50 ív

Digitális elemek

  • 90 kép

Tartalom

A könyv fejezetei

  1. Bevezetés. Mi az adatbányászat. Motiváló kihívások. Az adatbányászat eredete. Adatbányászati feladatok A könyv témája és felépítése.
  2. Az adatok. Adattípusok. Adatminőség. Az adatok előfeldolgozása. Hasonlósági és távolság mérőszámok.
  3. Feltárás. Az Iris adatállomány. Összegző statisztikák. Vizualizáció. OLAP és többdimenziós adatelemzés.
  4. Osztályozás: Alapfogalmak, döntési fák és modellek kiértékelése. Előismeretek. Az osztályozási feladat általános megoldása. Döntési fák. Modellek túlillesztése. Osztályozók hatékonyságának kiértékelése. Osztályozók összehasonlítása.
  5. Osztályozás: További módszerek. Szabály-alapú osztályozók. Legközelebbi-társ osztályozók. Bayes-osztályozók. Mesterséges neurális hálók. Támasz vektor gépek. Ensemble módszerek. Az osztályok közötti kiegyensúlyozatlanság problémája. Többszörös osztályozás.
  6. Társítási szabályok: Alapfogalmak és alapvető algoritmusok. A feladat megfogalmazása. Gyakori tételcsoport előállítása. Szabály-generálás. Gyakori tételcsoportok kompakt előállítása. Gyakori tételcsoportok előállításának további módszerei. FP-növekedési algoritmus. Kapcsolati mintázatok kiértékelése. A ferde támasz eloszlás hatása.
  7. Társítási szabályok: Haladott módszerek. Kategorikus változók kezelése. Folytonos változók kezelése. A hierarchia fogalma. Szekvenciális mintázatok. Részgráf mintázatok. Ritka mintázatok.
  8. Klaszterelemzés: Alapfogalmak és alapvető algoritmusok. Áttekintés. K-közép módszer. Összevonó hierarchikus klasztererezés. DBSCAN. A klaszterezési kiértékelése.
  9. Klaszterelemzés: További témák és algoritmusok Az adatok, a klaszterek és a klaszterezési módszerek jellemzői. Prototípus alapú klaszterezés. Sűrűség alapú klaszterezés. Gráf alapú klaszterezés. Skálázható klaszterezési algoritmusok. Melyik módszert válasszuk.
  10. Rendellenesség keresés. Előzmények. Statisztikus megközelítés. Hasonlóság alapú kilógó elemek. Sűrűség-alapú kilógó elemek. Klaszterezésen alapuló módszerek.
  11. Függelék. Lineáris algebra. Dimenziócsökkentés. Valószínűségszámítás és statisztika. Regresszió. Szélsőérték-keresés. Minden fejezetet irodalomjegyzék és a fejezethez kapcsolódó feladatok zárnak. Kurzus: Adatbányászat, Adatbányászati alkalmazások
Legutóbbi frissítés: 2023. 01. 26. 17:51