Słownik

START | EDUKACJA | SŁOWNIK | Data mining

Data mining

Data mining to anglojęzyczne określenie na proces pozyskiwania wiedzy z rozbudowanych baz danych. Najbardziej odpowiednim polskim odpowiednikiem tego zwrotu byłaby eksploracja danych.

W dawnych czasach eksploracja danych mogła być wykonywana „ręcznie”, ponieważ tworzone zbiory danych nie były złożone. Rozwój informatyki umożliwił jednak wykonywanie skomplikowanych analiz statystycznych, w związku z tym zależności występujące pomiędzy poszczególnymi zmiennymi w bazie danych przestały być zauważalne przez człowieka. Stąd w XX wieku wykształcono nowe metody eksploracji danych, przede wszystkim na gruncie uczenia maszynowego, takie jak sieci neuronowe, analiza skupień czy drzewa decyzyjne.

Data mining to proces składający się z trzech etapów. Pierwszy z nich to wstępna eksploracja. Obejmuje on przygotowanie danych i ich uporządkowanie, a także wybór prawidłowej techniki „zgłębiania” danych. Następnym etapem jest budowanie oraz ocena modelu. Jest to najtrudniejszy etap data miningu. W celu wiarygodnej oceny stosuje się wiele technik, takich jak agregacja, kontaminacja lub metauczenie modeli. Gdy uda się wytypować najlepsze modele, pozostaje już ostatni etap – czyli ich wdrożenie. Pozwala to na weryfikację, czy pozwalają one na uzyskanie jakichkolwiek wartości lub klasyfikacji z hurtrowni danych.

Zastosowanie data miningu obejmuje różne dziedziny, między innymi biznesu, inżynierii i nauki. Przykładowo, sklepy mogą zbierać dane dotyczące milionów transakcji oraz dzięki data miningowi określać trendy sprzedaży, przewidywać zachowania klientów oraz opracowywać kampanie marketingowe. Z kolei w medycynie data mining może być stosowany jako wsparcie procesu diagnostycznego, w którym wykrywane będą zarówno określone syndromy, jak i pojedyncze nietypowe przypadki kliniczne.

Podziel się wiedzą

z innymi

Opinie Klientów

Co o nas sądzą?

Współpracowaliśmy

między innymi z:

Nasi partnerzy