Što je Data Mining? Osnove i tehnike.

Sadržaj:

Što je Data Mining? Osnove i tehnike.
Što je Data Mining? Osnove i tehnike.

Video: Što je Data Mining? Osnove i tehnike.

Video: Što je Data Mining? Osnove i tehnike.
Video: Windows cannot complete the extraction, Windows cannot open the folder - Fixed - YouTube 2024, Travanj
Anonim

Temelj četvrte industrijske revolucije u velikoj će mjeri ovisiti Podaci i Povezivanje. Usluge analize sposobna za razvoj ili stvaranje rješenja za rudarenje podataka igrat će ključnu ulogu u tom pogledu. To bi moglo pomoći u analiziranju i predviđanju ishoda ponašanja kupaca kupaca za ciljanje potencijalnih kupaca. Podaci će postati novi prirodni resursi, a proces izdvajanja relevantnih informacija iz ovih nesortiranih podataka zauzima veliku važnost. Kao takvo, pravilno razumijevanje pojma - Rudarstvo podataka, njegovi procesi i primjena mogli bi nam pomoći u razvoju holističkog pristupa o ovoj riječi.

Osnove baze podataka i njegove tehnike

Image
Image

Data mining, također poznat kao Otkrivanje znanja u podacima (KDD) odnosi se na traženje velikih pohranjenih podataka za otkrivanje obrazaca i trendova koji nadilaze jednostavnu analizu. To, međutim, nije rješenje za jedno korak, već postupak u više koraka i dovršen u različitim fazama. To uključuje:

1] Prikupljanje podataka i priprema

Počinje prikupljanjem podataka i pravilnom organizacijom. To pomaže u značajnom poboljšanju šansi za pronalaženjem podataka koji se mogu otkriti kroz podatkovno rudarstvo

2] Izgradnja i evaluacija modela

Drugi korak u procesu data mining je primjena različitih tehnika modeliranja. Oni se koriste za kalibriranje parametara na optimalne vrijednosti. Tehnike koje se koriste u velikoj mjeri ovise o analitičkim sposobnostima potrebnim za rješavanje niza organizacijskih potreba i donošenju odluke.

Pokušajmo ukratko ispitati neke tehnike rudarenja podataka. Utvrđeno je da većina organizacija kombinira dvije ili više tehnika kopanja podataka kako bi stvorila odgovarajući postupak koji zadovoljava njihove poslovne zahtjeve.

Čitati: Što su veliki podaci?

Tehnike prikupljanja podataka

  1. Udruga - Udruga je jedna od poznatih tehnika pretraživanja podataka. Pod tim se obrazac dešifrira na temelju odnosa između stavki u istoj transakciji. Stoga je također poznat kao tehnika odnosa. Veliki trgovci robnih marki oslanjaju se na ovu tehniku za istraživanje kupčeva navika / preferencija kupnje. Na primjer, prilikom praćenja kupovnih navika ljudi mogu otkriti da kupac uvijek kupuje vrhnje kad kupuje čokolade, te stoga predlaže da sljedeći put kada kupuju čokolade, oni bi također željeli kupiti kremu.
  2. Klasifikacija - Ova tehnika rudarenja podataka razlikuje se od gore navedenog na način da se temelji na strojnom učenju i koristi matematičke tehnike kao što su linearno programiranje, stabla odluke, neuronska mreža. U klasifikaciji tvrtke pokušavaju izraditi softver koji može naučiti klasificirati podatke u grupe. Na primjer, tvrtka može definirati klasifikaciju u aplikaciji koja "daje sve zapise zaposlenika koji su se ponudili da podnese ostavku iz tvrtke, predvidjeti broj pojedinaca koji će vjerojatno biti podnijeli ostavku iz tvrtke u budućnosti". tvrtka može klasificirati zapise zaposlenika u dvije skupine koje "odlaze" i "ostaju". Može se zatim koristiti softverom za rudarenje podataka kako bi se zaposlenici svrstali u zasebne skupine koje su ranije stvorene.
  3. grupiranje - Različiti objekti koji pokazuju slične karakteristike grupirani su zajedno u jednom klasteru putem automatizacije. Mnogi takvi klasteri su stvoreni kao razredi i objekti (s sličnim karakteristikama) su smješteni u njemu u skladu s tim. Da bismo to bolje razumjeli, razmotrimo primjer upravljanja knjigama u knjižnici. U knjižnici je velika zbirka knjiga potpuno katalogizirana. Stavke iste vrste navedene su zajedno. To nam olakšava pronalaženje knjige od našeg interesa. Slično tome, pomoću klasterske tehnike možemo držati knjige koje imaju neke vrste sličnosti u jednom klasteru i dodijeliti im odgovarajuće ime. Dakle, ako čitatelj želi zgrabiti knjigu koja je relevantna njegovom interesu, mora samo otići na tu policu umjesto da pretražuje cijelu knjižnicu. Stoga tehnika klastera definira klase i stavlja objekte u svaku klasu, dok se u klasifikacijskim tehnikama objekti dodjeljuju u unaprijed definirane klase.
  4. proricanje - Predviđanje je tehnika rudarenja podataka koja se često koristi u kombinaciji s drugim tehnikama rudarenja podataka. To uključuje analizu trendova, klasifikacije, podudaranja uzoraka i odnosa. Analizom prošlih događaja ili slučajeva u pravilnom slijedu može se sigurno predvidjeti budući događaj. Na primjer, tehnika predviđanja analize može se koristiti za prodaju da bi se predvidjela buduća dobit ako je prodaja odabrana kao nezavisna varijabla i dobit kao varijabla ovisna o prodaji. Zatim, na temelju povijesnih podataka o prodaji i dobiti, može se nacrtati odgovarajuća regresijska krivulja koja se koristi za predviđanje dobiti.
  5. Stabla odluke - U stablu odluke počinjemo jednostavnim pitanjem koja ima više odgovora. Svaki odgovor dovodi do daljnjeg pitanja kako bi se klasificirali ili identificirali podaci tako da se može kategorizirati ili da se predviđanje može izvršiti na temelju svakog odgovora. Na primjer, koristimo sljedeće stablo odluke kako bismo odredili hoće li igrati kriket ODI: Rudarstvo odluka o rudarstvu podataka: Polazeći od korijenskog čvora, ako vremenska prognoza predviđa kišu onda bi trebalo izbjeći borbu za taj dan. Alternativno, ako je vremenska prognoza jasna, trebali bismo igrati utakmicu.

Data Mining je u središtu analitičkih napora diljem raznih industrija i disciplina poput komunikacije, osiguranja, obrazovanja, proizvodnje, bankarstva i maloprodaje i još mnogo toga. Stoga, prije nego što primijenite različite tehnike, bitno je imati točne informacije o tome.

Preporučeni: