Atšķirība Starp Datu Ieguvi Un OLAP

Atšķirība Starp Datu Ieguvi Un OLAP
Atšķirība Starp Datu Ieguvi Un OLAP
Anonim

Datu ieguve pret OLAP

Gan datu ieguve, gan OLAP ir divas no izplatītākajām biznesa inteliģences (BI) tehnoloģijām. Biznesa inteliģence attiecas uz datorizētām metodēm noderīgas informācijas identificēšanai un iegūšanai no biznesa datiem. Datu ieguve ir datorzinātņu joma, kas nodarbojas ar interesantu modeļu iegūšanu no lieliem datu kopumiem. Tas apvieno daudzas metodes no mākslīgā intelekta, statistikas un datu bāzes pārvaldības. OLAP (tiešsaistes analītiskā apstrāde), kā norāda nosaukums, ir daudzdimensiju datu bāzu vaicājumu veidošanas apkopojums.

Datu ieguve ir pazīstama arī kā zināšanu atklāšana datos (KDD). Kā minēts iepriekš, tā ir datorzinātņu joma, kas nodarbojas ar iepriekš nezināmas un interesantas informācijas iegūšanu no neapstrādātiem datiem. Sakarā ar datu eksponenciālo pieaugumu, īpaši tādās jomās kā uzņēmējdarbība, datu ieguve ir kļuvusi par ļoti svarīgu instrumentu, lai šo lielo datu bagātību pārveidotu biznesa inteliģencē, jo pēdējās desmitgadēs modeļu manuāla iegūšana ir šķietami neiespējama. Piemēram, pašlaik to izmanto dažādām lietojumprogrammām, piemēram, sociālo tīklu analīzei, krāpšanas atklāšanai un mārketingam. Datu iegūšana parasti attiecas uz šādiem četriem uzdevumiem: kopu veidošana, klasifikācija, regresija un asociācija. Klasterizācija ir līdzīgu grupu identificēšana no nestrukturētiem datiem. Klasifikācija ir mācību noteikumi, kurus var piemērot jauniem datiem, un tie parasti ietver šādas darbības: datu pirmapstrāde, modelēšanas izstrāde, mācīšanās / funkciju izvēle un novērtēšana / validēšana. Regresija ir funkciju atrašana ar minimālu kļūdu, lai modelētu datus. Asociācija meklē attiecības starp mainīgajiem. Datu ieguvi parasti izmanto, lai atbildētu uz jautājumiem, piemēram, kādi ir galvenie produkti, kas varētu palīdzēt iegūt lielu peļņu nākamajā gadā Wal-Mart. Datu ieguvi parasti izmanto, lai atbildētu uz jautājumiem, piemēram, kādi ir galvenie produkti, kas varētu palīdzēt iegūt lielu peļņu nākamajā gadā Wal-Mart. Datu ieguvi parasti izmanto, lai atbildētu uz jautājumiem, piemēram, kādi ir galvenie produkti, kas varētu palīdzēt iegūt lielu peļņu nākamajā gadā Wal-Mart.

OLAP ir sistēmu klase, kas sniedz atbildes uz daudzdimensionāliem jautājumiem. Parasti OLAP tiek izmantots mārketingam, budžeta plānošanai, prognozēšanai un līdzīgām lietojumprogrammām. Pats par sevi saprotams, ka OLAP izmantotās datu bāzes ir konfigurētas sarežģītiem un ad-hoc vaicājumiem, paturot prātā ātru veiktspēju. Parasti OLAP izejas parādīšanai tiek izmantota matrica. Rindas un kolonnas veido vaicājuma izmēri. Lai iegūtu kopsavilkumus, viņi bieži izmanto apkopošanas metodes vairākās tabulās. Piemēram, to var izmantot, lai uzzinātu par šī gada pārdošanas apjomiem Wal-Mart, salīdzinot ar pagājušo gadu? Kāda ir nākamā ceturkšņa pārdošanas prognoze? Ko var teikt par tendenci, aplūkojot procentuālās izmaiņas?

Lai gan ir acīmredzams, ka datu ieguve un OLAP ir līdzīgas, jo tās izmanto datus, lai iegūtu intelektu, galvenā atšķirība rodas no tā, kā viņi darbojas ar datiem. OLAP rīki nodrošina daudzdimensionālu datu analīzi, un tie sniedz datu kopsavilkumus, bet atšķirībā no tā, datu ieguve koncentrējas uz attiecībām, modeļiem un ietekmēm datu kopā. Tas ir OLAP darījums ar apkopošanu, kas saistīts ar datu darbību, izmantojot “pievienošanu”, bet datu iegūšana atbilst “sadalīšanai”. Vēl viena ievērojama atšķirība ir tā, ka, kamēr datu ieguves rīki modelē datus un atgriež darboties spējīgus noteikumus, OLAP reālā laikā veiks salīdzināšanas un kontrasta paņēmienus biznesa dimensijā.