Galvenā atšķirība - uzraudzīta un bez uzraudzības mašīnmācīšanās
Vadīta mācīšanās un bez uzraudzības ir divi mašīnmācīšanās pamatjēdzieni. Uzraudzītā mācīšanās ir mašīnmācīšanās uzdevums, lai iemācītos funkciju, kas piesaista ieeju izvadei, pamatojoties uz ieejas un izvades pāru piemēriem. Nepieskatīta mācīšanās ir mašīnmācīšanās uzdevums, lai izsecinātu funkciju, kas apraksta slēpto struktūru no nemarķētiem datiem. Galvenā atšķirība starp uzraudzīto un nepieskatīto mašīnmācīšanos ir tā, ka uzraudzītajā mācībā tiek izmantoti apzīmēti dati, bet bez uzraudzības - apzīmēti dati.
Mašīnmācība ir joma datorzinātnēs, kas dod iespēju datorsistēmai mācīties no datiem, nepārprotami nepārprogrammējot. Tas ļauj analizēt datus un paredzēt to modeļus. Mašīnmācībā ir daudz lietojumu. Daži no tiem ir sejas atpazīšana, žestu atpazīšana un runas atpazīšana. Ir dažādi algoritmi, kas saistīti ar mašīnmācīšanos. Daži no tiem ir regresija, klasifikācija un kopu veidošana. Visizplatītākās programmēšanas valodas mašīnmācīšanās balstītu lietojumprogrammu izstrādei ir R un Python. Var izmantot arī citas valodas, piemēram, Java, C ++ un Matlab.
SATURS
1. Pārskats un galvenās atšķirības
2. Kas ir uzraudzīta mācīšanās
3. Kas ir nepieskatīta mācīšanās
4. Līdzības starp uzraudzītu un bez uzraudzības mašīnmācīšanos
5. Blakus salīdzinājums - uzraudzīta un nepieskatīta mašīnmācīšanās tabulas veidā
6. Kopsavilkums
Kas ir uzraudzīta mācīšanās?
Mašīnmācībā balstītās sistēmās modelis darbojas pēc algoritma. Uzraudzītās mācībās tiek uzraudzīts modelis. Pirmkārt, ir nepieciešams apmācīt modeli. Izmantojot iegūtās zināšanas, tas var paredzēt atbildes nākamajām instancēm. Modelis tiek apmācīts, izmantojot marķētu datu kopu. Kad sistēmai tiek piešķirts datu paraugs, kas var paredzēt rezultātu. Tālāk ir sniegts neliels izraksts no populārās IRIS datu kopas.
Saskaņā ar iepriekšminēto tabulu, atribūtus sauc par sīpolu garumu, sīpolu platumu, pateles garumu, pateles platumu un sugām. Kolonnas ir pazīstamas kā funkcijas. Vienā rindā ir dati par visiem atribūtiem. Tāpēc vienu rindu sauc par novērojumu. Dati var būt skaitliski vai kategoriski. Modelim tiek doti novērojumi ar atbilstošo sugas nosaukumu kā ievadi. Kad tiek dots jauns novērojums, modelim vajadzētu paredzēt sugu tipu, kurai tas pieder.
Uzraudzītā mācībā ir klasifikācijas un regresijas algoritmi. Klasifikācija ir marķēto datu klasificēšanas process. Modelis izveidoja robežas, kas atdalīja datu kategorijas. Kad modelim tiek piegādāti jauni dati, tas var kategorizēt pēc tā, kur punkts pastāv. K-Tuvākie kaimiņi (KNN) ir klasifikācijas modelis. Atkarībā no k vērtības tiek izlemta kategorija. Piemēram, kad k ir 5, ja konkrēts datu punkts ir tuvu astoņiem datu punktiem A kategorijā un sešiem datu punktiem B kategorijā, tad datu punkts tiks klasificēts kā A.
Regresija ir iepriekšējo datu tendences prognozēšanas process, lai prognozētu jauno datu iznākumu. Regresijā izeja var sastāvēt no viena vai vairākiem nepārtrauktiem mainīgajiem. Paredzēšana tiek veikta, izmantojot līniju, kas aptver lielāko daļu datu punktu. Vienkāršākais regresijas modelis ir lineārā regresija. Tas ir ātrs, un tam nav nepieciešami tādi parametri kā KNN. Ja dati rāda paraboliskas tendences, tad lineārās regresijas modelis nav piemērots.
Šie ir daži uzraudzītu mācību algoritmu piemēri. Parasti uzraudzīto mācību metožu rezultāti ir precīzāki un ticamāki, jo ievades dati ir labi zināmi un apzīmēti. Tāpēc mašīnai ir jāanalizē tikai slēptie modeļi.
Kas ir bez uzraudzības mācīšanās?
Mācībās bez uzraudzības modelis netiek uzraudzīts. Modelis darbojas pats par sevi, lai prognozētu rezultātus. Tas izmanto mašīnmācīšanās algoritmus, lai nonāktu pie secinājumiem par nemarķētiem datiem. Parasti bez uzraudzības mācīšanās algoritmi ir grūtāk nekā uzraudzīti mācīšanās algoritmi, jo ir maz informācijas. Klasteru veidošana ir bezuzraudzības veids. To var izmantot nezināmu datu grupēšanai, izmantojot algoritmus. K-vidējā un uz blīvumu balstītā klasterizācija ir divi klasterizācijas algoritmi.
k-vidējais algoritms, katram centram nejauši novieto k centroidu. Tad katrs datu punkts tiek piešķirts tuvākajam centroidam. Eikalida attālumu izmanto, lai aprēķinātu attālumu no datu punkta līdz centroidam. Datu punkti tiek klasificēti grupās. Atkārtoti tiek aprēķinātas k centraīdu pozīcijas. Jauno centroidu pozīciju nosaka vidējais visu punktu skaits grupā. Katrs datu punkts atkal tiek piešķirts tuvākajam centroidam. Šis process atkārtojas, līdz centroidi vairs nemainās. k-mean ir ātrs klasterizācijas algoritms, taču nav noteikta klasterizācijas punktu inicializācija. Tāpat ir liela klasteru modeļu variācija, pamatojoties uz klasteru punktu inicializēšanu.
Vēl viens klasterizācijas algoritms ir klasterizācija, kuras pamatā ir blīvums. Tas ir arī pazīstams kā uz blīvuma balstītas telpiskās kopu lietojumprogrammas ar troksni. Tas darbojas, nosakot kopu kā maksimālo ar blīvumu saistīto punktu kopu. Tie ir divi parametri, kas tiek izmantoti blīvuma grupēšanai. Tie ir Ɛ (epsilon) un minimālie punkti. Ɛ ir apkārtnes maksimālais rādiuss. Minimālie punkti ir minimālais punktu skaits apkārtnē Ɛ, lai definētu kopu. Šie ir daži kopu veidošanas piemēri, kas ietilpst bez uzraudzības.
Parasti rezultāti, kas iegūti no neuzraudzītiem mācību algoritmiem, nav daudz precīzi un ticami, jo mašīnai ir jānosaka un jāapzīmē ievades dati pirms slēpto modeļu un funkciju noteikšanas.
Kāda ir līdzība starp uzraudzītu un bez uzraudzības mašīnmācīšanos?
Gan uzraudzīta, gan bez uzraudzības ir mašīnmācīšanās veidi
Kāda ir atšķirība starp uzraudzītu un bez uzraudzības mašīnmācīšanos?
Atšķirīgs raksts vidū pirms tabulas
Uzraudzīta un nepieskatīta mašīnmācīšanās |
|
Uzraudzītā mācīšanās ir mašīnmācīšanās uzdevums, lai iemācītos funkciju, kas piesaista ieeju izvadei, pamatojoties uz ieejas un izvades pāriem. | Nepieskatīta mācīšanās ir mašīnmācīšanās uzdevums, izsecinot funkciju, kas apraksta slēpto struktūru no nemarķētiem datiem. |
Galvenā funkcionalitāte | |
Uzraudzītās mācībās modelis paredz rezultātu, pamatojoties uz iezīmētajiem ievades datiem. | Nepieskatītās mācībās modelis paredz rezultātu bez marķētiem datiem, pats identificējot modeļus. |
Rezultātu precizitāte | |
Uzraudzīto mācību metožu rezultāti ir precīzāki un ticamāki. | Nepieskatītu mācību metožu rezultātā iegūtie rezultāti nav daudz precīzi un ticami. |
Galvenie algoritmi | |
Ir regresijas un klasifikācijas algoritmi uzraudzītā mācībā. | Ir algoritmi klasteru izveidošanai bez uzraudzības. |
Kopsavilkums - uzraudzīta un bez uzraudzības mašīnmācīšanās
Mācīšanās ar uzraudzību un bez uzraudzības ir divi mašīnmācīšanās veidi. Uzraudzītā mācīšanās ir mašīnmācīšanās uzdevums, lai iemācītos funkciju, kas piesaista ieeju izvadei, pamatojoties uz ieejas un izvades pāriem. Nepieskatīta mācīšanās ir mašīnmācīšanās uzdevums, izsecinot funkciju, kas apraksta slēpto struktūru no nemarķētiem datiem. Atšķirība starp uzraudzītu un nepieskatītu mašīnmācīšanos ir tāda, ka uzraudzītajā mācībā tiek izmantoti apzīmēti dati, bet bez uzraudzības tiek izmantoti nemarķēti dati.