Lineārā vs loģistiskā regresija
Statistiskajā analīzē ir svarīgi noteikt attiecības starp mainīgajiem, kas saistīti ar pētījumu. Dažreiz tas var būt vienīgās analīzes mērķis. Viens spēcīgs instruments, ko izmanto, lai noteiktu attiecību esamību un identificētu saistību, ir regresijas analīze.
Vienkāršākā regresijas analīzes forma ir lineārā regresija, kur sakarība starp mainīgajiem ir lineāra. Statistikas izteiksmē tas izceļ saistību starp paskaidrojošo mainīgo un atbildes mainīgo. Piemēram, izmantojot regresiju, mēs varam noteikt saikni starp preču cenu un patēriņu, pamatojoties uz datiem, kas savākti no nejaušas izlases. Regresijas analīze radīs datu kopas regresijas funkciju, kas ir matemātiskais modelis, kas vislabāk atbilst pieejamajiem datiem. To viegli var attēlot ar izkliedes diagrammu. Grafiski regresija ir līdzvērtīga vislabākās atbilstošās līknes atrašanai dotajai datu kopai. Līknes funkcija ir regresijas funkcija. Izmantojot matemātisko modeli, preces cenu var paredzēt par noteiktu cenu.
Tāpēc regresijas analīze tiek plaši izmantota prognozēšanā un prognozēšanā. To izmanto arī, lai izveidotu attiecības eksperimentālajos datos, fizikas, ķīmijas un daudzās dabaszinātnēs un inženierzinātnēs. Ja sakarība vai regresijas funkcija ir lineāra funkcija, tad process ir pazīstams kā lineārā regresija. Izkliedes grafikā to var attēlot kā taisnu līniju. Ja funkcija nav lineāra parametru kombinācija, tad regresija ir nelineāra.
Loģistiskā regresija ir salīdzināma ar daudzfaktoru regresiju, un tā rada modeli, lai izskaidrotu vairāku prognozētāju ietekmi uz reakcijas mainīgo. Tomēr loģistikas regresijā gala rezultāta mainīgajam jābūt kategoriskam (parasti sadalīts; ti, sasniedzamu rezultātu pāri, piemēram, nāve vai izdzīvošana, lai gan īpašas metodes ļauj modelēt kategorizētāku informāciju). Nepārtrauktu iznākuma mainīgo var pārveidot par kategorisku mainīgo, ko izmantot loģistikas regresijai; tomēr nepārtrauktu mainīgo sabrukšana šādā veidā lielākoties nav ieteicama, jo tas samazina precizitāti.
Atšķirībā no lineārās regresijas, virzoties uz vidējo rādītāju, loģistiskās regresijas prediktora mainīgajiem lielumiem nav jāpiespiež būt lineāri saistītiem, kopīgi sadalītiem vai vienādām dispersijām katrā klasterī. Tā rezultātā saistība starp prognozētāju un iznākuma mainīgajiem, visticamāk, nebūs lineāra funkcija.
Kāda ir atšķirība starp loģistisko un lineāro regresiju?
• Lineārajā regresijā tiek pieņemta lineāra sakarība starp paskaidrojošo mainīgo un reakcijas mainīgo, un analīze atrod modelim atbilstošus parametrus, lai iegūtu precīzu saistību.
• Kvantitatīvajiem mainīgajiem tiek veikta lineārā regresija, un tā rezultātā iegūtā funkcija ir kvantitatīva.
• Loģistiskajā regresijā izmantotie dati var būt gan kategoriski, gan kvantitatīvi, bet rezultāts vienmēr ir kategorisks.