Regresado Analizas Rilatojn Inter Variabloj
Regresado estas datuma minado-tekniko uzita por antaŭdiri gamon de nombraj valoroj (ankaŭ nomitaj kontinuaj valoroj ), donita apartan datumeton. Ekzemple, regresado povus esti uzata por antaŭdiri la koston de produkto aŭ servo, donitaj aliaj variabloj.
Regresado estas uzata tra multnombraj industrioj por komercado kaj merkatado, financaj prognozoj, ekologiaj modeloj kaj analizo de tendencoj.
Regresado Vs. Klasifiko
Regresado kaj klasifiko estas datumaj minindustriaj teknikoj uzataj por solvi similajn problemojn, sed ili ofte konfuzas. Ambaŭ estas uzataj en antaŭdira analizo, sed regresado estas uzata por antaŭdiri nombran aŭ kontinuan valoron dum la klasifiko atribuas datumojn en diskretajn kategoriojn.
Ekzemple, regresado uzus por antaŭdiri valoron de la hejmo bazita sur ĝia loko, kvadrataj piedoj, prezo kiam lastatempe vendis, prezo de similaj hejmoj kaj aliaj faktoroj. Klasifiko estus en ordo, se vi volus anstataŭe organizi domojn en kategoriojn, kiel marŝebleco, grandega grandeco aŭ krimaj indicoj.
Tipoj de Regresaj Teknikoj
La plej simpla kaj plej malnova formo de regresado estas lineara regresio uzita por taksi rilaton inter du variabloj. Ĉi tiu tekniko uzas la matematikan formulon de rekto (y = mx + b). En klaraj terminoj, ĉi tio simple signifas ke, donita grafeo kun Y kaj X-akso, la rilato inter X kaj Y estas rekta kun malmultaj eksteruloj. Ekzemple, ni povus supozi, ke kreskanta en la loĝantaro, produktado de nutraĵoj pliiĝus samtempe - tio postulas fortan, linean rilaton inter la du figuroj. Por visualigi ĉi tion, konsideru grafeon en kiu la Y-akso spuras popularan kreskon, kaj la X-akso spuras manĝaĵon. Ĉar la valoro Y pliigas, la X-valoro pliiĝus samtempe, farante la rilaton inter ili rektan.
Altnivelaj teknikoj, kiel multajn regresojn, antaŭdiras rilaton inter multaj variabloj - ekzemple, ĉu ekzistas interrilato inter enspezoj, edukado kaj kie oni elektas vivi? La aldono de pli variabloj konsiderinde pliigas la kompleksecon de la antaŭdiro. Ekzistas pluraj tipoj de multoblaj regresaj teknikoj inkluzive de normo, hierarkia, aro kaj paŝo, ĉiu kun sia propra apliko.
Ĉe ĉi tiu punkto, estas grave kompreni, kion ni provas antaŭdiri (la dependa aŭ antaŭvidita variablo) kaj la datumoj, kiujn ni uzas por fari la antaŭdiron (la sendependajn aŭ antaŭdirektajn variablojn). En nia ekzemplo, ni deziras antaŭdiri la lokon, kie oni elektas vivi (la antaŭviditan variablon) donita enspezo kaj edukado (ambaŭ antaŭdireblaj variabloj).
- Norma multobliga regresado konsideras ĉiujn antaŭdifajn variablojn samtempe. Ekzemple 1), kio estas la rilato inter enspezo kaj edukado (antaŭdiroj) kaj elekto de kvartalo (antaŭvidita); kaj 2) kiomgrade ĉiu el la individuaj antaŭdiroj kontribuas al tiu rilato?
- Stepwise-multobla regresado respondas tute malsaman demandon. Alteritmo de progresiga paŝo analizos, kiuj antaŭdiroj estas plej bone uzataj por antaŭdiri la elekton de najbareco, kio signifas, ke la paŝo de la modelo taksas la ordo de graveco de la variabloj de la antaŭdiristo kaj tiam elektas suban subaĵon. Ĉi tiu tipo de regresiga problemo uzas "paŝojn" por evoluigi la regresan ekvacion. Donita ĉi tiun tipon de regresado, ĉiuj antaŭdiroj eble eĉ ne aperas en la fina regreska ekvacio.
- Hierarkia regresio , kiel paŝo, estas sekva procezo, sed la variabloj de la antaŭdiristo estas enmetitaj al la modelo en antaŭ-specifita ordo difinita antaŭen, tio estas, la algoritmo ne enhavas korpigita aro de ekvacioj por determini la ordo en kiu eniri la antaŭdiristojn. Ĉi tio estas plej ofte uzita kiam la individuo kreanta la regresan ekvacion havas spertan scion pri la kampo.
- Simila regreso ankaŭ similas al paŝo, sed analizas aroj de variabloj anstataŭ individuaj variabloj.