Difinanta La Regresan Statistikan Modelon

Regresado Analizas Rilatojn Inter Variabloj

Regresado estas datuma minado-tekniko uzita por antaŭdiri gamon de nombraj valoroj (ankaŭ nomitaj kontinuaj valoroj ), donita apartan datumeton. Ekzemple, regresado povus esti uzata por antaŭdiri la koston de produkto aŭ servo, donitaj aliaj variabloj.

Regresado estas uzata tra multnombraj industrioj por komercado kaj merkatado, financaj prognozoj, ekologiaj modeloj kaj analizo de tendencoj.

Regresado Vs. Klasifiko

Regresado kaj klasifiko estas datumaj minindustriaj teknikoj uzataj por solvi similajn problemojn, sed ili ofte konfuzas. Ambaŭ estas uzataj en antaŭdira analizo, sed regresado estas uzata por antaŭdiri nombran aŭ kontinuan valoron dum la klasifiko atribuas datumojn en diskretajn kategoriojn.

Ekzemple, regresado uzus por antaŭdiri valoron de la hejmo bazita sur ĝia loko, kvadrataj piedoj, prezo kiam lastatempe vendis, prezo de similaj hejmoj kaj aliaj faktoroj. Klasifiko estus en ordo, se vi volus anstataŭe organizi domojn en kategoriojn, kiel marŝebleco, grandega grandeco aŭ krimaj indicoj.

Tipoj de Regresaj Teknikoj

La plej simpla kaj plej malnova formo de regresado estas lineara regresio uzita por taksi rilaton inter du variabloj. Ĉi tiu tekniko uzas la matematikan formulon de rekto (y = mx + b). En klaraj terminoj, ĉi tio simple signifas ke, donita grafeo kun Y kaj X-akso, la rilato inter X kaj Y estas rekta kun malmultaj eksteruloj. Ekzemple, ni povus supozi, ke kreskanta en la loĝantaro, produktado de nutraĵoj pliiĝus samtempe - tio postulas fortan, linean rilaton inter la du figuroj. Por visualigi ĉi tion, konsideru grafeon en kiu la Y-akso spuras popularan kreskon, kaj la X-akso spuras manĝaĵon. Ĉar la valoro Y pliigas, la X-valoro pliiĝus samtempe, farante la rilaton inter ili rektan.

Altnivelaj teknikoj, kiel multajn regresojn, antaŭdiras rilaton inter multaj variabloj - ekzemple, ĉu ekzistas interrilato inter enspezoj, edukado kaj kie oni elektas vivi? La aldono de pli variabloj konsiderinde pliigas la kompleksecon de la antaŭdiro. Ekzistas pluraj tipoj de multoblaj regresaj teknikoj inkluzive de normo, hierarkia, aro kaj paŝo, ĉiu kun sia propra apliko.

Ĉe ĉi tiu punkto, estas grave kompreni, kion ni provas antaŭdiri (la dependa aŭ antaŭvidita variablo) kaj la datumoj, kiujn ni uzas por fari la antaŭdiron (la sendependajn aŭ antaŭdirektajn variablojn). En nia ekzemplo, ni deziras antaŭdiri la lokon, kie oni elektas vivi (la antaŭviditan variablon) donita enspezo kaj edukado (ambaŭ antaŭdireblaj variabloj).