Výhody a nevýhody modelu viacnásobnej regresie

Posted on
Autor: Laura McKinney
Dátum Stvorenia: 9 Apríl 2021
Dátum Aktualizácie: 17 November 2024
Anonim
Výhody a nevýhody modelu viacnásobnej regresie - Veda
Výhody a nevýhody modelu viacnásobnej regresie - Veda

Obsah

Viacnásobná regresia sa používa na preskúmanie vzťahu medzi niekoľkými nezávislými premennými a závislou premennou. Aj keď viacero regresných modelov vám umožňuje analyzovať relatívne vplyvy týchto nezávislých alebo prediktorových premenných na závislú alebo kriteriálnu premennú, tieto zložité súbory údajov môžu viesť k nesprávnym záverom, ak sa správne nezistia.

Príklady viacnásobnej regresie

Realitný agent by mohol použiť viacnásobnú regresiu na analýzu hodnoty domov. Napríklad mohla ako nezávislé premenné použiť veľkosť domov, ich vek, počet spální, priemernú cenu domu v susedstve a blízkosť škôl. Pri ich vynesení do modelu s viacnásobnou regresiou mohla tieto faktory použiť na to, aby ich vzťah k cenám domov považoval za premennú kritéria.

Ďalším príkladom použitia modelu viacnásobnej regresie môže byť niekto v oblasti ľudských zdrojov, ktorý určuje plat riadiacich funkcií - premenná kritéria. Premennými prediktormi môžu byť každé odpracované roky manažérov, priemerný počet odpracovaných hodín, počet riadených ľudí a rozpočet oddelenia manažérov.

Výhody viacnásobnej regresie

Pri analýze údajov pomocou modelu s viacnásobnou regresiou existujú dve hlavné výhody. Prvou je schopnosť určiť relatívny vplyv jednej alebo viacerých predikčných premenných na hodnotu kritéria. Realitný agent mohol zistiť, že veľkosť domov a počet spální má silnú koreláciu s cenou domu, zatiaľ čo blízkosť škôl nemá vôbec žiadnu koreláciu alebo dokonca negatívnu koreláciu, ak ide predovšetkým o odchod do dôchodku. komunita.

Druhou výhodou je schopnosť identifikovať odľahlé hodnoty alebo anomálie. Napríklad pri skúmaní údajov týkajúcich sa platov vedúcich pracovníkov mohol manažér ľudských zdrojov zistiť, že počet odpracovaných hodín, veľkosť oddelenia a jeho rozpočet mali silnú koreláciu s platmi, zatiaľ čo počet odpracovaných rokov nebol. Alternatívne by sa mohlo stať, že všetky uvedené hodnoty prediktorov korelovali s každou skúmanou mzdou, s výnimkou jedného manažéra, ktorý bol preplatený v porovnaní s ostatnými.

Nevýhody viacnásobnej regresie

Akákoľvek nevýhoda použitia modelu viacnásobnej regresie zvyčajne súvisí s použitými údajmi. Dva príklady na to používajú neúplné údaje a nepravdivo usudzujú, že korelácia je príčinná súvislosť.

Napríklad pri skúmaní ceny domov predpokladajme, že realitný agent hľadal iba 10 domov, z ktorých sedem kúpili mladí rodičia. V tomto prípade môže vzťah medzi blízkosťou škôl viesť k presvedčeniu, že to malo vplyv na predajnú cenu všetkých domov predávaných v komunite. Toto ilustruje úskalia neúplných údajov. Keby použila väčšiu vzorku, mohla zistiť, že zo 100 predaných domov bolo iba desať percent domácich hodnôt spojených s blízkosťou škôl. Keby použila vek kupujúcich ako predikčnú hodnotu, mohla by zistiť, že mladší kupujúci boli ochotní platiť za domovy v komunite viac ako starší kupujúci.

Na príklade miezd za riadenie predpokladajme, že existoval jeden odchádzajúci pracovník, ktorý mal nižší rozpočet, menej odpracovaných rokov a menej zamestnancov na správu, ale vydělával viac ako ktokoľvek iný. HR manažér sa mohol pozrieť na údaje a dospieť k záveru, že táto osoba je preplatená. Tento záver by však bol chybný, ak by nezohľadnil, že tento manažér mal na starosti webovú stránku spoločnosti a mal vysoko vyhľadávanú zručnosť v oblasti zabezpečenia siete.