Obsah
Keď vedci, ekonómovia alebo štatistici robia predpovede na základe teórie a potom zbierajú skutočné údaje, potrebujú spôsob, ako zmerať rozdiely medzi predpokladanými a nameranými hodnotami. Zvyčajne sa spoliehajú na priemernú štvorcovú chybu (MSE), ktorá je súčtom variácií jednotlivých dátových bodov na druhú a delených počtom dátových bodov mínus 2. Keď sa údaje zobrazujú v grafe, určíte MSE podľa sčítanie zmien v údajových bodoch vertikálnej osi. Na grafe x-y by to boli hodnoty y.
Prečo štvorec variácie?
Násobenie odchýlky medzi predpokladanou a pozorovanou hodnotou má dva žiaduce účinky. Prvým je zabezpečiť, aby boli všetky hodnoty pozitívne. Ak by jedna alebo viac hodnôt boli záporné, súčet všetkých hodnôt by mohol byť nerealisticky malý a zlá reprezentácia skutočnej odchýlky medzi predpokladanými a pozorovanými hodnotami. Druhou výhodou porovnávania je priradiť väčšiu váhu väčším rozdielom, čo zaisťuje, že veľká hodnota pre MSE znamená veľké dátové variácie.
Algoritmus výpočtu zásob
Predpokladajme, že máte algoritmus, ktorý predpovedá ceny konkrétnej zásoby na dennej báze. V pondelok sa predpokladá, že cena akcií bude 5,50 dolárov, v utorok 6,00 dolárov, streda 6,00 dolárov, štvrtok 7,50 dolárov a piatok 8,00 dolárov. Ak vezmeme do úvahy pondelok ako deň 1, máte k dispozícii množinu údajových bodov, ktoré sa objavujú takto: (1, 5, 50), (2, 6,00), (3, 6,00), (4, 7,50) a (5, 8,00). Skutočné ceny sú nasledujúce: pondelok 4,75 USD (1, 4,75); Utorok 5,35 (2, 5,35); Streda 6,25 USD (3, 6,25); Štvrtok $ 7,25 (4, 7,25); a piatok: 8,50 USD (5, 8,50).
Rozdiely medzi hodnotami y týchto bodov sú 0,75, 0,65, -0,25, 0,25 a -0,50, kde záporné znamienko znamená predpokladanú hodnotu menšiu ako pozorovaná. Ak chcete vypočítať MSE, musíte najprv odobrať každú hodnotu variácie, ktorá eliminuje znamienka mínus a výnosy 0,5625, 0,4225, 0,0625, 0,0625 a 0,25. Sčítaním týchto hodnôt sa získa 1,36 a vydelením počtom meraní mínus 2, čo je 3, získa sa MSE, ktorá sa ukáže byť 0,45.
MSE a RMSE
Menšie hodnoty pre MSE naznačujú užšiu zhodu medzi predpokladanými a pozorovanými výsledkami a MSE 0,0 znamená dokonalú zhodu. Je však dôležité si uvedomiť, že hodnoty odchýlok sú na druhú. Ak sa vyžaduje meranie chýb, ktoré je v rovnakých jednotkách ako údajové body, štatistici berú koreňovú strednú štvorcovú chybu (RMSE). Získajú to tak, že vezmú druhú odmocninu strednej štvorcovej chyby. Vo vyššie uvedenom príklade by RSME bola 0,671 alebo asi 67 centov.