Akýkoľvek súbor údajov nahromadený na štatistické účely, napríklad údaje zo sčítania v USA, obsahuje informácie, ktoré si vyžadujú súčet a agregáciu. Je takmer nemožné uviesť zoznam atribútov, napríklad ako jednotlivé príjmy a veľkosť rodiny. Štatistici používajú grafy distribúcie frekvencie na komplexné zobrazenie údajov. Napríklad histogram rozdeľuje údaje do intervalov triedy a počíta frekvenciu výskytu všetkých členov patriacich do tohto intervalu triedy.Aj keď neexistujú prísne pravidlá na výpočet veľkosti a počtu intervalov triedy, existujú niektoré užitočné konvenčné kritériá.
Vypočítajte rozsah údajov, t. J. Rozdiel medzi najvyšším a najnižším dátovým bodom. Napríklad predpokladajme, že najvyšší platený jednotlivec v USA zarába 30 miliárd dolárov ročne a najnižší nulový príjem. Rozsah sa rovná 30 - 0, čo sa rovná 30 miliardám dolárov.
Určte počet tried z veľkosti vzorky. Spravidla sa päť až sedem tried používa pre veľkosť vzorky do 50, osem až 10 tried pre veľkosť vzorky medzi 50 a 100, 10 až 15 tried pre veľkosť vzorky medzi 100 a 250 a 15 až 20 tried pre veľkosť vzorky väčšie ako 250.
Vypočítajte interval triedy pomocou nasledujúceho vzorca: Interval triedy = rozsah ÷ počet tried. Ak máte napríklad v rozdelení príjmu 15 tried príjmu, vypracujte 30 ÷ 15 = 2 miliardy dolárov. Štatistici často ignorujú extrémne vysoké a nízke čísla a zameriavajú sa na stredné frekvencie. Z tohto dôvodu je rozdelenie príjmu v USA prezentované v menších intervaloch 10 000 dolárov a príjmy väčšie ako určitá suma, zvyčajne milión, sú spojené do jedného intervalu jednej triedy.
Pri výpočte intervalu triedy používajte uváženie. Svätý grál grafu, ako je histogram, má sprostredkovať relevantné informácie zmysluplným a jednoduchým spôsobom. Vyberte si intervaly svojej triedy, aby ste sprostredkovali informácie, ktoré považujete za hodné pozornosti čitateľov.