Avrunding Religiøse Wars, Take Two

January 9  by Eliza

Forrige uke jeg holdt et tips om uenighet blant statistikere og andre om hvordan en verdi, akkurat i midten av to andre verdier, bør være avrundet. For eksempel, mellom verdiene 7 og 8, hvor bør verdien 7,5 være avrundet? For noen folk, skal verdien alltid rundes opp, men for andre er det alltid skal avrundes til nærmeste partall. Med andre ord, 7,5 avrundes til 8 ved begge leire, men 8,5 ville være avrundet til 9 ved en leiren og 8 ved den annen leiren.

Jeg feilaktig oppgitt, i forrige uke, at avrunding en eksakt sentrum verdi til nærmeste partall ville introdusere skjevheter i resultatene. Spesielt sa jeg at gitt tallene 7,0, 7,1, 7,2, osv, hele veien gjennom 7.9, at hvis du runde av til nærmeste selv vil du få fem verdiene går ned (7.0 til 7.4), fire verdier går opp (7.6 gjennom 7.9), og en waffling uansett (7,5). Dette er feil fordi verdien 7.0 ikke er avrundet det hele tatt. Dette betyr at du virkelig får fire verdier går ned (7.1 til 7.4), fire går opp (7.6 gjennom 7.9), og senteret verdien bør være i stand til å gå begge veier for å holde de to retningene fri for bias.

Det ser også at det er en ANSI standard på hele denne saken. En abonnent indikert at han alltid hadde fulgt standardene ASTM E29 og ANSI Z25.1, som begge angir at en brøk verdi på 0,5, akkurat, skal avrundes til nærmeste tall som ender i en enda sifret. Hvis du trenger å gjøre denne type avrunding, deretter den riktige formelen til bruk er dette:

= HVIS (A1-INT (A1) -0.5, SELV (ROUNDDOWN (A1,0)), ROUND (A1,0))

For å se hvordan dette kan påvirke utfallet av avrunding, genererte jeg en serie på 25.000 tilfeldige tall mellom 1 og 100, hvor hvert resultat hadde opptil to desimaler. Jeg deretter rundet verdiene til en hel verdi ved hjelp av vanlig ROUND funksjon i en kolonne, og i neste kolonne jeg rundet tallene ved hjelp av formelen ovenfor. I så summert hver kolonne for å se hvilken metode for avrunding ga resultater nærmere den opprinnelige summen. I min test, var resultatene over 50% nærmere opprinnelige sum ved hjelp av ovennevnte formel i stedet for utmerker ROUND funksjon alene.

Jeg deretter genererte 25 000 tilfeldige tall med opptil tre desimaler, og resultatene var den samme - formelen var nærmere enn en generisk ROUND. Det samme gjaldt med tall med fire og fem desimaler, så vel.

En ting jeg la merke til i min testing var at i det første settet med testdata (tilfeldige tall med opptil to desimaler) var det 234 verdier som nøyaktig matchet kriteriene for å være nøyaktig 0,5 (og dermed kvalifisert for avrunding opp eller ned ). I listen med tre desimaler antall kamper falt til 14 verdier, med fire desimaler var det to verdier, og med fem desimaler var det 0 verdier. Det står til grunn at færre verdier er det som oppfyller kriteriene til slutt i 0,5, er det mindre nødvendig å bruke den "runde opp eller ned" logikk. Således avrundingen formelen ovenfor, mister sin effektivitet når man begynner å gjøre med tall som har fire, fem, seks eller flere sifre til høyre for desimalpunktet i kraft av det faktum at det er s-senter varer.

Det er en ting som ble nevnt i forrige uke som fortsatt har verdi - sørg for at du gjør ditt avrunding som en av dine siste trinnene. Du bør alltid arbeide med "rå" tall så mye som mulig. Dette betyr at når du bruker aggregative funksjoner, for eksempel SUM eller GJENNOMSNITT, bør du ikke bruke dem til verdier som allerede er avrundet. I stedet bør du sum eller gjennomsnittlig rå verdier, og deretter gjøre avrundingen på SUM eller GJENNOMSNITT. Du vil få mer nøyaktige resultater ved å huske dette tipset.

ExcelTips er din kilde for kostnadseffektiv Microsoft Excel trening. Dette tipset (2835) gjelder for Microsoft Excel 97, 2000, 2002, og 2003.