Juleøltesten 2014

Resultatene – kort og godt

Tradisjonen tro er årets juleøltest gjennomført, og analyseresultatene er kommet inn. For de utålmodige kan vi annonsere med en gang at Nøgene Ø kom på topp i år også. Nøgene Øs God Jul og Underlig Jul troner på henholdsvis første og andre plass, med Kinn Julefred på en hårfin tredjeplass. Verst ut kom Tuborg Julebrygg, som med et “uhell” kom med i rangeringen. Den har visstnok fått “brygge” nederst i kjøleskapet siden juleøltesten 2012.

Resultatoversikt for juleøltesten 2014.

Resultatoversikt for juleøltesten 2014. Justerte poengsummer gjør at total kan avvike.

Vinnernes bryggerier skal selv få beskrive ølen sin:

Førsteplass: Nøgene Ø God Jul. A dark ale brewed specially for the Christmas season, with a rich, complex taste of caramel. This is a strong, dark and rather sweet Christmas Beer – just the way we think a Christmas beer should be.

Andreplass: Nøgene Ø Underlig Jul. The name of this beer is “Peculiar Christmas” in english. This spiced Christmas ale is strange – and indeed a fusion beer. We have gathered inspiration from the Norwegian drink “gløgg”, and as such this is quite an uncompromising brew.

Tredjeplass: Kinn Julefred. I meir enn 1000 år har nordmenn bryggja øl til jul. Juleølet var festdrikk og sterkare enn ølet ein drakk ellers i året. Vårt juleøl er bryggja i denne tradisjonen og er eit fyldig og kraftig øl med god maltsmak. Julefred er bryggja spesielt med tanke på den tradisjonelle salta og tørka julematen, men høver og godt som sjelevarmar for ein frosen skrott.

Ønsker å takke verten og vertinnen, Helge og Marit, for deres innsats i å arrangere juleølsmaking atter et år. Det er ikke julestemning før smaksløkene bikker over, og skriker etter andre sanseinntrykk enn bekmørkt og overkrydret juleøl. Spesielt ønsker vi i juryen å takke vertinnen for hennes gjestmildhet og innsats som bartender, eller kanskje forskerspire(?), da juryens forhold til henne er nærmere den mellom forsøkskaniner og mad scientist.

Dem som ønsker et nærmere innblikk i hvordan vi kom fram til resultatene og er nysgjerrige på hva annet dataen kan fortelle om juleøla, og kanskje litt om jurymedlemmene selv, inviteres til å fortsette å lese.

Analysen – et dypdykk i ølla

Sist år ble analysen gjort i Excel, og resultatet finner du her. I år går vi grundigere og mer systematisk til verks. Vi har fått tak i en lisens til analyseverktøyet Tableau, noe som gjør dataanalyse til en lek.

Årets jury består av Helge Svendsen, Stian Skår (Krystad), Nikolai Skogstad, og André Andersen. Helge fronter instagramkontoen 365wines om vinkunsten, noe som muligens har farget vår tilnærming til juleøltestingen. Spesielt gjelder det poengsystemet vi har brukt som er basert på Robert Parkers poengsystem for vin. Poengsystemet har følgende delresultat:

  • Farge (med skum/head) gir opp til 5 poeng
  • Lukt gir opp til 15 poeng
  • Smak gir opp til 20 poeng
  • Helhet gir opp til 10 poeng

Poengene fra delresultatene pluss 50 grunnpoeng legges sammen og gir en skala fra 50 til 100 poeng. Dette følger det underliggende karaktersystemet i Amerikanske akademia.

Standardisering av poengene

Vi har digitalisert poengene og kan derfor gjøre en god del artig analyse. Først anerkjenner vi at minst to av oss ikke vet hva vi driver på med når det gjelder øltesting, og at poenggivingen spriker en god del. Dette har vi tatt hånd om ved å standardisere resultatene slik at jurymedlemmene har samme snitt og standardavvik. Dette er en fancy måte å si at vi får poengene til å kunne bedre sammenliknes. Hvis noen (*host* Nikolai) gir veldig sprikende og lave resultater blir de automatisk gjort mer konsentrert og hevet litt for å likne mer fellesresultatet. Både rådataen og de standardiserte resultatene finner du her. Delpoengene og endelig poengsum har blitt standardisert hver for seg, noe som gjør at endelig totalsum ikke nødvendigvis går opp.

Deskriptiv statistikk over jurymedlemmenes poenggivning.

Deskriptiv statistikk over jurymedlemmenes poenggivning.

Fra første tabellen over ser vi at rådataen til Helge og Stian begge har rimelig like standardavvik og gjennomsnitt, i motsetning til Nikolai og mine egen standardavvik som er ganske brede. Vi to har også henholdsvis ganske lav og høy gjennomsnitt. Det er kanskje ikke så rart at vi to virker mer urutinert i stemmegivningen i forhold til Helge som har erfaring innen vinkunsten og Stian som brygger eget øl. Pytt, pytt, vi gyver løs på oppgaven med hodet hevet likevel, og kompenserer våre mangler med å tvinge stemmene våre til å ha samme standardavvik og gjennomsnitt som de med peiling. Dette påvirker ikke Helge og Stians resultater så mye, men Nikolais og mine egne resultat blir normalisert.

Etter standardiseringen har vi følgende poengfordeling på sluttresultatene:

Fordeling av endelige poeng.

Fordeling av endelige poeng.

I all hovedsak gis det ikke mange poeng mellom 95 og 100, og vi virker svært så glad i å gi rundt 85 poeng. Fordelingen ser ikke akkurat ut som antatt normalfordeling, men det får være grenser på hvor statistisk korrekt vi skal være i en uformell juleøltest.

Poengfordelingen på hver av deltestene oppfører seg litt mer som forventet:

Fordeling av delpoeng.

Fordeling av delpoeng.

Her ser vi kanskje en tendens til normalfordeling. Siden vi summerer normalfordelinger er det å forvente at endelig poengsum bør være normalfordelt også, men akk nei; dette gjelder kun uavhengige normalfordelte variable, og senere vil vi se at dette på ingen måte er tilfellet. Lukter en øl godt er det stor sannsynlighet for at den også smaker godt. Mer om det senere.

Kanskje mest for jurymedlemmenes del så er de standardiserte poengsummene vi ga som følger:

Jurymedlemmenes poenggivning.

Jurymedlemmenes poenggivning.

Beste fem øl innen farge, duft, smak og helhet.

Så hvem er vinnerene av deltestene? Her følger topp fem for hver deltest:

Beste fem øl innen farge, duft, smak og helhet.

Beste fem øl innen farge, duft, smak og helhet.

Har du tenkt å drikke øl med kun ganen så ser det ut til at Kinn Julefred går av som vinner, ellers troner Nøgene Øs øl på topp også på deltestene.

Korrelasjonene – fra farge og duft til smak

Oppdelingen i flere deltester gjør at vi kan se nærmere på hva som muligens påvirker smaken og helhetsinntrykket. Følgende viser korrelasjoner; farge og duft versus duft, smak og helhet.

Scatter-plot mellom delpoengene.

Scatter-plot mellom delpoengene.

Det ser ut til å være en positiv korrelasjon mellom delpoengsummene. Tableau rapporterer at samtlige trendlinjer har p-verdi på lavere enn 0.0001, men følgende R-squared.

X-aksen Y-aksen R-squared p-verdi
Farge Helhet 0,216341 < 0.0001
Farge Smak 0,220991 < 0.0001
Farge Duft 0,236277 < 0.0001
Duft Helhet 0,615605 < 0.0001
Duft Smak 0,580103 < 0.0001
Duft Duft 1 < 0.0001

Poenggivningen ble gjort på en slik måte at vi ga delpoeng før vi gikk videre til neste deltest. Altså, fikk farge poeng før duft, og duft før smak og helhet. Dette kan gi støtte til at det er snakk om kausalitet og ikke bare korrelasjon i tallene. Det virker som at vi faktisk synes at øl som ser bra ut også lukter bra, og øl som lukter bra også smaker bra. Akkurat hvorfor skal jeg ikke begi meg innpå, annet enn at det kan være en slags anchoring effekt og/eller ønske om å være konsistent med tidligere poenggivning. Selvsagt, det kan jo også være at vi er superflinke til å tyde ølens kvaliteter fra utseende, men jeg tviler.

Svik og lureri

Hva skjer når eksperimentøren finner ut av å servere samme øl flere ganger? Og ikke minst samme øl rett etter hverandre? Tredjeplassen, Kinn Julefred, ble servert som nummer 4 og 10, samt Delirium Christmas som nummer 14 og 15, altså rett etter hverandre.

Servering av samme øl flere ganger.

Servering av samme øl flere ganger.

For Kinn Julefred var dens andre mottakelse svært så mørk; den gikk tilbake 10 poeng. Kun undertegnede valgte å ikke gi nevneverdig mindre poeng, mens største tilbakefallet fra et jurymedlem var på hele 20 poeng, eller 2.5 standardavvik lavere. Dette tilsvarer å gå fra å ha ei topp 1% øl til å ei som er nøyaktig midt på treet. For Delirium Christmas var tilbakefallet ikke så ille. De fleste jurymedlemmene sto på stedet hvil; tilbakefallet var på kun 3 poeng.

Betydningen av land og gjæringsprosess

I utgangspunktet forventet vi ikke mye forskjell mellom landene. Men la følgende illustrasjon synke inn.

Box-and-whiskers-plot av endelig poengsum mot varegruppe og land.

Box-and-whiskers-plot av endelig poengsum mot varegruppe og land.

Av en eller annen grunn kom dansk øl veldig dårlig ut. Mulig det er tilgjengelighet og seleksjonsbias. Sveriges resultat bør vi også ta med en klype salt, da de ikke har mange datapunkt. Muligens bare ei øl.

Når det kommer til gjæringsprosessen så er resultatet ca. det samme i snitt, men undergjæret ser ut til å gi mer konsistente resultat.

Kanskje bør man velge belgisk undergjæret øl for å være sikker på at juleølla er rimelig god? Vet ikke helt om vi har grunnlag for å si det, men artige resultat er det likevel.

Alkoholprosenten kan ha mye å si

En ting som undertegnede ikke hadde forventet var at alkoholprosenten kan ha en god del å si. Følgende viser samme poengfordeling som før, men denne gangen farger vi intervallene med alkoholprosenten. Tallet i søylene forteller snitt prosenten.

Poengfordeling med alkoholprosenten farget.

Poengfordeling med alkoholprosenten farget.

Det ser ut til at øl med for høy eller lav alkoholprosent ikke blir tatt i mot like godt som dem med mer normale alkoholnivåer. For å sjekke dette nærmere gjorde vi en scatter-plot mellom poeng og alkoholprosent.

Scatter-plot av alkoholprosent mot poeng.

Scatter-plot av alkoholprosent mot poeng.

Visuelt ser vi også her en tendens til at for høy eller lav alkoholprosent er negativt. Litt over 8% er perfekt – kanskje. Trendlinjene er polynomisk (andre grad) med følgende egenskaper:

X-aksen Y-aksen R-squared p-verdi
Alkoholprosent Smak 0,353001 < 0.0001
Alkoholprosent Duft 0,26575 < 0.0001
Alkoholprosent Total 0,373889 < 0.0001
Alkoholprosent Helhet 0,366977 < 0.0001

Hva har vi lært?

Helt klart: Den beste juleølla er ikke dansk, har rundt 8% alkoholvolum, og er overgjæret. Allerede av fargen vil du kunne ha en anelse om du vil like den, og når duften er sjekket så er dommen så og si allerede gitt. Helge og Stian vet hva de holder på med, mens vi to andre bør studere videre. Tja, vell, kanskje så bombastisk bør vi ikke være på alle punkter, men analysen har vært artig å utføre og kan kanskje være verdt en ettertanke. Er det en ting som er sikkert så går du ikke feil med Nøgene Øs juleøl.

Igjen takk til vertene, og øvrige jurymedlemmer. Det var utrolig gøy! Håper vi alle har blitt klokere på julebrygget. Ser frem til juleøltesten 2015.