Resultatene – kort og godt
Tradisjonen tro er årets juleøltest gjennomført, og analyseresultatene er kommet inn. For de utålmodige kan vi annonsere med en gang at Nøgene Ø kom på topp i år også. Nøgene Øs God Jul og Underlig Jul troner på henholdsvis første og andre plass, med Kinn Julefred på en hårfin tredjeplass. Verst ut kom Tuborg Julebrygg, som med et “uhell” kom med i rangeringen. Den har visstnok fått “brygge” nederst i kjøleskapet siden juleøltesten 2012.
Vinnernes bryggerier skal selv få beskrive ølen sin:
Førsteplass: Nøgene Ø God Jul. A dark ale brewed specially for the Christmas season, with a rich, complex taste of caramel. This is a strong, dark and rather sweet Christmas Beer – just the way we think a Christmas beer should be.
Andreplass: Nøgene Ø Underlig Jul. The name of this beer is “Peculiar Christmas” in english. This spiced Christmas ale is strange – and indeed a fusion beer. We have gathered inspiration from the Norwegian drink “gløgg”, and as such this is quite an uncompromising brew.
Tredjeplass: Kinn Julefred. I meir enn 1000 år har nordmenn bryggja øl til jul. Juleølet var festdrikk og sterkare enn ølet ein drakk ellers i året. Vårt juleøl er bryggja i denne tradisjonen og er eit fyldig og kraftig øl med god maltsmak. Julefred er bryggja spesielt med tanke på den tradisjonelle salta og tørka julematen, men høver og godt som sjelevarmar for ein frosen skrott.
Ønsker å takke verten og vertinnen, Helge og Marit, for deres innsats i å arrangere juleølsmaking atter et år. Det er ikke julestemning før smaksløkene bikker over, og skriker etter andre sanseinntrykk enn bekmørkt og overkrydret juleøl. Spesielt ønsker vi i juryen å takke vertinnen for hennes gjestmildhet og innsats som bartender, eller kanskje forskerspire(?), da juryens forhold til henne er nærmere den mellom forsøkskaniner og mad scientist.
Dem som ønsker et nærmere innblikk i hvordan vi kom fram til resultatene og er nysgjerrige på hva annet dataen kan fortelle om juleøla, og kanskje litt om jurymedlemmene selv, inviteres til å fortsette å lese.
Analysen – et dypdykk i ølla
Sist år ble analysen gjort i Excel, og resultatet finner du her. I år går vi grundigere og mer systematisk til verks. Vi har fått tak i en lisens til analyseverktøyet Tableau, noe som gjør dataanalyse til en lek.
Årets jury består av Helge Svendsen, Stian Skår (Krystad), Nikolai Skogstad, og André Andersen. Helge fronter instagramkontoen 365wines om vinkunsten, noe som muligens har farget vår tilnærming til juleøltestingen. Spesielt gjelder det poengsystemet vi har brukt som er basert på Robert Parkers poengsystem for vin. Poengsystemet har følgende delresultat:
- Farge (med skum/head) gir opp til 5 poeng
- Lukt gir opp til 15 poeng
- Smak gir opp til 20 poeng
- Helhet gir opp til 10 poeng
Poengene fra delresultatene pluss 50 grunnpoeng legges sammen og gir en skala fra 50 til 100 poeng. Dette følger det underliggende karaktersystemet i Amerikanske akademia.
Standardisering av poengene
Vi har digitalisert poengene og kan derfor gjøre en god del artig analyse. Først anerkjenner vi at minst to av oss ikke vet hva vi driver på med når det gjelder øltesting, og at poenggivingen spriker en god del. Dette har vi tatt hånd om ved å standardisere resultatene slik at jurymedlemmene har samme snitt og standardavvik. Dette er en fancy måte å si at vi får poengene til å kunne bedre sammenliknes. Hvis noen (*host* Nikolai) gir veldig sprikende og lave resultater blir de automatisk gjort mer konsentrert og hevet litt for å likne mer fellesresultatet. Både rådataen og de standardiserte resultatene finner du her. Delpoengene og endelig poengsum har blitt standardisert hver for seg, noe som gjør at endelig totalsum ikke nødvendigvis går opp.
Fra første tabellen over ser vi at rådataen til Helge og Stian begge har rimelig like standardavvik og gjennomsnitt, i motsetning til Nikolai og mine egen standardavvik som er ganske brede. Vi to har også henholdsvis ganske lav og høy gjennomsnitt. Det er kanskje ikke så rart at vi to virker mer urutinert i stemmegivningen i forhold til Helge som har erfaring innen vinkunsten og Stian som brygger eget øl. Pytt, pytt, vi gyver løs på oppgaven med hodet hevet likevel, og kompenserer våre mangler med å tvinge stemmene våre til å ha samme standardavvik og gjennomsnitt som de med peiling. Dette påvirker ikke Helge og Stians resultater så mye, men Nikolais og mine egne resultat blir normalisert.
Etter standardiseringen har vi følgende poengfordeling på sluttresultatene:
I all hovedsak gis det ikke mange poeng mellom 95 og 100, og vi virker svært så glad i å gi rundt 85 poeng. Fordelingen ser ikke akkurat ut som antatt normalfordeling, men det får være grenser på hvor statistisk korrekt vi skal være i en uformell juleøltest.
Poengfordelingen på hver av deltestene oppfører seg litt mer som forventet:
Her ser vi kanskje en tendens til normalfordeling. Siden vi summerer normalfordelinger er det å forvente at endelig poengsum bør være normalfordelt også, men akk nei; dette gjelder kun uavhengige normalfordelte variable, og senere vil vi se at dette på ingen måte er tilfellet. Lukter en øl godt er det stor sannsynlighet for at den også smaker godt. Mer om det senere.
Kanskje mest for jurymedlemmenes del så er de standardiserte poengsummene vi ga som følger:
Beste fem øl innen farge, duft, smak og helhet.
Så hvem er vinnerene av deltestene? Her følger topp fem for hver deltest:
Har du tenkt å drikke øl med kun ganen så ser det ut til at Kinn Julefred går av som vinner, ellers troner Nøgene Øs øl på topp også på deltestene.
Korrelasjonene – fra farge og duft til smak
Oppdelingen i flere deltester gjør at vi kan se nærmere på hva som muligens påvirker smaken og helhetsinntrykket. Følgende viser korrelasjoner; farge og duft versus duft, smak og helhet.
Det ser ut til å være en positiv korrelasjon mellom delpoengsummene. Tableau rapporterer at samtlige trendlinjer har p-verdi på lavere enn 0.0001, men følgende R-squared.
X-aksen | Y-aksen | R-squared | p-verdi |
---|---|---|---|
Farge | Helhet | 0,216341 | < 0.0001 |
Farge | Smak | 0,220991 | < 0.0001 |
Farge | Duft | 0,236277 | < 0.0001 |
Duft | Helhet | 0,615605 | < 0.0001 |
Duft | Smak | 0,580103 | < 0.0001 |
Duft | Duft | 1 | < 0.0001 |
Poenggivningen ble gjort på en slik måte at vi ga delpoeng før vi gikk videre til neste deltest. Altså, fikk farge poeng før duft, og duft før smak og helhet. Dette kan gi støtte til at det er snakk om kausalitet og ikke bare korrelasjon i tallene. Det virker som at vi faktisk synes at øl som ser bra ut også lukter bra, og øl som lukter bra også smaker bra. Akkurat hvorfor skal jeg ikke begi meg innpå, annet enn at det kan være en slags anchoring effekt og/eller ønske om å være konsistent med tidligere poenggivning. Selvsagt, det kan jo også være at vi er superflinke til å tyde ølens kvaliteter fra utseende, men jeg tviler.
Svik og lureri
Hva skjer når eksperimentøren finner ut av å servere samme øl flere ganger? Og ikke minst samme øl rett etter hverandre? Tredjeplassen, Kinn Julefred, ble servert som nummer 4 og 10, samt Delirium Christmas som nummer 14 og 15, altså rett etter hverandre.
For Kinn Julefred var dens andre mottakelse svært så mørk; den gikk tilbake 10 poeng. Kun undertegnede valgte å ikke gi nevneverdig mindre poeng, mens største tilbakefallet fra et jurymedlem var på hele 20 poeng, eller 2.5 standardavvik lavere. Dette tilsvarer å gå fra å ha ei topp 1% øl til å ei som er nøyaktig midt på treet. For Delirium Christmas var tilbakefallet ikke så ille. De fleste jurymedlemmene sto på stedet hvil; tilbakefallet var på kun 3 poeng.
Betydningen av land og gjæringsprosess
I utgangspunktet forventet vi ikke mye forskjell mellom landene. Men la følgende illustrasjon synke inn.
Av en eller annen grunn kom dansk øl veldig dårlig ut. Mulig det er tilgjengelighet og seleksjonsbias. Sveriges resultat bør vi også ta med en klype salt, da de ikke har mange datapunkt. Muligens bare ei øl.
Når det kommer til gjæringsprosessen så er resultatet ca. det samme i snitt, men undergjæret ser ut til å gi mer konsistente resultat.
Kanskje bør man velge belgisk undergjæret øl for å være sikker på at juleølla er rimelig god? Vet ikke helt om vi har grunnlag for å si det, men artige resultat er det likevel.
Alkoholprosenten kan ha mye å si
En ting som undertegnede ikke hadde forventet var at alkoholprosenten kan ha en god del å si. Følgende viser samme poengfordeling som før, men denne gangen farger vi intervallene med alkoholprosenten. Tallet i søylene forteller snitt prosenten.
Det ser ut til at øl med for høy eller lav alkoholprosent ikke blir tatt i mot like godt som dem med mer normale alkoholnivåer. For å sjekke dette nærmere gjorde vi en scatter-plot mellom poeng og alkoholprosent.
Visuelt ser vi også her en tendens til at for høy eller lav alkoholprosent er negativt. Litt over 8% er perfekt – kanskje. Trendlinjene er polynomisk (andre grad) med følgende egenskaper:
X-aksen | Y-aksen | R-squared | p-verdi |
---|---|---|---|
Alkoholprosent | Smak | 0,353001 | < 0.0001 |
Alkoholprosent | Duft | 0,26575 | < 0.0001 |
Alkoholprosent | Total | 0,373889 | < 0.0001 |
Alkoholprosent | Helhet | 0,366977 | < 0.0001 |
Hva har vi lært?
Helt klart: Den beste juleølla er ikke dansk, har rundt 8% alkoholvolum, og er overgjæret. Allerede av fargen vil du kunne ha en anelse om du vil like den, og når duften er sjekket så er dommen så og si allerede gitt. Helge og Stian vet hva de holder på med, mens vi to andre bør studere videre. Tja, vell, kanskje så bombastisk bør vi ikke være på alle punkter, men analysen har vært artig å utføre og kan kanskje være verdt en ettertanke. Er det en ting som er sikkert så går du ikke feil med Nøgene Øs juleøl.
Igjen takk til vertene, og øvrige jurymedlemmer. Det var utrolig gøy! Håper vi alle har blitt klokere på julebrygget. Ser frem til juleøltesten 2015.