Maskinlæringsmodell bidrar til å finne dem som ikke rapporterer utleie

  • Publisert:

Skatteetaten utviklet en maskinlæringsmodell for inntektsåret 2020 som skal finne dem som ikke rapporterer inn utleie av sekundærbolig. Modellen blir både brukt til å velge ut kandidater til kontroll, og til å velge ut målgrupper som får tilsendt informasjonsbrev. Modellen og tiltakene har ført til en økning i alminnelig inntekt på i overkant av 110 millioner kroner siden modellen ble tatt i bruk.

Viktig informasjon

Forfatter:
Morten Hordnes

Det er over 200 000 sekundærboliger i Norge. Hovedregelen er at hvis du leier ut en bolig du ikke selv bor i, en sekundærbolig, er det skattepliktig som kapitalinntekt med en skattesats på 22 prosent. Ikke alle som eier sekundærbolig driver med utleie, men for inntektsåret 2020 selvrapporterte nesten 70 000 skattytere utleie i skattemeldingen. Selv om de fleste rapporterer, estimerer Skatteetaten at det er rundt 15 000 leieforhold som ikke innrapporteres. Disse jobber vi for å avdekke ved mer målrettet kontroll, for eksempel basert på maskinlæringsmodellen som er beskrevet i denne artikkelen.  

For å gi et grovt overblikk over inntekter som ikke innrapporteres, kan vi se på Eiendom Norges kvartalsrapport for utleiepriser i storbyene i Norge for 1. kvartal 2023. I rapporten kan vi se at utleieprisene i snitt ligger på rundt 14 000 kroner i måneden for en leilighet i storbyene i Norge. Velferdsstaten taper dermed opp mot 250 millioner kroner i skatteinntekter fra markedet for langtidsutleie, enten fordi utleierne ikke vet at de skal rapportere inntektene, eller fordi de gjør et bevisst valg om å ikke rapportere.

Dette viser hvor viktig det er at Skatteetaten har tatt i bruk flere virkemidler, som maskinlæring, både i veiledning og kontroll. Det kan gi mer treffsikker veiledning til brukerne våre om hva de er pliktig å rapportere, slik at de enklere kan gjøre det rett. I kontrollarbeidet vårt hjelper maskinlæringen til med å sikre en god etterlevelse av regelverket.

Modellen beregner sannsynligheten for utleie

En maskinlæringsmodell som beregner sannsynligheten for utleie, er dermed et av tiltakene i Skatteetatens arbeid for å få flere til å rapportere inn utleie. Ved å utnytte historisk informasjon vi har om boligeiere og boligene i seg selv, kan vi forsøke å bedømme om det drives utleie av en bolig eller ikke.

Hva er maskinlæring?
«Maskinlæring er en spesialisering innen kunstig intelligens hvor man bruker statistiske metoder for å la datamaskiner finne mønstre i store datamengder. Vi sier at maskinen «lærer» i stedet for å bli programmert.» (maskinlæring – Store norske leksikon (snl.no))

Modellen ble utviklet for inntektsåret 2020, og er av typen XGBoost (xgboost.ai), som egner seg bra til å finne mønster i store mengder data. Den er spesielt god til å klassifisere, altså i dette tilfellet å gi en verdi på om det drives utleie eller ikke. Denne verdien kan vi videre bruke til å rangere og dele sekundærboligeiere inn i risikogrupper. Modellen vi utviklet, rangerer alle sekundærboligeiere med en sannsynlighet for utleie, fra 0 prosent til 100 prosent.

Modellen førte til at vi avdekket langt flere som ikke rapporterte utleie

Modellen ble for inntektsåret 2020 brukt til å støtte opp under utvalget av kandidater til kontroll, slik at de med høy sannsynlighet for å ikke rapportere utleie kom med på listen.

De med størst sannsynlighet for å ikke rapportere, får høyest score og blir rangert øverst på kontrollisten. Saksbehandlerne kan dermed jobbe seg nedover listen, fra dem som har høyere score til dem som har lavere score.

Vi så at den nye kontrollisten vi fikk fra modellen økte avdekningsgraden ved kontroll. Som vist i figur 1, var avdekningsgraden tidligere på litt over 12 prosent, mens den økte til 57 prosent etter at vi tok i bruk modellen. Da vi i tillegg benyttet forhåndsbestemte regler og modellen i kombinasjon, så økte avdekkingsgraden til over 85 prosent.

Resultatene av kontrollene førte til en økning i alminnelig inntekt på 67 millioner kroner for inntektsåret 2020. Når saksbehandlere utførte en kontroll, kontrollerte de også personens tidligere skattemeldinger. I over halvparten av disse kontrollene fant kontrollørene feil på minst en tidligere skattemelding, og avdekket dermed leieinntekt fra tidligere inntektsår. Dette kommer i tillegg til de 67 millioner kronene som ble avdekket for inntektsåret 2020.  

Informasjonsbrev og merknader i skattemeldingen viser seg å være et effektivt virkemiddel

I skattemeldingen bruker vi merknader til å spørre sekundærboligeiere om de leier ut (se Dulting i skattemeldingen hjelper folk til å rapportere riktig – Skatteetaten). Et annet virkemiddel Skatteetaten benytter seg av er å sende ut informasjonsbrev til aktuelle målgrupper. Maskinlæringsmodellen ble i august 2022 brukt til å avgjøre hvem som hadde høy sannsynlighet for å ha leid ut i inntektsåret 2021. Disse skulle motta et informasjonsbrev om utleie av sekundærboliger og hvordan de kunne sende inn skattemeldingen på nytt. Til sammen sendte vi ut 1 500 digitale informasjonsbrev via Min side på skatteetaten.no.

Resultatet var at 20 prosent av brukerne endret skattemeldingen sin etter at de hadde mottatt brevet. Dette samsvarer med responsen på tidligere brevutsendelser om utleie.

Responsen på informasjonsbrevet tilsvarte en økning i alminnelig inntekt på rundt 45 millioner kroner for inntektsåret 2021, før kontrollarbeidet startet. Siden de det gjelder ikke hadde rapportert utleie før brevet ble sendt ut, men endret skattemeldingen sin etter at de fikk brevet, kan vi være sikre på at det var brevet som bidro til denne økningen.

Maskinlæring og informasjonsbrev er gode virkemidler for å øke etterlevelsen

Ved hjelp av maskinlæringsmodellen har vi økt avdekningsgraden for kontroller på utleieområdet betydelig, og innrapportert alminnelig inntekt har økt med i overkant av 110 millioner kroner. Merknader i skattemeldingen og brev utsendt i ettertid har også vist seg å ha god effekt, og etterlevelsen har økt. Dette viser at med mer data og flere analyseverktøy, kan Skatteetaten klare å finne flere skattepliktige som bevisst eller ubevisst har rapportert feil. Denne måten å jobbe på er en viktig del av Skatteetatens strategi. Etaten er fortsatt i startgropen av dette arbeidet, og potensialet for utvikling og bruk av maskinlæring er stort.

[1] Skatteetaten. Skatt når du leier ut bolig og eiendom [Internett]. Oslo: Skatteetaten; 2023. Tilgjengelig fra: Skatt når du leier ut bolig og eiendom - Skatteetaten

[2] Eiendom Norge. Utleieboligrapporter [Internett]. Oslo: Eiendom Norge; 2023. Tilgjengelig fra: Utleieboligrapporter - Eiendom Norge

[3] Tidemann A. «Kunstig intelligens» [Internett]. Oslo: Store norske leksikon; 2023 [oppdatert 16. mai 2023]. Tilgjengelig fra: kunstig intelligens – Store norske leksikon (snl.no)

[4] Dvergsdal H og Elster AC. Stordata [Internett]. Oslo: Store norske leksikon; 2023 [oppdatert 15. september 2022]. Tilgjengelig fra: stordata – Store norske leksikon (snl.no)

[5] Rossen E. Programmering – IT [Internett]. Oslo: Store norske leksikon; 2023 [oppdatert 5. september 2022]. Tilgjengelig fra: programmering – IT – Store norske leksikon (snl.no)  

[6] Tidemann, A og Elster, AC. Maskinlæring [Internett]. Oslo: Store norske leksikon; 2023 [oppdatert 18. januar 2022]. Tilgjengelig fra: maskinlæring – Store norske leksikon (snl.no)

maskinlæring – Store norske leksikon (snl.no)

[7] XGBoost. About [Internett]. XGBoost; 2023. Tilgjengelig fra: About (xgboost.ai)

[8] Breivik, AL Habbestad A og Nilsskog, M. Dulting i skattemeldingen hjelper folk til å rapportere riktig. Oslo: Skatteetaten; 16. 12. 2021. Tilgjengelig fra https://www.skatteetaten.no/om-skatteetaten/analyse-og-rapporter/analysenytt/dulting-i-skattemeldingen-hjelper-folk-til-a-rapportere-riktig/#referanser 

[9] Min side [Internett]. Oslo: Skatteetaten; dato [oppdatert dag, måned årstall]. Tilgjengelig fra: Min side - Skatteetaten

[10] Melsom, AM, Pladsen TA og Thorsager M. Informasjonsbrev får flere til å gi opplysninger om utleie (side 26-30). Oslo: Skatteetaten; oktober 2014. Tilgjengelig fra: analysenytt2014-2.pdf (skatteetaten.no)