Restwaarde voorspellen

Door: Jan de Leeuw
Dit is het tweede artikel in een serie over voorspellende modellen. Meer algemene informatie over voorspellende modellen vind je in het artikel Voorspellende modellen.

Tegenwoordig kun je van alles leasen: zonnepanelen, een wasmachine of zelfs een matras of een scheerapparaat. Maar het meest bekende voorbeeld van leasen is toch wel de auto. Een leasemaatschappij “huurt” auto’s uit aan klanten en zorgt ervoor dat de auto’s worden onderhouden en gerepareerd. Dit alles tegen een vooraf vastgestelde prijs. Aan het einde van de leasetermijn wordt de auto meestal verkocht aan een dealer. Deze verkoopt de auto op de consumentenmarkt aan een gebruiker. De kostprijs van een leaseauto bestaat uit meerdere componenten: de afschrijving van een auto en kosten van reparatie/onderhoud, banden en verzekeringen. Het grootste deel van de kostprijs is de afschrijving. Om de afschrijving te bepalen, wordt naar de restwaarde van de auto gekeken. Bij het bepalen van de restwaarde krijg je vragen als ‘Hoeveel is een auto na 3 jaar met 90.000 kilometer op de teller nog waard?’ In dit artikel kijken we naar een methode om de restwaarde van een auto te voorspellen.

Businesswaarde

Het nauwkeurig voorspellen van de restwaarde kan van enorme waarde zijn voor ‘de business’. Het verdienmodel van een leasemaatschappij is vrij eenvoudig: er wordt een auto aan de klant beschikbaar gesteld tegen een vooraf bepaald bedrag, wat de totale opbrengsten zijn. De totale kosten bestaan uit afschrijving auto, reparatie, onderhoud, banden (ROB) en verzekeringen. De winst op het leasecontract is het verschil tussen de opbrengsten en de kosten. Het verkeerd inschatten van de restwaarde (de basis voor de afschrijving) kan leiden tot grote verliezen.

Een BMW 1 serie wordt ingezet voor 3 jaar met een totaal aantal kilometers van 120.000. Deze BMW kost € 30.000,- inclusief alle belastingen. De ROB kosten zijn geschat op € 2.000,- over de gehele looptijd. Naar verwachting kan de auto over 3 jaar worden verkocht tegen een restwaarde van € 10.300,-. Voor dit contract wordt € 625,- per maand betaald door de leaserijder (kostprijs € 603,- + marge € 22,-).

Totale kosten                       = (fiscale waarde auto – restwaarde auto) + ROB kosten

= (€ 30.000,-  – € 10.300,-) +€ 2.000,-   =   € 21.700,-

Totale opbrengsten            = leasetermijn * termijn bedrag

= 36 maanden * € 625,-   =    € 22.500,-

Winst                                   = totale opbrengsten – totale kosten

= € 22.500,- – € 21.700,-   =   € 800,-

Wanneer alles gaat zoals verwacht is de winst op dit contract € 800,-. Echter, de restwaarde is slechts een schatting aan het begin van het contract en de uiteindelijke opbrengst is onzeker. Indien de leasemaatschappij de auto aan het einde van het contract voor een hoger bedrag kan verkopen (oftewel de ‘echte’ restwaarde is hoger dan vooraf ingeschat), leidt dit tot een hogere winst. Bij een ‘echte’ restwaarde van bijvoorbeeld € 11.000,- in plaats van € 10.300,-, wordt de verwachte winst verdubbeld (€ 1.500,- in plaats van € 800,-). In tegenstelling tot een lagere ‘echte’ restwaarde (bijvoorbeeld € 9.000,- in plaats van € 10.300,-), wat tot verliezen kan leiden (€ 500,- verlies in plaats van € 800,- winst).

Restwaarde nauwkeurig bepalen is essentieel om een accurate kostprijs van een leasecontract te genereren. Accuraat restwaarde voorspellen vermijdt het inzetten van auto’s die een verlies opleveren. Daarnaast leidt het voorkomen van grote verliezen tot een lager financieel risico.

Wanneer restwaardes te hoog worden geschat, zal de kostprijs voor de betreffende auto’s te hoog zijn. Wanneer de prijs lager wordt ingeschat, kan het contract ineens goedkoper zijn dan bij de concurrent. Nauwkeurig inschatten van restwaardes heeft dus de potentie meer klanten op te leveren en marktaandeel te vergroten.

Data

Een leasebedrijf heeft data van de auto’s die ze verkocht hebben, aangevuld met open data sets van bijvoorbeeld het CBS of verzamelde data van autofabrikanten. In deze data staat, naast de restwaarde, een hoop andere informatie over de auto en het gebruik. De eerste stap die gedaan wordt, is controleren of de data in de dataset consistent en compleet is. Daarna wordt de dataset aangevuld en verbeterd om vervolgens gebruikt te worden voor het maken van model.

Model

Restwaarde kan met de beschikbare data op allerlei manieren worden gemodelleerd. Auto’s hebben verschillende attributen waar de restwaarde mee samenhangt. Er zijn verschillende methoden die op deze data een goed model kunnen maken, denk aan een regressiemodel of een random forest. Omdat een regressiemodel makkelijker te interpreteren is dan een random forest, is er gekozen voor een regressie model. Meer over het regressiemodel lees je in The power of machine learning.

Multiple Lineaire regressie

We zijn op zoek naar de causale verbanden in de dataset. De juiste variabele kiezen om de variantie in restwaarde te verklaren, is een belangrijk onderdeel van het regressiemodel. Een model kent geen definities en heeft geen verstand van auto’s. De logica in het model moet dus altijd worden nagelopen, idealiter in overleg met experts uit de business.

Als voorbeeld nemen we een handgeschakelde benzineauto van 3 jaar oud met 120.000 kilometer op de teller en een fiscale waarde van € 30.000,-. Het regressiemodel wordt geschat op een dataset met variabelen zoals hierboven onder het kopje ‘Data’ beschreven. Daar zou bijvoorbeeld onderstaand model uit kunnen komen met de bijbehorende variabelen en coëfficiënten.

Restwaarde        = β0 + β1*kms + β2*leeftijd + β3*benzine_dum + β4* automaat_dum
= 18.000 + (-0,05) * 120.000+ (-75)*36 + 1.000*1 + 400 * 0
                          = 10.300 (ongeveer 34,3% van de fiscale waarde)

Deze auto wordt over 3 jaar volgens het model dus verkocht met nog een waarde van € 10.300,-. Als over 3 jaar blijkt dat de auto 130.000 kilometer heeft gereden, dan is de auto volgens het model € 500,- minder waard (10.000*-0,05). Dit is de verwachte waarde over 3 jaar. Hoeveel de auto daadwerkelijk gaat opbrengen, zal moeten blijken.

Verder is het niet logisch dat een auto meer waard wordt met de tijd, dus we verwachten een negatief coëfficiënt voor leeftijd. Of een automaat een positief of negatief coëfficiënt heeft, is moeilijker te beredeneren; een klankbord met experts kan daarbij assisteren.

Een regressiemodel vindt alleen verbanden en trends die al in de dataset zitten. Tot voor kort bestonden elektrische auto’s nog nauwelijks. Een regressiemodel maken voor elektrische voortuigen is dan ook vrij lastig. In het regressiemodel wordt de assumptie van gelijkblijvende markt gebruikt. Echter, aangezien de markt continu in beweging is, moeten we hiervoor corrigeren. De uiteindelijke restwaarde die wordt gecommuniceerd naar de business, is de waarde die naar verwachting het meest accuraat is.

Stel het idee is nu dat over 3 jaar de eindgebruiker veel minder graag diesel wil rijden. In ons voorbeeld zijn benzineauto’s op dit moment € 1.000,- meer waard. Als de trend gebroken wordt en diesels nog minder waard worden, is het extra effect op diesel niet te schatten met historische data. Als door bijvoorbeeld maatregelen van de overheid diesels minder populair worden, kan dit de waarde doen verminderen. Deze maatregelen hebben we nog niet eerder gezien en kunnen we niet schatten met behulp van historische data. Het effect kan wel met andere methodes worden geschat en de restwaarde kan daarvoor worden gecorrigeerd. De gecorrigeerde restwaarde wordt gecommuniceerd naar de business en gebruikt in berekeningen voor (potentiële) klanten.

Valkuilen

Verouderde of foutieve data gebruiken

In veel datasets kruipen fouten. De fiscale waarde van een auto bestaat uit de catalogusprijs, BTW en BPM. Verschillen in definities tussen afdelingen en verschillende landen kan leiden tot verwarring over prijzen, denk bijvoorbeeld aan in- of exclusief BTW. Data kan ook verouderen, waar Cross-over-SUV’s zoals de Nissan Qashqai vroeger niet populair waren, is de populariteit afgelopen jaren sterk toegenomen. Door extreme verandering in sentiment is de vraag nu of de historische data nog een representatief beeld geeft.

Aannames niet blijven toetsen

In het model voor de restwaarde wordt een aanname gedaan over een gelijkblijvende markt. Het is echter best mogelijk dat er over 3 jaar heel anders over dieselauto’s wordt gedacht. Misschien is de prijs van benzine significant verhoogd ten opzichte van diesel, waardoor de eindgebruiker juist minder graag een benzineauto wil. Of de overheid gaat extra belastingen op diesels heffen of subsidies geven voor elektrische auto’s. Alle aannames die gemaakt worden in het model, moeten periodiek getoetst worden. Dit is een continu proces.

Niet maken van business case

Meten hoeveel de huidige methode van restwaardebepaling afwijkt van de werkelijkheid is een goede eerste stap om te zetten. Door vervolgens een inschatting van de nauwkeurigheid van het voorspellende model te maken kan worden bepaald hoeveel effect datamodellen hebben op restwaardebepaling. Na het uiteenzetten van voor- en nadelen, accuraatheid en kosten kan worden bepaald of het ontwikkelen van een voorspellend model nut heeft.

Over-fitting

Wanneer alle restwaardes in de dataset goed zijn geschat, betekent dit niet dat het model ook goed is. Er is gevaar van over-fitting, wat betekent dat het model te specifiek voor de dataset getraind kan zijn. Als er een nieuwe auto wordt verkocht, welke nog niet in de dataset bekend is, kan het zomaar zo zijn dat de restwaarde van deze auto niet correct kan worden voorspeld.

Implementatie

Uit het voorspellende model komt voor elk auto die je mogelijk gaat inzetten een restwaarde rollen. Toevoegen van aannamen en rekenregels rondom brandstofprijzen, consumentengedrag, wetgeving en subsidies naar de toekomst leiden samen tot een zo accuraat mogelijke schatting van de uiteindelijke restwaarde. Deze waarde gebruik je voor alle auto’s die worden ingezet als leaseauto.

Stel de overheid verbiedt plots alle dieselauto’s in alle grote binnensteden. Dan zijn alle dieselauto’s opeens veel minder waard voor de eindgebruiker. Met het voorspellende model kan het effect op de restwaarde van elke dieselauto van de leasemaatschappij worden doorgerekend. Zo kan op tijd worden geacteerd op nieuwe inzichten.

Zodra assumpties veranderen of onwaar blijken kan, gegeven de gecorrigeerde assumpties, doorgerekend worden wat de nieuwe restwaarde is. Hiermee wordt direct inzichtelijk wat deze correcties betekenen voor de restwaarde van alle auto’s die rondrijden. Zo kan er tijdig worden ingespeeld op slechtere (of juist betere) resultaten.

Het nieuwe model van de BMW 5 serie komt een half jaar eerder uit dan 3 jaar geleden werd gedacht. Wellicht is het lucratief om de oude BMW 5 series eerder te vervangen bij de berijders. Zo kunnen deze nog voor een hogere restwaarde verkocht worden, aangezien niemand meer in de oude BMW 5 serie wilt rijden als de nieuwe versie op de markt is gekomen.

Alle voorbeelden in dit artikel zijn een versimpelde weergave van de werkelijkheid.
2019-03-25T13:41:14+01:0025 maart 2019|Tags: , , , |