Voorspellen – deel 1: Een vergelijking van de N-BEATS en N-HiTS modellen voor energievoorspelling

Introductie

Voorspelmodellen hebben zich in het afgelopen decennium sterk ontwikkeld. Klassieke methoden zoals ARIMA, exponentiële smoothing en toestandsruimtemodellen blijven essentieel, maar nieuwe benaderingen vanuit machine learning en deep learning beginnen deze te evenaren – en vaak zelfs te overtreffen.

In deze blog wordt de voorspelkwaliteit van de N-BEATS- en N-HiTS-modellen beoordeeld. Hoewel beide modellen uit de wereld van deep learning komen, zien ze er heel anders uit dan de complexe neurale netwerken die vaak worden gebruikt voor beeldherkenning of natuurlijke taalverwerking. Die algemene modellen maken gebruik van ingewikkelde structuren zoals convoluties, recurrente lagen en attention-mechanismen om ruimtelijke of tekstuele structuren te verwerken.

N-BEATS en N-HiTS kiezen daarentegen voor een veel gerichtere en gestroomlijnde aanpak: het zijn deep learning-modellen die specifiek zijn ontworpen voor tijdreeksvoorspelling en niets anders. Hun architectuur is bewust vereenvoudigd en bestaat uit herhaalde, modulaire componenten in plaats van complexe pipelines. Hierdoor kan het model zich volledig richten op het leren van patronen in temporele data.

Deze specialisatie maakt ze makkelijker te begrijpen, eenvoudiger te trainen en vaak nauwkeuriger dan grotere, meer algemene deep learning-architecturen. Kortom: ze benutten de kracht van deep learning (flexibiliteit en automatische patroonherkenning) zonder de complexiteit die neurale netwerken vaak tot een “black box” maakt.

Naast de vergelijking tussen N-BEATS en N-HiTS wordt ook een relatief eenvoudig benchmarkmodel meegenomen: DLinear. De verschillende modellen worden hieronder beschreven.

N-BEATS

N-BEATS (Oreshkin et al., 2020) kan worden gezien als een reeks onderling verbonden componenten, waarbij elke component verantwoordelijk is voor het analyseren van een deel van de historische data en het stapsgewijs bijdragen aan de uiteindelijke voorspelling.

Elke component probeert eerst een specifiek aspect van het verleden te modelleren, zoals:

een trend
een seizoenspatroon
een langzame fluctuatie

Vervolgens voegt deze component zijn bijdrage toe aan de voorspelling van toekomstige waarden. De uiteindelijke voorspelling ontstaat door alle bijdragen te combineren.

Het model heeft geen expliciete input nodig over trends of seizoenspatronen; het leert deze automatisch uit de data. N-BEATS laat zien dat sterke voorspelprestaties mogelijk zijn met een transparant en modulair ontwerp, zonder complexe neurale netwerkstructuren. Het model is weergegeven in onderstaande figuur.

N-HiTS

N-HiTS (Challu et al., 2022) bouwt voort op dezelfde modulaire filosofie als N-BEATS, maar is aangepast voor situaties met:

veel hoogfrequente variatie
lange terugkijkvensters

In plaats van één detailniveau te gebruiken, splitst het model de voorspeltaak op in meerdere tijdsschalen. Hierdoor kunnen verschillende componenten zich richten op verschillende aspecten van het signaal:

sommige op langzame trends
andere op snelle fluctuaties

Deze componenten werken via een hiërarchisch interpolatiemechanisme dat de uiteindelijke voorspelling opbouwt uit grove, middelmatige en fijne patronen.

Net als bij N-BEATS levert elke component een deelvoorspelling, en ontstaat het eindresultaat door deze te combineren. N-HiTS presteert daardoor goed bij complexe of ruisrijke data, doordat het automatisch multi-scale patronen leert. Het model is weergegeven in onderstaande figuur.

DLinear

DLinear (Zeng et al., 2022) hanteert een minimalistische aanpak. Het model richt zich op de kerncomponenten van een tijdreeks:

Trendcomponent
Seizoenscomponent

Deze worden afzonderlijk vooruit geprojecteerd met een eenvoudige lineaire transformatie. In tegenstelling tot complexere neurale netwerken gebruikt DLinear:

geen niet-lineariteiten
geen diepe lagen

Het model laat zien dat goede prestaties vaak voortkomen uit een goede afstemming tussen modelstructuur en data, in plaats van complexiteit.

Data

Voor de evaluatie is een dataset gebruikt van Open Power System Data:
https://data.open-power-system-data.org/time_series

De dataset bevat ongeveer 50.000 uurlijkse observaties van elektriciteitsverbruik in Nederland tussen januari 2015 en oktober 2020. De data is weergegeven in onderstaande figuur.

De jaarlijkse seizoensgebondenheid is duidelijk zichtbaar in de figuur. Daarnaast wordt er dagelijkse seizoensgebondenheid en wekelijkse seizoensgebondenheid (weekenden) verwacht. Dit is verder geanalyseerd met behulp van MSTL (Multiple Seasonal-Trend decomposition using LOESS). Dit is een methode om een tijdreeks te ontleden in een trend, een restant en meerdere seizoenscomponenten met behulp van iteratieve LOESS-afvlakking. De resultaten worden weergegeven in de onderstaande figuur.

Kwantitatieve beoordeling

De voorspellende nauwkeurigheid van de drie modellen is geëvalueerd met behulp van rolling-origin cross-validation. Voor elke voorspellingshorizon werd de tijdreeks opgesplitst in vijf opeenvolgende evaluatievensters, elk met een lengte gelijk aan de voorspellingshorizon. Voor elk venster werd het model opnieuw getraind op alle data die beschikbaar was tot aan de oorsprong van het venster, en werden er voorspellingen gegenereerd voor de bijbehorende horizon. De Root Mean Squared Error (RMSE) werd berekend voor elk venster, en de gemiddelde RMSE over de vijf vensters werd gebruikt als de cross-validatiescore.

De resultaten worden in de onderstaande tabel weergegeven voor horizonten van 24 uur, 168 uur (een week) en 720 uur (een maand). Merk op dat voor alle drie de modellen kalendercovariaten (maand en dag-van-het-jaar) zijn opgenomen. Hoewel N-BEATS en N-HiTS in staat zijn om jaarlijkse seizoensgebondenheid direct uit de ruwe tijdreeksen te ontdekken, is het aanleveren van expliciete kalenderkenmerken computationeel efficiënter. Deze covariaten stellen de modellen in staat om lange seizoenspatronen vast te leggen zonder het invoervenster uit te breiden tot een heel jaar, waardoor zowel de computationele last als het geheugengebruik tijdens de training worden verlaagd.

De tabel laat zien dat N-BEATS het beste presteert voor de horizon van 24 uur en 168 uur. Het model gaat goed om met niet-lineaire effecten en meervoudige harmonischen op dagelijkse en wekelijkse basis. Voor de maandelijkse horizon presteert het N-HiTS model beter. Dit ligt in de lijn der verwachting, aangezien het mechanismen (pooling, afvlakking) bevat die ruis verminderen en zich richten op lang-periodieke componenten, ten koste van de hoogfrequente dynamiek.

Het benchmarkmodel DLinear presteert over het algemeen het minst van de drie modellen. Het is echter interessant om op te merken dat de RMSE afneemt voor langere horizonten. Dit impliceert dat DLinear alleen de zeer brede trend en seizoensgebondenheid vastlegt en lokale kortetermijnfluctuaties niet weet te vangen.

Conclusie

In deze blog wordt de voorspellingskwaliteit van twee deep learning modellen, N-BEATS en N-HiTS, vergeleken met een relatief eenvoudig benchmarkmodel voor een tijdreeks van uurlijks energieverbruik in Nederland. N-BEATS presteert het beste voor dagelijkse en wekelijkse horizonten, terwijl N-HiTS het beste presteert voor een maandelijkse horizon. Dit is in lijn met de verwachtingen gezien de structuur van deze modellen. In het tweede deel van de drie blogs zullen deze modellen worden vergeleken met een traditioneel econometrisch model, Dynamic Harmonic Regression.

Referenties

Challu et al. (2022). N-HiTS: Neural Hierarchical Interpolation for Time Series Forecasting.

Oreshkin et al. (2020). N-BEATS: neural basis expansion analysis for interpretable time series forecasting.

Zeng et al. (2022). Are Transformers Effective for Time Series Forecasting?