Aarhus Universitets segl

Nr. 522: Videreudvikling af model for metaller i vandløbsvand, MetalStat

Sørensen, P.B., Damgaard, C.F, Bjerg, P.L., Andersen, H.E., Holm, P.E., Bak, J.L., Rasmussen, D., Kjeldgaard, A., 2023. Aarhus Universitet, DCE – Nationalt Center for Miljø og Energi, 107 s. - Videnskabelig rapport nr. 522
http://dce2.au.dk/pub/SR522.pdf

Sammenfatning

Denne rapport indgår i et større arbejde under Miljøstyrelsen med udvikling af modeller til estimering af koncentrationer af miljøfarlige forurenende stoffer i overfladevand. Udgangspunktet i denne rapport er en pilot version af en statistisk model (MetalStat) for landsdækkende forekomst af metaller i vandløbsvand. Rapporten tager således udgangspunkt i afrapportering af MetalStats principper givet i Sørensen et al., 2022. Modellen er sat op, så metalkoncentrationen i vandløbet regnes for at være bestemt af det ID15 opland, som målestationen er placeret i, hvor et ID15 opland har en varierende udstrækning på typisk 10-15 km2. Opgaven for 2022 er at få pilotudgaven af MetalStat valideret og modnet, så den kan indgå i Miljøstyrelsens forvaltning. Af regnetekniske grunde var det kun muligt i 2021 at afslutte beregninger for de tre metaller bly, cadmium og nikkel, selvom der også er omfattende data på kobber og zink, Sørensen et al., 2022. Dette skyldtes, at der er blevet justeret på modellens struktur helt hen til udgangen af 2021, og der stilles større krav til beregningstid med fem metaller end med tre. I denne rapport er MetalStat derfor udvidet med kobber og zink, så den behandler fem metaller i en multivariat statistik model, der udnytter korrelationen med metallerne i bestræbelsen på at levere en optimal anvendelse af moniteringsdata.

For de oplande, hvor metalkoncentrationen er blevet målt, anvendes de estimerede latente variable, som modellerer middelværdien af koncentrationen på en logskala. Denne middelværdi på log skala kan omregnes til mediankoncentrationen, hvilket betyder at hovedresultatet fra MetalStat er prædiktioner af mediankoncentrationer. For de oplande, der ikke har målinger laver MetalStat prædiktioner af mediankoncentrationen, med tilhørende usikkerhedsinterval, og er således en model, der dækker hele landet.

De estimerede latente variabler er tilpasset til en multinormal målemodel og renset for effekten af år, men effekten af år kan medregnes hvis ønsket. Prædiktionerne bliver beregnet som sandsynlighedsfordelinger, og disse kan summeres for de enkelte oplande ved f.eks. fordelingens median eller andre fraktiler over et år. Usikkerheden af prædiktionen kan f.eks. gives ved et 95% usikkerheds interval (der er 95 % sandsynlighed, for at den rigtige værdi ligger inden for intervallet). Det er også muligt at angive den prædikterede sandsynlighed for, at der i oplandet er koncentrationer over miljøkvalitetskrav. Størrelsen af modellens usikkerhedsintervaller afhænger af hvor omfattende et datagrundlag, der indgår i modellen. Det er således forventeligt at MetalStat vil få betydeligt mindre usikkerhed når alle data fra perioden 2020-2022, der nu ikke er med i modellen, bliver brugt i modellen. Det vil betyde at de prædikterede øvre 95 % usikkerhedsintervaller vil blive reduceret. Det har dog ikke været muligt indenfor tidsrammen for denne rapport at få opdateret MetalStat med alle målinger fra perioden 2011-2022.

MetalStat kan dokumentere betydningen af forskellige kilder i forhold til den samlede andel af metalkoncentrationer i vandløb, som kan forklares med oplandets attributter.  MetalStat vil også kunne understøtte en identifikation af med hvilken andel naturgivne kilder bidrager til metalkoncentrationen.

Hvis et ID15 opland, der ikke omfatter nogle målestationer og derfor fremstår som umålt, udveksler vand med et andet opland, i hvilken der er målinger, vil disse målinger i det målte opland kunne bidrage med viden om koncentrationsniveauet i det umålte opland, da noget af vandet i det målte opland også optræder i det umålte opland.  For at tage fuldt hensyn til denne rummelige sammenhæng, er der udviklet en massebalancekorrektion for at forbedre modellens prædiktioner, så målinger i målte ID15 oplande kan bidrage med viden i andre oplande uden målinger, i det omfang udveksling af vand berettiger til det.

I MetalStat indgår en X matrice, der samler oplysning fra GIS om hvert opland, (se Sørensen et al., 2022). Som det også er beskrevet i Sørensen et al., 2022, så vil det derfor være muligt løbende at evaluere og forbedre X matricen, i takt med at flere målinger og nye datakilder bliver tilgængelige.  En regressionskoefficient R2 på logtransformerede koncentrationer er beregnet ud fra, hvor godt X matricen sammen med sæsonvariationen kan prædiktere den latente koncentration i de målte oplande. For fire ud af fem metaller var intervallet 0,19-0,3, mens Nikkel faldt ud med en lav værdi på 0,06. Så der er klart plads til forbedring af især X matricen. Det er projektgruppens vurdering, at det første skridt mod en forbedring er at inddrage grundvandsbidraget mere detaljeret. En lille værdi for R2 betyder, at MetalStat beskriver det meste af variationen i koncentrationsværdierne, dels som tilfældige effekter mellem oplande og år og dels som residualer, der varierer tilfældigt fra den ene måling til den næste. 

Nye målinger fra perioden 2020-2022 er anvendt til at evaluere MetalStat for de fem metaller.  Der har været et ret intensivt måleprogram i denne periode, hvor der er indsamlet ca. dobbelt så mange prøver i perioden 2020-2022 som for hele perioden 2011-2019, fra ca. 400 oplande. En deskriptiv statistisk analyse af de målinger fra perioden 2020-2022, der var målt over detektionsgrænsen, indikerer generelt et lavere koncentrationsniveau sammenlignet med målingerne for perioden 2011-2019, især for zink.  MetalStat bliver dog ikke udfordret af sådanne årlige forskydninger i koncentrationsniveau i det omfang disse ikke er større end den forskel mellem år, der optræder i perioden 2011-2019. Den efterfølgende analyse af de enkelte metaller viser at den årlige forskydning udfordrer MetalStat for zink, men ikke for de andre fire metaller.

MetalStat er brugt til at beregne realistiske intervaller for mediankoncentrationen for de nye målte oplande, så de kan sammenlignes med de nye målinger fra perioden 2020-2022. Disse intervaller afspejler niveau og usikkerhed for mediankoncentrationen i det pågældende oplande og kun i relativt få tilfælde, udfordres de beregnede intervaller af de nye målinger. En nærmere granskning af de enkelte større afvigelser for især bly viser, at oplandsstørrelsen på 10-15 km2 i nogle få tilfælde godt kan dække over en heterogenitet, som ikke synes helt at være repræsentativt dækket ind af de valgte placeringer af NOVANA stationer.  For zink giver MetalStat generelt en overprædiktion af usikkerhedsintervallet, som konsekvens af det voldsomme fald, der generelt har været i koncentrationsniveauet mellem periode 2011-2019 og periode 2020-2022. Når MetalStat opdateres med målingerne fra perioden 2020-2022, vil det derfor være en fordel at estimere variablerne for zink fra år 2020 som en ny latent variabel, så der er to versioner af latente variabler for zink i modellen, et før 2020 og et andet fra 2020.

Der er blevet inkorporeret nogle regnetekniske forbedringer i den nærværende version af MetalStat i forhold til afrapporteringen i Sørensen et al., 2022. Det er især brug af en oplandslokal likelihood funktion for de latente koncentrationer, der har mindsket beregningstiden. Det betyder, at MetalStat i en beregningsgang, der tester værdien for en latent koncentration, nu kun skal regne specifikt på det ID15 opland, som denne latente koncentration estimeres i, uden at genberegne alle de andre oplande. I bestræbelserne på at optimere X matricen afprøves såkaldte ”horseshoe priors”, der finder vigtigste betydende faktorer med mindre beregningstid, men denne afprøvning er ikke tilendebragt med udgivelsen af denne rapport.

Under udarbejdelse af denne rapport blev det klart, at en driftsversion af MetalStat ikke blev færdiggjort til forvaltningen i 2022, men at denne aktivitet vil blive søgt udført i 2023. Der er dog foretaget en planlægning af kodning af driftsversionen for at fremskynder arbejdet. Under denne planlægning udarbejdedes en klar plan for at parallelisere MetalStat til at accelerere beregningshastigheden over flere CPU-kerner. Så der foregår løbende en udvikling, der minimerer beregningstiden, dels ved at regne smartere og derfor mindske behovet for beregninger, dels ved at øge den computerkraft som kan udnyttes til at regne hurtigere. 

Den væsentligste forestående forbedring af X matricen vurderes at være en bedre beskrivelse af grundvandsbidraget, for bedre at beskrive det geogene bidrag, der ikke skyldes menneskelig aktivitet.  En sådan forbedring bør laves som led i udvikling af en driftsversion af MetalStat. Det anbefales, at der tages udgangspunkt i eksisterende undersøgelser, der relaterer metaller i grundvand til geologi, pH og redoxforhold. X matricen kan udvides med disse attributter, og MetalStat vil kunne finde den reelle betydning af disse på vandløbskoncentrationerne. Da relationen mellem disse attributter og metalkoncentrationen i grundvand er stærkt ikke-lineær, er det bedst at bruge en model, der anvender afskæringsværdier i stedet for at forudsætte en kontinuert funktion mellem pH og redox på den en side og metalkoncentrationen på den anden side. Derfor anbefales det, at der foretages en indledende analyse af sammenhænge mellem metalkoncentration i grundvand, pH, Redox og geologi, som skal danne input til beskrivelsen med X matricen i MetalStat. Første skridt skal være at sikre adgang til relevante GIS lag i samarbejde med relevante institutioner.

Forurenede grunde kunne også inddrages i X matricen, men det vurderes ikke at være så betydende som grundvandsbidraget for de fem metaller i MetalStat, hvorfor denne aktivitet skal prioriteres efter en inddragelse af grundvand. Med disse forbehold gives der i denne rapport et forslag til en model for forurenede grunde, som kunne bygges ind i MetalStat med udgangspunkt i en eksisterende screeningsmodel for forurenede grundes potentielle påvirkning af vandløb.