MOVE nationaal Model voor de Vegetatie versie 3.2 Achtergronden en analyse van modelvarianten

2.50
Hdl Handle:
http://hdl.handle.net/10029/9191
Title:
MOVE nationaal Model voor de Vegetatie versie 3.2 Achtergronden en analyse van modelvarianten
Authors:
Bakkenes MD; Zwart D de; Alkemade JRM
Other Titles:
MOVE national Model for the Vegetation
Abstract:
This report describes the process to produce optimal regression equations for vegetation response models in MOVE 3.2. MOVE is a Dutch national model for MOdelling VEgetation responses using regression models. The research consists of two parts, in part I the available data are analysed and in the second part the optimal regression equations are derived. The study shows that values of all variables are present for the complete data range and that the samples show a good spatial distribution. Comparing a random sample of thirteen species with records in the Dutch standard reference book 'Heukel's Flora van Nederland' shows that the values and dispersion of these species are similar. The construction of optimal regression equations for each species is done in two ways. The first method compares up to eleven different regression models, starting with a simple model and creating new and more complex models by adding variables. This resulted in the calculation of eleven enforced regression equations. The second method is a stepwise regression analysis. The only control on the stepwise procedure is the variation of start and end models of the stepwise regression. In the second method we have experimented with six different variants of which three are used in the final selection procedure. This totals the total number of calculated results to fourteen different models for each species. Of the original 914 species only those species (models) are selected that meet two criteria. First the measure of goodness of fit must lie within the 5 (alpha = 0.05) percent confidence interval (meaning that there is a possibility of 5% that a model will be wrongly rejected). When more than one model meets this criteria the model with the largest predictor will be selected. The second criterium is that at least one of the variables in the model must be a variable that can change over time. These criteria resulted in models for 690 species. The goodness of fit criteria resulted in poor models for fifteen models. Poor models are models with a relatively low predictor compared with the highest predictor in the set of the fourteen different models. For these fifteen models a better model is selected, i.e. a model with a much higher predictor and a goodness of fit value with p greater than 0.01. In the final set all fourteen different model runs are included. The variables with the fewest occurrences are the variable describing the impact of heavy metal, the variable salt en vegetation type. Apparently , these variables are for many plant species less important distinguishing variables.

Een beschrijving van het optimaliseren van de regressievergelijkingen voor MOVE 3.2. MOVE is een regressieMOdel voor de Nederlands VEgetatie. Het onderzoek is in twee fase uitgevoerd, allereerst is in deel I de geschiktheid van de dataset geanalyseerd en vervolgens (deel II) zijn de optimale regressievergelijkingen afgeleid. Uit de analyse in deel I is geconcludeerd dat de dataset geschikt is om te gebruiken voor het afleiden van de regressievergelijkingen. Er zijn voor het complete bereik van de variabelen gegevens aanwezig. De ruimtelijke spreiding van de gegevens over Nederland is redelijk homogeen, dit is een belangrijke voorwaarde voor het kunnen gebruiken van deze gegevens voor regressie analyse. Bij het vergelijken van de waarden van de te gebruiken variabelen met 13 willekeurig getrokken plantensoorten blijkt dat de gemiddelde waarden en de spreiding van deze variabelen goed overeenkomen met vermeldingen in Heukel's Flora van Nederland voor deze soorten. Er is op twee manieren geprobeerd om de optimale regressievergelijking (deel II) per plantensoort af te leiden. Bij de eerste methode is het aantal vrijheidsgraden van te voren opgelegd en worden specifieke modellen doorgerekend. In totaal zijn er op deze wijze elf verschillende modellen doorgerekend. Bij de tweede methode, de stapsgewijze regressie methode, bepaald het rekenproces, de computer, in grote mate welke modellen doorgerekend worden. Door het aangeven van het startmodel en het eindmodel is het mogelijk om enige sturing over het proces te houden. Bij de tweede methode zijn zes varianten doorgerekend. Drie varianten leverden nooit een beter model op, dus zijn er uiteindelijk drie varianten verder geanalyseerd. Vervolgens is per soort het beste model geselecteerd uit de in totaal veertien verschillende modellen. De selectieprocedure bestaat uit drie stappen. Allereerst is gekeken naar de goodness of fit. Van de oorspronkelijk aanwezige 914 plantensoorten uit de complete dataset zijn alleen die modellen geselecteerd met een redelijke goodness of fit. Hiervoor is de Hosmer en Lemeshow-test gebruikt met een alpha van 0.05. Dit betekent dat de kans dat een model onterecht wordt afgewezen 5% is. Ten tweede is, wanneer er meerdere modellen aan deze eis voldoen, het model gekozen met de hoogste schatter . Ten derde is als extra eis gesteld dat er minimaal 1 variabele aanwezig moet zijn, die veranderlijk in de tijd is of kan zijn. Dit resulteerde in 'optimale' modellen voor 690 soorten. Voor 15 soorten leverde de goodness of fit maat geen biologisch betekenisvol model op. Voor deze soorten is het model geselecteerd dat net buiten de goodness of fit eis lag, maar alpha groter dan 0.01, en een hogere maximale kans op voorkomen heeft. In het uiteindelijke resultaat worden alle veertien modelvarianten minimaal eenmaal gekozen. De variabelen combipaf (toxiciteit als gevolg van aanwezigheid van zware metalen), zout en vegetatietype komen het minst in de uiteindelijke modellen voor en zijn dus voor minder plantensoorten een belangrijke factor. De andere variabelen worden ongeveer even vaak gekozen.
Affiliation:
LBG; ECO
Publisher:
Rijksinstituut voor Volksgezondheid en Milieu RIVM
Issue Date:
30-Sep-2002
URI:
http://hdl.handle.net/10029/9191
Additional Links:
http://www.rivm.nl/bibliotheek/rapporten/408657006.html
Language:
nl
Series/Report no.:
RIVM rapport 408675006
Appears in Collections:
RIVM reports - old archive

Full metadata record

DC FieldValue Language
dc.contributor.authorBakkenes MDen_US
dc.contributor.authorZwart D deen_US
dc.contributor.authorAlkemade JRMen_US
dc.date.accessioned2007-02-26T15:59:30Z-
dc.date.available2007-02-26T15:59:30Z-
dc.date.issued2002-09-30en_US
dc.identifier408657006en_US
dc.identifier.urihttp://hdl.handle.net/10029/9191-
dc.description.abstractThis report describes the process to produce optimal regression equations for vegetation response models in MOVE 3.2. MOVE is a Dutch national model for MOdelling VEgetation responses using regression models. The research consists of two parts, in part I the available data are analysed and in the second part the optimal regression equations are derived. The study shows that values of all variables are present for the complete data range and that the samples show a good spatial distribution. Comparing a random sample of thirteen species with records in the Dutch standard reference book 'Heukel's Flora van Nederland' shows that the values and dispersion of these species are similar. The construction of optimal regression equations for each species is done in two ways. The first method compares up to eleven different regression models, starting with a simple model and creating new and more complex models by adding variables. This resulted in the calculation of eleven enforced regression equations. The second method is a stepwise regression analysis. The only control on the stepwise procedure is the variation of start and end models of the stepwise regression. In the second method we have experimented with six different variants of which three are used in the final selection procedure. This totals the total number of calculated results to fourteen different models for each species. Of the original 914 species only those species (models) are selected that meet two criteria. First the measure of goodness of fit must lie within the 5 (alpha = 0.05) percent confidence interval (meaning that there is a possibility of 5% that a model will be wrongly rejected). When more than one model meets this criteria the model with the largest predictor will be selected. The second criterium is that at least one of the variables in the model must be a variable that can change over time. These criteria resulted in models for 690 species. The goodness of fit criteria resulted in poor models for fifteen models. Poor models are models with a relatively low predictor compared with the highest predictor in the set of the fourteen different models. For these fifteen models a better model is selected, i.e. a model with a much higher predictor and a goodness of fit value with p greater than 0.01. In the final set all fourteen different model runs are included. The variables with the fewest occurrences are the variable describing the impact of heavy metal, the variable salt en vegetation type. Apparently , these variables are for many plant species less important distinguishing variables.en
dc.description.abstractEen beschrijving van het optimaliseren van de regressievergelijkingen voor MOVE 3.2. MOVE is een regressieMOdel voor de Nederlands VEgetatie. Het onderzoek is in twee fase uitgevoerd, allereerst is in deel I de geschiktheid van de dataset geanalyseerd en vervolgens (deel II) zijn de optimale regressievergelijkingen afgeleid. Uit de analyse in deel I is geconcludeerd dat de dataset geschikt is om te gebruiken voor het afleiden van de regressievergelijkingen. Er zijn voor het complete bereik van de variabelen gegevens aanwezig. De ruimtelijke spreiding van de gegevens over Nederland is redelijk homogeen, dit is een belangrijke voorwaarde voor het kunnen gebruiken van deze gegevens voor regressie analyse. Bij het vergelijken van de waarden van de te gebruiken variabelen met 13 willekeurig getrokken plantensoorten blijkt dat de gemiddelde waarden en de spreiding van deze variabelen goed overeenkomen met vermeldingen in Heukel's Flora van Nederland voor deze soorten. Er is op twee manieren geprobeerd om de optimale regressievergelijking (deel II) per plantensoort af te leiden. Bij de eerste methode is het aantal vrijheidsgraden van te voren opgelegd en worden specifieke modellen doorgerekend. In totaal zijn er op deze wijze elf verschillende modellen doorgerekend. Bij de tweede methode, de stapsgewijze regressie methode, bepaald het rekenproces, de computer, in grote mate welke modellen doorgerekend worden. Door het aangeven van het startmodel en het eindmodel is het mogelijk om enige sturing over het proces te houden. Bij de tweede methode zijn zes varianten doorgerekend. Drie varianten leverden nooit een beter model op, dus zijn er uiteindelijk drie varianten verder geanalyseerd. Vervolgens is per soort het beste model geselecteerd uit de in totaal veertien verschillende modellen. De selectieprocedure bestaat uit drie stappen. Allereerst is gekeken naar de goodness of fit. Van de oorspronkelijk aanwezige 914 plantensoorten uit de complete dataset zijn alleen die modellen geselecteerd met een redelijke goodness of fit. Hiervoor is de Hosmer en Lemeshow-test gebruikt met een alpha van 0.05. Dit betekent dat de kans dat een model onterecht wordt afgewezen 5% is. Ten tweede is, wanneer er meerdere modellen aan deze eis voldoen, het model gekozen met de hoogste schatter . Ten derde is als extra eis gesteld dat er minimaal 1 variabele aanwezig moet zijn, die veranderlijk in de tijd is of kan zijn. Dit resulteerde in 'optimale' modellen voor 690 soorten. Voor 15 soorten leverde de goodness of fit maat geen biologisch betekenisvol model op. Voor deze soorten is het model geselecteerd dat net buiten de goodness of fit eis lag, maar alpha groter dan 0.01, en een hogere maximale kans op voorkomen heeft. In het uiteindelijke resultaat worden alle veertien modelvarianten minimaal eenmaal gekozen. De variabelen combipaf (toxiciteit als gevolg van aanwezigheid van zware metalen), zout en vegetatietype komen het minst in de uiteindelijke modellen voor en zijn dus voor minder plantensoorten een belangrijke factor. De andere variabelen worden ongeveer even vaak gekozen.nl
dc.format.extent584000 bytesen_US
dc.format.extent597620 bytes-
dc.format.mimetypeapplication/pdf-
dc.language.isonlen_US
dc.publisherRijksinstituut voor Volksgezondheid en Milieu RIVMen_US
dc.relation.ispartofseriesRIVM rapport 408675006en_US
dc.relation.urlhttp://www.rivm.nl/bibliotheek/rapporten/408657006.htmlen_US
dc.subject.othermodellingen
dc.subject.othervegetationen
dc.subject.otherplantsen
dc.subject.othernetherlandsen
dc.subject.otherfloraen
dc.subject.othermodellenonderzoeknl
dc.subject.othervegetatienl
dc.subject.otherplantennl
dc.subject.otherfloranl
dc.subject.othernederlandnl
dc.subject.othermultiple regressienl
dc.subject.othernatuurplannernl
dc.titleMOVE nationaal Model voor de Vegetatie versie 3.2 Achtergronden en analyse van modelvariantenen_US
dc.title.alternativeMOVE national Model for the Vegetationen_US
dc.contributor.departmentLBGen_US
dc.contributor.departmentECOen_US
All Items in WARP are protected by copyright, with all rights reserved, unless otherwise indicated.