Informatie

Op Transect gebaseerde steekproeven gebruiken om steekproefbomen te selecteren


Ik vroeg me af of je me kunt helpen hoe ik op Transect gebaseerde bemonstering kan gebruiken om monsterbomen te selecteren


Meer details over wat je studeert, de vraag die je wilt beantwoorden en hoe je het wilt doen, zou erg nuttig zijn. Maar ik kan deze fundamentele vraag beantwoorden over het selecteren van bomen met een transect.

Je zal nodig hebben:

  • Formulieren om in te vullen voor gegevens.
  • Een kompas.
  • Een transect-tape (echt een heel lang meetlint, ongeveer 100 yards of meters).
  • Een steekproefopzet die past bij jouw studie. (Ik neem aan dat je dit al hebt, maar als je er meer over wilt praten, zie hierboven.)
  • Een houten meterstok.

Als je eenmaal in je eerste gebied bent en klaar bent om een ​​willekeurige subset van bomen te selecteren.

  1. Kies een willekeurige plek. (Meestal gedaan door een stok of waterfles over je achterhoofd te gooien en te gaan waar het landt).
  2. Kies een willekeurig getal tussen 0-360. Dit is de willekeurige richting die je opgaat vanaf je willekeurige plek. Zoek het noorden op je kompas en naar welke kant je willekeurige nummer wijst. Markeer in je geest een routepunt op die afstand waar je naartoe kunt lopen (een bergtop, een duidelijke boom, wat dan ook).
  3. Plak het begin van je transecttape in de grond en begin te lopen. De lengte die je loopt moet vooraf worden bepaald vanuit je studieontwerp.

Nu ga je bomen selecteren om de meting uit te voeren die je hebt gekozen. Maar hoe? De meeste bossen zijn niet zo dicht dat een rechte transecttape veel van hen zal raken. Dit is waar de meterstok binnenkomt. Loop terug langs het transect en kies een boom die aan weerszijden binnen 1 meter van de tape komt. Is het bos niet dicht genoeg om op die manier voldoende bomen te bevatten? Vergroot dan eenvoudig de lengte van uw transect, of de lengte die u meet vanaf de transect (dwz 2 meter of 3 meter).

Dit wordt technisch een "bandtransect" genoemd. En het werd gebruikt in natuurlijke hulpbronnen om dingen te meten die overvloedig zijn, maar niet erg compact. Zoals bomen in een bos of struiken in de woestijn. Het is in wezen een gigantische quadrat.

Waarom al die willekeur? Mensen zijn van nature vooringenomen. Zelfs als je denkt dat je niet bevooroordeeld bent, zou je onbewust een startpunt kunnen kiezen in een dicht stuk bomen, of een richting waarin je je favoriete soort kunt meten. Een rigoureuze studie is gebaseerd op een willekeurige steekproef van een populatie van interesse, en kleine niet-willekeurige beslissingen zoals deze betekenen dat het geen willekeurige steekproef is, maar een vertekende steekproef.


Hoe op Transect gebaseerde bemonstering te gebruiken om monsterbomen te selecteren - Biologie

Een eenvoudige ecologische studie: Voorgestelde studies. Lees de eerste hoofdstukken in je laboratoriumhandleiding (lees alle secties over experimenteel ontwerp en het testen van hypothesen) en het materiaal hieronder voordat je naar de les komt, en bereid je voor om het veld in te gaan. Als je gemiddelde, standaardfout en t-tests moet bekijken, doe dat dan. We ontmoeten elkaar in het lab voor een korte bespreking van de wetenschappelijke methode en een planningssessie voor ons veldwerk. Daarna gaan we naar het natuurreservaat en begin je met het maken van observaties voor je eenvoudige ecologische studie. Sommigen van jullie kunnen deze week beginnen met het verzamelen van gegevens, maar je hebt ook volgende week om door te gaan. Aan het einde van het lab zul je Inleveren: Vul het werkblad in Een eenvoudige ecologische studie: Voorgestelde studies en lever het in aan het einde van het lab. 5 punten gebaseerd op (1) de duidelijke verklaring van een toetsbare beschrijvende hypothese, (2) een geschikt steekproefregime en (3) een redelijke functionele hypothese.

Algemeen Ecologie Lab # 4 Een eenvoudige ecologische studie

In dit lab voer je een eenvoudige ecologische studie uit die je groep zal initiëren, ontwerpen en uitvoeren in de volgende twee labs. De doelen van dit laboratorium zijn dat u fundamentele ecologische studies begrijpt, een bemonsteringsregime ontwerpt, statistische analyses van uw resultaten uitvoert en een beknopt rapport maakt van wat u hebt gedaan.

Een ecologische studie ontwerpen : Een ecologische studie begint meestal met een observatie van een patroon in de natuur. U kunt bijvoorbeeld zien dat rode eekhoorns in het ene gebied veel voorkomen, terwijl grijze eekhoorns een ander gebied domineren. Op dit punt is uw eerste observatie slechts subjectief, u moet een formeel beschrijvend onderzoek uitvoeren om het patroon dat u heeft waargenomen te documenteren. Voor deze beschrijvende fase dient u eerst formeel uw vraag of beschrijvende hypothese: Domineren rode eekhoorns in gebied A? (of, gesteld als een hypothese: rode eekhoorns domineren in gebied A, terwijl grijze eekhoorns domineren in gebied B.) Nu zou je een bemonsteringsprotocol moeten ontwerpen dat de eekhoornpopulaties nauwkeurig zou beoordelen (zie het gedeelte over ecologische bemonstering) gevolgd door statistische analyse van de gegevens (zie paragraaf over statistische analyse).

Op dit punt heb je misschien objectief aangetoond dat er een patroon bestaat, en het is tijd om een functionele hypothese dat kan het patroon verklaren dat u hebt gedocumenteerd. Je zou bijvoorbeeld kunnen vermoeden dat de aanwezige boomsoort de verspreiding van de eekhoorns heeft bepaald, of dat de aanwezigheid van een roofdier of ziekte de eekhoorns op verschillende manieren heeft beïnvloed. U moet een functionele hypothese formuleren die een oorzaak-gevolgrelatie omvat. Je zou bijvoorbeeld je hypothese kunnen formuleren als "als eiken de meest voorkomende boomsoort zijn in een gebied, dan zullen grijze eekhoorns het meest voorkomen dan in gebieden die worden gedomineerd door dennen". Deze "als dan"-uitspraken zijn een gebruikelijke manier om een ​​functionele hypothese uit te drukken, maar in de ecologie is het ook gebruikelijk om je hypothese te formuleren door een vraag te stellen die moet worden beantwoord. Bijvoorbeeld: "komen grijze eekhoorns vaker voor in bosgebieden die worden gedomineerd door eiken dan in bosgebieden die worden gedomineerd door dennen"? In de ecologie wordt de "nulhypothese" niet vermeld, ook al wordt deze altijd geïmpliceerd. Nadat je een functionele hypothese hebt gevormd, heb je een experiment nodig om deze te testen. Misschien kun je grijze eekhoorns introduceren in gebied A, overleven ze?

Eerste observaties doen: Er zijn veel vergelijkingen mogelijk, maar in dit lab moet je je concentreren op het vergelijken van één soort in twee verschillende situaties. Vergelijk bijvoorbeeld de individuen van een soort in verschillende habitats. Enkele kenmerken die je zou kunnen vergelijken:

overvloed--de dichtheid van individuen in een habitat kan afhangen van het niveau van een hulpbron die varieert in verspreiding

morfologie--de grootte, vorm of kleur van individuen kan worden beïnvloed door de omgeving (of er kunnen genetische verschillen zijn in verschillende habitats).

reproductieve output -- het aantal geproduceerde nakomelingen is een kritisch ecologisch kenmerk en kan worden beïnvloed door verschillende habitats of de aan- of afwezigheid van roofdieren, herbivoren of parasieten

Houd rekening met de hulpmiddelen die je hebt om de verschillen die je waarneemt te meten: linialen, meetlinten en natuurlijk kun je dingen tellen.

Formuleer een hypothese : Voor de beschrijvende fase van je onderzoek zal je hypothese eenvoudig zijn: bijv. Het aantal individuen van Japanse kamperfoelie is groter in de schaduw dan in de zon. EEN functionele hypothese zal een mechanistische verklaring bevatten: bijvoorbeeld, de ontkieming van zaden in zonnige habitats wordt beperkt door snelle uitdroging in vergelijking met schaduw.

ecologische bemonstering : Ecologen verzamelen vaak informatie over een populatie (d.w.z. het aantal geproduceerde zaden), de gemeenschap (d.w.z. het aantal soorten) of een habitat (d.w.z. de organische stof in de bodem). We kunnen de zaadproductie van elke individuele plant in het veld niet meten, dus we moeten monsters nemen statistische steekproef.

U moet weten wat u aan het bemonsteren bent, bijvoorbeeld als u de zaden op een persoon meet in augustus, heeft u zaden gemist die in juni werden geproduceerd en sindsdien zijn afgevallen? zijn er zaden door muizen gegeten? worden er in september meer zaden geproduceerd? Als u zaadproductie van een individuele plant wilt proeven, moet u er zeker van zijn dat u daadwerkelijk proeft wat u denkt te bemonsteren.

U mag uw steekproeven niet vertekenen. Welke individuen ga je bemonsteren en welke worden genegeerd? Willekeurige steekproeven omvatten het gebruik van een tabel met willekeurige getallen om willekeurige plots te selecteren om te bemonsteren. De tabel geeft je een getal - zeg 6 - en je bemonstert plot 6. Het probleem met willekeurige getallen is dat alles wat je wilt samplen een nummer moet hebben (dat wil zeggen, je moet het studiegebied rasteren zodat alle punten genummerd). Bij lukrake bemonstering wordt bijvoorbeeld een paal uitgegooid en wordt de dichtstbijzijnde plant bemonsterd.

Uw monsters moeten worden gerepliceerd.

Statistische analyse van gegevens :

Vergelijkingen met twee steekproeven: Met deze procedure kunt u conclusies trekken over de overeenkomst of het verschil tussen de gemiddelden van twee steekproefpopulaties. U kunt bijvoorbeeld de zaadopbrengst van gladde sumak in de schaduw en in de zon vergelijken. Bereken het gemiddelde (x), de standaarddeviatie (s) en de standaardfout (s x of SE) voor elk monster. Gebruik de standaarddeviatie om de populatievariabiliteit uit te drukken en de standaardfout om een ​​schatting te geven van het interval waar het werkelijke populatiegemiddelde te vinden is (het interval: x + 1,96 * standaardfout, bevat 95% van de steekproefgemiddelden voor grote steekproeven.

De t . van een student-test stelt u in staat om de twee steekproeven statistisch te contrasteren, met andere woorden een objectief antwoord te geven op de vraag of de steekproeven hetzelfde of verschillend zijn. kleine t waarden geven een grote kans aan dat de twee populatiegemiddelden daarentegen hetzelfde zijn, groot t waarden impliceren een lagere waarschijnlijkheid. de berekende t waarde en waarschijnlijkheid ( p)worden gegeven in SYSTAT. Ecologen beschouwen een verschil tussen populatiegemiddelden als significant wanneer de kans dat ze hetzelfde zijn minder dan 5% is (P <. .05)

Regressie analyse: U kunt een regressieanalyse gebruiken om twee verschillende variabelen te vergelijken die op één soort zijn gemeten. Je zou bijvoorbeeld kunnen zien dat een grotere plant meer fruit produceerde dan kortere planten. Je zou deze beschrijvende hypothese kunnen testen door de hoogte van de plant te meten en het aantal zaden dat hij produceerde. Uw laboratoriumhandleiding zal u vertellen hoe u een regressieanalyse moet doen, en het is gemakkelijk om te doen in SYSTAT.


Naburige en maximale waarschijnlijkheidsbomen maken:

Maak een buur-joining (NJ) boom met behulp van het Tamura en Nei (1993) model (zie ?dist.dna voor meer informatie) en root deze op de outgroup "D4Thai63":

We gebruiken boot.phylo om de boom op te starten:

en we kunnen de boom opnieuw plotten en annoteren met de bootstrap-clade-ondersteuningswaarden:

We maken een boom met maximale waarschijnlijkheid (ML) en rooten deze zoals eerder:

Plot de ML-structuur opnieuw, met bootstrap-ondersteuningswaarden:


Dubbel gebalanceerde ruimtelijke bemonstering met spreiding en restitutie van hulptotalen

Correspondentie met: Anton Grafström, Department of Forest Resource Management, Swedish University of Agricultural Sciences, SE-90183 Umeå, Zweden.

Instituut voor Statistiek, Faculteit Economie, Universiteit van Neuchâtel, Pierre à Mazel 7, 2000 Neuchâtel, Zwitserland

Afdeling bosbeheer, Zweedse universiteit voor landbouwwetenschappen, SE-90183 Umeå, Zweden

Correspondentie met: Anton Grafström, Department of Forest Resource Management, Swedish University of Agricultural Sciences, SE-90183 Umeå, Zweden.

Instituut voor Statistiek, Faculteit Economie, Universiteit van Neuchâtel, Pierre à Mazel 7, 2000 Neuchâtel, Zwitserland

Abstract

Er wordt een nieuwe ruimtelijke bemonsteringsmethode voorgesteld om een ​​dubbele eigenschap van balanceren te bereiken. Het monster is ruimtelijk uitgebalanceerd of goed verspreid om te voorkomen dat aangrenzende eenheden worden geselecteerd. Bovendien maakt de methode het ook mogelijk om te voldoen aan balanceringsvergelijkingen op hulpvariabelen die beschikbaar zijn op alle steekproefeenheden, omdat de Horvitz-Thompson-schatter bijna gelijk is aan de populatietotalen voor deze variabelen. De methode werkt met elke definitie van afstand in een multidimensionale ruimte en ondersteunt het gebruik van ongelijke inclusiekansen. Het algoritme is eenvoudig en snel. Voorbeelden laten zien dat de methode erin slaagt meer informatie te gebruiken dan de lokale pivotale methode, de kubusmethode en de Generalized Random-Tessellation Stratified samplingmethode, en dus beter presteert. Een schatter van de variantie voor deze steekproefopzet wordt voorgesteld om te leiden tot een gevolgtrekking die rekening houdt met het effect van de steekproefopzet. Copyright © 2012 John Wiley & Sons, Ltd.


Invoering

Het wordt algemeen erkend dat natuurbehoud een sociale onderneming is, wat betekent dat benaderingen van sociaal onderzoek een cruciale rol spelen in de natuurbehoudwetenschap (Teel et al. 2018). In meerdere contexten is het nodig om de verschillende waarden en opvattingen van individuen te begrijpen met betrekking tot kwesties die belangrijk zijn voor natuurbehoud. Het succes en falen van instandhoudingsinterventies kan bijvoorbeeld sterk afhangen van de vraag of en hoe de standpunten van verschillende belanghebbenden worden begrepen en geïntegreerd (Redpath et al. 2013 Madden & McQuinn 2014 Bennett 2016) en de mate waarin voorgestelde oplossingen als acceptabel worden beschouwd. (bijv. Chandran et al. 2015). Het is ook waardevol om verschillende perspectieven binnen natuurbehoud te begrijpen, wat kan leiden tot kritische zelfreflectie bij natuurbeschermers over doelstellingen en benaderingen (bijv. Holmes et al. 2016).

De Q-methodologie (hierna Q) is verkennend en semi-kwantitatief, en biedt een duidelijke en gestructureerde manier om de standpunten van belanghebbenden te ontlokken (de zogenaamde "operante subjectiviteiten". in de Q-literatuur) over een kwestie. Het categoriseert deze individuele gezichtspunten in clusters van waardeposities, geloofssystemen of mentale modellen (McKeown & Thomas 2013). Het kan hierbij gaan om conflicten tussen mens en natuur, het beheer van een bedreigde soort of interne discussies over strategie binnen een natuurbeschermingsorganisatie. De meningen over elk natuurbehoudvraagstuk kunnen zeer uiteenlopend zijn. Om deze problemen succesvol aan te pakken, is het vaak belangrijk om rekening te houden met verschillende meningen. Onderzoekers kunnen Q gebruiken om de diversiteit aan opvattingen bloot te leggen, ongeacht of deze opvattingen vaak voorkomen binnen een populatie (Watts & Stenner 2012 ).

Van fundamenteel belang voor Q is dat het kwantitatieve en kwalitatieve data en analytische technieken combineert. Dit is een belangrijk sterk punt van de aanpak, maar kan ook tot verwarring leiden. In onze ervaring kunnen conservatieonderzoekers (inclusief auteurs van dit artikel) met een achtergrond in positivistisch en kwantitatief onderzoek in eerste instantie tot Q worden aangetrokken omdat het bekende kenmerken heeft (zoals multivariate datareductietechnieken) die niet aanwezig zijn in andere puur kwalitatieve methoden . Het is echter belangrijk voor iedereen die het gebruik van Q overweegt om te erkennen dat het, als een methodologie, gebaseerd is op filosofische en epistemologische premissen die niet-positivistisch zijn (Watts & Stenner 2005 deze concepten worden geïntroduceerd in Moon en Blackman [2014]) . Volgens een niet-positivistische benadering wordt de onderzoeker in Q niet beschouwd als een neutrale actor die de waarheid onthult. Ze spelen eerder een actieve rol bij het vormgeven van de analyse en de interpretatie van de resultaten, gebaseerd op hun kennis van het studiesysteem. Zoals hieronder verder wordt besproken, stimuleert Q de intuïtie en creativiteit van onderzoekers (evenals hun kwantitatieve analytische vaardigheden) en stelt Q hen in staat om een ​​actieve rol te spelen gedurende het hele proces.

We identificeerden vier primaire verschillen tussen Q en andere sociale onderzoeksmethoden die voor vergelijkbare doeleinden worden gebruikt. Ten eerste biedt het numerieke resultaten ter ondersteuning van de geïnterpreteerde perspectieven en combineert het daarom de voordelen van kwantitatieve en kwalitatieve benaderingen. Ten tweede onthult het hoe verschillende, maar verwante onderwerpen met elkaar verbonden zijn door respondenten te verplichten om dergelijke onderwerpen tegelijkertijd te overwegen (in tegenstelling tot standaardonderzoeken, die meningen over elk onderwerp afzonderlijk oproepen). Ten derde, om perspectieven te synthetiseren tot een hanteerbare set, richt Q zich op overeenkomsten tussen individuen (in tegenstelling tot overeenkomsten tussen vragen of variabelen, d.w.z. een zogenaamde omgekeerde factoranalyse [FA]). Ten slotte kan het bepaalde vooroordelen verminderen, omdat respondenten expliciet moeten reageren op meningen die zij ongepast of onverwacht achten.

De Q-methodologie kan goed worden gecombineerd met andere methoden, zoals interviews (Rastogi et al. 2013) of enquêtes (Hagan & Williams 2016). Meestal wordt het echter gebruikt als een op zichzelf staande techniek. In vergelijking met enquêtes levert Q meer genuanceerde en verfijnde meningen op (Kamal et al. 2014 ). Het biedt een middenweg tussen de structuur van enquêtes en de diepte van interviews en combineert de voordelen van beide. Het wordt het vaakst toegediend met individuen, en in dergelijke gevallen is het relatief vrij van bepaalde psychologische vooroordelen, zoals een dominantie-effect (Mukherjee et al. 2015), die van invloed kunnen zijn op methoden die in groepen worden toegediend (bijv. Focusgroepdiscussies).

Omgekeerd, omdat de steekproef van respondenten meestal niet willekeurig is, kunnen de resultaten van Q niet gemakkelijk worden geëxtrapoleerd naar bredere populaties. Ook laat Q aantoonbaar minder vrijheid van interpretatie dan kwalitatieve discoursanalyse en interviews, omdat de perspectieven in Q beperkt zijn tot een reeks items die aan respondenten worden gepresenteerd en, tot op zekere hoogte, tot de kwantitatieve resultaten.

De methodologie is ontstaan ​​met het voorstel van Stephenson (1935) om FA toe te passen om overeenkomsten tussen mensen te vinden (op basis van kenmerken zoals attitudes en gedrag). Hoewel de oorsprong in de psychologie ligt, werd Q later op grotere schaal toegepast in de politieke wetenschappen (Watts & Stenner 2012 ) en vervolgens in de menselijke geografie (Eden et al. 2005 ), de gezondheidszorg (Valenta & Wigger 1997 Cross 2005), en andere gebieden. Bij conservering heeft het echter een beperkte toepassing gehad in vergelijking met andere technieken die voor vergelijkbare doeleinden worden gebruikt, zoals interviews en focusgroepdiscussies. Omdat het begrijpen van perspectieven de kern vormt van een breed scala aan conserveringsvragen en -problemen, heeft deze techniek een aanzienlijk potentieel. Momenteel zijn er geen richtlijnen voor beste praktijken voor Q in conservering, noch beoordelingen van de toepassing ervan.

We bespraken het potentieel van het gebruik van Q in conserveringsonderzoek, op basis van een gestructureerd overzicht van 52 empirische studies. We probeerden een eerste-stop-referentie te bieden om het nut van de methodologie voor een bepaalde instandhoudingsvraag te beoordelen. We leggen uit hoe u een Q-onderzoek uitvoert en schetsen de benodigde middelen. We hebben beoordeeld in welke conserveringscontexten en de soorten vragen die zijn beantwoord met behulp van Q en hebben aanbevelingen gedaan voor de toepassing ervan.


Figuur 1.

Detectiewaarschijnlijkheidsgrafieken voor chiru in het Aru-bekken, gestratificeerd per seizoen (juni en september/oktober), onderzoekstechniek (CCT = langlaufen en TT = spoordoorsneden) en geografische lagen (west- en oostkant van het Aru-bekken) . Alle plots bevatten een rechtsafknotting op 800 m, maar er werden verschillende modellen voor detectiewaarschijnlijkheid als volgt geselecteerd (zie Tabel 2 voor meer details): A) de zomer (juni) Halfnormale detectiefunctie voor TT B) de Halfnormaal met Cosinusaanpassing voor de zomer (juni) CCT C) het Uniform met een Cosinusaanpassing op het westen voor de herfst (september/oktober) TT D) de Halfnormaalfunctie aan de oostkant van het bassin voor het najaar (september/oktober) TT E) de Half-normale toetsfunctie met Cosinus-aanpassing gepoold over de zijkant van het bassin voor de herfst (september/oktober) CCT.

De regressieschattingen voor grootte-bias konden de nulhypothesen van geen correlatie van loodrechte afstand en clustergrootte voor alle analyses behalve één verwerpen (tabel 3). Ook bleek de herfst-CCT aan de oostkant van het bekken een statistisch significante maar zwakke correlatie te hebben (b = -0.652, r = -0.226, df = 204, P < 0.001), en er was een positieve correlatie voor zomer-TT met de resulterende aangepaste verwachte clustergrootte Ê(s) bijna één eenheid groter dan de gemiddelde clustergrootte (s̄ zie tabel 3). Zonder correctie voor grootteafwijking bij detectie van clusters, waren de meeste schattingen van de dichtheid 0,52-3,39 dieren/km 2 lager dan toen de controle werd verstrekt, hoewel één extreme schatting van 10,10 lager optrad (zie tabellen 2 en 3). De nauwkeurigheid van de dichtheidsschattingen verkregen met behulp van de gemiddelde clustergrootte was slechter dan die verkregen met behulp van de regressie-geschatte clustergrootte (zie tabellen 2 en 3). Overtreding van de aanname met betrekking tot symmetrische detectie rond de middellijn was geen probleem. Alle geselecteerde modellen voldeden aan het 'vormcriterium' (een rechterstaart en een 'schouder' nabij de middellijn zie Fig. 1).


Hoe op Transect gebaseerde bemonstering te gebruiken om monsterbomen te selecteren - Biologie

WAAROM MOETEN WE MONSTERNEREN?

Als we willen weten wat voor soort planten en dieren er in een bepaalde habitat zijn en hoeveel er van elke soort zijn, is het meestal onmogelijk om ze allemaal te gaan tellen. Het zou hetzelfde zijn als proberen verschillende maten en kleuren zandkorrels op het strand te tellen.

Dit probleem wordt meestal opgelost door een aantal monsters rond het leefgebied te nemen, waarbij de noodzakelijke aanname wordt gedaan dat deze monsters representatief zijn voor het leefgebied in het algemeen. Om er redelijk zeker van te zijn dat de resultaten van de monsters de habitat zo goed mogelijk weergeven, is een zorgvuldige planning vooraf essentieel.

Monsters worden meestal genomen met behulp van een of andere standaard bemonsteringseenheid. Dit zorgt ervoor dat alle monsters telkens hetzelfde gebied of volume (water) van de habitat vertegenwoordigen.

De gebruikelijke steekproefeenheid is een quadrat. Quadrats bestaan ​​normaal gesproken uit een vierkant frame, de meest gebruikte afmeting is 1m 2 (zie onderstaande afbeelding). Het doel van het gebruik van een quadrat is om vergelijkbare monsters te verkrijgen uit gebieden van consistente grootte en vorm. In sommige onderzoeken zijn rechthoekige kwadraten en zelfs cirkelvormige kwadraten gebruikt. Het maakt niet echt uit welke vorm van quadrat wordt gebruikt, op voorwaarde dat het een standaard bemonsteringseenheid is en de vorm en afmetingen ervan in elke beschrijving worden vermeld. Het kan echter beter zijn om vast te houden aan het traditionele vierkante frame, tenzij er zeer goede redenen zijn om dat niet te doen, omdat dit gegevens oplevert die beter vergelijkbaar zijn met ander gepubliceerd onderzoek. (U kunt bijvoorbeeld gegevens die zijn verkregen met een cirkelvormig kwadraat niet vergelijken met gegevens die zijn verkregen met behulp van een vierkant kwadraat. Het verschil in vorm van de steekproefeenheden zal variaties in de verkregen resultaten introduceren.)

rechts: Een quadrat wordt gebruikt om de soorten in een habitat te bemonsteren.

De keuze van de quadratgrootte hangt in grote mate af van het type onderzoek dat wordt uitgevoerd. Het zou bijvoorbeeld moeilijk zijn om zinvolle resultaten te behalen met een 0,5 m 2 quadrat in een studie van een bosluifel! Kleine kwadraten zijn veel sneller te onderzoeken, maar zullen waarschijnlijk iets minder betrouwbare gegevens opleveren dan grote. Grotere quadrats vergen echter meer tijd en moeite om goed te onderzoeken. Er is dus een balans nodig tussen wat ideaal is en wat praktisch is. Als algemene richtlijn zou 0,5 - 1,0 m 2 quadrats worden aanbevolen voor korte graslanden of dwergheide, hogere graslanden en struikachtige habitats zouden 2 m quadrats nodig kunnen hebben, terwijl quadrats van 20 m 2 of groter nodig zouden zijn voor boshabitats. Aan de andere kant van de schaal, als u mos bemonstert op een oever die bedekt is met een zeer diverse reeks mossoorten, kunt u ervoor kiezen om een ​​0,25 m 2 quadrat te gebruiken.

Quadraten worden meestal gebruikt voor bemonstering, maar zijn niet het enige type bemonsteringseenheden. Het hangt ervan af wat je samplet. Als u aquatische micro-organismen bemonstert of waterchemie bestudeert, zult u hoogstwaarschijnlijk watermonsters verzamelen in flessen of containers van standaardformaat. Als u naar parasieten op vissen kijkt, dan is een individuele vis hoogstwaarschijnlijk uw bemonsteringseenheid. Evenzo zouden studies van mineervliegen waarschijnlijk inhouden dat individuele bladeren als bemonsteringseenheden worden verzameld. In deze laatste twee gevallen zullen de monsternemingseenheden niet van standaard grootte zijn. Dit probleem kan worden ondervangen door een gewogen gemiddelde te gebruiken, waarbij rekening wordt gehouden met verschillende groottes van de bemonsteringseenheid, om tot het gemiddelde aantal organismen per bemonsteringseenheid te komen.

Er zijn drie manieren om monsters te nemen.

2. Systematische bemonstering (inclusief lijntransect- en riemtransectmethoden).

Aselecte steekproeven worden meestal uitgevoerd wanneer het onderzochte gebied redelijk uniform, zeer groot is en of er weinig tijd beschikbaar is. Bij het gebruik van steekproeven worden grote aantallen monsters/registraties genomen vanuit verschillende posities binnen het leefgebied. Een quadratframe wordt meestal gebruikt voor dit type bemonstering. Het frame wordt op de grond geplaatst (of op wat er ook wordt onderzocht) en de dieren en/of planten erin worden geteld, gemeten of verzameld, afhankelijk van waar het onderzoek voor dient. Dit wordt vele malen op verschillende punten in het leefgebied gedaan om een ​​groot aantal verschillende monsters te verkrijgen.

In de eenvoudigste vorm van willekeurige steekproeven wordt de quadrat gegooid om te vallen op 'willekeurig'146 binnen de site. Dit is echter meestal onbevredigend omdat er onvermijdelijk een persoonlijk element in het werpen komt en het niet echt willekeurig is. Ware willekeur is een belangrijk element in de ecologie, omdat statistieken veel worden gebruikt om de resultaten van steekproeven te verwerken. Veel van de gebruikelijke statistische technieken die worden gebruikt, zijn alleen geldig voor gegevens die echt willekeurig zijn verzameld. Deze techniek is ook alleen mogelijk als er kwadraten van kleine omvang worden gebruikt. Het zou onmogelijk zijn om iets groters dan een 1m 2 quadrat te gooien en zelfs dit kan problemen opleveren. Binnen habitats zoals bossen of struikgewas is het ook vaak niet mogelijk om quadratframes fysiek neer te leggen, omdat boomstammen en struiken in de weg zitten. In dit geval moet in plaats daarvan een gebied van dezelfde grootte als het quadrat worden uitgemeten en moeten de hoeken worden gemarkeerd om het te bemonsteren quadrat-gebied aan te geven.

Een betere methode van willekeurige steekproeven is om het gebied in kaart te brengen en vervolgens een genummerd raster over de kaart te leggen. Een (door de computer gegenereerde) tabel met willekeurige getallen wordt vervolgens gebruikt om te selecteren in welke vierkanten moet worden gesampled. (Willekeurige getallentabel:). Als we bijvoorbeeld onze habitat in kaart hebben gebracht en er vervolgens een genummerd raster overheen hebben gelegd zoals weergegeven (figuur - hieronder), kunnen we kiezen in welke vierkanten we een steekproef moeten nemen met behulp van het willekeurige getal tafel.

Ga verder naar de tabel met willekeurige getallen en andere steekproefmethoden

Kunt u niet vinden wat u zoekt? Gebruik zoeken


Hoe op Transect gebaseerde bemonstering te gebruiken om monsterbomen te selecteren - Biologie

Waarom probeert u niet de bijgewerkte versie van deze bron, die het verschil bekijkt tussen twee verschillend beheerde graslanden in het Waun Las National Nature Reserve?

Deze online ecologie-oefening maakt gebruik van aselecte steekproeven om de abundantie van verschillende soorten op een grasland te meten.

De middelen zijn bedoeld om studenten te helpen vaardigheden en plantidentificatietechnieken te ontwikkelen voordat ze het veld in gaan, in plaats van veldwerk te vervangen.

Om studenten te laten oefenen op:

  • aselecte steekproeven gebruiken om de abundantie van verschillende soorten op een graslandgebied te meten.

Om een ​​kans te geven om twee verschillende maten van overvloed te onderzoeken:

  • dichtheid: het aantal individuele planten per quadrat of per oppervlakte-eenheid
  • frequentie: het aantal kwadraten waarin elke soort voorkomt

Het grasland bevat een klein aantal gemakkelijk herkenbare soorten. Het bemonsteringsgebied is relatief klein, waardoor het mogelijk is om een ​​redelijk monster te nemen met behulp van 25cm x 25 cm quadrats (d.w.z. bij bemonstering van minimaal 2% van het totale gebied). Het kleine kwadraat stelt ons in staat om een ​​close-up beeld te geven van het hele kwadraat, waardoor individuele soorten kunnen worden geïdentificeerd.

1. ‘Gazononderzoek - gebied dat wordt bemonsterd’- een luchtfoto van het stuk grasland dat in deze oefening wordt bemonsterd. Dit is 5m x 5m. Er zijn tapes gelegd langs twee randen die zijn verdeeld in intervallen van 0,25 m, de lengte van één zijde van het gebruikte quadrat. Volg de link om deze te bekijken.

Hiernaast worden 10 paren willekeurige intervallen geplaatst.

2. ‘Gazonkwadraat’ - 10 quadrats elk geleverd als een aparte afbeelding. Elk is hot gekoppeld aan een van de paren coördinaten die hierboven zijn gegeven.

3. ‘ID en opnametabellen’ - Tabellen geleverd voor het vastleggen van resultaten (als dichtheid of als frequentie) samen met afbeeldingen en namen van elk van de soorten die waarschijnlijk zullen worden gezien. Er is geen poging gedaan om de grassoorten te scheiden, maar Engels raaigras Lolium perenne is de meest voorkomende soort. Download deze via de links aan de rechterkant.

Suggesties voor het uitvoeren van de oefening

Onderzoek de ideeën van de leerlingen over hoe ze de overvloed aan verschillende soorten in een grasland zouden gaan meten.

Wat ze zouden meten?
Hoe ze zouden samplen?

Leg het principe van aselecte steekproeven uit en hoe het in de praktijk wordt gedaan. Breng dit in verband met hoe het in deze oefening gaat gebeuren. Leg uit hoe het bemonsteringsinterval gerelateerd is aan de kwadratgrootte.

1. Wijs elk paar of kleine groep studenten een paar willekeurige intervallen toe en vraag hen om hun kwadraat te vinden. Geef ze een soortidentificatie (dichtheid) resultatentabel.

Vraag hen om te proberen de dichtheid te meten, d.w.z. het aantal planten van een of twee soorten, b.v. het aantal klaverplanten, het aantal madeliefjesplanten, in hun kwadraat. (Misschien wilt u wat tijd besteden aan het oefenen van identificatie).

2. Ze zullen al snel zien dat dit moeilijk is. Bovendien kun je ze laten zien hoeveel bladeren, zoals witte klaver, zijn verbonden door horizontale kruipende stengels. Het is moeilijk om te definiëren wat een individuele plant is en deze maat, dichtheid, geeft je geen indicatie van de grootte van de planten.

Een betere maatstaf is de frequentie (het aantal kwadraten waarin elke soort voorkomt). Dit is gerelateerd aan zowel het aantal planten als hun grootte en is daarom ecologisch zinvoller.

3. Vraag hen om de aan- of afwezigheid van elke soort in hun kwadraat te noteren om de frequentie te meten. Met behulp van een soortidentificatie (frequentie) resultatentabel. Verzamel de resultaten voor de 10 kwadraten (met behulp van een eenvoudige spreadsheet) en bereken de procentuele frequentie voor elke soort - het aantal keren dat aanwezig is van 10 x 100.

4. Misschien wilt u de meting van de dekking bespreken (de oppervlakte die door elke soort wordt bedekt). Dit kan worden gemeten met behulp van puntkwadraten of wordt vaak visueel geschat. Het meten van de frequentie geeft meestal een betrouwbaarder resultaat dan een visuele schatting van de dekking.

Willekeurige steekproeven zijn een manier om persoonlijke keuze bij de selectie van een steekproef te elimineren. Elk deel van uw monstergebied moet een gelijke kans hebben om bemonsterd te worden elke keer dat u een monster gaat nemen. Om deze reden moet het bemonsteringsinterval even groot zijn als het kwadraat. In deze oefening is de quadrat bijvoorbeeld 25 cm x 25 cm en zijn de banden langs de twee zijden van de plot daarom verdeeld in intervallen van 25 cm.

De coördinaten van paren willekeurig gekozen intervallen bepalen de kwadratenposities.

Om willekeurige intervallen te maken, is de eenvoudigste manier om de intervallen van 0,25 van 0-10 op stukjes papier te schrijven en ze uit een hoed te tekenen. Let op: vervang elk stuk papier voordat u het volgende tekent.

In de praktijk vooral bij het werken onder moeilijke omstandigheden (stortregen!!) of bij jongere leerlingen concentreert men zich op het elimineren van persoonlijke keuze. In dit geval vinden de landmeters hun coördinaten door langs de banden te lopen met het aantal passen dat wordt aangegeven door de willekeurige getallen in plaats van de intervallen langs de band te meten.

Let op: het gooien van quadrats is geen willekeurige steekproef en elimineert op zijn best een zekere mate van persoonlijke keuze!

For more information about quadrats and sampling see 'Questions about quadrats' OSMOSIS 25 Spring 2004


Biodiversiteit

In order to measure the biodiversity of a habitat, you need to observe all the species present. However, observing the whole habitat is time-consuming en moeilijk. Sampling involves taking a small portion of the habitat and studying the area carefully. You can then multiply up the numbers of individuals of each species found, on order to estimate the number in the whole habitat.

Sampling is a evenwicht van ease en accuracy. To improve the accuracy of the estimation, repeated samples are taken and also the sample size must be groot.

(d) describe how random samples can be taken when measuring biodiversity

  1. Random Sampling– A basic way to do this is to stand within the area, and just throw the quadrat, however, it is not truly random. A better way is to use a calculator to generate random numbers, to get coordinates of where you will place your quadrat. The first number is the x coordinate and the second number is the y coordinate.
  2. Systematic Sampling– In some situations, you may want to sample more systematically. In this case, you could sample along a transect. A transect is a line taken across a habitat. You stretch a tape measure across the habitat and take samples along the line. You can use a:
  • Line Transect – recording each organism which is touching the line at suitable, regular intervals.
  • Belt Transect – placing a quadrat against the line, recording its contents, then placing the next quadrat immediately touching the first one, repeating this along the transect.
  • Interrupted Belt Transect – placing quadrats at regular intervals along the transect.

Quadrats are square frames used to define the size of the ample area. It’s important to choose the right size of the quadrat (normally 50cm or 1m quadrats are used) depending on the size of the area. The quadrat is placed randomly and the abundance is measures. You could:

  • Habitat – The range of habitats in which different species live. Each habitat will be occupied by a range of organisms.
  • Soort – The differences between species. This could be structural differences (between a tree and an ant) or functional differences (between bacteria that cause decay and those that help to digest food).
  • Genetic – Genetic variation between individuals belonging to the same species, ensures that they do not all look alike.

(c) explain the importance of sampling in measuring the biodiversity of a habitat

In order to measure the biodiversity of a habitat, you need to observe all the species present. However, observing the whole habitat is time-consuming en moeilijk. Sampling involves taking a small portion of the habitat and studying the area carefully. You can then multiply up the numbers of individuals of each species found, on order to estimate the number in the whole habitat.

Sampling is a evenwicht van ease en accuracy. To improve the accuracy of the estimation, repeated samples are taken and also the sample size must be groot.

(d) describe how random samples can be taken when measuring biodiversity

  1. Random Sampling– A basic way to do this is to stand within the area, and just throw the quadrat, however, it is not truly random. A better way is to use a calculator to generate random numbers, to get coordinates of where you will place your quadrat. The first number is the x coordinate and the second number is the y coordinate.
  2. Systematic Sampling– In some situations, you may want to sample more systematically. In this case, you could sample along a transect. A transect is a line taken across a habitat. You stretch a tape measure across the habitat and take samples along the line. You can use a:
  • Line Transect – recording each organism which is touching the line at suitable, regular intervals.
  • Belt Transect – placing a quadrat against the line, recording its contents, then placing the next quadrat immediately touching the first one, repeating this along the transect.
  • Interrupted Belt Transect – placing quadrats at regular intervals along the transect.

Quadrats are square frames used to define the size of the ample area. It’s important to choose the right size of the quadrat (normally 50cm or 1m quadrats are used) depending on the size of the area. The quadrat is placed randomly and the abundance is measures. You could:

  • Count the number of individuals of each species.
  • Estimate the percentage cover of each species – this is the proportion of the area within the quadrat which it occupies.
  • Use an abundance scale, such as the ACFOR scale, by estimating which one of these best describes the abundance of each species within the quadrat.
  • A point quadrat may be used. This is a frame holding a number of long needles or pointers. You lower the frame into the quadrat and record any plant touching the needles. It can also be useful for measuring the height of plants.
    Sampling Animals:

(f) use Simpson’s Index of Diversity (D) to calculate the biodiversity of a habitat, using the formula


Simpson’s index of diversity is a measure of the diversity of a habitat. It takes into account both species richness and species eveness. It is calculated by the formula:

(g) outline the significance of both high and low values of Simpson’s Index of Diversity

EEN high value of Simpson’s Index indicates a diverse habitat, which provides a place for many different species and many organisms to live in. Small changes to the environment would only affect one species. If the species is only a small part of the habitat, the total number of individual affected is a small proportion of the total number present. Therefore the effect on the whole habitat is klein. The habitat tends to be stal and able to withstand changes.

EEN low value of Simpson’s Index indicates a less diverse habitat, which provides a habitat for only a few different species. EEN small change to the environment that affects one of those species could schade of kapot maken the whole leefgebied. Such a small change could be a disease or predator, or even something that humans have done nearby.

(h) discuss current estimates of global diversity

Estimates of global diversity varies across the world. One estimate includes:


1. Compare the total number you got for sunflowers from the SAMPLING to the ACTUAL count. How close are they?

2. Why was the paper-slip method used to select the grid segments?

3a. A lazy ecologist collects data from the same field, but he stops just on the side of the road and just counts the 10 segments near the road. These 10 segments are located at J 1-10. When he submits his report, how many sunflowers will he estimate are in the field?

B. Suggest a reason why his estimation differs from your estimation.

4. Population Sampling is usually more effective when the population has an even dispersion pattern. Clumped dispersion patterns are the least effective. Explain why this would be the case.

5. Describe how you would use Sampling to determine the population of dandelions in your yard.

6. In a forest that measures 5 miles by 5 miles, a sample was taken to count the number of silver maple trees in the forest. The number of trees counted in the grid is shown below. The grids where the survey was taken were chosen randomly. Determine how many silver maple trees are in this forest using the random sampling technique. Laat je werk zien!

Extension: Have students apply what they have learned to determine the number of dandelions in an area of the school. This could also be flipped to an inquiry lesson by asking them to do the schoolyard estimate first, where they must work together to figure out how they would make the estimation. Most will come up with a type of sampling so they don't need to count every dandelion.

/>Dit werk is gelicentieerd onder een Creative Commons Naamsvermelding-NietCommercieel-GelijkDelen 4.0 Internationaal-licentie.


Inhoud

Bootstrapping is a statistical method for estimating the sampling distribution of an estimator by sampling with replacement from the original sample, most often with the purpose of deriving robust estimates of standard errors and confidence intervals of a population parameter like a mean, median, proportion, odds ratio, correlation coefficient or regression coefficient. It has been called the plug-in principle, [1] as it is the method of estimation of functionals of a population distribution by evaluating the same functionals at the empirical distribution based on a sample.

For example, [1] when estimating the population mean, this method uses the sample mean to estimate the population median, it uses the sample median to estimate the population regression line, it uses the sample regression line.

It may also be used for constructing hypothesis tests. It is often used as a robust alternative to inference based on parametric assumptions when those assumptions are in doubt, or where parametric inference is impossible or requires very complicated formulas for the calculation of standard errors. Bootstrapping techniques are also used in the updating-selection transitions of particle filters, genetic type algorithms and related resample/reconfiguration Monte Carlo methods used in computational physics. [2] [3] In this context, the bootstrap is used to replace sequentially empirical weighted probability measures by empirical measures. The bootstrap allows to replace the samples with low weights by copies of the samples with high weights.

Jackknifing, which is similar to bootstrapping, is used in statistical inference to estimate the bias and standard error (variance) of a statistic, when a random sample of observations is used to calculate it. Historically, this method preceded the invention of the bootstrap with Quenouille inventing this method in 1949 and Tukey extending it in 1958. [4] [5] This method was foreshadowed by Mahalanobis who in 1946 suggested repeated estimates of the statistic of interest with half the sample chosen at random. [6] He coined the name 'interpenetrating samples' for this method.

Quenouille invented this method with the intention of reducing the bias of the sample estimate. Tukey extended this method by assuming that if the replicates could be considered identically and independently distributed, then an estimate of the variance of the sample parameter could be made and that it would be approximately distributed as a t variate with N−1 degrees of freedom (N being the sample size).

The basic idea behind the jackknife variance estimator lies in systematically recomputing the statistic estimate, leaving out one or more observations at a time from the sample set. From this new set of replicates of the statistic, an estimate for the bias and an estimate for the variance of the statistic can be calculated.

Instead of using the jackknife to estimate the variance, it may instead be applied to the log of the variance. This transformation may result in better estimates particularly when the distribution of the variance itself may be non normal.

For many statistical parameters the jackknife estimate of variance tends asymptotically to the true value almost surely. In technical terms one says that the jackknife estimate is consistent. The jackknife is consistent for the sample means, sample variances, central and non-central t-statistics (with possibly non-normal populations), sample coefficient of variation, maximum likelihood estimators, least squares estimators, correlation coefficients and regression coefficients.

It is not consistent for the sample median. In the case of a unimodal variate the ratio of the jackknife variance to the sample variance tends to be distributed as one half the square of a chi square distribution with two degrees of freedom.

The jackknife, like the original bootstrap, is dependent on the independence of the data. Extensions of the jackknife to allow for dependence in the data have been proposed.

Another extension is the delete-a-group method used in association with Poisson sampling.

Both methods, the bootstrap and the jackknife, estimate the variability of a statistic from the variability of that statistic between subsamples, rather than from parametric assumptions. For the more general jackknife, the delete-m observations jackknife, the bootstrap can be seen as a random approximation of it. Both yield similar numerical results, which is why each can be seen as approximation to the other. Although there are huge theoretical differences in their mathematical insights, the main practical difference for statistics users is that the bootstrap gives different results when repeated on the same data, whereas the jackknife gives exactly the same result each time. Because of this, the jackknife is popular when the estimates need to be verified several times before publishing (e.g., official statistics agencies). On the other hand, when this verification feature is not crucial and it is of interest not to have a number but just an idea of its distribution, the bootstrap is preferred (e.g., studies in physics, economics, biological sciences).

Whether to use the bootstrap or the jackknife may depend more on operational aspects than on statistical concerns of a survey. The jackknife, originally used for bias reduction, is more of a specialized method and only estimates the variance of the point estimator. This can be enough for basic statistical inference (e.g., hypothesis testing, confidence intervals). The bootstrap, on the other hand, first estimates the whole distribution (of the point estimator) and then computes the variance from that. While powerful and easy, this can become highly computationally intensive.

"The bootstrap can be applied to both variance and distribution estimation problems. However, the bootstrap variance estimator is not as good as the jackknife or the balanced repeated replication (BRR) variance estimator in terms of the empirical results. Furthermore, the bootstrap variance estimator usually requires more computations than the jackknife or the BRR. Thus, the bootstrap is mainly recommended for distribution estimation." [7]

There is a special consideration with the jackknife, particularly with the delete-1 observation jackknife. It should only be used with smooth, differentiable statistics (e.g., totals, means, proportions, ratios, odd ratios, regression coefficients, etc. not with medians or quantiles). This could become a practical disadvantage. This disadvantage is usually the argument favoring bootstrapping over jackknifing. More general jackknifes than the delete-1, such as the delete-m jackknife or the delete-all-but-2 Hodges–Lehmann estimator, overcome this problem for the medians and quantiles by relaxing the smoothness requirements for consistent variance estimation.

Usually the jackknife is easier to apply to complex sampling schemes than the bootstrap. Complex sampling schemes may involve stratification, multiple stages (clustering), varying sampling weights (non-response adjustments, calibration, post-stratification) and under unequal-probability sampling designs. Theoretical aspects of both the bootstrap and the jackknife can be found in Shao and Tu (1995), [8] whereas a basic introduction is accounted in Wolter (2007). [9] The bootstrap estimate of model prediction bias is more precise than jackknife estimates with linear models such as linear discriminant function or multiple regression. [10]

Subsampling is an alternative method for approximating the sampling distribution of an estimator. The two key differences to the bootstrap are: (i) the resample size is smaller than the sample size and (ii) resampling is done without replacement. The advantage of subsampling is that it is valid under much weaker conditions compared to the bootstrap. In particular, a set of sufficient conditions is that the rate of convergence of the estimator is known and that the limiting distribution is continuous in addition, the resample (or subsample) size must tend to infinity together with the sample size but at a smaller rate, so that their ratio converges to zero. While subsampling was originally proposed for the case of independent and identically distributed (iid) data only, the methodology has been extended to cover time series data as well in this case, one resamples blocks of subsequent data rather than individual data points. There are many cases of applied interest where subsampling leads to valid inference whereas bootstrapping does not for example, such cases include examples where the rate of convergence of the estimator is not the square root of the sample size or when the limiting distribution is non-normal. When both subsampling and the bootstrap are consistent, the bootstrap is typically more accurate.

Cross-validation is a statistical method for validating a predictive model. Subsets of the data are held out for use as validating sets a model is fit to the remaining data (a training set) and used to predict for the validation set. Averaging the quality of the predictions across the validation sets yields an overall measure of prediction accuracy. Cross-validation is employed repeatedly in building decision trees.

One form of cross-validation leaves out a single observation at a time this is similar to the jackknife. Another, K-fold cross-validation, splits the data into K subsets each is held out in turn as the validation set.

This avoids "self-influence". For comparison, in regression analysis methods such as linear regression, each ja value draws the regression line toward itself, making the prediction of that value appear more accurate than it really is. Cross-validation applied to linear regression predicts the ja value for each observation without using that observation.

This is often used for deciding how many predictor variables to use in regression. Without cross-validation, adding predictors always reduces the residual sum of squares (or possibly leaves it unchanged). In contrast, the cross-validated mean-square error will tend to decrease if valuable predictors are added, but increase if worthless predictors are added. [11]

EEN permutation test (also called a randomization test, re-randomization test, or an exact test) is a type of statistical significance test in which the distribution of the test statistic under the null hypothesis is obtained by calculating all possible values of the test statistic under all possible rearrangements of the observed data points. In other words, the method by which treatments are allocated to subjects in an experimental design is mirrored in the analysis of that design. If the labels are exchangeable under the null hypothesis, then the resulting tests yield exact significance levels see also exchangeability. Confidence intervals can then be derived from the tests. The theory has evolved from the works of Ronald Fisher and E. J. G. Pitman in the 1930s.

The test proceeds as follows. First, the difference in means between the two samples is calculated: this is the observed value of the test statistic, T obs >> .

The one-sided p-value of the test is calculated as the proportion of sampled permutations where the difference in means was greater than or equal to T obs >> . The two-sided p-value of the test is calculated as the proportion of sampled permutations where the absolute difference was greater than or equal to | T obs | >|> .

Relation to parametric tests Edit

Permutation tests are a subset of non-parametric statistics. Assuming that our experimental data come from data measured from two treatment groups, the method simply generates the distribution of mean differences under the assumption that the two groups are not distinct in terms of the measured variable. From this, one then uses the observed statistic ( T obs >> above) to see to what extent this statistic is special, i.e., the likelihood of observing the magnitude of such a value (or larger) if the treatment labels had simply been randomized after treatment.

In contrast to permutation tests, the distributions underlying many popular "classical" statistical tests, such as the t-toets, F-toets, z-test, and χ 2 test, are obtained from theoretical probability distributions. Fisher's exact test is an example of a commonly used permutation test for evaluating the association between two dichotomous variables. When sample sizes are very large, the Pearson's chi-square test will give accurate results. For small samples, the chi-square reference distribution cannot be assumed to give a correct description of the probability distribution of the test statistic, and in this situation the use of Fisher's exact test becomes more appropriate.

Permutation tests exist in many situations where parametric tests do not (e.g., when deriving an optimal test when losses are proportional to the size of an error rather than its square). All simple and many relatively complex parametric tests have a corresponding permutation test version that is defined by using the same test statistic as the parametric test, but obtains the p-value from the sample-specific permutation distribution of that statistic, rather than from the theoretical distribution derived from the parametric assumption. For example, it is possible in this manner to construct a permutation t-test, a permutation χ 2 test of association, a permutation version of Aly's test for comparing variances and so on.

The major drawbacks to permutation tests are that they

  • Can be computationally intensive and may require "custom" code for difficult-to-calculate statistics. This must be rewritten for every case.
  • Are primarily used to provide a p-value. The inversion of the test to get confidence regions/intervals requires even more computation.

Advantages Edit

Permutation tests exist for any test statistic, regardless of whether or not its distribution is known. Thus one is always free to choose the statistic which best discriminates between hypothesis and alternative and which minimizes losses.

Permutation tests can be used for analyzing unbalanced designs [12] and for combining dependent tests on mixtures of categorical, ordinal, and metric data (Pesarin, 2001) [ citaat nodig ] . They can also be used to analyze qualitative data that has been quantitized (i.e., turned into numbers). Permutation tests may be ideal for analyzing quantitized data that do not satisfy statistical assumptions underlying traditional parametric tests (e.g., t-tests, ANOVA). [13]

Before the 1980s, the burden of creating the reference distribution was overwhelming except for data sets with small sample sizes.

Since the 1980s, the confluence of relatively inexpensive fast computers and the development of new sophisticated path algorithms applicable in special situations made the application of permutation test methods practical for a wide range of problems. It also initiated the addition of exact-test options in the main statistical software packages and the appearance of specialized software for performing a wide range of uni- and multi-variable exact tests and computing test-based "exact" confidence intervals.

Limitations Edit

An important assumption behind a permutation test is that the observations are exchangeable under the null hypothesis. An important consequence of this assumption is that tests of difference in location (like a permutation t-test) require equal variance under the normality assumption. In this respect, the permutation t-test shares the same weakness as the classical Student's t-test (the Behrens–Fisher problem). A third alternative in this situation is to use a bootstrap-based test. Good (2005) [ citaat nodig ] explains the difference between permutation tests and bootstrap tests the following way: "Permutations test hypotheses concerning distributions bootstraps test hypotheses concerning parameters. As a result, the bootstrap entails less-stringent assumptions." Bootstrap tests are not exact. In some cases, a permutation test based on a properly studentized statistic can be asymptotically exact even when the exchangeability assumption is violated. [14]

Monte Carlo testing Edit

An asymptotically equivalent permutation test can be created when there are too many possible orderings of the data to allow complete enumeration in a convenient manner. This is done by generating the reference distribution by Monte Carlo sampling, which takes a small (relative to the total number of permutations) random sample of the possible replicates. The realization that this could be applied to any permutation test on any dataset was an important breakthrough in the area of applied statistics. The earliest known references to this approach are Eden and Yates (1933) and Dwass (1957). [15] [16] This type of permutation test is known under various names: approximate permutation test, Monte Carlo permutation tests of random permutation tests. [17]


Bekijk de video: Steekproefgrootte berekenen (Januari- 2022).