Informatie

Afhankelijkheidsgrafiek van het leven


Dit is een fascinerend artikel dat ik heb gelezen met behulp van Bayesiaanse analyse om verschillende grafiekmodellen te vergelijken met genomische gegevens. Intrigerend genoeg laat het zien dat een afhankelijkheidsgrafiek veel beter past dan een boommodel. Een boommodel is echter wat we zouden verwachten van gemeenschappelijke afstamming met variatie. Wat zou in plaats daarvan dit afhankelijkheidsgrafiekmodel kunnen maken?

http://bio-complexity.org/ojs/index.php/main/article/view/BIO-C.2018.3

Voor degenen die zich zorgen maken over sitecookies, hier is de krant die wordt gehost op mijn Box.net-account:

https://app.box.com/s/2mtiwafzr67hsee8o9m7bnfjr7dbmzsv


Het lijkt erop dat de controverse voortkomt uit een verkeerd begrip van wat de log Bayes-factor in het artikel betekent. Dr. Swamidass stelt dat het D. Graph vs Tree-resultaat moet worden gedeeld door het Tree vs Null-resultaat om de D. Graph te tonen, maar de gegevens 1,7% beter verklaren dan de Tree.

De auteur beweert echter dat de log Bayes-factor eigenlijk betekent dat de D-grafiek $2^{111.823}$ keer beter is dan de Tree. Wat duidelijk een gemeenschappelijke afstamming (boom) laat zien, is een veel slechtere verklaring voor de gegevens dan de D.-grafiek.

Het probleem is dat er een enorme hoeveelheid gegevens is, die de log Bayes-factor kunstmatig kan opblazen. Het aandeel moet echter stabiel blijven. Vandaar de focus op de 1,7%. Hier uitgelegd:

https://discourse.peacefulscience.org/t/uncommon-or-common-descent/776/86