Informatie

Fylogenetica en substitutieverhoudingen voor positieve selectie


Zo erg nieuw voor fylogenetica!. Ik heb zo veel klauteren en gelezen om dit voor elkaar te krijgen!!.

Ik zou graag willen zien of een of meer van de sequenties die ik heb (uit een genenfamilie) onder positieve selectie staan ​​met behulp van de dN/dS-verhouding. De conceptuele delen zijn mij duidelijk, maar praktisch gezien ben ik onderweg verschillende problemen/vragen tegengekomen.

Mijn belangrijkste vraag zou zijn: ik heb vier verwante organismen (insecten) en hun volledige genenset in een genenfamilie. Ik heb bomen gereconstrueerd om hun evolutionaire verhaal (duplicaties en verliezen) af te bakenen. Wat zou de input zijn voor de berekening van dN/dS-verhoudingen wanneer een enkel gen verschillende mogelijke orthologen heeft in de andere organismen?, zoals gen A in soort 1 gen B en C en D heeft in soort 2 en E, F, G, H in soort 3 enz... Moet ik alleen de orthologen voor elke soort uitlijnen? allemaal?, of gewoon alle sequenties van de onderfamilie uitlijnen, inclusief alle paralogen en orthologen?, zou dat de verhouding niet overschatten?

Ik heb het PAML yn00-pakket geprobeerd en kreeg een resultaat voor een kleine "test" -reeks sequenties, die niet codon-uitgelijnd waren. Resultaten zijn paarsgewijs, hoe kan ik dit interpreteren? Wil ik "algemene" omega-waarden krijgen in plaats van paarsgewijs? wat zou in elk geval de meeste interpretatie zijn?

De tweede vraag is hoe ik codon-uitlijningen voor deze sequenties krijg?. Ik zag een paar gratis software op het internet, maar die werkten niet.

heel erg bedankt!