Informatie

9.10: Palindromen - Biologie


Een palindroom is een opeenvolging van letters en/of woorden, die voor- en achteruit hetzelfde leest. "in staat was ik voordat ik Elba zag" is een palindroom. Palindromen komen ook voor in een DNA. Er zijn twee soorten.

Palindromen die voorkomen op tegenovergestelde strengen van hetzelfde deel van de DNA-helix

5' GGCC 3'
3' CCGG 5'

Dit type palindroom dient als doelwit voor de meeste restrictie-enzymen. De afbeelding toont de palindroomsequenties die worden "gezien" door vijf restrictie-enzymen (genoemd in blauw) die gewoonlijk worden gebruikt in recombinant DNA-werk.

Omgekeerde herhalingen

In deze gevallen lezen twee verschillende segmenten van de dubbele helix hetzelfde, maar in tegengestelde richtingen.

5' AGAACAnnnTGTTCT 3'
3' TCTTTGnnnACAAGA 5'

Omgekeerde herhalingen worden vaak gevonden in

  • Het DNA waaraan transcriptiefactoren binden.

    De hierboven getoonde DNA-sequentie is die van de glucocorticoïde respons-element waar N staat voor elk nucleotide. Transcriptiefactoren zijn vaak dimeren van identieke eiwitten homodimeren het is dus niet verwonderlijk dat elk lid van het paar dezelfde DNA-sequentie in dezelfde oriëntatie moet "zien".

  • Het DNA van velen transposons wordt geflankeerd door omgekeerde herhalingen zoals deze:
  • 5' GGCCAGTCACAATGG..~400 nt..CCATTGTGACTGGCC 3'
    3' CCGGTCAGTGTTACC..~400 nt..GGTAACACTGACCGG 5'

  • Omgekeerde herhalingen aan beide uiteinden van retrovirale gensequenties helpen bij het inbrengen van de DNA-kopie in het DNA van de gastheer.
  • Gedupliceerde genen.

    Het menselijke Y-chromosoom bevat 7 sets genen - elke set bevat 2 tot 6 bijna identieke genen - back-to-back of head-to-head georiënteerd; dat wil zeggen, het zijn omgekeerde herhalingen zoals het hier getoonde gedeelte. (De streepjes vertegenwoordigen de duizenden basenparen die aangrenzende palindromen scheiden.)

CTCCCACAACCCATGGGATTTGTG... 3'

GAGGGTGTTGGGTACCCTAAACAC... 5'

Deze oriëntatie en redundantie kunnen ertoe bijdragen dat een schadelijke mutatie in één exemplaar van de set kan worden gerepareerd met behulp van de informatie in een ander exemplaar van die set. Het enige dat nodig is, is een lus vormen zodat de twee reeksen naast elkaar staan. Reparaties kunnen dan worden uitgevoerd (waarschijnlijk door het mechanisme van homologe recombinatie). Hier kan bijvoorbeeld het enkele verschil in de reeksen worden geëlimineerd (rood voor blauw of omgekeerd).


Wat zijn palindroomdata?

Mary Jo DiLonardo behandelt een breed scala aan onderwerpen gericht op natuur, gezondheid, wetenschap en alles wat helpt om de wereld een betere plek te maken.

Je hebt waarschijnlijk die palindroomzin gehoord, die voorwaarts en achterwaarts op dezelfde manier wordt gespeld. Maar palindroomdatums lijken ook veel nieuwsgierigheid op te wekken.

Palindroomdata komen door hun aard alleen voor in de eerste eeuwen van een millennium. Er zullen er 36 zijn gedurende dit millennium, de laatste zal plaatsvinden op 22 september 2290. De volgende zal pas op 3 oktober 3001 zijn.

In 2020 is er bijvoorbeeld maar één dag een palindroom in het m-dd-jjjj-formaat:

Palindroomdatums zijn ook afhankelijk van hoe een datum is opgemaakt, wat kan variëren afhankelijk van waar je woont. Als je de datum op een andere manier spelt, zoals het mm-dd-jj-formaat - wat gebruikelijk is in de Verenigde Staten - zijn er nog twee datums in 2020:

(Het is vermeldenswaard dat het om veiligheidsredenen beter is om het jaar 2020 te spellen om vervalsers te ontmoedigen om aan uw documenten te sleutelen, legt USA Today uit.)

Aziz S. Inan, hoogleraar elektrotechniek aan de Universiteit van Portland, heeft berekend dat wanneer datums worden geschreven in het mm-dd-jjjj-formaat, palindroomdagen doorgaans alleen in de eerste paar eeuwen van elk millennium voorkomen, volgens timeanddate.com . Het eerste voorbeeld van een palindroom in het huidige millennium (1 januari 2001 tot 31 december 3000) was 2 oktober 2001 (10-02-2001) en de laatste zal 22 september 2290 (09-09) zijn. 22-2290).

Voor landen die het dd-mm-jjjj-formaat gebruiken, zijn er 29 palindroomdagen in de huidige eeuw. De eerste was 10 februari 2001 (10-02-2001). De laatste zal een schrikkeldag zijn: 29 februari 2092 (29-02-2092), tevens de laatste palindroomdag van de 21e eeuw.


Palindroom (Kruiswoordraadsel)

Als het antwoord dat u zoekt niet in de bovenstaande antwoorden staat, kunnen deze definities helpen bij het oplossen van uw kruiswoordpuzzel.

&stier In de moleculaire biologie, een zelf-complementaire nucleïnezuursequentie
&bull Een woord of zin die achterstevoren hetzelfde leest als vooruit
&bull Een positief geheel getal waarvan de cijfers voorwaarts en achterwaarts hetzelfde zijn
&bull Een woord of zin die in beide richtingen hetzelfde betekent
&bull Een woord of zin die achterstevoren hetzelfde leest als vooruit
&bull Een woord, zin of vers dat achteruit of vooruit op dezelfde manier wordt gelezen
&bull Een woord, vers of zin, dat is hetzelfde als het achteruit of vooruit wordt gelezen
&bull Woord, zin of versregel die voorwaarts of achterwaarts hetzelfde leest e
&stier Woord, getal, zin of vers dat hetzelfde achteruit of vooruit leest
&bull Een woord, vers, zin of passage die hetzelfde voor- of achteruit leest
Nog eens 9 definities zijn te vinden op Encyclo

Ben je op zoek naar meer antwoorden, of heb je een vraag voor andere kruiswoordpuzzels? Gebruik de "Crossword Q & A"-community om hulp te vragen.

Als je het palindroom kruiswoordraadsel nog niet hebt opgelost, probeer dan ons kruiswoordraadselwoordenboek te doorzoeken door de letters in te voeren die je al kent! (Voer een punt in voor elke ontbrekende letter, bijv. "P.ZZ.." zal "PUZZEL" vinden.)

Kijk ook naar de gerelateerde aanwijzingen voor kruiswoordraadselaanwijzingen met vergelijkbare antwoorden op "palindroom"


1 antwoord 1

Gezien het antiparallelle karakter van de dubbele DNA-helix, wordt verwacht dat slechts twee soorten herhalende sequenties structurele betekenis hebben: gewone herhalingen (A B C..
[. ]
Wanneer omgekeerde herhalingen worden gescheiden door slechts een paar tussenliggende nucleotiden, is hun gelijkenis met een palindroom voldoende om ze deze naam te geven

A', B' en C' zijn complementair aan A, B en C.

Het feit is dat een echt sensu stricto palindroom (bijv. ACTTCA) een grappige trivia zou zijn, maar geen structurele betekenis zou hebben, daarom is het niet echt nodig om het een naam te geven.


De laatste palindroomweek van de eeuw begint vandaag

Als je de afgelopen tien jaar elk jaar de Palindrome Week over het hoofd hebt gezien, is het onze burgerplicht om ervoor te zorgen dat het deze keer op je radar staat. De statistieken laten immers zien dat het de laatste week van deze eeuw is waarin de datums er zowel vooruit als achteruit hetzelfde zullen uitzien. Wil je je palindroomfeest naar een hoger niveau tillen? Trek aan in een raceauto, zing die karaoke-solo's, verwijs naar al je gasten als mevrouwen stuur ze dan met een kajak naar huis.

Zoals AL.com meldt, begint de Palindroomweek vandaag met 9-10-19 en gaat door tot aanstaande donderdag, 9-19-19. U kunt de volledige lijst met datums en hun ononderbroken, vijfcijferige palindroomreeksen hieronder bekijken.

Om de datums correct als palindromen te schrijven, zijn er een paar bepalingen: Ten eerste moet de maand eerst komen, dan de dag en dan het jaar. De door het VK favoriete volgorde van dag, maand en jaar zal het palindroom door elkaar gooien. Ten tweede kunt u geen nul voor het eerste cijfer plaatsen, zoals formulieren en andere documenten vaak vragen.

9-10-19 (91019)
9-11-19 (91119)
9-12-19 (91219)
9-13-19 (91319)
9-14-19 (91419)
9-15-19 (91519)
9-16-19 (91619)
9-17-19 (91719)
9-18-19 (91819)
9-19-19 (91919)

TimeandDate.com legt uit dat je sinds 2011 elk jaar hetzelfde patroon van palindromen kunt vinden, toen de Palindrome Week begon op 10 januari (1-10-11). Sindsdien is de Palindrome Week elk jaar verplaatst naar het moment waarop het nummer van de maand overeenkomt met het laatste cijfer van het jaar. Maart komt bijvoorbeeld overeen met 3, dus de Palindroomweek van maart vond plaats in 2013. Aangezien je de eerste twee cijfers van het jaar weglaat, vond hetzelfde decennium van Palindroomweken plaats in 1911, en zal zich herhalen in 2111.

Hoewel dit misschien de laatste volledige week van palindromen in deze eeuw is, zijn er nog steeds genoeg enkele Palindrome-dagen om in ons leven te vieren. Als je bereid bent een nul toe te voegen aan het begin van de datum, kun je uitkijken naar 11 februari 2020 (02-11-20) en 22 februari 2020 (22-02-20). Zet anders 11 december 2021 (12-11-21) en 22 december 2021 (12-22-21) in uw agenda.


Achtergrond

Next-Generation Sequencing (NGS) belooft robuuste sequencingplatforms te bieden voor fundamenteel biologisch onderzoek en klinische en moleculaire diagnoses [1-4]. Momenteel wordt de sequencingmarkt gedomineerd door 3 NGS-lijnen: Roche's 454, Illumina's Solexa en Life Technologies' SOLiD. Over het algemeen zijn de kosten voor 454 veel hoger dan die van de andere twee, maar de sequentielengte kan gemakkelijk 400 bps bereiken, gevolgd door de Solexa-lijn en vervolgens SOLiD, die alleen korte uitlezingen tot 75 bp kan produceren.

De sequentiechemie van deze drie systemen verschilt min of meer. 454 gebruikt emulsie-PCR om tempels op kralen te amplificeren, gevolgd door pyrosequencing met DNA-polymerase [5]. Solexa-afstamming gebruikt brug-PCR om de slapen op het glaasje te amplificeren, gevolgd door colorimetrische sequencing met DNA-polymerase. Als zodanig hanteren zowel de 454- als de Solexa-afstamming een "sequencing-by-synthesis" -benadering. Aan de andere kant, hoewel SOLiD-systemen ook emulsie-PCR gebruiken om sjablonen op kralen te amplificeren, wordt de sequencing ervan uitgebreid met twee unieke stappen: eerst door oligo's te gebruiken om te hybridiseren met het doelwit in de enkelstrengs sjabloon, gevolgd door ligase te gebruiken om de inkeping tussen de 5' van de groeiende streng en de 3' van de oligo. Deze sequentiebenadering, die groeit in de richting van 3 'naar 5', wordt bedacht als 'sequencing-by-ligation'-mechanisme. Het duidelijkste verschil tussen sequentiebepaling door synthese en sequentiebepaling door ligatie is dat de eerste DNA-polymerase gebruikt om complementaire nucleotiden aan de verlengde streng op te nemen, terwijl de laatstgenoemde ligase gebruikt om de verbinding tussen de langwerpige streng en de nieuw opgenomen complementaire streng af te dichten. oligonucleotiden. Aangezien DNA-polymerase een essentieel enzym in de cel is, wordt de eerste beschouwd als een meer natuurlijke benadering in vergelijking met de laatste.

Mogelijke ondervertegenwoordiging van GC-rijke regio's is beoordeeld voor zowel sequencing-by-synthese als sequencing-by-ligatiemechanismen [6]. De mogelijke obstakels die door palindroomregio's worden opgelegd, zijn echter nooit aangepakt. Een palindroomsequentie is een nucleïnezuursequentie die hetzelfde leest, ongeacht vanaf het 5'-uiteinde van de sequentie zelf of vanaf het 5'-uiteinde van zijn complementaire streng. Het heeft de potentie om een ​​haarspeldstructuur te vormen [7]. Het succes van ligatie is afhankelijk van de beschikbaarheid van de complementaire streng. Gezien het feit dat korte stukken palindroomsequenties haarspeldstructuren kunnen vormen in de enkelstrengs-matrijs, kunnen palindroomsequenties die van nature voorkomen in genomen of in RNA-sequenties (in het bijzonder mRNA's of miRNA's) regionale obstakels worden voor sequencing-by-ligatie-sequencers, problemen veroorzaken bij de assemblage van het genoom en het introduceren van vooringenomenheid in transcriptoomanalyse. Het is dus een belangrijke kwestie om de mogelijke obstakels die worden veroorzaakt door palindroomsequenties beter te begrijpen, vooral voor het mechanisme voor sequentiebepaling door ligatie.

In dit artikel hebben we een gecentraliseerde palindroomsequentie gebruikt om de effecten van een palindroomsequentie op sequencing te bestuderen. We construeerden een enkele kloon met een palindroomgebied geflankeerd door twee tag-sequenties (

18 bp), amplificeerde de kloon, verteerd met Mme I, en construeerde een sequencing-bibliotheek van de Mme Ik fragmenten. De bibliotheek werd gesequenced door SOLiD 5500xl sequencer. Hier rapporteren we de resultaten, wat aangeeft dat een sequencing-by-ligatiemachine niet in staat is om door het palindroomgebied te lezen.


9.10: Palindromen - Biologie

Ik heb hulp nodig en weet niet wat ik doe


MVoor deze opdracht ga je een programma maken dat een string test om te zien of het een palindroom is. Een palindroom is een string zoals "mevrouw", "radar", "papa" en "ik", die voorwaarts en achterwaarts hetzelfde leest. De lege string wordt beschouwd als een palindroom. Schrijf een recursieve functie:

bool isPalindroom(string str, int onder, int boven)

dat geeft true terug als en alleen als het deel van de string str in de posities lager tot hoger (inclusief aan beide uiteinden) een palindroom is. Test uw functie door een hoofdfunctie te schrijven die de gebruiker herhaaldelijk vraagt ​​om tekenreeksen in te voeren die worden afgesloten met de ENTER-toets. Deze snaren worden vervolgens getest op palindromiciteit. Het programma stopt wanneer de gebruiker op de ENTER-toets drukt zonder tekens ervoor te typen.

Dat zou je eerst moeten weten dubbel posten contraproductief is.
De andere draad: http://www.cplusplus.com/forum/beginner/267939/

Als uw probleem is "Ik begrijp er niets van", dan moet je terug naar de basis en opnieuw studeren.

Wat is laag? Een dergelijke variabele bestaat niet.
Wat is hoog? Een dergelijke variabele bestaat niet.

U kunt alleen variabelen gebruiken die bestaan.

cblack618, maak je geen zorgen over die poster. Hij is een racistische trol die zich nog niet verveelt. Negeer zijn deelname.

Je bent eigenlijk heel dichtbij om het te laten werken, kijk maar eens van dichterbij naar hoog en laag en werk uit wat je daar eigenlijk van plan was.

Dus nu trekken we de racistische kaart zonder reden.

Zelfs als het waar was, verslaat het zeker incompetentie. ImageMan en blackness hebben nog geen probleem opgelost - een gecombineerd totaal van nul runs op het bord. na bijna 2800 berichten. Niet eens 1 nuttige of creatieve regel code tussen de twee.

Zoals ik al schreef, gaan we voor de lange termijn naar nergens van ImageMan. Niets saais aan het kijken naar het gebrek aan intellect in het spel met de droomteam-matchingpsychologie aan het werk.


Inhoud

Satelliet-DNA vormen samen met minisatelliet- en microsatelliet-DNA de tandemherhalingen. [3]

De belangrijkste satelliet-DNA-families bij mensen worden genoemd:

Satelliet familie Grootte van herhaaleenheid (bp) Locatie in menselijke chromosomen
α (alfoïde DNA) 170 [4] Alle chromosomen
β 68 Centromeren van chromosomen 1, 9, 13, 14, 15, 21, 22 en Y
Satelliet 1 25-48 Centromeren en andere regio's in heterochromatine van de meeste chromosomen
Satelliet 2 5 De meeste chromosomen
Satelliet 3 5 De meeste chromosomen

Een herhaald patroon kan tussen 1 basenpaar lang zijn (een mononucleotide-herhaling) tot enkele duizenden basenparen lang, [5] en de totale grootte van een satelliet-DNA-blok kan meerdere megabasen zijn zonder onderbreking. Er zijn lange herhalingseenheden beschreven die domeinen van kortere herhaalde segmenten en mononucleotiden (1-5 bp) bevatten, gerangschikt in clusters van microsatellieten, waarbij verschillen tussen individuele kopieën van de langere herhalingseenheden werden geclusterd. [5] Het meeste satelliet-DNA is gelokaliseerd in de telomere of centromere regio van het chromosoom. De nucleotidesequentie van de herhalingen is redelijk goed geconserveerd tussen soorten. Variatie in de lengte van de herhaling is echter gebruikelijk. Minisatelliet-DNA is bijvoorbeeld een kort gebied (1-5 kb) van herhalende elementen met een lengte van >9-nucleotiden. Terwijl microsatellieten in DNA-sequenties worden beschouwd als een lengte van 1-8 nucleotiden. [6] Het verschil in hoeveel van de herhalingen aanwezig zijn in de regio (lengte van de regio) is de basis voor DNA-fingerprinting. [ citaat nodig ]

Microsatellieten worden verondersteld te zijn ontstaan ​​door polymerase slippen tijdens DNA-replicatie. Dit komt van de waarneming dat microsatelliet-allelen gewoonlijk specifiek polymorf zijn in lengte, de lengteverschillen die worden waargenomen tussen microsatelliet-allelen zijn over het algemeen veelvouden van de lengte van de herhaalde eenheid. [7]

Microsatelliet-expansie (trinucleotide repeat-expansie) wordt vaak gevonden in transcriptie-eenheden. Vaak zal de herhaling van het basenpaar de juiste eiwitsynthese verstoren, wat leidt tot ziekten zoals myotone dystrofie. [8]

Satelliet-DNA neemt driedimensionale structuren van hogere orde aan in eukaryote organismen. Dit werd aangetoond in de landkrab Gecarcinus lateralis, waarvan het genoom 3% van een GC-rijke satellietband bevat bestaande uit a

2100 basenpaar (bp) "repeat unit" sequentiemotief genaamd RU. [9] [10] De RU was gerangschikt in lange tandemreeksen met ongeveer 16.000 exemplaren per genoom. Verschillende RU-sequenties werden gekloond en de sequentie ervan werd bepaald om geconserveerde gebieden van conventionele DNA-sequenties te onthullen over stukken groter dan 550 bp, afgewisseld met vijf "divergente domeinen" binnen elke kopie van RU.

Vier divergerende domeinen bestonden uit microsatelliet-herhalingen, bevooroordeeld in basissamenstelling, met purines op de ene streng en pyrimidinen op de andere. Sommige bevatten mononucleotide-herhalingen van C:G-basenparen met een lengte van ongeveer 20 bp. Deze streng-biased domeinen varieerden in lengte van ongeveer 20 bp tot meer dan 250 bp. De meest voorkomende herhaalde sequenties in de ingebedde microsatellietgebieden waren CT:AG, CCT:AGG, CCCT:AGGG en CGCAC:GTGCG [11] [12] [5] Deze herhalende sequenties bleken veranderde structuren aan te nemen, waaronder driestrengs DNA , Z-DNA, stam-loop en andere onder superhelische stress. [11] [12] [5]

Tussen de strengbevooroordeelde microsatellietherhalingen en C:G-mononucleotideherhalingen behielden alle sequentievariaties één of twee basenparen waarbij A (purine) de pyrimidine-rijke streng onderbrak en T (pyrimidine) de purine-rijke streng onderbrak. Dit sequentiekenmerk verscheen tussen microsatelliet-herhalingen en C:G-mononucleotiden in alle vier de streng-biased domeinen waarvan de sequentie werd bepaald. Deze onderbrekingen in de samenstellingsbias namen sterk vervormde conformaties aan, zoals blijkt uit hun reactie op nuclease-enzymen, vermoedelijk als gevolg van sterische effecten van de grotere (bicyclische) purines die uitsteken in de complementaire streng van kleinere (monocyclische) pyridineringen. De sequentie TTAA:TTAA werd gevonden in het langste domein van RU, dat de sterkste van alle reacties op nucleasen produceerde. Dat specifieke divergente domein met streng vooringenomenheid werd gesubkloneerd en de gewijzigde helixstructuur ervan werd in meer detail bestudeerd. [11]

Een vijfde divergent domein in de RU-sequentie werd gekenmerkt door variaties van een symmetrisch DNA-sequentiemotief van afwisselende purines en pyrimidines waarvan is aangetoond dat ze een linkshandige Z-DNA/stam-lusstructuur aannemen onder superhelische stress. Het geconserveerde symmetrische Z-DNA werd afgekort tot Z4Z5Nieuw-Zeeland15Nieuw-Zeeland5Z4, waarbij Z staat voor afwisselende purine/pyrimidine-sequenties. Een stam-lusstructuur was gecentreerd in de Z15 element op de sterk geconserveerde palindroomsequentie CGCACGTGCG:CGCACGTGCG en werd geflankeerd door verlengde palindroom Z-DNA-sequenties over een gebied van 35 bp. Veel RU-varianten vertoonden deleties van ten minste 10 bp buiten de Z4Z5Nieuw-Zeeland15Nieuw-Zeeland5Z4 structureel element, terwijl andere extra Z-DNA-sequenties hadden die het afwisselende purine- en pyrimidine-domein verlengen tot meer dan 50 bp. [13]

Er werd aangetoond dat één verlengde RU-sequentie (EXT) zes tandemkopieën van een 142 bp geamplificeerd (AMPL) sequentiemotief had ingevoegd in een gebied dat wordt begrensd door omgekeerde herhalingen waar de meeste kopieën slechts één AMPL-sequentie-element bevatten. Er waren geen nuclease-gevoelige gewijzigde structuren of significante sequentiedivergentie in de relatief conventionele AMPL-sequentie. Een afgeknotte RU-sequentie (TRU), 327 bp korter dan de meeste klonen, kwam voort uit een enkele baseverandering die leidde tot een tweede EcoRI-restrictieplaats in TRU. [9]

Nog een krab, de heremietkreeft Pagurus pollicaris, bleek een familie van AT-rijke satellieten te hebben met omgekeerde herhalingsstructuren die 30% van het gehele genoom omvatten. Een andere cryptische satelliet van dezelfde krab met de volgorde CCTA:TAGG [14] [15] werd gevonden ingevoegd in enkele van de palindromen. [16]


Palindroom weken

Hoewel het lijkt alsof een reeks palindroomdatums - of palindroomweken - zeldzaam zijn, zegt Inan dat dat nauwelijks het geval is.

Sinds 2011 heeft elk jaar 10 opeenvolgende palindroomdagen. In 2011 begonnen ze bijvoorbeeld op 10 januari (1-10-11 tot 1-19-11), en in 2012 begon een andere reeks op 10 februari (2-10-12 tot 2-19-12) . In 2019 gebeurde het in september.

In het m-dd-jj-formaat heeft elke eeuw negen jaar met 10 opeenvolgende palindroomdagen. Timeanddate.com wijst erop dat ze altijd in het tweede decennium van de eeuw zijn. Elk jaar tussen 2011-2019, 2111-2119 en 2211-2219 hebben 10 palindroomdagen op rij.

Maar palindroomdatums zijn niet de enige manier waarop kalendergeeks - ik bedoel liefhebbers - krijgen hun opwinding.

Onder andere patronen zijn er herhalende datums (1/11/11 = 11111), herhalende reeksen (10/31/03 = 103 103) en opeenvolgende datums (8/9/10 = 8,9,10 en als je begint met de tijd van 12:34:56.7 krijg je 1, 2, 3, 4, 5, 6, 7, 8, 9, 10).


4. Conclusie

Gewend aan het lezen van DNA als lineaire sequenties, hebben we de neiging om te vergeten dat het dubbelstrengs van aard is. In dubbelstrengs DNA zijn palindromen de enige sequenties die uniek zijn. Hier bevestigen we het idee dat korte palindromen ondervertegenwoordigd zijn in alle verschillende soorten genomen. De frequentieverdeling van korte palindromen vertoont de hoogste variantie tussen soorten, maar een lage variantie binnen de soort. We maken hiervan gebruik om DNA te typen op basis van palindroomfrequentie, waarbij we zeer specifieke patronen genereren die het DNA van verschillende soorten onderscheiden, waarbij sequenties van dezelfde soort worden geclusterd. De methode maakt de toewijzing van plasmiden en bepaalde virussen aan hun respectievelijke gastheergenomen mogelijk. Hoewel de onderliggende selectieve krachten niet volledig worden begrepen, zijn deze patronen zeer nuttig voor de analyse van DNA-sequenties van onbekende oorsprong, zoals die welke worden gegenereerd door de gigabase in metagenomische high-throughput sequencing-onderzoeken. Palindroomfrequentieverhoudingen zoals hier gepresenteerd kunnen worden opgenomen in meer geavanceerde classificaties zoals zelforganiserende kaarten, 34 Bayesiaanse classificaties, 35 of ondersteunende vectormachines. 36 Concentratie op palindromen kan helpen om de diversiteit van microbiële gemeenschappen in te schatten en om verschillende, niet-overlappende sequenties die afkomstig zijn van hetzelfde genoom te bineren, om sequenties te classificeren door vergelijking met referentiepatronen, en om plasmiden en bacteriofagen toe te wijzen aan hun respectievelijke gastheergenomen.


Bekijk de video: Сигорских. - Машинное обучение в биологии. Лекции - 4. Методы понижения размерности (Januari- 2022).