Informatie

Ontwerp primers voor PCR van een bepaalde DNA-sequentie


Gegeven de volgorde: 5'-ACTGACTATGTAGAA... GGCCCTAAGGGCCAA-3' (1)

U wilt PCR van dit dsDNA doen om "overhangen" aan de uiteinden ervan toe te voegen. Aan het 5'-uiteinde van u plaatst u de restrictieplaats voor het NdeI-enzym (5'-CATATG). Aan het 3'-uiteinde plaatst u de restrictieplaats voor MspI (5'-CCGG).

Schrijf de sequenties voor de "forward" en "reverse" primers om dit te doen. Elke primer moet 16-18 nt zijn, met 12 nt voor hybridisatie en 4-6 nt voor "overhang".

Ik ben een beetje in de war over hoe ik de voorwaartse en achterwaartse inleidingen voor de sequentie moet schrijven. Van video's heb ik gezien dat ik de complementaire streng van mijn gevende streng moet schrijven. Welke zou zijn:

3' -TGACTGATACATCTT… CCGGGATTCCCGGTT-5' (2)

Dan zou ik van sequentie (1) de reverse primer moeten krijgen en van sequentie (2) de forward primer. Dit staat me echter niet toe om beide restrictie-enzymen toe te voegen omdat beide primers van 5' tot 3' zouden zijn.

Of moet ik gewoon de gegeven volgorde nemen en alleen daar de inleidingen van schrijven? Zodat de primers zouden zijn:

Voorwaartse primer: 3'-GGCCTGACTGATACAT

Omgekeerde primer: GGATTCCCGGTTGTATAC - 5'

waarbij de vetgedrukte punten de restrictieplaatsen zijn.

Bedankt!


Zoals vermeld in de opmerkingen hierboven, onthoud dat je dubbelstrengs DNA amplificeert, dus uit elke cyclus moeten twee nieuwe omgekeerde complementaire strengen worden gegenereerd (zodat ze met elkaar kunnen hybridiseren). Zoals beschreven in uw antwoord, zouden uw beide primers hybridiseren met uw gegeven streng, en de amplicons zouden elkaar niet overlappen (één bindt aan elk uiteinde, maar beide zouden in dezelfde richting amplificeren).

Om dit op te lossen, heb je één primer nodig die bindt aan de doelsequentie, en één die bindt aan de omgekeerde complementstreng, die je al hebt gegenereerd. De nieuwe amplicons verlengen 5' -> 3' (vanaf het 3'-uiteinde van de primer niet de sjabloon), dus uw primers moeten binden aan het 3'-uiteinde van hun respectieve streng. Deze link heeft daar een goede visualisatie van.

Het 3'-uiteinde van de inleiding moet nauw hybridiseren met de sjabloon, aangezien dit is waar extensie plaatsvindt (besproken in deze handleiding). Dus uw flankerende restrictieplaatssequenties zullen altijd aan het 5'-uiteinde van beide primers zijn (merk op dat de vraag hier eigenlijk op duidt door het 5'-uiteinde van elke flank aan te geven).

De primer die als uw "omgekeerde" primer wordt gegeven, zal in feite binden aan het 3'-uiteinde van uw gegeven reeks in de juiste richting, maar misschien wilt u uw 3'-flank op het 5'-uiteinde van die primerreeks plaatsen, omdat dit zal zijn theoretisch het 3'-uiteinde van uw amplicon zijn. Je andere primer moet het 3'-uiteinde van je omgekeerde complement binden (dat is het 5'-uiteinde van je doelwit), dus het zal de 5'-restrictieplaatsflank hebben.

Volgens afspraak worden primersequenties altijd in 5'---3'-formaat gegeven. Zorg er dus voor dat uw antwoord die conventie volgt. (d.w.z. 5'-Flank-primer-3').

Als dit allemaal erg verwarrend klinkt, is dat omdat het zo is. Ik doe dit voor de kost, en ik controleer nog steeds altijd mijn primers in een programma als Primer3


Hoe primers te ontwerpen voor plaatsgerichte mutagenese

Site-directed mutagenese (SDM) is een in vitro methode om een ​​mutatie in een bekende sequentie te creëren. Het wordt vaak uitgevoerd door op PCR gebaseerde methoden. Typisch worden één of twee basen veranderd in plaatsgerichte mutagenese. Primers kunnen worden ontworpen met de gewenste mutaties voor het introduceren van kleine veranderingen in de nucleotidesequentie. Primerverlenging en inverse PCR kunnen worden gebruikt om grootschalige mutaties te introduceren. Deze benadering kan de aminozuursamenstelling van een bepaald eiwit veranderen. Plaatsgerichte mutagenese wordt gebruikt om de veranderingen van de activiteit van eiwitten te bestuderen. Het wordt ook gebruikt om fusie-eiwitten te maken.

Belangrijkste gebieden die worden gedekt

Sleutelbegrippen: deleties, inserties, mutaties, plaatsgerichte mutagenese, substituties, traditionele PCR


Familiespecifiek gedegenereerd primerontwerp: een hulpmiddel om consensus-gedegenereerde oligonucleotiden te ontwerpen

Het ontwerpen van gedegenereerde PCR-primers voor sjablonen met onbekende nucleotidesequentie kan een zeer moeilijke taak zijn. In dit artikel presenteren we een nieuwe methode om gedegenereerde primers te ontwerpen, geïmplementeerd in familiespecifieke gedegenereerde primerontwerp (FAS-DPD) computersoftware, waarvoor het uitgangspunt een meervoudige uitlijning van verwante aminozuren of nucleotidesequenties is. Om hun efficiëntie te beoordelen, werden vier verschillende genoomcollecties gebruikt, die een breed scala aan genomische lengtes bestrijken: Arenavirus (

nucleotiden), Baculovirus (

bp), Lactobacillus sp. (

bp), en Pseudomonas sp. ( naar

bp). In elk geval werden door FAS-DPD ontworpen primers computationeel getest om de specificiteit te meten. Ontworpen primers voor: Arenavirus en baculovirus werden experimenteel getest. De hier gepresenteerde methode is nuttig voor het ontwerpen van gedegenereerde primers op verzamelingen van verwante eiwitsequenties, waardoor nieuwe familieleden kunnen worden gedetecteerd.

1. Inleiding

De polymerasekettingreactie (PCR), een van de belangrijkste analytische instrumenten van de moleculaire biologie, maakt een zeer gevoelige detectie en specifieke genotypering van omgevingsmonsters mogelijk, vooral belangrijk in het metagenomische tijdperk [1]. Een grote lijst van toepassingen voor genoomtypering omvat willekeurig geprimed PCR [2] (AP-PCR), willekeurig geamplificeerde geprimede DNA's [3] (RAPD's), PCR-restrictiefragmentlengtepolymorfisme [4] (PCR-RFLP) en directe amplificatie van lengte polymorfisme [5] (DALP). Al deze technieken vereisen een hoge kwaliteit en zuiverheid van de specifieke doeltemplate, omdat elk beschikbaar DNA substraat zou kunnen zijn voor de amplificatiestap. Met het oog hierop zijn genotyperingsprocedures van grote genomen of complexe monsters betrouwbaarder als ze zijn gebaseerd op DNA-amplificatie met specifieke oligonucleotiden. Daarom is het ontwerp van de primer cruciaal voor een efficiënte en succesvolle amplificatie.

Er zijn verschillende primer-ontwerpprogramma's beschikbaar (bijv. OLIGO [6], OSP [7, 8], Primer Master [9], PRIDE [10], Primer3 [11], onder andere). Ongeacht elke computationele werkstrategie gebruiken deze allemaal een reeks gemeenschappelijke criteria (bijv.

inhoud, smelttemperatuur, enz.) om de kwaliteit van primerkandidaten in een specifiek door de gebruiker geselecteerd doelgebied te evalueren. Alternatieve programma's zijn gericht op meer specifieke doeleinden, zoals selectie van primers die binden aan geconserveerde genomische regio's op basis van meerdere sequentie-uitlijningen [12, 13], primerontwerp voor selectieve amplificatie van eiwitcoderende regio's [14], oligonucleotide-ontwerp voor plaats- gerichte mutagenese [15] en primerontwerp voor hybridisatie [16]. Gewoonlijk vereist het ontwerp van echt specifieke primers de informatie van de volledige nucleotidesequentie. Dit is het uitgangspunt voor de meeste programma's die in de literatuur worden beschreven. De noodzaak om specifieke primers te ontwerpen gaat echter niet altijd gepaard met de volledige kennis van de doelgenoomsequentie.

Een primer, of meer in het algemeen elke DNA-sequentie, wordt specifiek genoemd als deze een unieke sequentie vertegenwoordigt en wordt gedegenereerd genoemd als deze een verzameling unieke sequenties vertegenwoordigt. De aminozuursequentie "YHP" kan bijvoorbeeld worden gecodeerd door "TATCATCCC", "TACCATCCA" of "TACCACCCG", onder andere zijn dit allemaal unieke sequenties die kunnen worden samengevat in een "gedegenereerde" nucleotidesequentie "TAYCARCCN", IUPAC-code gebruiken. Operationeel impliceert het gebruik van een gedegenereerde primer het gebruik van een populatie van specifieke primers die alle mogelijke combinaties van nucleotidesequenties die coderen voor een gegeven eiwitsequentie dekken. Ook kunnen primers met gemodificeerde basen worden gebruikt. Sommige gewijzigde bases kunnen overeenkomen met verschillende bases.

Hoewel de toename in degeneratie de kans op niet-specifieke annealing van de ontworpen primers verhoogt, verhoogt het ook de kans op het vinden van onbekende divergente varianten van een sequentiefamilie. Met dit dubbele gedrag moet bij het ontwerp rekening worden gehouden. Algoritmisch zoeken naar primers die gedegenereerde posities bevatten, wordt gewoonlijk gedefinieerd als het probleem van het gedegenereerde primerontwerp (DPD). In de afgelopen jaren zijn er verschillende methoden ontwikkeld om het DPD-probleem op te lossen. Elk heeft een specifieke reikwijdte of is ontworpen om een ​​variant van het probleem op te lossen, maar ze zijn allemaal gericht op het minimaliseren van het aantal degeneraties van de resulterende primers.

Het DPD-probleem werd door veel onderzoekers op verschillende manieren geuit. Linhart en Shamir [17] presenteerden het DPD-probleem met maximale dekking (MC-DPD), met als doel een primer te vinden die het maximale aantal invoersequenties dekt. De selectie van primers wordt beperkt door de maximale degeneratie te beperken. Ze noemden ook het minimale degeneratie-DPD-probleem (MD-DPD), waarbij het doel is om een ​​primer te vinden met de minimale degeneratie die alle invoersequenties dekt. Om MC-DPD op te lossen hebben ze het HYDEN-programma ontwikkeld [18]. Wei et al. [19] ontwikkelde het DePiCt-programma dat hiërarchische clustering van eiwitblokken gebruikt om de primers te ontwerpen. Roos et al. [20] ontwikkelde een methode voor hybride gedegenereerde-niet-gedegenereerde primers, waarbij het 3'-gebied gedegenereerd is en het 5'-gebied een consensusklem is. Het werd geïmplementeerd in CODEHOP [21] en iCODEHOP [22] programma's en werd gebruikt om nieuwe leden van eiwitfamilies te zoeken en voor identificatie en karakterisering van virale genomen. Balla en Rajasekaran [23] beschreven een methode voor een variant van MD-DPD die mismatch-fouten tolereert, geïmplementeerd in het minDPS-programma. De programma's PT-MIPS en PAMPS richten zich voornamelijk op het probleem van meervoudig gedegenereerd primerontwerp. Het doel van deze programma's is het vinden van het minimale aantal gedegenereerde primers dat alle invoersequenties dekt, rekening houdend met het feit dat geen van hen meer gedegenereerd kan zijn dan een invoerwaarde.

In deze studie wordt een nieuwe methode voorgesteld voor het oplossen van het DPD-probleem, waarbij de focus wordt verlegd van de globale minimale gedegenereerde primer naar het maximaliseren van een scorewaarde die degeneratie bevat maar gewogen door de nabijheid van het 3'-uiteinde van de primer . Dit minimaliseert de degeneratie aan dat einde terwijl er meer vrijheid is in de resterende posities. Hierbij zijn de best scorende primers misschien niet de minder gedegenereerde, maar houden ze rekening met een biologische beperking die bij andere methoden niet zo zwaar wordt overwogen. Het 3'-uiteinde is de essentiële verankeringsplaats omdat het de plaats is waar het polymerase zijn activiteit initieert. Vanuit strategisch oogpunt moet een beslissing worden genomen om degeneratie op dit punt al dan niet toe te staan. De aanwezigheid van degeneratie aan het 3'-uiteinde zorgt waarschijnlijk voor een grotere diversiteit aan te detecteren sequenties. Tegelijkertijd vermindert het echter het aandeel primer dat specifiek is voor een bepaalde sequentie. Daarom hebben we besloten zeer strikt te zijn in het zoeken naar geconserveerde gebieden en de hoeveelheid degeneratie die aan dit doel wordt toegevoegd, te minimaliseren. Als de ingevoerde reeks sequenties voldoende groot is, is het zeer waarschijnlijk dat een gebied dat is geïdentificeerd als geconserveerd onder alle bekende sequenties, eveneens zal worden geconserveerd in elk nieuw lid van de familie.

2. Scoren en Primer-zoekstrategie

De hier gepresenteerde methode kan worden gebruikt beginnend met DNA- of eiwitsequentie-uitlijningen (Figuur 1 (a)). Als de invoer DNA was, werden de sequenties uitgelijnd om één globale gedegenereerde DNA-consensus te verkrijgen. Als de invoer een eiwituitlijning was, wordt elk eiwit van de uitlijning terugvertaald in een gedegenereerde DNA-sequentie. Alle gedegenereerde DNA-sequenties werden gecombineerd in één globale gedegenereerde DNA-consensus. Deze consensussequentie omvat alle vermeende invoersequenties die de oorsprong zouden kunnen zijn van elke eiwitsequentie (Figuur 1(b)). Ook kan de consensussequentie coderen voor aminozuren die niet werden gedetecteerd in de bekende sequenties. Dit is onvermijdelijk gezien het soort degeneratie van de genetische code.


(een)
(B)

Sequentiespecifieke Primer (PCR-SSP) technologie

Analyse van het type humaan leukocytenantigeen (HLA) is een belangrijk onderdeel van immunologisch onderzoek en biofarmaceutisch onderzoek. Traditioneel werden micronucleotoxiciteit (MLCT) en flowcytometrie (FC) veel gebruikt om HLA-typen te detecteren. Er worden ook verschillende moleculair-biologische methoden gebruikt vanwege de beperkingen en tekortkomingen van MLCT en FC, terwijl deze dure optie op de een of andere manier moeilijk te betalen is voor laboratoria met weinig geld. Om wetenschappers te helpen dit dilemma op te lossen, Creatieve Biolabs heeft de sequentie-specifieke primer (PCR-SSP)-technologie gestandaardiseerd en toegepast op HLA-typedetectie, die kan worden bepaald door elektroforetische analyse.

Inleiding tot HLA-weefseltypering

HLA verwijst in het algemeen naar het gehele leukocytenantigeensysteem, dat wordt gecontroleerd door genen op de korte arm van chromosoom 6, en maakt deel uit van het genetische gebied dat bekend staat als het major histocompatibility complex (MHC). De fysiologische rol van HLA is voornamelijk het beheersen van de zelfidentificatie van het immuunsysteem en het weerstaan ​​van de invasie van micro-organismen. Het HLA-gen zorgt voor het nauwkeurige beoordelings- en aanvalsvermogen van de externe bedreigingen van het lichaam dankzij zijn extreme diversiteit. Omdat sommige HLA-antigenen worden herkend op alle lichaamsweefsels (in plaats van alleen op bloedcellen), wordt de identificatie van HLA-antigenen beschreven als "Weefseltypering". Traditioneel zijn HLA-antigenen geclassificeerd en gedefinieerd door serologische technieken die berusten op het verkrijgen van levende lymfocytpreparaten en geschikte antisera om de beschikbaarheid van HLA-antigenen te identificeren. In de afgelopen jaren is DNA-technologie op grote schaal gebruikt en heeft het geleidelijk de serologische technologie vervangen in klinische toepassingen op het gebied van histocompatibiliteit en immunogenetica. Veel laboratoria zijn begonnen met het ontwikkelen en toepassen van verschillende DNA-methoden voor DNA-typering om HLA-allelen te detecteren.

Fig.1 Principe van PCR-SSP.

PCR-SSP voor HLA-weefseltypering

De PCR-SSP-techniek verscheen voor het eerst in het begin van de jaren negentig en was gebaseerd op de amplificatie van refractaire mutatiesystemen (ARMS). Het principe van deze methode is dat een perfect op elkaar afgestemde primer efficiënter is in een PCR-reactie dan een of meer niet-overeenkomende primers. Specificiteit wordt bepaald door het gebruik van sequentiespecifieke primers, waarbij een 3'-single-base mismatch de initiatie van een niet-specifieke reactie remt. Vanwege het ontbreken van 3'- tot 5'-exonuclease-activiteit van Taq-polymerase, hechten zelfs primerparen niet specifiek en worden ze niet efficiënt geamplificeerd. Daarom zal alleen het vereiste allel worden geamplificeerd en vervolgens kan het geamplificeerde product worden gedetecteerd door middel van agarosegelelektroforese.

Creatieve Biolabs heeft PCR-SSP-technologie ontwikkeld om HLA-typeringsdiensten te leveren aan een breed scala aan onderzoekers. Deze methode kost veel minder dan traditionele analytische methoden zoals flowcytometrie, waardoor u op korte termijn experimentele resultaten kunt behalen en uw project efficiënter kunt maken.

Als u vragen heeft over onze vectorontwerpservice, kunt u per e-mail contact met ons opnemen of ons een aanvraag sturen om een ​​complete oplossing te vinden.

Alle vermelde diensten en producten zijn alleen voor onderzoeksdoeleinden. Niet gebruiken in diagnostische of therapeutische toepassingen.


Hoe PCR-primers te ontwerpen

wikiHow is een 'wiki', vergelijkbaar met Wikipedia, wat betekent dat veel van onze artikelen mede zijn geschreven door meerdere auteurs. Om dit artikel te maken, hebben vrijwillige auteurs gewerkt om het in de loop van de tijd te bewerken en te verbeteren.

Dit artikel is 14.826 keer bekeken.

Polymerase Chain Reaction (PCR) is een techniek die verschillende toepassingen heeft op onderzoeks-, medisch en forensisch gebied. Het versterkt het DNA-fragment van belang. Het is ook een gevoelige test voor ziektediagnose en genotypering. De basisingrediënten van een reactiesysteem omvatten een DNA-matrijs, een bufferoplossing, deoxyribonucleosidetrifosfaat (dNTP's), Taq-polymerase en een paar primers (de voorwaartse en de omgekeerde). Goed ontworpen primers verminderen de kosten en tijd die aan experimenten worden besteed. Primer-BLAST is een krachtig hulpmiddel om de primers te vinden die specifiek zijn voor een sjabloon. Deze tool is gratis te gebruiken en vereist geen software-installatie of programmeervaardigheden. Dit artikel laat zien hoe u PCR-primers kunt ontwerpen met een voorbeeld van Primer-BLAST.


MATERIALEN EN METHODES

Berekeningen van DNA-binding en vouwenergie

We gebruiken statistische mechanische modellen van DNA om de bindingsaffiniteit tussen de relevante DNA-dimeren in een PCR-reactie te berekenen (8, 9). Deze modellen gebruiken dynamisch programmeren om de stabiliteit van vele configuraties te evalueren waarin het ene molecuul via ten minste 1 bp aan het andere is gebonden, en ze integreren de stabiliteiten van al deze conformaties in een uiteindelijke stabiliteitsvoorspelling. We gebruiken een reeks thermodynamische parameters (11) die de energetische bijdragen van basenparen en stapelen, evenals interne en haarspeldlussen, aan de thermodynamische stabiliteit van DNA-duplexmoleculen specificeren.

Er is een andere statistische mechanische benadering ontwikkeld om de vouwenergie van een nucleïnezuurmolecuul te voorspellen (10). Er zijn verschillende dynamische programmeeralgoritmen beschikbaar om uiteindelijke gevouwen stabiliteiten af ​​te leiden. We houden geen rekening met het vouwen van conformaties met pseudoknots, zodat we een dynamisch programmeeralgoritme kunnen gebruiken met een rekencomplexiteit van O(N 4 ) in de lengte van de gevouwen reeks in plaats van O(N 7 ) (16) wanneer pseudo-knopen worden beschouwd. We gebruiken dezelfde thermodynamische parameters als voor de bindingsenergieberekeningen.


Primer ontwerp en testen

PCR en sequencing primer ontwerptool. Primer-database en testen.

Ingebouwde primer-database en browser

Versleep uw inleidingen in FASTA-, spreadsheet- of Genbank-formaat. Eenmaal geladen, heb je ze allemaal als primers in je eigen doorzoekbare database. Geneious Prime laat u weten of u al primers heeft die overeenkomen met een nieuwe sequentie.

Elegante ontwerptool voor primers

Ontwerp PCR- en sequencing-primers en hybridisatieprobes, naar elk doelgebied of de volledige sequentie, rechtstreeks op uitlijningen en assemblages in de Geneious Sequence-viewer. Voor, tijdens of na het ontwerpproces extensies aan een primersequentie toevoegen en verwijderen.

Primer specificiteit testen

Wees er zeker van dat uw primers zich slechts op één enkele locatie zullen binden met automatische identificatie van eventuele extra, off-target, bindingsplaatsen die worden gevonden bij het gebruik van Test met opgeslagen primers. Off-target informatie voor het geteste document zal worden toegevoegd aan de nieuwe primer-annotaties.

Test PCR-primers tegen elke sequentie vóór uw bestelling

Geneious Prime zit boordevol functies om u te helpen het meeste uit uw PCR-experimenten te halen.

  • Scherm voor fysieke eigenschappen, haarspelden en primer-dimeren
  • Selecteer alle PCR-producten op een sequentie of twee primers in een paar om het product van die primers te extraheren
  • 5′ primerverlenging – Verleng een primer met een restrictieplaats, polyA-staart of een andere aangepaste sequentie
  • Bereken dynamisch het DNA-smeltpunt voor een geselecteerde regio voor handmatig primerontwerp
Hoe gidsen
Tutorials

Primer Design – Leer hoe u oligonucleotide-primers, primer-paren en primer-paar/probe-combinaties importeert, ontwerpt en test.

TOPO Cloning – Leer hoe u TOPO-klonen kunt simuleren met behulp van TA, Blunt of Directional methoden.

Meer geniale prime-functies

CRISPR – Vind CRISPR-sites, ontwerpgids RNA's en analyseer uw bewerkingsresultaten

Uitlijning - Voer paarsgewijze en meerdere uitlijningen van DNA of eiwit uit met behulp van vertrouwde algoritmen, waaronder MAFFT en ClustalW.

Moleculair klonen - Bekijk plasmide-kaarten, annoteer automatisch vectoren, vind restrictieplaatsen verteren, ligeren en voer Golden Gate-, Gibson- en Gateway-klonen uit.

BLAST / NCBI - Maak verbinding met NCBI en PubMed, verzend sequenties rechtstreeks naar GenBank, BLAST-sequenties en doorzoek uw eigen database.


MATERIALEN EN METHODES

MRPrimer-methode:

De stroom van MRPrimer bestaat uit zeven stappen (Figuur 1). MRPrimer neemt een DNA-sequentiedatabase en een reeks filterbeperkingen als invoer en retourneert vervolgens, in zeven stappen, alle haalbare en geldige primerparen die in de database bestaan. Hieronder lichten we elke stap in detail toe.

Stap 1 (kandidaat-primer generatie): Stap 1 neemt een set DNA-sequenties en extraheert alle mogelijke subsequenties van de lengtes tussen de minimale lengte en de maximale lengte van elke sequentie, als kandidaat-primers. Die lengtes worden door gebruikers gespecificeerd als een van de filterbeperkingen met één primer. Deze stap extraheert ook hun reverse complementaire primers terwijl ze worden gelabeld met 'reverse primers'.

Stap 2 (enkele filtering): Stap 2 past zes filterbeperkingen voor een enkele primer toe op elke kandidaat-primer die uit stap 1 is doorgegeven. De primers die een filterbeperking schenden, worden eruit gefilterd. De beperkingen omvatten smelttemperatuur, GC-gehalte, zelfcomplementariteit, 3′-end zelfcomplementariteit, aaneengesloten residu en Gibbs vrije energie. De lengte van de primer is al gecontroleerd in stap 1. Al deze beperkingen kunnen door gebruikers worden opgegeven bij het starten van het programma. Voor het berekenen van de smelttemperatuur en de waarde van vrije energie hebben we het thermodynamisch model van de naaste buur ( 24) aangenomen, dat een verbeterd model is van het vorige (25) dat in Primer3Plus (9) werd gebruikt.

Stap 3 (5′ kruishybridisatiefiltering): Stap 3 elimineert een kandidaat-primer die hetzelfde is als elke subsequentie van een off-target sequentie aan het 3'-uiteinde en slechts weinig mismatches heeft (maximaal vier mismatches) aan het 5'-uiteinde, en dus zou kunnen kruishybridiseren met de off-target sequentie vanwege de grote gelijkenis daartussen, vooral aan het 3'-uiteinde. Deze stap vereist twee ingangen, Kaart1, wat de uitvoer is van stap 1 (d.w.z. alle mogelijke subreeksen), en Kaart2, wat de uitvoer is van stap 2 (d.w.z. een set kandidaat-primers die alle enkele filterbeperkingen hebben doorstaan). Als een primer van Map1 en een primer van Map2 identiek zijn aan elkaar, behalve aan het 5'-uiteinde, wordt tijdens het uitvoeren van een all-pair join tussen de twee sets de primer van Map2 eruit gefilterd. We presenteren een voorbeeld van deze stap in aanvullende figuur S2.

Stap 4 (algemene kruishybridisatiefiltering): Stap 4 elimineert een kandidaat-primer die vergelijkbaar is met elke subsequentie van een off-target sequentie. Deze stap vereist twee ingangen, Kaart1, wat de uitvoer is van stap 1 (d.w.z. alle mogelijke subreeksen) en Kaart2, wat de uitvoer is van stap 3 (d.w.z. een set kandidaat-primers die zowel de enkele filterbeperkingen als de 5'-kruishybridisatiefilterbeperking hebben doorstaan). We geven het aantal niet-overeenkomende residuen aan als #mismatch. Tijdens het uitvoeren van een all-pair join tussen twee sets, als een primer van Kaart1 en een primer van Kaart2 zijn identiek behalve #mismatch, de primer van Kaart2 wordt eruit gefilterd. Om dit efficiënt te berekenen, splitst deze stap elke primer in een reeks kleinere stukken (zaden genaamd). Volgens de stelling is een rij van lengte m met hoogstens k mismatches moeten een seed bevatten die exact overeenkomt met ten minste ⌊m/(k + 1)⌋ residuen (26-28). Alle primers van Kaart1 en Kaart2 met een gemeenschappelijk zaad worden verzameld via het shuffle-proces van MapReduce (aanvullende figuur S1). Vervolgens controleert deze stap de algemene filterbeperking voor kruishybridisatie op elke groep primers met een gemeenschappelijk zaad. We presenteren een voorbeeld van deze stap in aanvullende figuur S3.

Stap 5 (duplicaat verwijderen): Na stap 4 kunnen er nog steeds vals-positieve primers zijn die de algemene beperking van kruishybridisatiefiltering schenden. In aanvullende figuur S3 passeert primer (d) bijvoorbeeld stap 4 wanneer deze wordt gecontroleerd tegen primer (a). Het moet echter worden uitgefilterd omdat het erg lijkt op de primer (b). Om zo'n primer te elimineren, controleert deze stap elk zaadje van een primer. Bijvoorbeeld, van drie zaden van primer (d) bij de iteratie van #mismatch = 2, schendt het gemeenschappelijke zaad tussen primers (d) en (a) niet de algemene beperking van kruishybridisatiefiltering, terwijl het gemeenschappelijke zaad tussen primers ( d) en (b) het schendt. Dus stap 5 elimineert primer (d). De reeks stappen 4 en 5 wordt herhaaldelijk uitgevoerd totdat de controle van de algemene kruishybridisatiefilterbeperking is voltooid.

Stap 6 (paar filteren): Stap 6 herschikt het resultaat van stap 5 in een reeks groepen primers, waarbij elke groep bestaat uit de primers die zijn geëxtraheerd uit dezelfde DNA-sequentie, met behulp van het shuffle-proces van MapReduce (aanvullende figuur S1). Vervolgens splitst deze stap de kandidaat-primers van elke groep in twee sets, een set voorwaartse primers en een set omgekeerde primers, met behulp van tags die in stap 1 worden behandeld, en voert zelf-join-berekeningen tussen hen uit. Bij self-join-berekening past deze stap vijf filterbeperkingen toe op elk kandidaat-primerpaar. Deze beperkingen omvatten lengteverschil, smelttemperatuurverschil, productgrootte, paarcomplementariteit en 3′-end paarcomplementariteit. Ze kunnen allemaal door gebruikers worden opgegeven bij het starten van het programma.

Stap 7 (rangschikking): De primerparen die uit stap 6 zijn doorgegeven, zijn mogelijk niet even effectief, zelfs als ze aan alle gegeven beperkingen voldoen. De laatste stap van MRPrimer, d.w.z. Stap 7, bepaalt dus hun rangschikking door een strafscore voor elk primerpaar te berekenen. De rangorde wordt bepaald binnen een specifieke doelsequentie(s) en gebruikers kunnen dus gemakkelijk het top-1 primerpaar voor elke doelsequentie kiezen. De berekening van strafscores volgt de methode van Primer3Plus (9), die strafscores van zeven beperkingen optelt voor enkele primers en vijf beperkingen voor primerparen. Over het algemeen heeft de mediaanwaarde voor de beperkingen met een bereik (bijv. smelttemperatuur) de laagste straf. Voor de andere beperkingen (bijv. zelfcomplementariteit) heeft de kleinste waarde, meestal nul, de laagste straf. Elke strafscore voor elke beperking is genormaliseerd tussen 0 en 1. Primerparen met lage scores hebben een hoge rangorde voor de overeenkomstige doelreeks.

Toegang tot MRPrimer

De meest recente MRPrimer-release is beschikbaar op http://MRPrimer.com. De broncode voor MRPrimer is vrij beschikbaar onder de GNU General Public License (GPL) versie 3.0.

Validatie van de volledigheid en rangschikkingsmethode van MRPrimer

Om de volledigheid en superioriteit van MRPrimer in termen van het aantal ontworpen primerparen aan te tonen, vergelijken we de resultaten van MRPrimer met PrimerBank, een van de grootste databases met primers die de afgelopen jaren is gebouwd en bijgewerkt (6, 7, 29, 30). PrimerBank gebruikt de genendatabases van mensen en muizen van het NCBI RefSeq-project (31-33). Er zijn meerdere versies van de RefSeq-database, gespecificeerd door hun releasedatums. Helaas is de versie van de RefSeq-database die voor PrimerBank wordt gebruikt, verouderd en daarom niet meer beschikbaar. Daarom gebruiken we de oudste versie die beschikbaar is voor vergelijking, omdat dit de versie is die het meest lijkt op die van PrimerBank. Die versie (uitgebracht op 7 november 2007) bevat in totaal 22 942 menselijke mRNA-sequenties en in totaal 27 305 muizen-mRNA-sequenties. Voor een eerlijke vergelijking gebruiken we exact dezelfde set filterbeperkingen die werden gebruikt om PrimerBank te construeren (6). Deze beperkingen zijn samengevat in aanvullende tabel S1.

Om de effectiviteit van de rangschikkingsmethode van MRPrimer aan te tonen, hebben we bovendien de gevalideerde primerparen geëxtraheerd die specifiek de olfactorische receptor (OR) -sequenties van de muis dekken van PrimerBank en deze geanalyseerd met behulp van de rangschikkingsmethode van MRPrimer. Onder de 27 305 muis-mRNA-sequenties van de RefSeq-database zijn er 990 muis-OR-genen. We zochten naar de NCBI-gen-ID's van die genen in de PrimerBank (//pga.mgh.harvard.edu/primerbank/index.html) en verzamelden 778 gevalideerde primerparen die 768 muis-OR-genen omvatten. MRPrimer kan ook 772 van de 778 primerparen vinden en dus kunnen we die 772 primerparen rangschikken, die gemeenschappelijk zijn tussen PrimerBank en MRPrimer, volgens de rangschikkingsmethode van MRPrimer. De rangschikkingsresultaten onthulden de rationaliteit van onze rangschikkingsmethode. Zes primerparen werden niet gevonden door MRPrimer omdat de zes sequenties die ze bevatten niet aanwezig zijn in de versie van de RefSeq-database (uitgebracht op 7 november 2007) die voor onze experimenten werd gebruikt.

QPCR-analyse van MRPrimer

Om de kwaliteit van primerparen ontworpen door MRPrimer te valideren, hebben we qPCR-experimenten uitgevoerd met behulp van de muis CCDS-database in plaats van de RefSeq-database (//www.ncbi.nlm.nih.gov/CCDS/CcdsBrowse.cgi). Het biedt een gouden standaard voor coderingsregio-locaties (34, 35). In de CCDS-datasets zijn er momenteel in totaal 29 064 menselijke gen-DNA-sequenties (de laatste update was 29 november 2013) en een totaal van 23 874 muizengen-DNA-sequenties (de laatste update was 7 april 2014). We gebruikten voornamelijk muisgenen voor onze qPCR-analyse.

We selecteerden willekeurig 96 OR-genen en 99 niet-OR-genen (inclusief feromoonreceptoren, G-eiwitten, ionkanalen, signaalmoleculen, enz.). Zo hebben we in totaal 195 qPCR-experimenten uitgevoerd. Voor elk gen hebben we het top-1 primerpaar voor dat gen geselecteerd, volgens de rangschikkingsmethode van MRPrimer. We vatten de voorwaartse en achterwaartse primers samen die automatisch zijn ontworpen en geselecteerd door MRPrimer in aanvullende tabellen S2 en S3. We volgden de MIQE-richtlijnen (36) voor de qPCR-experimenten.

Vergelijkende analyse tussen MRPrimer en PrimerBank

Om de effectiviteit en superioriteit van MRPrimer voor qPCR aan te tonen, hebben we zowel qPCR- als sequencing-analyses uitgevoerd en de resultaten vergeleken met die verkregen met PrimerBank. Omdat de primers van zowel MRPrimer als PrimerBank er gemakkelijk in slaagden om normale doelsequenties te amplificeren, vergeleken we hun prestaties met behulp van 'moeilijke' doelsequenties, d.w.z. OR-genen die veel homologe regio's hebben en daarom vaak falen in qPCR-experimenten (30). OR-genen vormen de grootste multigenfamilie bij zoogdieren (37). Deze genen delen veel homologe regio's, daarom is het moeilijk om geldige primerparen voor hen te ontwerpen (30). Een aantal onderzoeken rapporteerde de expressie van OR's in zowel reuk- als niet-olfactorische weefsels (38, 39). Voor dergelijke onderzoeken is qPCR met behulp van geldige primerparen een effectieve en eenvoudige manier om OR-genen te detecteren (38, 39).

Om de OR-genen van de muis voor te bereiden, zochten we naar de NCBI-gen-ID's van de OR-genen van de muis uit de CCDS-database in PrimerBank en verzamelden we 860 gevalideerde primerparen, die elk een enkel OR-gen versterken. We hebben eerst hun specificiteit gecontroleerd met PrimerBlast. Van de 860 primerparen waren 599 primerparen van hoge kwaliteit (d.w.z. hoge specificiteit). Deze 599 primerparen kwamen 100% overeen met hun beoogde verwachte doelwitgenen en de mogelijkheid om een ​​niet-doelwitgen te matchen was niet meer dan 80%. Van de resterende 261 primerparen waren er 96 100% gematcht met de verwachte doelwitgenen en de mogelijkheid om een ​​off-target gen te matchen was niet meer dan 85%. Deze 695 (599 plus 96) primerparen worden als zeer specifiek voor hun doelgenen beschouwd. Van de resterende primerparen kwamen 75 primerparen voor 95% overeen, en 69 primerparen kwamen voor 90% overeen met zowel doel- als niet-doelgenen. Deze 144 (75 plus 69) primerparen kunnen doelgenen amplificeren samen met genen buiten het doel (d.w.z. verkeerd doel of multi-doelwit). We selecteerden ongeveer 6% van de paren die overeenkomen met de 695 zeer specifieke genen (d.w.z. 40 primerparen) en ongeveer 24% van de paren die overeenkomen met de 144 minder specifieke genen (d.w.z. 34 primerparen). Vervolgens selecteerden we 74 primerparen uit de resultaten van MRPrimer voor dezelfde 74 genen. The selection ratios differed (6 versus 24%) because the 695 genes are relatively easy to amplify, whereas the 144 genes are relatively hard. We also note that the 74 OR genes used for this experiment are distinct from the 96 OR genes in the above experiment furthermore, they represent harder target sequences. We summarize the forward and backward primers for the 74 genes of MRPrimer and PrimerBank used in our experiments (Supplementary Table S4).

To identify amplified samples, we compared the sequences of qPCR amplicons with the expected gene sequences using NCBI BLASTn (http://blast.ncbi.nlm.nih.gov/Blast.cgi) and checked the percent identity between the two sequences. For BLAST analysis, we applied the following criteria, used in a previous study ( 30). If more than 50% of the length of an expected PCR product sequence matches with only the expected target sequence, multiple genes or another gene with 100% identity between the sequences, it is considered to be target-specific, multiple-target of wrong target, respectievelijk. Finally, if a qPCR product sequence does not match with at least 50% of the length of its expected target sequence, it is considered to be a sequencing failure.


Primer Design

Given a DNA sequence, PRIMER adopts the following naming conventions: While the program will be searching for appropriate primers, three subsequent "status" indicators will be showing how much percentage of the search has been done. This is reported both graphically (using red and green combination, changing from left to right by approaching completion) and with digits.

    looking at the dots
    The horizontal grid represents location of the first 5' base of a forward primer in the Plus Strand, with the 5' end on the left side and the 3' end on the right side.

The vertical grid represent the location of the first 5' base of a reverse primer in the Minus Strand, with the 5' end on the bottom side and the 3' end on the top side

Thus each dot in the grid represents a combination of forward and reverse primers.

Therefore, the more distant are the dots from the upper left corner of the graph, the larger is their PCR product.

  1. the primer pair (one reverse and one forward) with the most similar melting temperature (and thus more ideal condition for its hybridization) gets a green color,
  2. while the one with largest difference gets a red color
  3. Any primer pair with intermediate values gets a intermediate colour
  • Start base
  • Sequence
  • Tm (Melting Temperature)
  • GC % (Percentage of G or C)
  • Hairping propensity (maximum number of adjacent bases which self-pair)
  • Self pairing (maximum number of adjacent bases which pair to another primer of the same sequence)
  • Label (containing or omissing the word "REJECTED").
  1. Tm outside range
  2. GC or N outside range
  3. missing required GC clamp
  4. exceeding cross-complementarity
  5. exceeding self-complementarity

Benchmarking

The benchmark used the sample files distributed with Primer0.5. The PPC version of Primer0.5 as available at the www.mit.genome.wi.edu site was crashing on a PowerPC 7200/75 since probably had been compiled on a non PCI-bus architecture. Benchmarking had therefore been accomplished on a binary obtained by rebuilding the Mac version from the original C code. The binary so obtained (using Metrowerks 9.0 ) had been made with maximum optimization speed flags.

The comparison is being performed using all the public available Applet Viewers for Macintosh OS as well as the one available commercially by Metrowerk. Results are shown in Table 1:

In conclusion, the Java implementation of the algorithm described in Primer0.5 is between 3 and 6 times slower then the native C version, with differences largely given by the Java Virtual Machine that interprete the bytecodes.


SnapGene software allows easy planning and visualization of molecular biology procedures, including In-Fusion Cloning.

Takara Bio USA, Inc.
Verenigde Staten/Canada: +1.800.662.2566 &stier Azië-Pacific: +1.650.919.7300 &stier Europa: +33.(0)1.3904.6880 &stier Japan: +81.(0)77.565.6999
UITSLUITEND VOOR ONDERZOEK. NIET VOOR GEBRUIK IN DIAGNOSTISCHE PROCEDURES. &kopie 2021 Takara Bio Inc. Alle rechten voorbehouden. Alle handelsmerken zijn eigendom van Takara Bio Inc. of haar dochteronderneming(en) in de VS en/of andere landen of hun respectievelijke eigenaren. Bepaalde handelsmerken zijn mogelijk niet in alle rechtsgebieden geregistreerd. Aanvullende informatie over producten, intellectueel eigendom en beperkt gebruik is beschikbaar op Takarabio.com.

Takara Bio Europe is lid van de Takara Bio Group, een toonaangevend life sciences bedrijf dat zich inzet voor het verbeteren van de menselijke conditie door middel van biotechnologie. Via onze merken Takara, Clontech en Cellartis is het onze missie om innovatieve tools en diensten van hoge kwaliteit te ontwikkelen om ontdekking te versnellen.