Informatie

Wat betekenen de letters 'p' en 'c' in mutatiebeschrijvingen?


Voorbeeld:

NM_000525.3(KCNJ11):C. 67A>G ( P. Lys23Glu) EN Permanente neonatale diabetes mellitus

Staat "p" voor "polymorfisme"?

Waar staat de letter "c" voor?


Volgens de HGVS-richtlijnen moet een letterprefix worden gebruikt om de gebruikte referentievolgorde aan te geven. Geaccepteerde voorvoegsels zijn:

  • "G." voor een genomische referentiesequentie
  • "m." voor een mitochondriale referentiesequentie
  • "C." voor een coderende DNA-referentiesequentie
  • "N." voor een niet-coderende DNA-referentiesequentie
  • "R." voor een RNA-referentiesequentie (transcript)
  • "P." voor een eiwitreferentiesequentie

Wat betekenen de letters 'p' en 'c' in mutatiebeschrijvingen? - Biologie

Subtotaal ( Artikelen) .00

Heb je een promotiecode? Vul het in tijdens het afrekenen!

De meest populaire accessoires voor uw nieuwe telescoop!

Begin hier om de perfecte te vinden
telescoop voor jou!

NIEUW: Nature DX ED verrekijker

De bekroonde Nature DX-verrekijker van Celestron krijgt een belangrijke upgrade met de toevoeging van ED-objectieven.

NIEUW: Elements ThermoTank 3

Onderweg, op het werkterrein, in de klas of gewoon ontspannen thuis - de Celestron Elements ThermoTank 3 houdt je handen warm.

NIEUW: Elements ThermoTorch 5

Dit robuuste 3-in-1-apparaat heeft een echte tactische zaklamp met 3 standen, een handwarmer en een draagbare powerbank om uw persoonlijke elektronica onderweg op te laden.


Het Coronavirus-genoom

Het coronavirus is een olieachtig membraan vol met genetische instructies om miljoenen kopieën van zichzelf te maken. De instructies zijn gecodeerd in 30.000 "letters" van RNA - a , c , g en u - die de geïnfecteerde cel leest en vertaalt in vele soorten viruseiwitten.

RNA-instructies om het ORF1a-eiwit te maken

Begin van het coronavirus-genoom

Begin van het coronavirus-genoom


Wat is een MTHFR-mutatie?

Methyleentetrahydrofolaatreductase, of MTHFR, is een enzym dat het aminozuur homocysteïne afbreekt. Het MTHFR-gen dat voor dit enzym codeert, kan muteren, wat het vermogen van het enzym om normaal te functioneren kan verstoren of het volledig kan inactiveren.

Mensen hebben er twee MTHFR genen, die er één van elk van hun ouders erven. Mutaties kunnen een (heterozygoot) of beide (homozygoot) van deze genen aantasten.

Er zijn twee veelvoorkomende typen, of varianten, van MTHFR mutatie: C677T en A1298C.

mutaties in MTHFR genen komen voor bij ongeveer 25% van de mensen van Spaanse afkomst en 10-15% van de Noord-Amerikaanse blanken.

Deze mutaties leiden in zeldzame gevallen tot hoge niveaus van homocysteïne in het bloed, wat kan bijdragen aan tal van gezondheidsproblemen, zoals:

In dit artikel kijken we naar MTHFR mutaties in meer detail, inclusief gerelateerde gezondheidsproblemen, diagnose en behandelingsopties. We bespreken ook hoe MTHFR mutaties kunnen de zwangerschap beïnvloeden.

Delen op Pinterest Een arts kan de medische geschiedenis van een persoon onderzoeken bij het diagnosticeren van een MTHFR-mutatie.

Mutaties in de MTHFR gen kan het vermogen van het lichaam om aminozuren te verwerken, namelijk homocysteïne, beïnvloeden, wat kan leiden tot nadelige gezondheidsresultaten.

Aandoeningen die onderzoekers hebben geassocieerd met MTHFR genmutaties zijn onder meer:

    , de term voor abnormaal hoge niveaus van homocysteïne in het bloed of de urine , een neurologische aandoening die de coördinatie beïnvloedt
  • perifere neuropathie, een neurologische aandoening die de zenuwen beschadigt, een bij de geboorte aanwezige aandoening waarbij het hoofd kleiner is dan normaal, een abnormale kromming van de wervelkolom, wat betekent dat een persoon een gebrek aan gezonde rode bloedcellen heeft
  • hart- en vaatziekten, zoals bloedstolsels, beroertes en hartaanvallen
  • geestelijke gezondheids- en gedragsstoornissen, zoals depressie en aandachtstekortstoornis met hyperactiviteit (ADHD)

Symptomen variëren zowel tussen individuen als afhankelijk van het type mutatie. Mensen weten meestal niet dat ze een MTHFR mutatie tenzij ze ernstige symptomen ervaren of genetische tests ondergaan.

Een of twee hebben MTHFR mutaties kunnen de homocysteïnespiegels in het bloed licht verhogen. Deze aandoening wordt homocystinemie genoemd.

Homocysteïne is een aminozuur dat het lichaam produceert door voedingseiwitten af ​​te breken. Hoge niveaus van homocysteïne kunnen bloedvaten beschadigen en tot bloedstolsels leiden. Mensen met een hoog homocysteïnegehalte hebben meestal een laag vitamine B12-gehalte.


Chromosoomherschikkingen in neurospora en andere filamenteuze schimmels

David D. Perkins, in Advances in Genetics, 1997

Achtergrond van herschikkingen in neurospora

Cytogenetica van schimmels werd ontwikkeld door Barbara McClintock in 1944 tijdens een bezoek van 10 weken aan Stanford University op uitnodiging van G.W. Beadle (McClintock, 1945). Eerder, toen McClintock en Beadle beide studenten aan Cornell waren, had ze een revolutie teweeggebracht in de maïscytogenetica door Bellings (1927) squashtechniek te gebruiken om microsporocyten voor te bereiden voor onderzoek, een methode die informatiever en handiger is dan de traditionele inbedding en coupe. Ze paste de methode aan voor: neurospora asci en slaagde erin aan te tonen dat de zeven neurospora chromosomen konden worden onderscheiden door hun grootte en morfologie, hoewel (zoals we nu weten) hun DNA-gehalte twee ordes van grootte kleiner is dan dat van maïs.

In haar eerste neurospora studie beschreef McClintock het karyotype bij pachytene en bij postmeiotische metafase en toonde aan dat meiose in wezen hetzelfde is als bij planten en dieren. Ze onderzocht ook drie vermeende wederzijdse translocaties, identificeerde profase I quadrivalenten en associeerde segregatie in de structurele heterozygoten met patronen van ascospore-abortus in de lineaire asci. In de jaren die volgden, werden cytologische en genetische studies van neurospora translocaties werden uitgebreid door haar studenten Singleton (1948) en St. Lawrence (1953), en door Barry (1960b, 1967) en Phillips (1967). Voor een evaluatie van het werk van McClintock met: neurospora, zie Perkins (1992a).

Herschikkingen die in de vroegste werden gebruikt neurospora studies werden gedetecteerd vanwege onverwachte genetische verbanden. Sindsdien zijn herschikkingen echter gewoonlijk als afwijkend erkend omdat een fractie van de ascosporen van kruisingen van Herschikking × normaal zijn ongepigmenteerd ("wit" genoemd), in tegenstelling tot ascosporen van structureel homozygote kruisen, die bijna allemaal zwart zijn. Het falen van pigmentatie is het gevolg van de tekortkomingen die worden gegenereerd door meiotische recombinatie. Deze leiden tot stopzetting van de rijping en vroege dood van elke ascospore die een deficiënt genoom ontvangt. Niet alleen wordt heterozygotie voor een herschikking visueel gesignaleerd door de ongepigmenteerde ascosporen, maar ook komen gepigmenteerde en ongepigmenteerde sporen voor in patronen en frequenties die kenmerkend zijn voor verschillende soorten aberraties.

Ascospore-abortuspatronen kunnen worden gezien in lineaire asci wanneer perithecia wordt geopend, dit was de methode die door McClintock werd gebruikt. Chromosoomherschikkingen kunnen ook worden gedetecteerd door de ascosporen te inspecteren die zijn geschoten uit rijpende perithecia. Sporen worden uitgeworpen als ongeordende groepen van acht die afkomstig zijn van individuele asci. Het type herschikking kan gewoonlijk worden afgeleid uit de relatieve frequenties van ongeordende asci met verschillende aantallen ongepigmenteerde, geaborteerde ascosporen (Perkins, 1966, 1974). Honderden herschikkingen zijn geïdentificeerd in neurospora deze aanpak gebruiken. Deze zijn genetisch bevestigd en hun breekpunten zijn in kaart gebracht.

De neurospora herschikkingen zijn veel gebruikt.

Koppelingsgroepen en genen toewijzen aan cytologisch te onderscheiden chromosomen en chromosoomsegmenten (St. Lawrence, 1953 Phillips, 1967 Barry, 1967 Perkins en Barry, 1977).

Bestudering van de polariteit van intragene recombinatie (Murray, 1968).

Aantonen dat een recombinator alleen werkt in cis (Catcheside en Angel, 1974).

Gebruik van stammen met meerdere translocaties om de efficiëntie van koppelingsdetectie te verhogen ( Perkins et al., 1969 ).

Een balancer maken en deze gebruiken om stammen uit de natuur te onderzoeken op de aanwezigheid van recessieve, dodelijke of schadelijke allelen in de seksuele fase (Leslie, 1985).

Het produceren van doublures en tekortkomingen van gedefinieerde inhoud (zie Perkins, 1974 Perkins en Barry, 1977). (De termen "duplicatie" of "segmentale duplicatie" zullen worden gebruikt om ofwel een chromosoomsegment aan te duiden dat aanwezig is als twee niet-tandemkopieën of een stam die een dergelijk segment bevat. Een duplicatiestam kan ook een "gedeeltelijke diploïde" worden genoemd.)

Met behulp van duplicatie-genererende herschikkingen om genen, centromeren en koppelingsgroepuiteinden in kaart te brengen (Perkins, 1974, 1986 Perkins en Barry, 1977 voor andere voorbeelden, zie Davis, 1979 Metzenberg et al., 1985 ). (tzijn precieze methode is analoog aan het in kaart brengen van deletie in faag. De basis voor het in kaart brengen op dubbele dekking wordt weergegeven in figuur 1 .)

Figuur 1 . Een voorbeeld van hoe genen en breekpunten in kaart worden gebracht door middel van duplicatie. Genotypen van levensvatbaar nageslacht in asci van een kruising van insertietranslocatie (zwarte centromeren) × normaal (witte centromeren), waarbij de ouder met de normale sequentie één recessieve marker (d) binnen het getransloceerde segment en een andere recessieve marker (b) buiten het segment bevatte . Het getransloceerde segment wordt ongepaard getoond met zijn nonnally gepositioneerde homoloog. De bovenste twee diagrammen tonen de gevolgen van ouderlijke ditype- en niet-ouderlijke ditype-segregatie van centromeren en breekpunten, zonder overschrijding. Oversteken in een van de interstitiële gebieden tussen centromeren en breekpunten resulteert in tetratype asci, waarvan de samenstelling wordt weergegeven in de onderste twee diagrammen. Duplicatie-nakomelingen zijn D/d heterozygoten, fenotypisch D+. Deficiënte producten zijn onmisbaar. De dominante: recessieve fenotypische verhouding onder levensvatbare nakomelingen is 1:2 voor b, die niet wordt gedekt, en 2:1 voor d, die wel wordt gedekt. De verwachtingen zouden vergelijkbaar zijn voor quasiterminale translocaties. Deze verhoudingen zijn van toepassing op markers die niet recombineren met een translocatiebreekpunt. Oversteken tussen b en de translocatie zou de B:b-verhouding in de richting van gelijkheid verschuiven. Voor een insertie of quasiterminale translocatie met 60% tetratypes, zouden de verwachte ongeordende ascustypes 20% 8B:0 W, 60% 6B:2 W, 20% 4B:4 W, 0% 2B:6 W en 0% 0B zijn. :8 W.

Duplicaties gebruiken om genen te identificeren die vegetatieve incompatibiliteit bepalen (Newmeyer en Taylor, 1967 Perkins, 1975 Perkins et al., 1993a Mylyk, 1975, 1976 Arganoza et al., 1994 Glas en Kuldau, 1992 Leslie, 1995). (Indien NS en NS in figuur 1 waren allelen op zo'n locus, heterozygotie in de duplicatie-nakomelingen zou worden gesignaleerd door een karakteristiek abnormaal fenotype.)

Bepaling van dominantie en doseringseffecten in onderzoeken naar regulering (Metzenberg et al., 1974 Metzenberg en Chia, 1979). Aantonen van verschillen in dominantie tussen seksuele en vegetatieve fasen ( turner, 1977).

Het verduidelijken van de basis van transgene positie-effecten die leiden tot activator-onafhankelijke expressie van positief gereguleerde genen (Versaw en Metzenberg, 1996).

Zoeken naar een variatie-type positie-effect (Johnson, 1979).

Bepaling van het effect van mutageengevoelige mutanten op chromosoomstabiliteit (Schroeder, 1970, 1986 Newmeyer en Galeazzi, 1977, 1978).

Bepaling van de relatie van centromeer-breekpuntafstand tot niet-disjunctie van translocatie-quadrivalenten (Perkins en Raju, 1995).

Bestudering van de nucleolus-organizer (NOR), de locatie op de genetische kaart, recombinatie binnen de NOR en tussen de NOR en verplaatste blokken van rDNA, veranderingen in het aantal rDNA-herhalingen, vatbaarheid van rDNA voor breuk en het afdekken van breuken met nieuwe telomeren ( Phillips, 1967 Barry en Perkins, 1969 Perkins et al., 1980, 1984, 1986, 1995a Rodland en Russell, 1982, 1983 Russell en Rodland, 1986 Butler en Metzenberg, 1989, 1990 Butler, 1992).

Bepaling van de 3'-5'-oriëntatie van genen waarvan de sequentie is bepaald ten opzichte van koppelingskaarten ( Paluh et al., 1990 Schmidhauser et al., 1990 ).

Het uitgangspunt voor een chromosoomwandeling bieden en de richting bepalen (Smith en Glass, 1996).

Bepaling van nucleotidesequenties over breekpuntovergangen (Asch et al., 1992 Cambareri en Kinsey, 1997, zie Perkins, 1995).

Identificatie van chromosomale DNA's gescheiden door gepulseerde veldgelelektroforese (Orbach et al., 1988 ).

Het verstrekken van afgeknotte chromosomen waarmee regio-specifieke bibliotheken kunnen worden voorbereid voor het construeren van contigs en kloneringsgenen van belang ( Ballario et al., 1989, 1996 ).

Aantonen van synaptische aanpassing bij heterozygote inversies (Bojko, 1990).

Bestudering van premeiotische herhaling geïnduceerde puntmutatie (RIP) van genen in segmentale duplicaties ( Perkins et al., 1997 ).

Het verkrijgen van heterokaryons met complementaire duplicaties en tekortkomingen in de samenstellende kernen (D.D. Perkins, niet gepubliceerd).

Methoden en vroege resultaten met herschikkingen werden beschreven door Perkins (1966, 1974) en werden in een bredere cytogenetische context beoordeeld door Perkins en Barry (1977). Een compilatie van informatie over 167 neurospora herschikkingen werd toegevoegd aan de 1977 herziening. Op dat moment waren er slechts een handvol chromosoomherschikkingen bekend in andere eukaryote micro-organismen dan Neurospora crassa en Aspergillus nidulans.


Discussie

Het aantal beschikbare genoom- en eiwitsequenties is de afgelopen tien jaar enorm toegenomen als gevolg van de vooruitgang in sequentietechnologieën van de volgende generatie. In deze schat aan nieuwe gegevens hebben we een groot aantal voorheen ongeziene codeervarianten van onbekende functionele betekenis ontdekt. Om ons te helpen bij het analyseren van deze nieuwe gegevens, zijn computationele voorspellers ontwikkeld, maar de training en evaluatie van deze voorspellers lijden vaak aan vooroordelen. DMS-experimenten bieden een ideale benchmark voor het testen van voorspellers, zodat geen van de trainingsgegevens wordt meegenomen in de evaluatie. De beschikbaarheid van een groot aantal van dergelijke experimentele DMS-datasets heeft deze studie vergemakkelijkt.

We zijn ons ervan bewust dat tal van technische en computationele factoren van invloed kunnen zijn op de kwaliteit van gegevens uit DMS-onderzoeken. Deze kunnen voortkomen uit een experimentele procedure en dus worden beoordeeld door middel van reproduceerbaarheid in biologische replica's, of meetonzekerheid beoordeeld door technische replica's. De grootste bron van fouten van DMS wordt aangetroffen in de sequencing-fase, waar sequencing van de volgende generatie doorgaans tussen 1/100 en 1/1.000 basen onjuist leest (Ma et al, 2019 ). Veel groepen passen een streepjescodestrategie toe om dit probleem aan te pakken, zodat een unieke kunstmatige sequentie op meerdere basen aan elke variant wordt gekoppeld. Bovendien worden uitlezingen onder een bepaalde kwaliteitsdrempel verworpen en worden varianten die aanwezig zijn met een snelheid onder een bepaalde detectiedrempel verwijderd. Verschillende groepen bieden zowel hun volledige fitnessscores als een filter voor resultaten van hoge kwaliteit (Starita et al, 2015 Migell et al, 2018 ). In deze gevallen vinden we dat de gefilterde resultaten van hoge kwaliteit een hogere gemiddelde correlatie hebben met de VEP's (tabellen EV12 en EV13), evenals een superieure voorspellende kracht voor ziektemutaties (Fig 3).

Van de 46 verschillende voorspellers die in dit onderzoek zijn geëvalueerd, vinden we dat een enkel programma, DeepSequence, zich duidelijk onderscheidt van alle andere, zowel qua prestaties als qua methodologie. DeepSequence vertoonde de sterkste correlaties met de DMS-gegevens bij mensen en bacteriën en was de beste computationele voorspeller van mutaties bij menselijke ziekten. De meeste machine learning-methoden maken gebruik van verschillende functies, vaak inclusief een zekere mate van sequentiebehoud op de betreffende plaats, en leren vervolgens de patronen van deze functies die ertoe leiden dat een mutatie wordt geclassificeerd als schadelijk of goedaardig. DeepSequence maakt gebruik van diepe generatieve modellen om factoren uit de hele reeks in één keer te integreren, in plaats van slechts één of enkele sites. Dit type probleem is grotendeels onhandelbaar voor traditionele machine learning, gezien het aantal betrokken parameters, maar DeepSequence overwint dit door de latente factoren te leren die ten grondslag liggen aan de eiwitsequentie. Deze benadering levert ook voordelen op in termen van de vooroordelen die inherent zijn aan gesuperviseerde methoden. We kunnen verwachten dat een machine learning-methode die wordt geconfronteerd met een voorbeeld waarop hij is getraind, deze meestal correct classificeert, wat een niet-representatieve beoordeling van de nauwkeurigheid oplevert. DeepSequence maakt gebruik van meerdere sequentie-uitlijningen en ziet nooit gelabelde eiwitgegevens, wat resulteert in scores die niet vertekend zijn door trainingsvoorbeelden. Dit wil echter niet zeggen dat DeepSequence een volledig onbevooroordeelde methode is. De scores die worden gegenereerd, hangen volledig af van de database waaruit meerdere sequentie-uitlijningen worden getrokken. Als bepaalde sequenties ondervertegenwoordigd zijn, zullen de voorspellingen daarvoor van lagere kwaliteit zijn, zoals de resultaten die we waarnemen voor virale eiwitten uit de UniRef100-database. Het succes dat DeepSequence heeft behaald bij het voorspellen van mutatie-effecten voor menselijke eiwitten, toont aan dat diepe generatieve modellen op dit gebied wellicht de weg vooruit zijn, waardoor de afhankelijkheid van gelabelde datasets voor het maken van voorspellingen wordt weggenomen.

Een van de VEP's die we hebben beoordeeld, Envision, is getraind met een gesuperviseerde leerbenadering met behulp van DMS-gegevens in plaats van gelabelde pathogene en goedaardige varianten. Deze methode gebruikt een aantal van dezelfde DMS-sets die we in deze analyse voor training hebben gebruikt (BRCA1(a), HSP82, UBI4(a en b), PAB1 en bla(a)). De rangschikking van deze methode in tabel EV7 is dus vrijwel zeker onderhevig aan opleidingsbias. Het is echter interessant dat Envision ondanks dit voordeel slechts matige algemene prestaties levert voor menselijke DMS-gegevenssets (hoewel het wel op de eerste plaats staat voor TPK1). In termen van het voorspellen van pathogene missense-mutaties, presteert Envision goed voor BRCA1 op de derde plaats van de VEP's en P53, op de vierde plaats, maar de prestaties zijn onopvallend voor de andere eiwitten. Met name, hoewel Envision niet was getraind op een P53-dataset, werd het geëvalueerd met behulp van een (hoewel niet dezelfde DMS-dataset die in dit onderzoek werd gebruikt). Hoewel de benadering die door Envision wordt gebruikt innovatief is, heeft het beoordelen van de prestaties met DMS dezelfde kanttekeningen als het beoordelen van de prestaties van andere onder toezicht staande VEP's met behulp van pathogene-mutatiedatabases.Het is dus opmerkelijk dat, ondanks dit voordeel, Envision slechts bescheiden prestaties liet zien ten opzichte van de DMS-gegevens.

De meeste voorspellers, onder toezicht of anderszins, ondergaan hyperparameteroptimalisatie, een proces om interne variabelen zoals leersnelheid, netwerkarchitectuur of regularisatie aan te passen om betere prestaties te verkrijgen. Dit proces houdt steevast in dat de prestaties van de voorspeller herhaaldelijk worden getoetst aan een bepaalde "test"-dataset en kan een andere bron van vooringenomenheid introduceren, zelfs in niet-gecontroleerde methoden. Ons gebruik van DMS-gegevens om deze methoden te beoordelen, zou de impact van dit effect voor alle methoden aanzienlijk moeten verminderen, behalve Envision en mogelijk DeepSequence, die mogelijk zijn geoptimaliseerd tegen DMS-gegevens die in de oorspronkelijke evaluatie werden gebruikt. Envision presteert hoe dan ook niet uitzonderlijk, en we laten zien dat DeepSequence nog steeds goed presteert wanneer het wordt beoordeeld op basis van gegevens die het absoluut niet heeft gezien (tabel EV9).

Bepaalde DMS-experimenten lijken uitstekende prestaties te leveren bij het identificeren van ziektemutaties. Het is interessant om de prestaties met betrekking tot de gebruikte experimentele fenotypes te vergelijken, aangezien het nut van een experimenteel fenotype voor het identificeren van pathogene mutaties gerelateerd moet zijn aan het mechanisme waarmee mutaties ziekte veroorzaken. We merken op dat die DMS-experimenten op basis van competitieve groeiassays bijzonder goed lijken te presteren, waarbij ze boven alle computationele voorspellers staan ​​voor drie van de vier eiwitten waar ze beschikbaar zijn. Voor BRCA1, waar DMS-gegevenssets zijn gebaseerd op drie verschillende experimentele fenotypes, is de op groeisnelheid gebaseerde test (Findlay et al, 2018 ) presteert veel beter dan die op basis van gist-twee-hybride of E3-ubiquitine-ligase-activiteit (Starita et al, 2015 ). De groeisnelheid is waarschijnlijk een zeer algemeen experimenteel fenotype dat elk functieverlies op moleculair niveau weerspiegelt. Als sommige van de pathogene BRCA1-mutaties daarentegen werken door een ander mechanisme dan verstoring van de interactie met specifieke bindingspartners (BARD1) of het verstoren van E3-activiteit, zou dit de ondermaatse prestatie van de DMS-gegevens op basis van deze alternatieve fenotypes kunnen verklaren. Interessant is echter dat de HRAS DMS-gegevens, die ook superieur zijn aan alle computationele voorspellers, zijn gebaseerd op een twee-hybride sonde van de interactie met RasGAP (Bandaru et al, 2017), wat suggereert dat verstoring van deze interactie een afspiegeling is van de moleculaire mechanismen die aan de ziekte ten grondslag liggen.

PTEN is ook opmerkelijk, omdat het ook verschillende DMS-gegevenssets beschikbaar heeft op basis van verschillende experimentele fenotypen. Het scherm voor de PTEN(b)-gegevensset beoordeelt de verstoring van een kunstmatig gencircuit in gist, waarbij in wezen de fosfatase-activiteit wordt onderzocht. Deze dataset is superieur aan alle VEP's op vier na, wat suggereert dat het een redelijke afspiegeling is van moleculaire ziektemechanismen. Daarentegen meet het fenotypische scherm voor PTEN (a) de eiwitovervloed in de cel door fluorescentie van EGFP gebonden aan het eiwit (Matreyek et al, 2018 ). Deze techniek, VAMP-seq genaamd, identificeert thermodynamisch onstabiele varianten, maar dit kan mogelijk geen ziektemechanismen vastleggen die optreden door interactieverstoring en verlies of winst van functie die geen verband houdt met destabilisatie. In deze studie werd inderdaad opgemerkt dat dominant-negatieve varianten niet significant verschilden van wildtype, in overeenstemming met onze eerdere observatie dat dominant-negatieve mutaties de neiging hebben om zeer mild te zijn op het structurele eiwitniveau (McEntagart et al, 2016 ). Er moet dus grote zorg worden besteed bij het selecteren van een experimenteel fenotype. Bij afwezigheid van een betere fenotypische test die specifiek gerelateerd is aan een bekend ziektemechanisme, kunnen experimenten op basis van groei de meest algemene manier zijn om verlies van eiwitfunctie te onderzoeken, en dus de meest bruikbare voor het voorspellen van ziekte.

Onze resultaten bij het analyseren van het voorspellend vermogen van DMS-datasets vatten grotendeels de resultaten samen die in de oorspronkelijke onderzoeken werden gepresenteerd. De CALM1-gegevensset (Weile et al, 2017) naar verluidt superieure precisie-recall-prestaties hebben dan PolyPhen-2 en PROVEAN, die we ook vinden (voor de onbewerkte scores in plaats van de omgedraaide scores). De TPK1-gegevensset (Weile et al, 2017) maakte volledige scheiding van de neutrale en ziekte-allelen mogelijk, net als PolyPhen-2 en PROVEAN, maar alleen na extra filtering op recessieve ziekte-allelen, wat we niet hebben uitgevoerd. De BRCA1(a) dataset (Starita et al, 2015 ) wordt door de auteurs gebruikt om een ​​model te trainen om homologie-directe DNA-reparatie-redding te voorspellen, maar voorspellingen worden voornamelijk gedaan buiten het gebied van DMS-dekking die we niet kunnen beoordelen. BRCA1(b) (Findlay et al, 2018) wordt door de auteurs gerapporteerd om pathogene en goedaardige mutaties in ClinVar bijna perfect te scheiden, een resultaat dat we ook in onze analyse zien. De PTEN(a) (Matreyek et al, 2018 ) wordt vermeld dat meer dan 90% van de pathogene PTEN-varianten worden geïdentificeerd, hoewel er geen fout-positief percentage wordt gegeven omdat er geen PTEN-varianten officieel als goedaardig werden geclassificeerd. Nogmaals, onze resultaten zijn vergelijkbaar, gezien de hoge precisie-recall AUC van de PTEN (a) dataset, maar de aanzienlijk lager gerangschikte ROC AUC geeft een significant fout-positief percentage aan. Ten slotte hebben de PTEN(b)-auteurs (Mighel et al, 2018) hanteerde een vergelijkbare benadering als ons, met behulp van gnomAD-varianten als vervanging voor goedaardige vervangingen. Hun resultaten geven aan dat hun gegevens een superieure positief voorspellende waarde hebben dan PROVEAN, SIFT en PolyPhen-2 die we ook vinden.

De twee meest gebruikte VEP's zijn waarschijnlijk PolyPhen-2 en SIFT, die beide nog steeds zeer veel worden gebruikt bij het prioriteren van varianten. Geen van beide vertoonde uitzonderlijke prestaties in deze studie, waarbij ze op de 14e en 25e plaats stonden ten opzichte van de menselijke DMS-gegevens (hoewel SIFT4G, een op genomische instandhouding gebaseerde implementatie van het SIFT-algoritme (Vaser et al, 2016 ) op de 9e plaats). Daarom raden we andere VEP's aan op basis van onze analyses. Helaas is DeepSequence erg rekenintensief en kan het voor een typische eindgebruiker behoorlijk moeilijk zijn om te gebruiken. Het heeft ook geen gedefinieerde ziektedrempels, deze zouden per eiwit moeten worden beoordeeld, waarschijnlijk door analyse van vermoedelijk goedaardige (bijv. GnomAD) varianten. We benadrukken daarom SNAP2, DEOGEN2, SNPs&GO en SuSPect, die ook goed presteerden ten opzichte van de DMS-datasets, en gebruiksvriendelijke webinterfaces hebben. Verder raden we REVEL aan - hoewel het geen webinterface heeft, is het vooraf berekend voor alle menselijke chromosomen en is het online beschikbaar om te downloaden. We stellen voor dat deze methoden goede keuzes zouden maken voor routinematige prioritering van varianten. Belangrijk is echter dat ze allemaal grote variatie vertoonden in hun prestaties tussen verschillende eiwitten, wat suggereert dat men nog steeds niet te veel moet vertrouwen op de resultaten van een enkele voorspeller.

Hoewel algemeen wordt aangenomen dat evolutionair behoud de meest voorspellende functie is die wordt gebruikt bij het voorspellen van varianteffecten, integreren sommige VEP's ook functies die zijn afgeleid van experimenteel bepaalde eiwitstructuren (PolyPhen-2, S3D-PROF, SNP&GOs3D, DEOGEN2 en MPC). Het is interessant dat de opname van structurele eiwitmodellen niet bijzonder nuttig leek voor de VEP's. Omdat ziektemechanismen in principe vaak kunnen worden verklaard door structurele effecten van eiwitten (Steward et al, 2003) zou men kunnen verwachten dat de eiwitstructuur nuttig zou zijn. Het kan zijn dat de waarde van evolutionaire informatie eenvoudigweg elke bijdrage van het opnemen van structuur in de schaduw stelt, dat wil zeggen dat als een mutatie op structureel niveau schadelijk is, dit waarschijnlijk wordt weerspiegeld in de evolutionaire instandhouding van dat residu. Bovendien zijn veel pathogene mutaties niet erg schadelijk op eiwitstructuurniveau, bijvoorbeeld die geassocieerd met een dominant-negatief effect in eiwitcomplexen (Bergendahl et al, 2019) of die van invloed zijn op de bindingsspecificiteit van transcriptiefactoren (Williamson et al, 2019 ). Het is mogelijk dat toekomstige strategieën die rekening houden met de diverse moleculaire mechanismen die ten grondslag liggen aan menselijke genetische ziekten en de unieke structurele eigenschappen van individuele eiwitten, beter gebruik kunnen maken van de enorme hoeveelheid structurele eiwitgegevens die nu beschikbaar zijn.

De waarde van DMS-gegevens voor het direct identificeren van pathogene mutaties is bijzonder opwindend, gebaseerd op de resultaten die we hier hebben waargenomen. Gezien de juiste keuze van het experimentele fenotype, zijn DMS-experimenten waarschijnlijk beter dan (of op zijn minst concurrerend met) de beste computationele VEP's. De toepasbaarheid van DMS-gegevens voor directe prioritering van varianten wordt momenteel beperkt door de kleine fractie van menselijke eiwitresiduen waarvoor DMS-experimenten zijn uitgevoerd. In de komende jaren, naarmate meer eiwitten worden bestudeerd en experimentele strategieën worden verbeterd, verwachten we dat het gebruik van dergelijke gegevens voor de identificatie van schadelijke varianten routine zal worden.


Wat bedoelde Erwin? De fysica van informatie van de materialen genomica van aperiodische kristallen en water tot moleculaire informatiekatalysatoren en leven

Erwin Schrödinger schreef op beroemde en vooruitziende wijze het voertuig dat de erfelijke informatie die ten grondslag ligt aan het leven doorgeeft, toe aan een 'aperiodiek kristal'. We vergelijken en contrasteren dit, waarvan pas later werd ontdekt dat het is opgeslagen in het lineaire biomolecuul-DNA, met de informatiedragende, gelaagde quasi-eendimensionale materialen die zijn onderzocht door het opkomende veld van chaotische kristallografie. Ondanks verschillen in functionaliteit, vangen dezelfde informatiematen structuur en nieuwheid in beide op, wat een intieme samenhang suggereert tussen het informatiekarakter van biotische en abiotische materie - een breed toepasbare fysica van informatie. We bekijken gelaagde vaste stoffen en beschouwen drie voorbeelden van hoe informatie- en rekentheoretische technieken worden toegepast om hun structuur te begrijpen. In het bijzonder (i) bespreken we recente pogingen om nieuwe soorten informatiemaatregelen toe te passen om ongeordende kristallen te kwantificeren, (ii) bespreken we de structuur van ijs I in informatietheoretische termen en (iii) we vertellen over recente onderzoeken naar de structuur van tris( bicyclo[2.1.1]hexeno)benzeen, waaruit blijkt hoe een informatietheoretische analyse extra inzicht geeft in de structuur ervan. Vervolgens illustreren we een nieuwe tweede wet van de thermodynamica die informatieverwerking in actieve laagdimensionale materialen beschrijft, waarbij we Maxwell's Demon beoordelen en een nieuwe klasse van moleculaire apparaten die fungeren als informatiekatalysatoren. Ten slotte besluiten we door te speculeren over hoe deze ideeën uit de informatiemateriaalwetenschap de biologie kunnen beïnvloeden.

1. Inleiding

Om rekening te houden met de 'speciale eigenschappen' van het leven - b.v. beweging, stofwisseling, voortplanting, ontwikkeling - de heersende wijsheid vanaf de tijd van Aristoteles tot in de negentiende eeuw was dat organische stof op een of andere fundamentele manier verschilde van anorganische stof. Terwijl dit begrip, genaamd vitalisme, lijkt misschien vreemd voor wetenschappers van de eenentwintigste eeuw, maar het bleef de scepter zwaaien totdat de chemicus Friedrich Wöhler aantoonde dat, onverwachts, een bekende organische verbinding, ureum, kunstmatig kon worden gesynthetiseerd uit cyaanzuur en ammoniak [1]. Dit fabricageproces, hoewel anders dan dat gebruikt in biologische systemen, diende niettemin als een belangrijke aanwijzing dat de kloof tussen levende en niet-levende materie niet absoluut was. Door abiotische processen konden stoffen tot dusver alleen in biologisch afgeleide materialen worden aangetroffen. Bovendien zien we dat - en niet voor de laatste keer - resultaten die zijn verkregen uit de ene discipline, de scheikunde, belangrijke gevolgen hebben gehad in een andere, de biologie. Deze samenvloeiing van verschillende onderzoekskanalen die samensmelten tot een steeds groter conceptueel beeld van de natuur, is natuurlijk een vaak herhaald thema in de wetenschappen. Andere bekende voorbeelden zijn Newtons ontdekking dat de beweging van hemellichamen, zoals de maan en planeten, en die van aardse lichamen onder invloed van de zwaartekracht, zoals de spreekwoordelijke appel, beide manifestaties zijn van een universele wet van zwaartekracht. James Clerk Maxwells unificatie van elektriciteit en magnetisme in zijn beroemde vergelijkingen en James Prescott Joule's demonstratie dat de calorische waarde niets anders was dan energie met een andere naam, nu geformaliseerd in de Eerste Wet van de Thermodynamica. E. O. Wilson neemt inderdaad het extreme standpunt in dat: alle menselijke kennis, van de meest concrete wetenschappen tot de minst nauwkeurige van de vrije kunsten, is uiteindelijk met elkaar verbonden [2].

We hoeven niet zo ver te gaan als Wilson. Voor ons doel is het voldoende om te beseffen dat, terwijl 'abiotische' wetenschappen zoals natuurkunde, scheikunde, astronomie en geologie duidelijk sterke onderlinge verbanden hebben, de biologie relatief afstandelijk is gebleven. Dit wil niet zeggen dat de biologie niet veel heeft geprofiteerd van de kennis die vanuit andere natuurwetenschappen naar haar is overgebracht. Merk naast het bovenstaande voorbeeld van ureum op dat metabolisme in de kern een kwestie is van het gebruik en de transformatie van energie - een begrip dat in de natuurkunde concreet en operationeel is gemaakt. En ook de biologie heeft enorm geprofiteerd van technieken en ontdekkingen die in andere wetenschappen zijn gedaan. In 1937 paste Max Delbrück (Nobelprijs voor Fysiologie of Geneeskunde 1969) zijn opleiding in astrofysica en theoretische natuurkunde aan om de gevoeligheid van genen voor mutaties te onderzoeken, de interesse van natuurkundigen voor biologie te stimuleren en moleculaire biologie te vestigen. Bekender was echter het beruchte röntgendiffractiebeeld dat bekend staat als 'foto 51' uit het laboratorium van Rosalind Franklin dat een belangrijk inzicht verschafte dat de geneticus James Watson en natuurkundige Francis Crick (Nobelprijs voor fysiologie of geneeskunde 1962) ertoe bracht een voorstel voor te stellen de dubbele helixstructuur van DNA [3]. Ondanks het bovenstaande is biologie duidelijk het minst goed geïntegreerd in de familie van de wetenschappen. We kunnen speculeren dat de pure complexiteit van het leven en de nieuwe fenomenen die het vertoont hier op zijn minst gedeeltelijk verantwoordelijk voor zijn. Zelfs een van de meest elementaire organismen, Mycoplasma genitalium, heeft een genoom van ‘slechts’ 580 070 basenparen [4]. Biologie is ingewikkeld.

En het is misschien door deze complicatie dat de wiskundige 'wetenschappen' 1 hun minste impact hebben gehad in de theoretische biologie. Over het algemeen vinden de geavanceerde wiskundige technieken die elke theoretische natuurkundetekst verzadigen geen tegenhanger in biologieteksten. Er is echter één gebied waarop de biologie aantoonbaar haar zusterwetenschappen heeft overtroffen: de integratie van informatie theorie [5,6] in de beschrijving van fysieke systemen. En we zullen suggereren dat de biologie een conceptueel pad heeft uitgestippeld dat abiotische natuurwetenschappen er goed aan zouden doen om te evenaren. Maar laten we, voordat we te ver vooruit gaan, beginnen aan het begin van de twintigste eeuw en een bezoek brengen aan een van de vele revolutionaire ontwikkelingen die het tijdperk van de 'moderne' fysica inluidden en die vandaag de dag nog steeds een belangrijk onderzoek naar de moleculair-biologische structuur is.

2. Structuur, aperiodische kristallen en informatie

De immense conceptuele vooruitgang in de natuurkunde die in het eerste derde deel van de twintigste eeuw is gemaakt, is legio, maar hier concentreren we ons op de bijdragen aan de structuur van materie. Hoewel het Max von Laue (Nobelprijs voor natuurkunde 1914) is die wordt gecrediteerd voor de ontdekking van de diffractie van röntgenstralen door kristallen, is het het team van vader en zoon, Sir William Henry Bragg en William Lawrence Bragg (Nobelprijs voor natuurkunde) 1915), die veel lof ontvingen voor het gebruik ervan als een hulpmiddel om de kristalstructuur te bepalen. Voor een periodieke herhaling van een patroon, zoals men zou kunnen vinden in de eenvoudige kristallen zoals NaCl, wordt het diffractiepatroon gedomineerd door zeer sterke reflecties onder bepaalde hoeken, genaamd Bragg-reflecties. Het is bekend dat er veel zwakkere diffuse verstrooiing optreedt tussen de Bragg-reflecties en al in 1912 werd waargenomen door Walter Friedrich. Hoewel deze diffuse verstrooiing kan worden verklaard door de thermische beweging van de samenstellende atomen, zou het echt een voorbode kunnen zijn van afwijkingen van de perfecte periodieke orde. Maar de aanname van periodiciteit vereenvoudigt de analyse van diffractiepatronen enorm, en de eerste jaren van de kristallografie werden gekenmerkt met enorm succes bij het oplossen van de periodieke structuren die zo gewoon leken. Er kan inderdaad worden beweerd dat dit onderzoeksprogramma, dat zo succesvol was in het beschrijven van een bepaald soort structuur - periodieke structuur, 'de oneindige herhaling in de ruimte van identieke structurele eenheden' - ten koste ging van de ontwikkeling van alternatieve theoretische hulpmiddelen.

Op het gebied van de biologie, op de hoogte van Delbrücks resultaten over mutaties, was de prominente natuurkundige Erwin Schrödinger (Nobelprijs voor natuurkunde 1933) bezig het leven vanuit een natuurkundig oogpunt te beschouwen. In zijn nu klassieke boek uit 1944, Wat is leven? [7], introduceert Schrödinger hier twee concepten die voor ons van belang zijn. De eerste is negentropie, of de entropie die een organisme naar zijn omgeving exporteert om zijn interne entropie laag te houden. Als je entropie ziet als een maatstaf voor wanorde, dan maakt de tweede wet van de thermodynamica duidelijk dat een organisme, wil het een bepaalde structuur behouden, zich moet ontdoen van de stoornis die gepaard gaat met levensonderhoudende processen. Het tweede, en even belangrijke, is het idee dat het erfelijke mechanisme dat moet bestaan ​​om eigenschappen van individuen aan het nageslacht te kunnen doorgeven, zou kunnen worden ondergebracht in wat hij een aperiodisch kristal. Hoewel H.L. Müller meer dan 20 jaar eerder een soortgelijk voorstel deed, was het de pleidooi van Schrödinger die tot de verbeelding van Crick en Watson sprak om deze mogelijkheid serieus te onderzoeken. Het aperiodieke kristal van Schrödinger was een materieel substraat, misschien een molecuul, dat geen strikte periodiciteit had. De reden hiervoor is dat exacte herhaling van een motief, met andere woorden een kristal, informatiearm is - te arm om erfelijkheid te dragen. Zonder enige onvoorspelbaarheid of nieuwigheid wordt er niets nieuws geleerd en gecommuniceerd. Het is opmerkelijk dat Schrödinger deze voorspelling deed voordat een kwantitatief begrip van informatie werd gearticuleerd.

In 1947 vonden drie natuurkundigen van Bell Telephone Laboratories, John Bardeen, Walter Brattain en William Shockley (Nobelprijs voor natuurkunde 1956), een klein apparaat uit dat een revolutie teweegbracht in het ontwerp van elektrische circuits: de transistor, die het tijdperk van de elektronica inluidde.Het belang ervan werd onmiddellijk erkend en het volgende jaar werd er een persbericht uitgegeven. Toch was dit waarschijnlijk [8] slechts de... tweede belangrijkste aankondiging van Bell Laboratories in 1948. De eerste kwam van een 32-jarige wiskundige, ingenieur en cryptograaf, Claude E. Shannon, 2 in de vorm van een paper in de Bell systeem technisch journaal met de bescheiden titel ‘Een wiskundige theorie van communicatie’ [5].

Shannons belangrijkste uitgangspunt is dat informatie een zekere mate van verrassing is. gegeven an informatiebronx—een reeks berichten <x> die optreden met waarschijnlijkheden —een individuele boodschap zelf informatie is . Voorspelbare gebeurtenissen ( ) zijn dus niet informatief: H(x)=0—omdat ze niet verrassend zijn. Geheel onvoorspelbare gebeurtenissen, zoals het opgooien van een eerlijke munt, zijn zeer informatief: . Bij gebruik van logaritmen met grondtal 2 is de informatie-eenheid a beetje of binair cijfer. Shannons eerste belangrijke resultaat was om aan te tonen dat de gemiddelde zelfinformatie, wat hij de entropie parallel aan Boltzmann en Gibbs in woordenschat en notatie, , meet hoe samendrukbaar de berichten van een bron zijn. Het kwantificeren van informatie was echter gewoon een voorbode van de belangrijkste motivatie van Shannon. Hij werkte voor de Bell Telephone Company, een communicatiebedrijf, en zijn belangrijkste doel was om operationele beperkingen op te stellen voor het communiceren van informatie via luidruchtige, foutgevoelige transmissieapparatuur, die hij formaliseerde als een communicatiekanaal. Het resultaat was zijn meest bekende en verreikende resultaat: zolang de bronentropie kleiner is dan de transmissiecapaciteit van het kanaal, is er een manier om de bronberichten te coderen, zelfs als er fouten worden geïntroduceerd, zodat de ontvanger de luidruchtige kanaaluitgang kan precies reconstrueer de oorspronkelijke berichten. Dit enkele resultaat is de sleutel tot bijna alle communicatietechnologieën die de moderne economieën van vandaag aandrijven.

Shannon zelf was nogal voorzichtig om zijn kwantitatieve theorie over de hoeveelheid informatie in een bron te distantiëren van discussies over de betekenis of semantische inhoud van die informatie [9]. Zijn doel was het zojuist beschreven operationele resultaat, waarvoor niet bekend was welke informatie er werd gecommuniceerd. Maar, zoals we zullen uitleggen, blijken zijn hoeveelheid informatie en de semantiek ervan een centraal en kwantitatief hulpmiddel te zijn voor het begrijpen van de organisatie van materialen die meer zijn dan periodieke kristallen - materialen die geen regelmatige herhalingen zijn van identieke eenheidscellen. We noemen deze toepassing van Shannons informatietheorie op de materiële structuur 'chaotische kristallografie', om redenen die duidelijk zullen worden.

Welke soorten materialen zijn geen kristallen? Een voor de hand liggende klasse is die waarin willekeurige atomen willekeurig in de ruimte worden geplaatst. De resulterende dichotomie - materialen zijn periodiek of willekeurig - is een te eenvoudig beeld. Er is een spectrum. Een eerste voorbeeld, een controversieel in die tijd, was de ontdekking van quasi-kristallen [10]: metalen met een oriëntatie op lange afstand, een icosahedrale fase, maar geen translationele symmetrie. Dit viel zo ver buiten de periodiek-willekeurige dichotomie dat het enkele jaren na experimentele detectie was dat quasi-kristallen algemeen aanvaard werden (Nobelprijs voor de Scheikunde 2011). 3

Gezien dit brede spectrum heeft men hulpmiddelen nodig die processen die variëren van periodiciteit tot willekeur gemakkelijk beschrijven en de tussenliggende semi-geordende, semi-wanordelijke structuren vastleggen. Informatietheorie is een van die instrumenten. We zullen beschrijven hoe het van toepassing is op de materiële structuur en het streven naar chaotische kristallografie vormen. Een overtuigend inzicht is dat, hoewel we beginnen met een focus alleen op verrassing en voorspelling, we worden geleid tot nieuwe noties van structuur, partiële symmetrieën en informatieopslag.

3. Van voorlichtingsmaatregelen naar structuur

Hoewel fundamenteel voor de praktijk van de wetenschap, is een grondig begrip van de informatie verkregen uit individuele metingen pas onlangs in detail onderzocht [15,16]. De belangrijkste problemen zijn gemakkelijk te noemen: hoeveel leer je van een bepaalde waarneming, gegeven een geschiedenis van dergelijke metingen? Hoeveel van het verleden is bruikbaar voor het voorspellen van de resultaten van toekomstige metingen? In welke mate is een meting gewoon willekeur en geen structuur? Hoeveel informatie die in het heden is verkregen, wordt doorgegeven aan de toekomst? Het is misschien niet verrassend dat als we deze vragen in het licht van de informatietheorie [6] beschouwen, een aantal nieuwe computationele en informatieve maatregelen aan het licht kwamen die belangrijke inzichten verschaffen in hoe correlaties zich manifesteren in verschillende soorten structuren.

Zoals hierboven opgemerkt, is het werkpaard van de informatietheorie de Shannon entropie [5] van een willekeurige variabele x: , waar de x zijn de mogelijke realisaties van de discrete variabele x en is de kans om te observeren x. Hoewel Shannon-entropie vele interpretaties heeft, is het nuttigst hier dat het de gemiddelde hoeveelheid informatie is die een waarneming onthult bij het meten van die variabele. Echte metingen zijn vaak sequentieel in de tijd en je zou verwachten dat er correlaties zijn tussen metingen. De uitbreiding van de Shannon-entropie tot een reeks metingen volgt natuurlijk door de enkele willekeurige variabele te vervangen x met de volgorde x1,x2,…xL van willekeurige variabelen—vaak geschreven x L —en het realiseren van één enkele meting x door de reeks metingen x1,x2,…xL, de laatste handig aangeduid x L . Dus, door achtereenvolgens langere verledens te beschouwen-x−1, dan x−2x−1, enzovoort - men kan kwantificeren hoe minder onzeker een meting van x0 is. Of, anders gezegd, we kunnen kwantificeren hoeveel kennis van het verleden de in het heden geleerde informatie vermindert: H[x0]≥H[x0 | x−1]≥H[x0 | x−1,x−2]≥⋯ , waar we de voorwaardelijke Shannon-entropie H[ hebben geïntroduceerdx | ]. Het is ook nuttig om rekening te houden met de entropiesnelheid Hμ, de informatie die gemiddeld per waarneming is geleerd, na een oneindig verleden te hebben gezien: Hμ=H[x0 | …x−3x−2x−1].

Aangezien de informatietheorie oorspronkelijk werd ontwikkeld in de context van communicatie, voorgesteld als een tijdelijke opeenvolging van symbolen, doordrong een natuurlijk begrip van verleden, heden en toekomst de theorie. Werkend onder dit vooroordeel introduceerde een voorkeurspijl van tijd. Als gevolg hiervan is het nut van conditionering huidig metingen, of waargenomen symbolen, op toekomst waarnemingen was niet duidelijk. Vanuit wiskundig oogpunt is er natuurlijk geen inherente belemmering om dit te doen. Het vervangen van een tijdreeks door een ruimtelijke heft echter het directionele vooroordeel op en opent een manier om andere informatiematen te identificeren die het verleden en de toekomst op gelijke voet behandelen [15,17-20].

Overweeg als voorbeeld een enkele meting van de willekeurige variabele x. De theoretische maximale hoeveelheid informatie die men mogelijk kan leren is slechts H[x] (Figuur 1een). Als er echter correlaties of regelmatigheden in de gegevens zijn, had een deel hiervan op basis van eerdere waarnemingen kunnen worden verwacht. Laten we dit deel de . noemen redundantiegraadρμ=ik[x0:…x−3x−2x−1]—de gedeelde of wederzijdse informatie tussen het heden x0 en het verleden…x−3x−2x−1. Het andere deel van de informatie kon niet worden verwacht, het is echt willekeurig en is gewoon Hμ. Dus de hoeveelheid informatie H[x0] beschikbaar in een enkele meting x0 ontleedt van nature in deze twee delen, zoals weergegeven in figuur 1B.

Figuur 1. Ontleden van de informatie H[x] geleerd van een meting van een enkele willekeurige variabele x. (Aangepast van James et al. [15], met toestemming.) (Online versie in kleur.)

Verdere conditionering levert echter een verdere ontleding van elk van deze op. Ten eerste, het willekeurige deel Hμ valt uiteen in twee delen: de kortstondige informatiesnelheidRμ en de gebonden informatie tariefBμ. De kortstondige informatiesnelheid Rμ=H[x0 | …x−3x−2x−1,x1x2x3…] is de informatie die alleen in het heden bestaat. Het is niet voorspelbaar vanuit het verleden en wordt ook niet gecommuniceerd naar de toekomst. Het bestaat alleen in het heden en is kortstondig. Het gebonden informatietarief Bμ=ik[x0:x1x2x3… | …x−3x−2x−1] is de informatie die wordt gedeeld tussen het heden en de toekomst, maar niet in het verleden. Als zodanig meet het de snelheid waarmee spontaan gegenereerde informatie (Hμ) wordt actief opgeslagen door een systeem. Ten tweede valt het ontslagpercentage ook in twee delen uiteen, waarbij de eerste opnieuw is: Bμ en een tweede deel genaamd de enigmatische informatiesnelheidQμ. Dit laatste is wederzijdse informatie in drie richtingen die ik[…x−3x−2x−1:x0:x1x2x3…] gedeeld tussen verleden, heden en toekomst.

De netto ‘ontleding’ van de informatie H[x0] in een enkele meting wordt geïllustreerd in figuur 1C. Dit is slechts een greep uit de mogelijke manieren waarop informatie semantisch kan worden verdeeld tussen verleden, heden en toekomst. Figuur 1NSis bijvoorbeeld een ontleding in gedissipeerd Rμ en nuttige informatie met wieμ. Bovendien, andere aanvullende maatregelen, besproken door James et al. [15,16,21], zijn gedefinieerd en onderzocht. Belangrijk is dat ze nu allemaal analytisch kunnen worden berekend op basis van een proces ε-machine [22,23], als die eenmaal in de hand is.

4. Chaotische kristallografie

Gewapend met dit nieuwe arsenaal aan structurele informatiemaatregelen wordt een gedetailleerd, kwantitatief beeld geschetst van hoe informatie wordt uitgewisseld tussen verleden, heden en toekomst. Met deze in gedachten, intrinsieke berekening wordt gedefinieerd als hoe systemen historische en ruimtelijke informatie opslaan, organiseren en transformeren [24,25]. Verschillende processen kunnen kwantitatief en kwalitatief verschillende soorten intrinsieke berekeningen hebben, en het begrijpen van deze verschillen geeft inzicht in hoe een systeem is gestructureerd [26].

Chaotische kristallografie (ChC) [23,27-33] 4 is dan de toepassing van deze informatie- en rekentheoretische methoden om structuur in materialen te ontdekken en te karakteriseren. Het herinterpreteert de tijdas, die hierboven om pedagogische redenen is gebruikt, voor een eendimensionale ruimtelijke coördinaat langs een bepaalde richting in een materiaal. De keuze van de naam is bedoeld om suggestief te zijn: we behouden de term 'kristallografie' om de continuïteit te benadrukken met eerdere doelen om materiële structuur te begrijpen en we introduceren de term 'chaotisch' om deze nieuwe benadering te associëren met noties van wanorde, complexiteit en informatieverwerking . Met behulp van chaotische kristallografie kunnen we de manieren beschrijven waarop deze informatiedecompositie de kristalstructuur kwantitatief vastlegt - een onderscheid maken tussen structuur die zou kunnen worden verwacht, d.w.z. repetitieve periodieke structuur, van die structuur die niet wordt verwacht, d.w.z. breukstructuur. Materialen die in dit kader nuttig en ontvankelijk worden beschreven, worden chaotische kristallen.

Het is duidelijk dat de studie van wanorde in systemen van gecondenseerde materie verre van nieuw is, maar te vaak werd het overschaduwd door de kristallografie van periodiek geordende materialen, genaamd klassieke kristallografie [35-37]. Mackay heeft lang en hardnekkig gepleit voor uitbreiding van de reikwijdte van kristallografie tot organisatie op vele lengteschalen en met organisatievormen die niet noodzakelijk periodiek zijn. In een reeks artikelen van meer dan 40 jaar [12,36-42] promootte Mackay het idee dat kristallografie een algemene structuurwetenschap is - of op zijn minst zou moeten zijn. 5 Wij zijn het eens. Dit onderzoeksprogramma, genaamd gegeneraliseerde kristallografie, claimt een enorme hoeveelheid conceptuele ruimte, inclusief hiërarchische organisatie, vijfhoekige symmetrie, cellulaire automaten, aperiodische kristallen, incommensurabele periodiciteiten, glazen, lyotrope vloeibare kristallen, mesofasen en eindige kristallen - om er maar een paar te noemen [36]. Ook inbegrepen zijn concepten uit de informatietheorie en berekeningen. Door vervolgens de naam 'chaotische kristallografie' te kiezen, onderscheiden we onze inspanningen van dit meer diffuse programma om in plaats daarvan scherp te focussen op hoe informatie en berekeningen de materiële structuur en organisatie ophelderen.

We moeten opmerken dat chaotische kristallografie niet de enige of zelfs de eerste poging is om informatie- en berekeningstheoretische ideeën op te nemen in kristallografie. Sommige inspanningen uit de jaren tachtig waren gericht op het gebruik van informatietheorie als een hulpmiddel om het 'faseprobleem' op te lossen [43–45]. Meer recentelijk heeft Lalik [46] informatietheorie gebruikt als maatstaf om de mate van vervorming in coördinatieveelvlakken in kristallen te meten door het 'verschil in de Shannon-informatie-inhoud tussen uniforme en niet-uniforme verdelingen van de bindingsorden binnen veelvlakken' te berekenen. Estevez-Rams & González-Férez [47] hebben algoritmische of Kolmogorov-Chaitin-complexiteit toegepast om de kristalstructuur te kwantificeren voor zowel geordende als ongeordende exemplaren, evenals quasi-kristallen. Ze droegen bij aan de voortdurende discussie over de definitie van een kristal, wat suggereert dat informatie- en rekentheoretische noties inzicht verschaffen in de structuur van materie. Hoewel zeker van conceptueel belang, is de complexiteit van Kolmogorov-Chaitin helaas in het algemeen niet te overzien, waardoor deze benadering van beperkt praktisch nut is. Krivovichev [48,49] heeft de topologische complexiteit van kristalstructuren berekend als Shannon-informatiegebaseerde metingen over de bijbehorende quotiëntgrafiek. Daarnaast heeft hij de 2000 meest complexe structuren in de Inorganic Crystal Structure Database onderzocht om te bepalen welke anorganische structuur het meest complex is [50]. 6 Dit onderzoeksprogramma lijkt zich, althans op dit moment, grotendeels, zo niet uitsluitend, te beperken tot zuiver kristallijne structuren.

Voor zover wij weten, is de term 'chaotisch kristal' in twee eerdere contexten gebruikt. In 1991 introduceerde Leuschner [51] verschillende structuurmodellen voor eendimensionale kristallen, die volledig periodiek, quasi-periodiek en chaotisch gedrag kunnen produceren. Dit laatste werd bereikt met behulp van de Logistic Map [24] als generator van onzekerheid in de stapelvolgorde - in feite als een generator van willekeurige getallen. Later, Le Berre et al. [52] definieerde in de context van stabiele patroonvorming van tweedimensionale systemen een chaotisch kristal als 'elke structuur zonder langeafstandsorde, maar ruimtelijk statistisch homogeen'. Ons gebruik van de term is zowel minder beperkend, om rekening te houden met de orde op lange termijn, als meer algemeen, omdat het rekening houdt met een breed scala aan soorten stoornissen. Het mag duidelijk zijn dat het chaotische kristal dat we hier beschrijven precies het soort kristal is dat Schrödinger zich voorstelde als de drager van erfelijkheid. Hoewel hij het een aperiodisch kristal noemde, is die term gebruikt om een ​​heel speciaal soort afwijking van periodiciteit te beschrijven, het soort dat scherpe pieken in het diffractiepatroon blijkt te behouden [53]. Daarom gebruiken we de term chaotisch kristal om een ​​breder begrip van niet-kristalliniteit aan te duiden, een begrip dat structuren omvat met een entropiedichtheid die niet nul is, zoals nodig is voor elke structuur, zoals DNA, om informatie te huisvesten. 7

(a) Materiële informatica van fouten en defecten

Omdat klassieke kristallografie zich grotendeels concentreert op periodieke structuren, stuit het op moeilijkheden bij het classificeren van structuren die niet in dit paradigma passen. De meeste inspanningen waren gericht op het beschrijven hoe een kristal, dat vermoedelijk perfect geordend had kunnen zijn, niet aan dit ideaal voldoet. In dicht opeengepakte structuren onderscheidde Frank [55] bijvoorbeeld twee soorten laagfouten: intrinsiek en extrinsiek. Voor intrinsieke fouten kan elke laag in het materiaal worden beschouwd als behorend tot een van de twee kristalstructuren: ofwel die aan de linkerkant van de fout of die aan de rechterkant. Het is alsof twee perfecte, onbeschadigde kristallen aan elkaar zijn gelijmd en de interface tussen hen is de fout. Daarentegen kan het zijn dat een bepaalde laag niet kan worden gezien als een natuurlijke uitbreiding van de kristalstructuur aan weerszijden van de breuk. Dit zijn extrinsieke fouten. Een ander classificatieschema vindt zijn oorsprong in het mechanisme dat de fout veroorzaakte. In dicht opeengepakte structuren omvatten veel voorkomende fouten: groeifouten-d.w.z. die optreden tijdens het kristalgroeiproces vervormingsfouten-die vaak gepaard gaan met enige mechanische spanning na de vorming van het kristal en laagverplaatsingsfouten-die kan optreden door diffusie tussen aangrenzende lagen. Omdat elk is gedefinieerd in relatie tot zijn ouderkristalstructuur, heeft elk soort kristalstructuur typisch zijn eigen kenmerkende morfologie voor elk soort fout.

Het resultaat is een verwarrende menagerie van stapelsequenties die afwijken van het normale. Deze verzameling is mogelijk niet uitputtend, afhankelijk van hoe groot een buurt is die men beschouwt, en evenmin kunnen bepaalde reeksen ondubbelzinnig worden toegewezen aan een bepaald soort breukstructuur. Inderdaad, in het geval dat er meerdere soorten fouten zijn, of meerdere mechanismen om fouten te produceren, kan een poging tot analyse van de foutstructuur onbepaald zijn [27]. Fouten kunnen ook worden geclassificeerd in termen van hoe fouten ruimtelijk met elkaar verband houden. De afwezigheid van correlatie tussen fouten impliceert: willekeurige fouten. Als alternatief kan de aanwezigheid van een storing de kans op het vinden van een andere storing in de buurt beïnvloeden. Dit laatste fenomeen heet niet willekeurig defecten en is niet ongewoon in zwaar defecte exemplaren. Ten slotte lijken in sommige materialen regelmatig fouten in het monster te worden geïnjecteerd, en dit wordt aangeduid als: periodieke fouten. Er wordt aangenomen dat schroefdislocaties een veelvoorkomende oorzaak zijn van deze laatste fouten [56].

Deze fenomenologische categorisaties, hoewel vaak nuttig en zinvol, vooral voor zwak defecte kristallen, zijn niet zonder problemen. Ten eerste is het duidelijk dat elk ervan is gebaseerd op de veronderstelling dat de oorspronkelijke of ideale toestand van het specimen een periodieke structuur moet zijn. Deze vooringenomenheid, misschien niet opzettelijk, degradeert niet-periodiek stapelen tot minder statuur, zoals blijkt uit het gebruik van de term 'fout'. Het kan zijn dat wanorde de natuurlijke staat van het monster is [57], in welk geval het gebruik van een raamwerk waarin dit kenmerk van materie vooraf is opgenomen, meer bevredigend zal zijn.Het is zelfs niet eens duidelijk dat periodieke orde de grondtoestand zou moeten zijn voor veel soorten materialen, zelfs niet voor die met eindige-bereikinteracties en bij gebrek aan fijnafstemming van energetische koppelingsparameters tussen lagen [58], zoals wel het geval is. gevonden in axiale naast dichtstbijzijnde Ising (ANNNI) modellen [59]. Ten tweede kan een analyse van de stapelstructuur op basis van deze categorieën niet eenduidig ​​zijn, vooral in het geval van zware breuken. Ten derde is deze hele opvatting alleen houdbaar in de limiet dat een ouderkristal bestaat, d.w.z. het is alleen van toepassing in de zwakke breuklimiet.

Consistentie kan worden gebracht in dit gecompliceerde beeld van materiële structuur door gebruik te maken van informatietheorie [33]. Een complementaire visie kan worden gepostuleerd door te vragen hoe informatie wordt gedeeld en verspreid in een kristal, en een natuurlijke kandidaat voor dit soort analyse is om de bovenstaande informatiemaatregelen te gebruiken. Hoewel de vorige expositie een temporele woordenschat van verleden, heden en toekomst gebruikte, is er geen wiskundige verandering in de theorie als we in plaats daarvan aannemen dat de waargenomen sequenties ruimtelijke configuraties zijn. Dat wil zeggen, er zijn metingen die zich links van de huidige meting bevinden, de huidige meting zelf en die metingen rechts van de huidige meting. Voor quasi-eendimensionale materialen nemen we elke meting aan als de oriëntatie van een laag. Deze weergave van een reeks laagoriëntaties vertaalt zich in een informatie diagram of l-diagram, zoals weergegeven in figuur 2. Daar zien we hoe informatie wordt gedeeld tussen de verschillende helften van het monster en de huidige laag. De informatiemaatregelen die in termen van wederzijdse informatie worden gegeven, kunnen worden geïnterpreteerd als: laagcorrelaties binnen het monster. Belangrijk is dat, hoewel men ze meestal over het kristal gemiddeld, het in plaats daarvan mogelijk is om dat gemiddelde niet uit te voeren, maar ze laag voor laag te onderzoeken. Zoals getoond in James et al. [16], informatietheoretische metingen kunnen behoorlijk gevoelig zijn voor veranderingen in systeemparameters en we verwachten dat ze een barometer zullen opleveren die belangrijke aspecten van de materiaalstructuur kwantificeert.

Figuur 2. Informatiediagram met de informatie-anatomie van H[x0] in de context van de volledige ruimtelijke stapeling van lagen in een chaotisch kristal. Laten x0 wees de interesselaag, x:0=…x−2x−1 een willekeurig lange maar eindige sectie zijn van het monster links van x0, en x1:=x1x2... evenzo een willekeurig lange maar eindige sectie van het monster rechts van . zijn x0. De informatie aan de linkerkant x:0 partities H[x0] in twee stukken: Hμ en ρμ. De informatie aan de rechterkant x1: verdeelt die vervolgens in Rμ, twee Bμs en Qμ. (Herinner je figuur 1 die alleen H[x0].) Dit laat een component achter σμ, de ongrijpbare informatie, dat wordt gedeeld door links en rechts, maar bevindt zich niet in de huidige laag. Indien positief, geeft dit aan dat niet alle correlatie tussen linker- en rechterhelftconfiguraties lokaal aanwezig is en dat er dus interne verborgen mechanismen zijn die de correlatie dragen [21]. (Aangepast van James et al. [15], met toestemming.) (Online versie in kleur.)

Het is bijvoorbeeld bekend dat elektronische structuurberekeningen die voortkomen uit eendimensionale potentialen afhankelijk zijn van paarsgewijze correlaties [60,61], waarbij het transmissiewaarschijnlijkheidsspectrum van een elektron door dergelijke potentialen vaak wordt bepaald door de correlatielengte. Informatietheoretische grootheden, met hun meer genuanceerde kijk op correlatielengtes in termen van voorwaardelijke en wederzijdse informatie, geven een gedetailleerder beeld van de rol van wanorde in elektronische structuur. Een van de eenvoudigere en meer gebruikelijke maatstaven voor globale correlatie is de wederzijdse informatie tussen de twee helften van een monster: de overtollige entropieE= ik[…x−3x−2x−1:x0x1x2…]. Inspectie van het informatiediagram onthult de ontbinding ervan in informatie-atomen: E=Bμ+Qμ+σμ.

Bovendien is niet alleen de globale structuur belangrijk, maar kunnen lokale defecten ook lokale afwijkingen van de gemiddelde structuur introduceren, zoals te zien is in Anderson-lokalisatie [61]. Dit is een actueel onderzoeksgebied [62]. Evenzo kunnen gebieden met een overschot of uitputting van de lading andere eigenschappen beïnvloeden, zoals de transmissie van licht. Het gebied van ongeordende fotonica probeert dergelijke structuren te begrijpen en te exploiteren voor nieuwe technologieën [63].

Er kunnen dus een aantal vragen worden gesteld over de verspreiding van informatie in het kristal zoals blijkt uit zijn structuur. Hoeveel informatie wordt bijvoorbeeld verkregen uit de huidige meting? Wordt dit gedeeld met de buren of is het gelokaliseerd? Het overwegen van vragen als deze leidt tot een nieuwe indeling van de wanordelijke structuur in kristallen.

(b) Chaotische kristallen: structuur in wanorde

Het nettoresultaat is een consistente, kwantitatieve en voorspellende structuurtheorie in ongeordende materialen die verder gaat dan breuken en zwakke wanorde en die van toepassing is op het volledige spectrum van materiële structuur, van ideaal periodiek kristal tot amorfe materialen en complexe langeafstandsmengsels daartussenin. Zoals Ball [64] opmerkt, hebben we, kortom, een nieuwe kijk op wat kristallen zijn en kunnen zijn. Varn & Crutchfield [33] bekijken in detail hoe dit werkt.

Laten we illustreren hoe chaotische kristallografie van toepassing is op materialen uit de echte wereld - de dicht opeengepakte structuren van ijs en een complex molecuul dat wordt gebruikt om de chemie van de aromaticiteit van benzeen te onderzoeken. Vervolgens, door deze resultaten te combineren met eerdere chaotische kristallografische analyses van zinksulfide (ZnS), laten we zien hoe een uniforme visie op organisatie in materialen ontstaat.

(i) Laagstoornis in ijs I

Hoewel vaak beschouwd als slechts het medium van het leven - zij het een essentiële 8 - is er een groeiende waardering voor de actieve rol die water speelt in biologische processen. Als voorbeeld noemt Ball [65,66] de generieke interactie van twee eiwitten. Als beide zijn opgelost in het cellulaire medium, moeten de tussenliggende watermoleculen worden verwijderd om een ​​interactie te laten plaatsvinden. Water is natuurlijk polair en het verdringen van de laatste paar waterlagen kan niet triviaal zijn, afhankelijk van bijvoorbeeld in welke mate de eiwitactiveringsplaatsen hydrofiel of hydrofoob zijn. Bovendien mag men verwachten dat eigenschappen van dunne waterfilms, zoals viscositeit, aanzienlijk afwijken van hun bulkeigenschappen. Zelfs de simulatie van complexe polypeptiden is onvolledig zonder rekening te houden met de invloed van water [65]. Als ander voorbeeld is er bewijs dat het leven de vorming van ijs veroorzaakt en versnelt. Zonder de invloed van onzuiverheden om als centra van inhomogene ijskiemvorming te fungeren, kan worden verwacht dat water in wolken bevriest bij 235 K of zelfs zo hoog als 243 K via homogene ijskiemvorming [67]. Onzuiverheden zoals roet, metaaldeeltjes en biologische agentia kunnen deze temperatuur verhogen. Inderdaad, Murray et al. [68] melden dat boven 258 K de enige materialen waarvan bekend is dat ze ijskiemvorming bevorderen, biologische zijn. Een bijzonder effectief biologisch middel is de bacterie Pseudomonas syringae dat, vanwege eiwitcomplexen op het celoppervlak, bevriezing kan initiëren bij temperaturen tot 271 K [69]. Hoewel zijn specifieke rol afhankelijk van de omstandigheden zeer gevarieerd kan zijn, zoals Ball opmerkt [65], is het simplistisch en naïef om 'het [water] in wezen te beschouwen als de achtergrond waarop de moleculaire componenten van het leven zijn gerangschikt'.

Gezien de structurele eenvoud van een watermolecuul-H2O - en het belang ervan voor zowel biologische als andere natuurlijke systemen, is het misschien verrassend dat, zowel in vloeibare als vaste vorm, H2O blijft enigszins mysterieus. In vloeibare toestand vormen watermoleculen ‘netwerken’, waarbij de verbindingen worden gemaakt uit waterstofbruggen, waardoor de stof een behoorlijke structuur krijgt. Dus ook ijs vertoont een aanzienlijke en variabele structuur. Er zijn niet minder dan 15 bekende verschillende polymorfen van ijs (meestal aangegeven met Romeinse cijfers) [70], hoewel sommige alleen bestaan ​​onder omstandigheden die te extreem zijn om algemeen op aarde te worden waargenomen [71] en sommige zijn ook metastabiel. Bovendien kunnen deze verschillende polymorfen, naarmate de thermodynamische omstandigheden veranderen, transformaties in vaste toestand van de ene vorm naar de andere ondergaan. De veelvoorkomende polymorf die je in het dagelijks leven tegenkomt, heet zeshoekig ijs (ijs IH). Sinds enige tijd is er een alternatieve vorm van ijs, kubieke ijs (ijs IC), werd beschouwd als een modificatie bij lage temperatuur naast ijs IH bij temperaturen tot 240 K [72]. Recente studies [73] hebben echter geconcludeerd dat eerdere waarnemingen waarschijnlijk niet deze puur kubische vorm zijn, maar eerder een mengsel van kubische en hexagonale stapelingen, genaamd stapelen-wanordelijk ijs, afgekort (ijs Isd) door Malkin et al. [74] en (ijs Ich) door Hansen et al. [75]. Of dit al dan niet zal worden bevestigd door aanvullende studies, ice IC geeft een handige randvoorwaarde aan de mogelijke structuren die zouden kunnen bestaan ​​en we zullen te werk gaan alsof ijs IC is een mogelijke metastabiele fase. Boven 170 K, ijs Isd transformeert onomkeerbaar naar ijs IH.

Structureel, ijs I (ijs IH, ijs IC, ijs Isd) kan worden gezien als een gelaagd materiaal. De zuurstofatomen in de watermoleculen organiseren zich in lagen bestaande uit zesdelige gebobbelde ringen [74]. 9 Deze lagen kunnen verder slechts drie mogelijke stapeloriëntaties aannemen, genaamd EEN, B of C, net als in dicht opeengepakte structuren [76]. De lagen zijn zo georganiseerd dat, bij het scannen van het materiaal, de lagen zich vormen dubbele lagen, waarbij elke afzonderlijke laag in deze dubbele laag dezelfde oriëntatie moet hebben. Bovendien, net als in de dicht opeengepakte behuizing, kunnen aangrenzende dubbele lagen niet dezelfde oriëntatie hebben. Omdat stapelfouten beperkt blijven tot onderbrekingen tussen de dubbele lagen, neemt men meestal een dubbele laag als a modulaire laag (ML) [77], en labelt het met EEN, B of C. Dus ijs IH is gegeven door …ABAB… (of gelijkwaardig …BCBC… of …CACA...), en ijs IC door …ABCABC… (of gelijkwaardig …CBABA…). Soms is het handiger om met een alternatieve aanduiding te werken, de Wyckoff-Jagodzinski-notatie [76]. Men beschouwt triples van ML's en labelt de middelste ML als ofwel: H of C, afhankelijk van of het hexagonaal is (H) of kubusvormig (C) in verband met zijn buren. Bijvoorbeeld de binnenste vier ML's van de stapelvolgorde ABCBCA zou worden geschreven als chhc. Het moet duidelijk zijn dat elke stapelstructuur, of deze nu geordend of ongeordend is, kan worden uitgedrukt als een hc volgorde. het ijs ikH stapelstructuur wordt weergegeven in figuur 3een en ijs ikC staat in figuur 3B. Een mogelijke ongeordende stapelvolgorde wordt getoond in figuur 3.C.

Figuur 3. (een) Het stapelen van lagen in hexagonaal ijs (ijs IH). De verticale as staat loodrecht op het (0001) basale oppervlak van hexagonaal ijs. Alleen zuurstofatomen (bollen), die zijn verbonden door waterstofbruggen (lijnen), worden weergegeven. (B) Het stapelen van lagen in kubisch ijs (ijs IC), met de verticale as loodrecht op het (111) vlak. (C) Een voorbeeld van een stapelvolgorde die kan komen van het stapelen van ongeordend ijs (ijs Isd). De lagen zijn gemarkeerd afhankelijk van of de laag hexagonaal (H) of kubusvormig (C) is ten opzichte van zijn buren. (Aangepast van Malkin et al. [73], met toestemming.) (Online versie in kleur.)

Ondanks een recente stortvloed van theoretische, simulatie- en experimentele studies [69,72-75,77-81], is er echter nog steeds veel dat niet wordt begrepen over de vorming van ijs of de transformaties tussen de verschillende polymorfen [70]. In een poging om het naast elkaar bestaan ​​van ijs te begrijpen IH en ijs ikC bij lage temperaturen onderzochten Thürmer & Nie [72] hun vorming op Pt via scanning tunneling microscopie en atoomkrachtmicroscopie. Ze vonden een complex samenspel tussen de initiële vorming van ijs IH clusters die groeien door laagnucleatie en uiteindelijk samenvloeien. De details van de coalescentie en de aard van domeingrenzen tussen nucleatiecentra hebben een sterke invloed op de vraag of latere groei ijs I . isH of ijs IC. Belangrijk is dat ze aantonen dat ijsfilms van willekeurige dikte kunnen worden afgebeeld met een resolutie van de moleculaire laag. Verschillende groepen [73-75,78] hebben de stoornismodel van Jagodzinski [82,83] naar gesimuleerde of experimentele röntgendiffractiepatronen, gebruikmakend van een reeks invloeden tussen lagen, de zogenaamde Reichweite, van s=2,3,4. Ze vonden dat het nodig is om te gebruiken s=4 om enkele voorbeelden te beschrijven. Moleculaire dynamische simulaties [80] toonden aan dat ijs dat kristalliseert bij 180 K zowel ijs I . bevatC en ijs ikH in een verhouding van 2:1, terwijl andere moleculaire dynamische simulatiestudies [84] vonden dat paren van puntdefecten een belangrijke rol kunnen spelen bij het verschuiven van lagen in ijs I. Weer andere moleculaire simulaties [85] suggereerden dat een nog nieuwe fase van ijs , genaamd ijs 0, kan een thermodynamische verklaring bieden voor sommige kenmerken van ijsgroei.

Chaotische kristallografie levert belangrijke inzichten op in de soorten geschikte modellen en de aard van waargenomen stapelingsprocessen, evenals hulp bij het vergelijken van experimentele, simulatie- en theoretische studies. Op deze manier biedt chaotische kristallografie een gemeenschappelijk platform om deze verschillende waarnemingen en berekeningen met elkaar in verband te brengen.

Laten we beginnen met de gebruikte modellen. De ε-machines die ijs beschrijven IH en ijs ikC worden getoond in figuur 4een,B. Ze lijken veel op elkaar, beide hebben slechts één toestand en elk één overgang. Computationeel zijn ze vrij eenvoudig. Ook eenvoudig is de ε-machine getoond in figuur 4C. Er zijn twee overgangen van een enkele toestand, met de kans op a C wezen α0 en een H wezen . 10 Het is duidelijk dat de vorige twee modellen slechts speciale gevallen zijn van deze laatste. We erkennen dat deze drie modellen beschrijven: onafhankelijk en identiek verdeeld (IID) stapelprocessen. Ze impliceren geen correlaties tussen de symbolen. Het hier gebruikte coderingsschema, de transformatie van de abc notatie naar de Wyckoff-Jagodzinski-notatie, bouwt stapelbeperkingen in en geeft effectief een invloedsafstand van twee ML. We identificeren dit bereik van invloed als de Reichweites.

Figuur 4. ε-Machines die het stapelen van ijs beschrijven I. Knooppunten vertegenwoordigen causale toestanden en zijn verbonden door bogen met het label s | P, waar s is het symbool dat wordt uitgezonden en P is de kans op het maken van een dergelijke overgang. (een) De ε-machine voor ijs IH en (B) ijs IC. Modellen voor ongeordende stapelsequenties van dicht opeengepakte structuren werden geïntroduceerd door Jagodzinski [82,83]. De modelparameter die het invloedsbereik tussen ML's specificeert, wordt de . genoemd Reichweites. (C) De makkelijkste ε-machine in de hc notatie die een ijs I . geeftsd stapelvolgorde (s=2 ijs Isd). (NS) De ε-machine voor s=3 ijs Isd en (e) s=4 ijs Isd. (Online versie in kleur.)

Het volgende veelgebruikte model is dat van Jagodzinski s=3 stoornismodel in figuur 4NS. Hier hangt het volgende symbool in de reeks alleen af ​​van het vorige symbool (ofwel H of C), waardoor dit een eerste-orde Markov-model is. Het laatste model dat in de literatuur is onderzocht, is dat van Jagodzinski s=4 stoornismodel, en dit is weergegeven in figuur 4e. Aangezien de kans op het waarnemen van het volgende symbool afhangt van de vorige twee symbolen, herkennen we dit als een tweede-orde Markov-model. Nogmaals, het in kaart brengen van de abc notatie naar de Wyckoff-Jagodzinski-notatie vouwt in een extra twee-ML-bereik van invloed in termen van de fysieke stapeling van ML's. Het is duidelijk dat men dit proces zou kunnen voortzetten, gezien de steeds groter wordende Reichweite, d.w.z. Markov-modellen van een hogere orde, voor onbepaalde tijd. Markov-processen met een eindig bereik zijn echter slechts een klein deel van de mogelijke eindige-toestandsprocessen die men zou kunnen overwegen. Met eindige toestand bedoelen we dat er een eindig aantal toestanden is, maar dit betekent niet dat het invloedsbereik eindig hoeft te zijn. Simulaties van eenvoudige solid-state transformaties in ZnS (ook een dichtgepakte structuur) van de hexagonale stapelstructuur naar de ongeordende kubieke structuur produceerden stapelprocessen met een oneindig bereik van invloed [28]. We krijgen dus het vermoeden dat, ondanks de uitstekende overeenkomst tussen experimentele en theoretische diffractiepatronen die door sommige onderzoekers voor ijs I zijn gerapporteerd, het echte proces mogelijk tot een rekenkundig meer geavanceerde klasse behoort. Chaotische kristallografie, met de nadruk op informatie- en rekentheoretische maatregelen, laat toe de mogelijkheid te herkennen en inderdaad de relevante vragen te stellen.

Hoe kunnen we de aanwezigheid van dergelijke geavanceerde stapelprocessen waarnemen of afleiden? Een manier is verbeterde inferentietechnieken. Terwijl chaotische kristallografie een inferentie-algoritme heeft, ε-machine spectrale reconstructie theorie [27,30] dat processen met een eindig bereik detecteert uit diffractiepatronen, is er de mogelijkheid om het uit te breiden met processen van oneindige orde. Ook kunnen de eerder besproken simulatiestudies resulteren in ongeordende stapelsequenties en er zijn technieken, zoals de algoritmen voor het samenvoegen van subbomen [24] en Bayesiaanse structuurinferentie [86], die deze processen met een eindige toestand maar met een oneindig bereik kunnen ontdekken uit sequentiële gegevens . Dit suggereert dat het juiste niveau van vergelijking tussen theorie, simulatie en experiment niet een of ander signaal is (het diffractiepatroon), maar eerder het stapelproces zelf, zoals gespecificeerd door de ε-machine. Chaotische kristallografie is een platform voor een dergelijke vergelijking.

Ook door het bestuderen van de ε-de causale architectuur van de machine, d.w.z. de rangschikking van causale toestanden en de overgangen die ze verbinden, is het mogelijk om de soorten aanwezige fouten te ontdekken. Dit werd inderdaad gedaan voor ZnS-polytypen [27,29]. Onlangs zijn verschillende soorten fouten voorgesteld voor ijs I [77], en een goede analyse van de bijbehorende ε-machine, gecombineerd met theoretische en experimentele studies, kan ophelderen welke fouten in een bepaald exemplaar belangrijk zijn.Dit zou behoorlijk waardevol kunnen zijn, omdat er veel mogelijke vormingsroutes zijn voor ongeordende ijsmonsters, en verschillende mechanismen, zoals transformaties in vaste toestand versus groei, laten waarschijnlijk een waarneembare vingerafdruk achter in de causale architectuur.

(ii) Organisatie van aromaticiteit

Benzeen staat bekend om zijn merkwaardige 'aromatische' karakter dat rechtstreeks voortkomt uit de zes π elektronen gedeeld tussen zijn zes koolstofatomen en zweven boven en onder het vlak van zijn koolstofatoomring. Om dit karakter te begrijpen, proberen scheikundigen het gedelokaliseerde te lokaliseren π elektronen, deels om het fysieke karakter van benzeen te begrijpen en deels om nieuwe manieren te vinden om chemische reactiviteit te beheersen en nieuwe synthetische paden te ontdekken. Een van de doelen is om het nieuwe elektronische motief van benzeen te ontwikkelen als een regelbare reactiekatalysator. Er loopt een actief onderzoeksprogramma om de aromatische eigenschappen van benzeen te wijzigen door toevoeging van 'bicyclische' ringen buiten de hoofdring. Dit leidde tot de vorming van tris(bicyclo[2.1.1]hexeno)benzeen (TBHB). De structuur van TBHB is van cruciaal belang om te begrijpen hoe benzeen te lokaliseren π elektronen [87].

We vertellen over recente experimentele sondes van de structuur van TBHB en laten zien hoe een informatietheoretische analyse extra inzicht oplevert. TBHB is een grotendeels vlakke molecule die de aandacht heeft getrokken als een van de eerste bevestigde mononucleaire benzenoïde koolwaterstoffen met een cyclohexatrieen-achtige geometrie [88]. Figuur 5een toont de moleculaire structuur van TBHB, en figuur 5B geeft een schema van de formule. Van bijzonder belang is de centrale benzeenring, waar de interne hoeken van de koolstof-koolstofbindingen allemaal 120 ° zijn, maar er is een opmerkelijke verandering van de twee ongelijke bindingslengten tussen de koolstoffen (1.438(5)−1.349(6) Å) [88]. Van bijkomend belang is de kristallografische structuur van TBHB. Hier worden twee kristalmorfologieën waargenomen, monoklien en hexagonaal [90]. Voor deze laatste structuur onthullen röntgendiffractiestudies significante diffuse verstrooiing langs staven in de wederzijdse ruimte, een kenmerk van vlakke wanorde. Figuur 6een toont de posities van de diffuse staven in de reciproke ruimte, en figuur 6B geeft een illustratie van de gemiddelde laagopbouw van TBHB. We zullen de uitbreiding van deze configuratie naar een tweedimensionale periodieke array een ML voor TBHB noemen.

Figuur 5. (een) Moleculaire structuur van TBHB. Zwarte bollen vertegenwoordigen koolstofatomen, terwijl de witte waterstofatomen zijn. (B) De zogenaamde 'skeletformule'-weergave van TBHB. (Aangepast van Michels-Clark et al. [89], met toestemming.)

Figuur 6. (een) Schema van het wederzijdse ruimtevlak hk0. Cirkels vertegenwoordigen de posities van de diffuse verstrooiing (Hk≠3N) en kruist de posities van de Bragg-achtige reflecties (Hk=3N). (B) Gemiddelde laagstructuur voor TBHB waarbij de laagsymmetrie . Een tweedimensionale array van TBHB-moleculen die zo is gerangschikt, wordt a . genoemd modulaire laag (ML). (Aangepast van Bürgi et al. [91], met toestemming.)

Van recenter belang [89,91], en het probleem dat ons hier bezighoudt, is het kwantificeren en beschrijven van de ongeordende stapelstructuren die worden waargenomen bij TBHB. Om dit te doen, moeten we de mogelijke ML-ML-stapelarrangementen specificeren en een handige nomenclatuur opstellen om uitgebreide stapelstructuren uit te drukken. De stapelregels en -conventies voor lagen van TBHB kunnen als volgt worden samengevat. 11 (i) Hoewel er drie manieren zijn waarop twee ML's kunnen worden gestapeld, zijn ze geometrisch equivalent en zijn ze gerelateerd door een rotatie van 120° rond de stapelrichting. Er is dus maar één soort ML-ML-relatie. (ii) Voor tripletten van ML's zijn er twee geometrisch ongelijke stapelarrangementen. Voor het geval waarin een molecuul in de (l+2)e ML is direct boven één in de le ML, deze opstelling heet verduisterd. De andere duidelijke mogelijkheid is dat de (l+2)e ML bezet een van de andere twee posities. Deze zijn geometrisch equivalent, gerelateerd aan een spiegeloperatie, en worden genoemd krom. Naarmate men echter voortgaat in de stapelrichting, kunnen deze laatste twee worden onderscheiden als roterend met de klok mee of tegen de klok in. Samen moeten we dus onderscheid maken tussen drie verschillende triolen van stapelreeksen: een verduisterd triplet, dat we symboliseren door e, een met de klok mee gebogen triplet, die we zullen symboliseren door ik, en een tegen de klok in gebogen triplet, gesymboliseerd door R. 12 We verzamelen deze mogelijkheden in de set.

Laten we ons een schuifraam voorstellen waarin slechts drie ML's tegelijk kunnen worden bekeken. Aan die reeks van drie ML wordt vervolgens een symbool toegewezen van . Het venster wordt dan in de stapelrichting met één ML verhoogd, zodat de laatste ML in de reeks wordt verborgen en een nieuwe ML wordt onthuld. Deze nieuwe reeks van drie ML kan opnieuw worden gespecificeerd door een van de symbolen in , zodat de reeks van vier ML wordt gegeven door een reeks van twee letters uit . Zo kan een fysieke stapelreeks worden geschreven als een reeks over de verzameling van deze tripletten, .

Onlangs heeft Michels-Clark et al. [89] vergeleek drie verschillende methoden voor het bepalen van de stapelstructuur voor ongeordende TBHB uit diffractiepatronen: differentiële evolutie, optimalisatie van deeltjeszwerm en een genetisch algoritme. Hoewel rekenintensief, vonden ze een uitstekende overeenkomst tussen berekende en referentiediffractiepatronen, waardoor ze een R-factor fitness van voor hun best case differentiële evolutie algoritme. We analyseren die zaak nu in detail.

Michels-Clark et al. [89] ga uit van een tweede-orde Markov-proces in de rle notatie, 13 zodat de kansen van opeenvolgende symbolen alleen afhankelijk zijn van de twee eerder geziene symbolen, d.w.z. die ze noemen structurele motieven. Michels-Clark et al. [89] rapporteer direct de kans op e volgend op e as , wat slechts twee standaarddeviaties boven 0 is. Bovendien is de kans op de ee sequentie zelf is slechts 0.00033. Zo verwaarlozen we de ee volgorde wanneer we het verborgen Markov-model construeren. Michels-Clark et al. [89,92] relateren overgangskansen tussen structurele motieven aan modelparameters, zodat we overgangskansen direct kunnen berekenen uit elke oplossing van modelparameters. 14 Door de waarden te nemen voor de best case differentiële evolutieoplossing gegeven in tabel 2 van [89], berekenen we deze kansen. Daarbij vinden we dat en . Deze gelijkwaardigheid van futures met een lengte van twee tussen de twee verledens van lengte NS en rl suggereert dat deze twee verledens moeten worden gecombineerd tot een enkele causale toestand. 15 Een soortgelijk argument geldt voor: rr en lr. Zo verzamelen we de verledens NS en rl in een enkele staat en eveneens in een groep rr en lr in de enkele staat. De overige vier mogelijke lengtes - twee passen -met betrekking tot,le,eh,el-elk heeft een unieke toekomst, en dus vormt elk zijn eigen causale toestand. De resulterende zes-state ε-machine is weergegeven in figuur 7. We kunnen nu een chaotische kristallografische interpretatie geven van het stapelproces.

Figuur 7. TBHB causale-toestandsarchitectuur. Het alfabet is . In deze nomenclatuur is het proces Markoviaans van de tweede orde en worden causale toestanden gespecificeerd door hun lengte - twee verledens, waarbij de verledens NS en rl zijn samengevoegd tot de enkele causale toestand, en op dezelfde manier voor het verleden rr en lr naar binnen . Elke causale toestand is gelabeld met zijn asymptotische toestandswaarschijnlijkheid. Men merkt dus op dat het stapelproces wordt gedomineerd door de twee causale toestanden en , met grote en bijna gelijke overgangswaarschijnlijkheden daartussen (de middelste twee (groene) overgangsbogen). In tegenstelling tot bijna kristallijne structuren, is er geen gesloten lus geflankeerd door minder bezochte satelliettoestanden, vaak geïnterpreteerd als breukstructuren. Hier is in plaats daarvan de dominante structuur ongeordend, wat suggereert dat we dit als een 'antikristal' beschouwen. Merk op dat de som van de overgangskansen die twee van de toestanden verlaten, en , iets kleiner is dan 1. Dit komt omdat we hier de ee stapelvolgorde (zie tekst). (Online versie in kleur.)

Het meest merkwaardige kenmerk van deze structuur is het zeer ongeordende paar centrale toestanden en , elk met een asymptotische toestandswaarschijnlijkheid van 0,456. Als we het symbool voor het moment verwaarlozen e (die alleen een waarschijnlijkheid heeft van ), deze kern met twee toestanden vertegenwoordigt een bijna willekeurig proces tussen de twee symbolen ik en R. Met slechts een kans van 0,024, tekenreeksen die zijn samengesteld uit willekeurig lr reeksen worden onderbroken door e. Nu, uit de staten en komen de meest scheve overgangskansen op de ε-machine: dat zien we . Dat wil zeggen, bijna altijd (0,978 kans) merkt op dat het volgende symbool e is tegenover degene die voorafging aan de e:

Vaak onderzoekt men de causale architectuur voor hints van welke soorten fouten aanwezig kunnen zijn. Maar aangezien de meest bezochte staten ( en ) geen cyclus vertegenwoordigen, is er hier geen ouderkristal. In plaats daarvan zou men kunnen denken dat het onderliggende proces willekeurig is tussen: ik en R en slechts af en toe onderbroken door e, zoals dat e speelt de rol van een fout. Als dat zo is, beschouwen we dit als een extrinsieke fout, omdat e maakt aan geen van beide zijden deel uit van de structuur. In ieder geval presenteert de causale architectuur van de stapeling van TBHB een interessante omkering van de gebruikelijke dichotomie van kristalfoutstructuren. Het zijn de kerntoestanden en die aanleiding geven tot de wanordelijke stapeling, en de minder bezochte perifere toestanden, in het bijzonder en , die dienen om de waarschijnlijkheid van stapelsequenties te beperken en dus een soort 'structuur' op te leggen. In die optiek is het misschien niet al te extreem om TBHB als een soort ‘antikristal’ te zien.

(iii) Naar een uniform beeld van de materiële structuur

Hoe past dit alles bij elkaar? Laten we het karwei afzetten van de kristallograaf die belast is met het bepalen van de structuur van een periodiek materiaal en een niet-periodiek materiaal. Voor het volledige driedimensionale periodieke geval zijn er zeven mogelijke kristalsystemen: trikliniek, monoklinisch, orthogonaal, tetragonaal, kubieke, trigonaal en zeshoekig. Men kan natuurlijk specifieker zijn en opmerken dat er 230 kristallografische ruimtegroepen zijn. Een periodiek kristal moet tot één en slechts één van hen behoren. Zo is kristallografie uitgerust met hulpmiddelen die de ruimte van alle mogelijke kristalstructuren verdelen in een eindig aantal niet-overlappende sets. Van al het verbijsterende aantal manieren waarop je je zou kunnen voorstellen atomen samen te voegen in een periodieke driedimensionale reeks, put dit beperkte classificatiesysteem de mogelijkheden uit. Men kan de overeenkomsten tussen de verschillende systemen [93] bespreken en anders een echt begrip van variëteiten van mogelijke structuren benaderen. Maar geldt hetzelfde voor niet-periodieke materialen?

Om de discussie te vereenvoudigen, beperken we onze aandacht tot het eendimensionale geval van het stapelen van 1000 ML's. Laten we aannemen dat dit over een alfabet van kardinaliteit twee gaat. Hoeveel mogelijke stapelvolgordes zijn er? 16 Welnu, er zijn 2 1000 ≈10 301 . Gezien het feit dat er ongeveer 10 80 protonen in het waarneembare heelal zijn, is het duidelijk dat een volledige opsomming eenvoudigweg niet mogelijk is. En als dat zo was, is het de vraag hoe nuttig het zou zijn. Voor deze ongeordende materialen zijn we dus genoodzaakt een beroep te doen op statistische methoden. In plaats van een fijnmazig classificatieschema op het niveau van individuele reeksen, verzamelen we in plaats daarvan alle reeksen die dezelfde statistische eigenschappen hebben in een set. In de volksmond vertegenwoordigt elke set a stapelproces. Operationeel proberen we te identificeren tot welk proces een bepaalde sequentie behoort, en dan analyseren we het proces in plaats van de specifieke sequentie.

Elk van de grafieken in figuur 4 en 7 specificeert een bepaald proces en definieert een verborgen Markov-model. Hoewel er nog steeds een oneindig aantal mogelijke processen is in de limiet van oneindig lange reeksen, is er een soort orde opgelegd. We kunnen bijvoorbeeld alle processen opsommen over een alfabet met twee symbolen en slechts één toestand. Er is er maar één, en deze wordt getoond in figuur 4C. (Figuur 4een,B zijn slechts speciale gevallen van figuur 4C.) Voor binaire processen met twee toestanden zijn er 13 [86]. 17 Voor binaire processen is het aantal afzonderlijke processen tot zes toestanden getabelleerd [95]. Chaotische kristallografie doet dus voor ongeordende materialen ongeveer dezelfde dienst als klassieke kristallografie voor perfect geordende materialen: het organiseert en structureert de ruimte van mogelijke atomaire rangschikkingen. Bovendien maakt het een vergelijking mogelijk van de verborgen Markov-modellen tussen verschillende materialen op vrijwel dezelfde manier waarop kristalstructuren van verschillende materialen worden vergeleken op basis van bijvoorbeeld het kristalsysteem waartoe ze behoren.

We beweren dan dat de verborgen Markov-modellen die niet alleen verschillende exemplaren van hetzelfde materiaal beschrijven, maar ook verschillende materialen, kunnen worden vergeleken, hetzij door direct onderzoek van het grafische model van het proces, hetzij door informatiemaatregelen die verschillende rekenkundige vereisten kenmerken. Als voorbeeld kunnen we metingen van intrinsieke berekening vergelijken tussen de twee materialen die in de vorige subparagrafen zijn beschouwd, evenals die van een derde gelaagd materiaal, ZnS. Van de vele maatregelen die men kan selecteren, kiezen we ervoor om de informatieve organisatie van deze materialen te onderzoeken via een complexiteit-entropiediagram [25]. In een complexiteits-entropiediagram wordt voor elk stapelproces de entropiesnelheid weergegeven Hμ van een symboolreeks besproken in §3 en de onderlinge informatie tussen de twee helften van het monster, de overtollige entropie E, geïntroduceerd in §4. Deze maten kunnen direct worden berekend vanuit het verborgen Markov-model voor de stapelprocessen.

We beginnen met ijs. Merk op dat ijs IC en ijs ikH worden beide beschreven door machines met één toestand en dus deelt elke helft van het kristal geen informatie met de andere helft, waardoor E(LC)=E(lH)=0 bits. Evenzo, perfect geordend, vinden we: Hμ(LC)=Hμ(lH)=0 bits ML −1 . voor ijs Isd, berekenen we deze hoeveelheid voor een aantal experimentele exemplaren die in de literatuur zijn vermeld. Malkin et al. [73] voerde röntgendiffractiestudies uit van verschillende monsters van ijs I dat was herkristalliseerd uit ijs II en verwarmd met snelheden tussen 0,1 en 30 K per minuut over een temperatuurbereik van 148-168 K. Ze gebruikten de s=4 Jagodzinski-stoornismodel om hun resultaten te analyseren, en we vinden door directe berekening uit de gegevens in hun tabel 4 dat deze informatiematen clusteren in het bereik van E(Lsd)≈0.10−0.15 bits en Hμ(Lsd)≈0,75−0,90 bits ML −1 . Murray et al. [78] voerde soortgelijke studies uit op ijs dat ik als amorf ijs uit de dampfase op een glazen substraat bij 110 K had afgezet. Het monster werd vervolgens verwarmd met een snelheid van 1 K per minuut, en ze rapporteerden diffractiepatronen die bij geselecteerde temperaturen in het bereik van 125-160 K. Ook zij analyseerden de diffractiepatronen met behulp van de s=4 Jagodzinski-stoornismodel, hoewel ze vonden dat de geheugeneffecten verwaarloosbaar waren. We vinden door directe berekening op basis van de gegevens in hun tabel 1 dat deze informatiemaatregelen clusteren in de buurt van E(Lsd)≈0 bits en Hμ(Lsd)≈0.95−1.00 bits ML −1 . We kunnen hetzelfde doen voor TBHB. We vinden E(TBHB)=0,21 bits en Hμ(TBHB)=1,1 bits ML −1 . Ter vergelijking beschouwen we deze hoeveelheden ook voor verschillende exemplaren van ZnS die elders zijn geanalyseerd [29]. Ten slotte beschouwen we, om te contrasteren met deze ongeordende monsters, een eendimensionaal proces dat kenmerken heeft die vergelijkbaar zijn met die van een quasi-kristal, de Thue-Morse-proces (TM-proces) [96]. Als een quasi-kristal is het volledig 'geordend', maar niet-periodiek. We hebben stukjes, waar? N is het aantal lagen in het monster, en Hμ(TM)=0 bits ML −1 .

Aangezien de maximaal mogelijke stapelstoornis 1 bit ML −1 is voor ijs I, zien we dat ongeordend ijs I echt, nou ja, ongeordend is. Verder weinig informatie (E) wordt gedeeld tussen de verschillende helften. Er is weinig dat kan voorspellen dat de ene helft van het monster de andere helft kent. De clustering van deze informatiemaatregelen geeft geloofwaardigheid aan het idee dat ijs Isd is een ‘nieuwe’ vorm van ijs. We zouden echter voorzichtig zijn als we hiernaar verwijzen als een afzonderlijke thermodynamische fase van ijs. Merk op dat het niet alleen niet goed gedefinieerd is in de stapelreeksruimte, dat wil zeggen dat er veel reeksen zijn die overeenkomen met ijs Isd, maar we zien ook aan de verspreiding van informatiematen op het complexiteit-entropiediagram, het is ook niet goed gedefinieerd in de procesruimte. We geven de voorkeur aan de interpretatie dat deze exemplaren chaotische kristallen zijn, die elk worden beschreven door een ander verborgen Markov-model en elk verschillende maten van informatieverwerking vertonen. Ze vormen dus echt geen afzonderlijke fase in dezelfde zin als ijs IC en ijs ikH zijn. ijs Isd is, althans op dit moment, een overkoepelende term voor ijs I met een grotendeels willekeurige stapeling van hexagonale en kubische lagen. We merken op dat informatietheoretische maatregelen onderscheid kunnen maken tussen ijs Isd monsters met verschillende geschiedenissen onder verschillende thermodynamische omstandigheden.

TBHB lijkt eveneens zeer ongeorganiseerd te zijn. We merken op dat, aangezien er drie mogelijke stapeloriëntaties zijn voor elke ML, de maximaal mogelijke stapelentropie . Zoals eerder opgemerkt, is er inderdaad geen centrale periodieke cyclus in de grafiek van figuur 7, zoals vaak wordt gezien bij defecte materialen. Evenzo wordt er ook niet veel informatie gedeeld tussen de twee helften. ZnS presenteert de minst entropische van de ongeordende exemplaren die we beschouwen. Net als de ijs-I-monsters die ik heb overwogen, zijn de ZnS-exemplaren ofwel ongeordend gegroeid of gevangen in de transformatie tussen kristallijne fasen: een hexagonale fase en een kubische fase. In het algemeen lijkt ZnS echter meer gestructureerde tussentoestanden te hebben, wat een meer gestructureerde transformatie suggereert, waarschijnlijk als gevolg van aanzienlijke beperkingen op de soorten ontregelende mechanismen die in het spel zijn.We kunnen speculeren dat, hoewel ijs I en ZnS beide kunnen worden beschreven als dicht opeengepakte structuren, de wanorde- en transformatiemechanismen op zijn minst kwantitatief, zo niet kwalitatief, voor elk verschillend zijn.

Als we figuur 8 bekijken, zien we dat het complexiteit-entropiediagram ook een indeling biedt voor de soorten structuren die kunnen bestaan. Elk periodiek proces heeft bijvoorbeeld nul entropie, dus op een complexiteit-entropiediagram zijn alle perfecte kristallen beperkt tot de verticale as. Dit maakt dus concreet hoe bijzonder kristalliniteit is. Evenzo bewonen quasi-kristallen de linkerbovenhoek van het diagram, ook beperkt tot de verticale as. Dus, hoewel best interessant, zijn quasi-kristallen informatief nogal speciale organisaties. Alle ruimte rechts van de verticale as wordt ingenomen door entropische kristallen - precies het soort exemplaren dat chaotische kristallografie bij uitstek geschikt is om te beschrijven. Chaotische kristallografie introduceert dus hulpmiddelen om deze structuren te kwantificeren en vertegenwoordigt een aanzienlijke uitbreiding op het domein van klassieke kristallografie.

Figuur 8. De verscheidenheid aan intrinsieke berekeningen zoals onthuld door een complexiteit-entropiediagram voor materiaalarchitectuur. Voor ongeordend ijs plotten we waarden berekend op basis van experimenten op Isd (* uit tabel 1 van [78] en uit tabel 4 van [73]) TBHB ( uit [89]) en ZnS ( uit [29]). Ter referentie plotten we het complexiteits-entropiepunt voor zowel IH en ikC (⊗) evenals Isd (•). Niet getoond is het punt voor het TM-proces (zie tekst), een eendimensionaal surrogaat voor een quasi-kristal. We zouden het oneindig hoog op de verticale as vinden. (De overtollige entropie is divergent met een verdwijnend kleine entropiesnelheid voor grote exemplaren.) Verschillende waarden van intrinsieke berekening duiden op significante verschillen in de organisatie van het stapelproces voor elk materiaal, evenals hun entropiedichtheden. (Online versie in kleur.)

Hoewel we volhouden dat het begrijpen van structuur op zich een waardig genoeg doel is, zijn we ons ervan bewust dat een van de vruchten die uit dit onderzoek kunnen worden geoogst, de mogelijke exploitatie is van de verbinding tussen structuur en functie. 18 De onderlinge relatie tussen structuur en materiaaleigenschappen is vrij goed bekend. Koolstof kan bestaan ​​als een kubusvormig kristal in het midden en, wanneer een exemplaar zo is besteld, noemen we het een diamant. Vaker wordt koolstof gevonden in zeshoekige platen en staat bekend als grafiet. Koolstof kan ook worden gerangschikt als nanobuisjes en bolvormige schelpen die informeel worden genoemd Bucky ballen. En hoewel elk van deze qua samenstelling equivalent is, zijn hun materiaaleigenschappen enorm verschillend. Structuur is belangrijk. Minder drastisch veranderen verschillende soorten stapelstructuren de materiaaleigenschappen op subtielere manieren. Brafman & Steinberger [98] merkten op dat, door van de ene soort periodieke stapelstructuur in ZnS naar de andere te veranderen, de mate van dubbele breking verandert. Deze verandering bleek inderdaad af te hangen van slechts één enkele parameter, de hexagonaliteit, de fractie van lagen die hexagonaal gerelateerd zijn aan hun buren, gegeven door . En, misschien als gevolg daarvan, deed het dat op een zeer soepele en voorspelbare manier. We weten dat de stapelstructuur andere materiaaleigenschappen beïnvloedt, zoals het diffractiepatroon en, duidelijk, de correlatiefuncties. Er is weinig fantasie voor nodig om te speculeren dat andere eigenschappen op dezelfde manier kunnen worden beïnvloed.

Laten we dan terugkeren naar het geval van het stapelen van 1000 ML's. Stel dat we een materiaalwetenschapper de opdracht geven om de mogelijke materiaaleigenschappen te onderzoeken die kunnen worden verkregen uit verschillende stapelvolgordes. Zelfs in het eenvoudige binaire geval, zoals we hierboven zagen, zijn er ongeveer 10 301 van dergelijke reeksen. Dus (de weliswaar naïeve benadering van) een gedetailleerde sequentie-voor-sequentie-analyse is onhaalbaar - experimenteel, theoretisch of via simulatie. Maar bij afwezigheid van enige theorie van wanorde in materialen, zou een dergelijke onderzoeksbenadering met brute kracht nodig kunnen worden geacht. Een chaotisch kristallografieperspectief voorziet de materiaalwetenschapper onmiddellijk van tools om het probleem aan te pakken. Zo weet ze dat veel materiaaleigenschappen worden bepaald door en alleen te berekenen zijn uit kennis van het stapelproces. Dus in plaats van te proberen het probleem volgorde voor volgorde aan te pakken, is het winstgevend om het proces per proces te benaderen. Hoewel de ruimte nog steeds enorm is, is deze aanzienlijk kleiner en, belangrijker nog, nu gesystematiseerd. Beginnen met eenvoudige processen en overgaan naar complexere processen kan bijvoorbeeld een effectieve strategie zijn. 19 Bovendien zijn eigenschappen misschien niet eens afhankelijk van de details van het stapelproces, maar kunnen ze in plaats daarvan correleren met algemene statistische eigenschappen of informatietheoretische maatregelen. Het geval van de dubbele breking van ZnS zinspeelt hierop. Een enkele statistische parameter correleert met de waargenomen dubbele breking, tenminste voor periodieke stapelsequenties. Ook is bekend dat het diffractiepatroon alleen afhangt van de paarsgewijze correlaties tussen ML's. Het is algemeen bekend dat verschillende stapelprocessen dezelfde correlatiefuncties kunnen hebben, wat suggereert dat een nog minder fijnmazige benadering winstgevend kan zijn. Voor zover transmissie-eigenschappen door ongeordende potentialen alleen afhankelijk zijn van correlatiefuncties [61], kan ook hier een minder fijnmazige benadering nuttig zijn.

Men kan bezwaar maken en zich afvragen of we gegarandeerd zijn dat alle materiaaleigenschappen hetzelfde zijn voor alle realisaties van een proces. Wij zijn niet. Echter, theoretische resultaten die de belangrijke parameters suggereren waarmee rekening moet worden gehouden, in combinatie met experimentele observaties en de resultaten van simulaties, kunnen vertrouwen geven dat een bepaalde eigenschap die wordt bestudeerd een ensemble-eigenschap is. Ongetwijfeld blijft veel van het verband tussen informatietheoretische eigenschappen en materiaaleigenschappen onontgonnen. In de lijn die hier wordt gepresenteerd en parallel loopt met Schrödingers principiële maar speculatieve gedachten over de organisatie van het leven, zijn de overvloedige hints van intieme connecties te veelbelovend en zijn mogelijke beloningen voor het vinden en exploiteren van dergelijke connecties te rijk om niet te onderzoeken.

We merken ook op dat het voorspellen van materiaaleigenschappen op basis van structuur geenszins academisch is: het Materials Genome Initiative [99] is een gecoördineerde en toegewijde inspanning die theoretische, experimentele en simulatiestudies omvat die juist dit proberen te doen. Gezien de enorme verscheidenheid aan mogelijke rangschikkingen van atomen, is een organisatieschema dat de ruimte van mogelijkheden structureert een absolute noodzaak. Anders zullen onderzoekers merken dat ze alleen op intuïtie vertrouwen - formidabel, maar al te vaak onbetrouwbaar - om mogelijke configuraties met nieuwe materiaaleigenschappen voor te stellen en samen te stellen. Zonder al te veel overdrijving lijkt het op op een toetsenbord bonzen in de hoop een van Shakespeare's sonnetten eruit te pikken: mogelijk ja, maar des te waarschijnlijker als men de regels van de Engelse grammatica kent.

5. Thermodynamica van materiaalberekening

Tot nu toe hebben we ons uitsluitend gericht op informatieve eigenschappen die zijn ingebed in de statische structuur van 'chaotische' materialen, waarbij we de temporele dynamiek van hun groei, hun functionele gedrag in het 'wild' en dergelijke negeerden. Een volledig verhaal vereist echter een thermodynamisch verslag van de informatieve aspecten van dergelijke materialen - de energieën van hun evenwichts- en niet-evenwichtsconfiguraties, de energieën van hoe ze tot stand komen, hoe ze worden getransformeerd en welke functies ze ondersteunen. Om het verband tussen intrinsieke informatie en energetische kosten te illustreren, bespreken we hier kort recente verkenningen van Maxwell's Demon en een ratelmodel dat beschrijft hoe moleculaire 'motoren' informatie kunnen opslaan en verwerken terwijl ze een controlereeks doorlopen.

(a) Szilard's single-molecule engine

Biologische macromoleculen [100-102] voeren taken uit die de gelijktijdige manipulatie van energie, informatie en materie inhouden. Hoewel we soms een dergelijk functioneren kunnen identificeren - in de stroomafsluiting van een membraanionkanaal [103,104] dat de voortplanting van spike-treinen langs een neuronaal axon ondersteunt of in een motoreiwit dat voedingsstoffen over de microtubuli-snelwegen van een cel vervoert [100] - is het niet goed begrepen. Begrijpen vereist een thermodynamica van systemen op nanoschaal die ver uit evenwicht opereren en een fysica van informatie die organisatie en functie kwantitatief identificeert. In wezen moeten we dit functioneren corrigeren met de entropiegeneratie die wordt gedicteerd door de tweede wet van de thermodynamica. James Clerk Maxwell introduceerde de Demon die nu zijn naam draagt ​​om de essentiële paradox te benadrukken. Als een demon de toestand van een moleculair systeem kan meten en acties kan ondernemen op basis van die kennis, kan de Tweede Wet worden geschonden: het sorteren van langzame en snelle moleculen op afzonderlijke zijden van een scheidingswand creëert een temperatuurgradiënt die een warmtemotor kan omzetten in nuttig werk . Op deze manier kan demonische 'intelligentie' - of, in ons vocabulaire, informatieverwerking - thermische fluctuaties (ongeorganiseerde energie) omzetten in werk (georganiseerde energie).

In 1929 introduceerde Leo Szilard een ideale Maxwelliaanse demon voor het onderzoeken van de rol van informatieverwerking in de Tweede Wet [105], een gedachte-experiment dat ongeveer tien jaar later een impuls gaf aan Shannons communicatietheorie [106]. Szilard's Engine bestaat uit drie componenten: een controller (de demon), een thermodynamisch systeem (een molecuul in een doos) en een warmtereservoir dat beide tot een temperatuur houdt t. Het werkt door een eenvoudig mechanisme van een herhalende cyclus van drie stappen van meten, controleren en wissen. Tijdens de meting wordt halverwege de doos een barrière geplaatst, waardoor het molecuul wordt beperkt tot de linker- of rechterhelft van de doos, en het geheugen van de demon verandert om weer te geven aan welke kant het molecuul zich bevindt. In de thermodynamische regelstap gebruikt de demon die kennis om het molecuul in staat te stellen de barrière naar de kant tegenover het molecuul te duwen en werk uit het thermische reservoir te halen. In de wisstap zet de demon zijn eindige geheugen terug naar een standaardstatus, zodat hij opnieuw kan meten. de periodieke protocol cyclus van meten, controleren en wissen herhaalt zich eindeloos en deterministisch. Het netto resultaat is de extractie van werk uit het reservoir, gecompenseerd door entropie gecreëerd door veranderingen in het geheugen van de demon. De tweede wet wordt gerespecteerd en de demon wordt uitgedreven, omdat het dumpen van die entropie in het warmtebad een werkstroom vereist die de energie die tijdens de controlestap wordt gewonnen, precies compenseert.

Door niet-lineaire dynamiek te verbinden met de thermodynamica van Szilard's Engine, hebben we onlangs aangetoond dat het protocol voor het schuiven van de meet-controle-uitwissing-barrière equivalent is aan een discrete-time tweedimensionale kaart van het vierkant van de eenheid naar zichzelf [107]. Deze expliciete constructie stelt vast dat Szilard's Engine een chaotisch systeem is waarvan de componentkaarten thermodynamische transformaties zijn - wat we nu een stuksgewijs thermodynamisch systeem. Een animatie van de Szilard Engine, herschikt als dit chaotische dynamische systeem, kan worden bekeken op http://csc.ucdavis.edu/

Wat betekent chaos in de Szilard Engine? Het gezamenlijke systeem genereert informatie - informatie die de demon herhaaldelijk moet blijven meten om gesynchroniseerd te blijven met de positie van het molecuul. Enerzijds wordt informatie gegenereerd door het warmtereservoir door expansie van de toestandsruimte tijdens de regeling. Dit is de chaotische instabiliteit in de motor, gezien als een dynamisch systeem. En aan de andere kant wordt informatie door de demon (tijdelijk) opgeslagen zodat deze energie uit het reservoir kan halen door de scheidingswand in de juiste richting te laten bewegen. Om de Engine terug te brengen naar dezelfde oorspronkelijke staat, moet die opgeslagen informatie worden gewist. Dit trekt dynamisch de toestandsruimte samen en is dus lokaal dissipatief, waardoor energie wordt afgegeven aan het reservoir.

De totale informatieproductiesnelheid wordt gegeven door de Kolmogorov-Sinai-entropie van de Engine Hμ [108]. Dit meet de informatiestroom van het moleculaire subsysteem naar de demon: informatie die uit het reservoir wordt geoogst en door de demon wordt gebruikt om thermische energie in arbeid om te zetten. Simpel gezegd, de mate van chaos bepaalt de mate van energiewinning uit het reservoir. Bovendien, in zijn basisconfiguratie met de barrière in het midden van de doos en zijn geheugentoestanden van gelijke grootte, zijn de metingen van de molecuulpositie van de demon optimaal. Het gebruikt alle gegenereerde informatie Hμ door het thermodynamische systeem: herinnerend aan §3, alle gegenereerde informatie Hμ is gebonden informatie Bμ geen van de gegenereerde informatie gaat verloren (Rμ verdwijnt).

Kritisch is dat de dynamische Szilard Engine aantoont dat een wijdverbreid geloof over de thermodynamische kosten van informatieverwerking - het zogenaamde Landauer-principe [109-113]: elk gewist bit kost gedissipeerde energie en de handeling van het meten brengt geen thermodynamische kosten met zich mee - is op zijn best een speciaal geval [107,114-116]. 20 Aangezien de partitielocatie varieert en de Demon-geheugencellen van grootte veranderen, kunnen zowel meting als wissen elke positieve of negatieve hoeveelheid warmte afvoeren. Specifiek zijn er Szilard Engine-configuraties die het principe van Landauer rechtstreeks schenden: wissen is thermodynamisch gratis en meting is duur - een anti-Landauer-principe. Het resultaat is dat de Szilard Engine een ondergrens bereikt voor de energiedissipatie, uitgedrukt als de som van de meet- en wisthermodynamische kosten. Hierin legt de Szilard Engine een optimaliteit vast in de omzetting van informatie in werk die analoog is aan de optimale efficiëntie van een Carnot Engine bij het omzetten van een verschil in thermische energieën naar werk.

(b) Informatiekatalysatoren

Szilard's Engine is een van de eenvoudigste gecontroleerde thermodynamische apparaten die de spanning blootlegt tussen de Tweede Wet en de functionaliteit van een informatieverzamelende entiteit of subsysteem (de Demon). Het geëxtraheerde netwerk houdt precies de thermodynamische (entropische) kosten in evenwicht. Dit was het belangrijkste punt van Szilard, hoewel we zien dat zijn Engine niet erg functioneel was, alleen in overeenstemming met de Tweede Wet. De belangrijkste bijdrage was dat Szilard, lang voor Shannons informatietheorie, het belang inzag van het verzamelen en opslaan van informatie door de demon bij het oplossen van Maxwells paradox.

Dit stelt ons in staat om over te stappen op een meer geavanceerd apparaat dat een informatiereservoir (een reeks willekeurige bits) gebruikt om netto positief werk uit een warmtereservoir te halen. Om de weg vrij te maken voor de thermodynamica waarin we geïnteresseerd zijn, maar in de geest van complexe materialen te blijven, laten we ons de Szilard Engine opnieuw voorstellen die is geïmplementeerd als een enzymmacromolecuul waarvan de conformationele toestanden het protocol voor meting-controle-wissen implementeren. Laat dit enzym bovendien een eendimensionaal periodiek kristal doorkruisen - zeg maar een DNA-streng - en de opeenvolgende basenparen lezen om individuele meet-, controle- en wisprotocolopdrachten te verkrijgen. De voorgaande thermodynamica en informatieanalyse zijn dus van toepassing op zo'n moleculaire motor - een actief gecontroleerd systeem dat fluctuaties kan corrigeren, omdat het slechts tijdelijk en lokaal in strijd is met de Tweede Wet.

Laten we echter nog een stap verder gaan door ons een functioneel enzym voor te stellen dat gedurende een thermodynamische cyclus netto positieve arbeid extraheert uit een informatiereservoir om energie op te slaan of vrij te geven terwijl het een keten van kleine moleculaire componenten assembleert of demonteert. Hierin vervangen we het eendimensionale 'controle'-molecuul door een set willekeurige bits die in lokaal evenwicht komen met het enzym. Terwijl ze dat doen, verschuift de dynamiek van het enzym om de assemblage van de componenten te katalyseren. De verschuiving stelt het enzym in staat om selectief energie uit een reservoir te gebruiken, zeg een ATP-rijke omgeving waarvan de moleculen de machine gebruikt wanneer energie nodig is (ATP → ADP) of wordt opgegeven (ADP → ATP). Figuur 9 illustreert de nieuwe, functionele moleculaire machine.

Figuur 9. Informatiekatalysator: een enzymatische moleculaire Maxwelliaanse demon thermaliseert met een opeenvolging van willekeurige bits (informatiereservoir), die elk hun katalytische activiteit veranderen om energiebarrières te overwinnen om een ​​keten van eenvoudige moleculaire componenten samen te stellen. De omgeving, bij constante temperatuur t, levert energierijke moleculen die nodig zijn om de gekatalyseerde reacties en de ketencomponentmoleculen aan te sturen (vgl. de informatieratel van [117]). (Online versie in kleur.)

Op deze manier werkt het ingebeelde enzym als een informatie katalysator dat vergemakkelijkt, via wat anders thermodynamisch ongunstige reacties zijn, de assemblage van de keten van moleculaire componenten. In de jaren veertig beschouwden Leon Brillouin [118] en Norbert Wiener [119], vroege pioniers in de fysica van informatie, enzymen als dit soort katalysatoren. Brillouin stelde in het bijzonder een vrij gelijkaardige 'negatieve katalyse' voor als het moleculaire substraat dat negentropie genereerde - het ordeningsprincipe dat Schrödinger identificeerde als noodzakelijk om levensprocessen in overeenstemming met de Tweede Wet te ondersteunen. Pas veel later zouden dergelijke ‘informatiemoleculen’ worden verdedigd door de evolutionaire biologen John Maynard Smith en Eörs Szathmáry [120].

We hebben onlangs de thermodynamica geanalyseerd van een klasse van geheugenvolle informatiekatalysatoren [117] waarvoor alle correlaties tussen systeemcomponenten expliciet kunnen worden verklaard. Dit gaf een exacte, analytische behandeling van de thermodynamisch relevante Shannon-informatieverandering uit het invoerinformatiereservoir (bitstring met entropiesnelheid Hμ) naar een uitlaatreservoir (bitstring met entropiesnelheid ). Het resultaat was een verfijnde en breed toepasbare Tweede Wet die goed rekening houdt met de intrinsieke informatieverwerking die wordt weerspiegeld in de accumulatie van temporele correlaties. Enerzijds geeft het resultaat een informatieve bovengrens aan de maximale gemiddelde arbeid 〈W〉 geëxtraheerd per cyclus:

Deze tweede wet stelt ons in staat om de thermodynamische functies van de demon te identificeren. Afhankelijk van de modelparameters fungeert het als een motor, energie uit een enkel reservoir halen en omzetten in arbeid (〈W〉>0) door de invoerinformatie willekeurig te verdelen (Hμ′−Hμ>0), of als een informatie gum, informatie wissen (Hμ′−Hμ<0) in de input ten koste van de externe input van werk (〈W〉<0). Bovendien ondersteunt de Demon een contra-intuïtieve functionaliteit. In tegenstelling tot eerdere gummen die alleen de single-bit onzekerheid H[x0], heeft het een nieuw soort gum dat onzekerheden van meerdere bits verwijdert door correlatie (tijdelijke volgorde) toe te voegen, terwijl onzekerheden van enkelvoudige bits juist worden vergroot (H′[x0]−H[x0]>0). Deze modaliteit leidt tot een provocerende interpretatie van levensprocessen: het bestaan ​​van natuurlijke demonen met geheugen (interne toestanden) is een teken dat ze zijn aangepast om tijdelijk gecorreleerde fluctuaties in hun omgeving te benutten.

6. Conclusie

We zijn ver verwijderd van Schrödingers vooruitziende inzicht in aperiodische kristallen. We betoogden, op verschillende nogal verschillende schalen van ruimte en tijd en op verschillende toepassingsdomeinen, dat er een nauw verband bestaat tussen de fysica van het leven en het begrijpen van de informatiebasis van biologische processen, gezien in termen van de samenstellende complexe materialen van het leven. Onderweg merkten we het nauwe verband op tussen nieuwe experimentele technieken en nieuwe theoretische grondslagen - een verband dat nodig is om ons begrip van biologische organisatie en processen te vergroten. We pleitten voor het belang van structuur en probeerden aan te tonen dat we nu direct en kwantitatief kunnen praten over organisatie in wanordelijke materialen, een gevolg van het breken met het beschouwen van kristallen als alleen periodiek [42,64]. Deze gestructureerde ongeordende materialen, in hun vermogen om informatie op te slaan en te verwerken, speelden vermoedelijk een rol bij de overgang van louter moleculen naar materiële organisaties die substraten werden die de biologie ondersteunen [121]. Voor de biologie is de niet-kristallijne 'stoornis' natuurlijk veel meer, het codeert de informatie die nodig is voor het leven. Biologische materie is dus meer dan natte, squishy 'zachte materie', het is informatieve materie. DNA, RNA en eiwitten zijn informatiemoleculen [118-120]. Zozeer zelfs dat DNA bijvoorbeeld geprogrammeerd kan worden [122–124]. En, op een complementaire manier, geven de parallellen die onze ontwikkeling hier aansturen misschien een alternatieve kijk op 'materiële genomica' [99].

Wat biologische materie onderscheidt van louter fysieke materie, is dat de informatie in de eerstgenoemde codeert voor organisatie en dat die organisatie een katalyserende functie vervult door interacties in een structureel diverse omgeving. Bovendien en kritisch worden deze karakters uitgedrukt op een manier die leidt tot steeds nieuwere, complexere chemische structuren - structuren die zich vormen tot entiteiten met verschillende replicatiesnelheden [125]. En de entiteiten met een hoge replicatie wijzigen op hun beurt de omgeving en bouwen 'niches' die de replicatie verbeteren en een thermodynamische cyclus voltooien waarvan men denkt dat de evolutionaire dynamiek op lange termijn creatief open is.

We zagen dat nadenken over Schrödingers kijk op de fysieke basis van het leven vragen opriep over orde, wanorde en structuur in eendimensionale materialen. Chaotische kristallografie - vrij van 'de welwillende tirannie van het kristal' [126] - kwam naar voren als een overkoepelende theorie voor de organisatie van dicht opeengepakte materialen. Het gaf een consistente manier om tegelijkertijd orde en wanorde te beschrijven in laagstapeling in ijs en aromatische verbindingen en, in het algemeen, in eendimensionale chaotische kristallen. En hierin zinspeelt het op een rol die lokale (wan)ordening kan spelen bij het verbeteren van hoe biomoleculen synergetisch in oplossing functioneren. De kwestie van de biologische functie dwong ons om dieper in te gaan op de consistentie ervan met de tweede wet van de thermodynamica. Vervolgens gingen we twee eenvoudige gevallen van Maxwelliaanse moleculaire demonen beschouwen om te illustreren dat de tweede wet van de thermodynamica perfect consistent is met het informatieve karakter en de functionaliteit van slimme moleculen - dat de thermodynamica de energie van dergelijke informatiekatalysatoren kan gaan beschrijven.

Toegegeven, we hebben slechts vluchtig ingegaan op enkele van de grote uitdagingen die een informatieve kijk op materie met zich meebrengt. Shannon introduceerde informatie als verrassing en we toonden aan dat dit gemakkelijk leidde tot zien hoe informatie wordt gemaakt, opgeslagen en verzonden. We hebben echter net de blijvende vraag gesteld hoe dit soort informatie bijdraagt ​​aan materiële functionaliteit. Szilard's Engine en gerelateerde informatiekatalysatoren lieten doorschemeren hoe we functionele informatie in complexe materialen en biomoleculen gaan analyseren. Hopelijk zal het informatieve perspectief voldoende vruchtbaar zijn om uit te breiden tot het analyseren van hoe dergelijke gestructureerde objecten in hun omgeving werken - hoe bijvoorbeeld water een cruciale rol speelt in biomoleculaire interacties en functie.

Opmerking toegevoegd als bewijs

Het is onder onze aandacht gebracht dat recentelijk Cartwright & Mackay [42] speculeerden dat kubisch ijs met voordeel zou kunnen worden gezien als een eendimensionaal chaotisch kristal vanwege zijn wanordelijke en aperiodieke karakter. Merk op dat we hun vermoedens bevestigen en precies dat doen in §4b(i). We danken Julian Cartwright dat hij hierop heeft gewezen. Voorafgaand aan het idee van een chaotisch kristal is natuurlijk Ruelle's beroemde 'turbulente kristal' [127], een kristal dat translatiesymmetrie doorbreekt en 'een structuur heeft die op een niet-quasiperiodieke manier is gemoduleerd'. Van dergelijke kristallen zou worden verwacht dat ze enige 'fuzziness' vertonen in de scherpe reflecties van het diffractiepatroon en diffuse verstrooiing en zouden vergelijkbaar zijn met het idee van een chaotisch kristal dat hier wordt besproken. We onderscheiden onze inspanningen van deze eerdere beschrijvingen door erop te staan ​​dat informatie- en berekeningstheoretische maatregelen en methoden het juiste platform zijn om ongeordende kristalstructuren te kwantificeren.


Meld je aan voorSpectrumnieuwsbrieven

Dit artikel is oorspronkelijk gepubliceerd in juni 2017. Het is herzien om meer recent onderzoek weer te geven.

Onderzoekers weten al sinds de jaren zeventig dat genen bijdragen aan autisme, toen een team ontdekte dat identieke tweelingen vaak dezelfde aandoening delen. Sindsdien hebben wetenschappers potentiële genetische boosdoeners bij autisme opgespoord, een proces dat DNA-decoderingstechnologieën het afgelopen decennium hebben versneld.

Naarmate dit werk vorderde, hebben wetenschappers verschillende soorten genetische veranderingen blootgelegd die ten grondslag kunnen liggen aan autisme. Hoe meer wetenschappers in DNA graven, hoe ingewikkelder de bijdrage ervan aan autisme lijkt te zijn.

Hoe kennen onderzoekers genen? bijdrage leveren tot autisme?
Sinds de eerste autisme-tweelingstudie in 1977 hebben verschillende teams de autismecijfers bij tweelingen vergeleken en aangetoond dat autisme in hoge mate erfelijk is. Wanneer een identieke tweeling autisme heeft, is er ongeveer 80 procent kans dat de andere tweeling het ook heeft. Het overeenkomstige percentage voor twee-eiige tweelingen is ongeveer 40 procent.

De genetica is echter niet volledig verantwoordelijk voor de kansen van een kind om autisme te hebben. Omgevingsfactoren dragen ook bij aan de aandoening - hoewel onderzoekers het niet eens zijn over de relatieve bijdragen van genen en omgeving. Sommige omgevingsinvloeden, zoals blootstelling aan een maternale immuunrespons in de baarmoeder of complicaties tijdens de geboorte, kunnen samen met genetische factoren autisme veroorzaken of de eigenschappen ervan versterken.

Bestaat er zoiets als een autisme-gen??
Niet echt. Er zijn verschillende aandoeningen geassocieerd met autisme die voortkomen uit mutaties in een enkel gen, waaronder fragiele X- en Rett-syndromen. Maar minder dan 1 procent van de niet-syndromale gevallen van autisme komt voort uit mutaties in een enkel gen. Tot nu toe bestaat er in ieder geval niet zoiets als een 'autisme-gen' - wat betekent dat geen enkel gen consequent wordt gemuteerd in elke persoon met autisme. Er lijkt ook geen gen te zijn dat autisme veroorzaakt elke keer dat het wordt gemuteerd.

Toch groeit de lijst met genen die betrokken zijn bij autisme. Onderzoekers hebben ongeveer 100 genen opgeteld die volgens hen sterk verband houden met autisme. Veel van deze genen zijn belangrijk voor de communicatie tussen neuronen of regelen de expressie van andere genen.

Hoe werken deze genen? bijdragen aan autisme?
Veranderingen of mutaties in het DNA van deze genen kunnen leiden tot autisme. Sommige mutaties beïnvloeden een enkel DNA-basenpaar, of 'letter'. In feite heeft iedereen duizenden van deze genetische varianten. Een variant die bij 1 procent of meer van de bevolking voorkomt, wordt als 'vaak' beschouwd en wordt een single nucleotide polymorphism of SNP genoemd.

Veelvoorkomende varianten hebben meestal subtiele effecten en kunnen samenwerken om bij te dragen aan autisme. 'Zeldzame' varianten, die bij minder dan 1 procent van de mensen voorkomen, hebben meestal sterkere effecten. Veel van de mutaties die tot nu toe aan autisme zijn gekoppeld, zijn zeldzaam geweest. Het is aanzienlijk moeilijker om veel voorkomende varianten te vinden die verband houden met autisme. De grootste studie tot nu toe, gepubliceerd in 2019 en waarbij meer dan 18.000 autistische en 27.000 niet-autistische mensen betrokken waren, onthulde 12 regio's van het genoom die aan autisme gerelateerde veelvoorkomende varianten herbergen. Twee extra regio's kwamen naar voren in een heranalyse van de 2019-gegevens in 2020, samen met ongeveer 6.000 extra monsters.

Andere veranderingen, bekend als kopienummervariaties (CNV's), verschijnen als deleties of duplicaties van lange stukken DNA en bevatten vaak veel genen.

Maar mutaties die bijdragen aan autisme zitten waarschijnlijk niet allemaal in genen, die minder dan 2 procent van het genoom uitmaken. Onderzoekers proberen de resterende 98 procent van het genoom binnen te dringen om te zoeken naar onregelmatigheden die verband houden met autisme. Tot nu toe zijn deze regio's slecht begrepen, maar er zijn aanwijzingen dat autisme in verband wordt gebracht met mutaties in stukken niet-coderend DNA die regulerende elementen bevatten die genexpressie regelen.

Zijn alle mutaties even schadelijk?
Nee. Op moleculair niveau kunnen de effecten van mutaties verschillen, zelfs tussen SNP's. Mutaties kunnen schadelijk of goedaardig zijn, afhankelijk van het aantal cellen dat ze in het lichaam aantasten en in hoeverre ze de functie van het overeenkomstige eiwit veranderen. Een missense-mutatie verwisselt bijvoorbeeld het ene aminozuur in het eiwit voor het andere. Als de substitutie het eiwit niet significant verandert, is het waarschijnlijk goedaardig. Een nonsensmutatie daarentegen plaatst een ‘stop’-teken in een gen, waardoor de eiwitproductie voortijdig stopt. Het resulterende eiwit is te kort en functioneert slecht of helemaal niet.

Hoe doen mensen verkrijgen mutaties?
De meeste mutaties worden geërfd van ouders en kunnen vaak voorkomen of zeldzaam zijn. Mutaties kunnen ook spontaan ontstaan ​​in een eicel of zaadcel en komen dus alleen voor bij het kind en niet bij haar ouders. Onderzoekers kunnen deze zeldzame ‘de novo’-mutaties door de DNA-sequenties van mensen met autisme te vergelijken met die van hun niet-aangedane familieleden. Spontane mutaties die na de conceptie ontstaan, zijn meestal 'mozaïek', wat betekent dat ze slechts enkele cellen in het lichaam aantasten. Hoe minder cellen deze mutaties aantasten, hoe milder hun bijdragen aan autismekenmerken.

Kan genetica verklaren waarom jongens meer kans hebben? dan meisjes autisme hebben?
Misschien. Meisjes met autisme lijken meer mutaties te hebben dan jongens met de aandoening. En jongens met autisme erven soms hun mutaties van onaangetaste moeders. Samen suggereren deze resultaten dat meisjes op de een of andere manier resistent kunnen zijn tegen mutaties die bijdragen aan autisme en een grotere genetische hit nodig hebben om de aandoening te krijgen.

Is er een manier om op mutaties te testen voordat een kind wordt geboren?
Clinici screenen routinematig de chromosomen van een zich ontwikkelende baby om grote chromosomale afwijkingen te identificeren, waaronder CNV's. Er zijn prenatale genetische tests voor sommige syndromen die verband houden met autisme, zoals het fragiele X-syndroom. Maar zelfs als een zich ontwikkelende baby deze zeldzame mutaties heeft, is er geen manier om zeker te weten of hij later de diagnose autisme zal krijgen.


Wat is genotype? Wat is fenotype?

Uw genotype is uw volledige erfelijke genetische identiteit, het is uw unieke genoom dat zou worden onthuld door persoonlijke genoomsequencing. Het woord genotype kan echter ook alleen verwijzen naar een bepaald gen of een reeks genen die door een persoon worden gedragen. Als u bijvoorbeeld een mutatie draagt ​​die verband houdt met diabetes, mag u alleen verwijzen naar uw genotype met betrekking tot deze mutatie, zonder rekening te houden met alle andere genvarianten die u mogelijk drager bent.

Uw fenotype daarentegen is een beschrijving van uw werkelijke fysieke kenmerken. Dit omvat duidelijke zichtbare kenmerken zoals uw lengte en oogkleur, maar ook uw algehele gezondheid, uw ziektegeschiedenis en zelfs uw gedrag en algemene instelling. Kom je gemakkelijk aan in gewicht? Ben je angstig of rustig? Hou je van katten? Dit zijn allemaal manieren waarop je jezelf aan de wereld presenteert, en worden als zodanig beschouwd als fenotypes. Niet alle fenotypes zijn echter een direct gevolg van uw genotype, de kans is groot dat uw persoonlijke aanleg voor katten het resultaat is van uw levenservaring met huisdieren in plaats van een mutatie in een hypothetisch kattenliefhebbergen.

De meeste fenotypes worden beïnvloed door zowel je genotype als door de unieke omstandigheden waarin je je leven hebt geleefd, inclusief alles wat je ooit is overkomen. We verwijzen vaak naar deze twee inputs als 'natuur', het unieke genoom dat je draagt, en 'nurture', de omgeving waarin je je leven hebt geleefd.


Referenties

Ferlay, J. et al. Kankerincidentie en mortaliteit wereldwijd: bronnen, methoden en belangrijke patronen in GLOBOCAN 2012. Internationaal tijdschrift voor kanker (2015).

Wereld Gezondheid Organisatie. Laatste wereldwijde kankergegevens: de kankerlast stijgt tot 18,1 miljoen nieuwe gevallen en 9,6 miljoen sterfgevallen door kanker in 2018. Internationaal Agentschap voor Kankeronderzoek (2018).

Janssen-Heijnen, M.L. & Coebergh, J.-W. W. Trends in incidentie en prognose van de histologische subtypes van longkanker in Noord-Amerika, Australië, Nieuw-Zeeland en Europa. longkanker 31, 123–137 (2001).

Rose-James, A. & Tt, S. Molecular Markers met voorspellende en prognostische relevantie bij longkanker. Internationale longkanker (2012).

Jorge, S.E., Kobayashi, S.S. & Costa, D.B. Epidermale groeifactorreceptor (EGFR) -mutaties bij longkanker: preklinische en klinische gegevens (2014).

Harrison, P.T., Vyse, S. & Huang, P.H. Zeldzame epidermale groeifactorreceptor (EGFR) -mutaties bij niet-kleincellige longkanker. Seminars in kankerbiologie 1-13 (2019).

Ferrer, ik. et al. KRAS-mutant niet-kleincellige longkanker: van biologie tot therapie (2018).

Zhang, S.M. et al. Prognostische waarde van EGFR en KRAS bij gereseceerde niet-kleincellige longkanker: een systematische review en meta-analyse. Kankerbeheer en onderzoek (2018).

Fang, S. & Wang, Z. EGFR-mutaties als een prognostische en voorspellende marker bij niet-kleincellige longkanker (2014).

Martin, P., Leighl, N.B., Tsao, M.S. & Shepherd, F.A. KRAS-mutaties als prognostische en voorspellende markers bij niet-kleincellige longkanker (2013).

Planchard, D. et al. Gemetastaseerde niet-kleincellige longkanker: ESMO Clinical Practice Guidelines voor diagnose, behandeling en follow-up. Annalen van de oncologie (2018).

Lynch, T.J. et al. Mutaties activeren in de epidermale groeifactorreceptor die ten grondslag ligt aan de respons van niet-kleincellige longkanker op gefitinib. New England Journal of Medicine (2004).

Paez, J.G. et al. EGFR-mutaties in long, kanker: correlatie met klinische respons op gefitinib-therapie. Wetenschap (2004).

Pao, W. et al. EGF-receptorgenmutaties komen vaak voor bij longkankers van "nooit-rokers" en zijn geassocieerd met gevoeligheid van tumoren voor gefitinib en erlotinib. Proceedings van de National Academy of Sciences van de Verenigde Staten van Amerika (2004).

Schrank, Z. et al. Huidige moleculair gerichte therapieën bij NSCLC en hun resistentiemechanisme (2018).

Zhao, W. et al. Op weg naar automatische voorspelling van de EGFR-mutatiestatus in longadenocarcinoom met 3D deep learning. Medicijnen tegen kanker (2019).

Tomasini, P., Walia, P., Labbe, C., Jao, K. & Leighl, N. B. Gericht op de KRAS-route bij niet-kleincellige longkanker. de oncoloog (2016).

Canon, J. et al. De klinische KRAS(G12C)-remmer AMG 510 stimuleert de antitumorimmuniteit. Natuur (2019).

Fakih, M. et al. Fase 1-studie ter evaluatie van de veiligheid, verdraagbaarheid, farmacokinetiek (PK) en werkzaamheid van AMG 510, een nieuwe KRAS G12C-remmer met kleine moleculen, in geavanceerde solide tumoren. Tijdschrift voor klinische oncologie (2019).

Adderley, H., Blackhall, F.H. & Lindsay, C.R. KRAS-mutante niet-kleincellige longkanker: convergerende kleine moleculen en remming van het immuunsysteem. EBioGeneeskunde 41, P711-716 (2019).

Mullard, A. Kras kraken. Natuurrecensies Drug Discovery (2019).

Folch, E., Costa, D. B., Wright, J. & VanderLaan, P. A. Diagnose en stadiëring van longkanker in de minimaal invasieve leeftijd met toenemende vraag naar weefselanalyse (2015).

Jain, E. & Roy-Chowdhuri, S. Moleculaire pathologie van cytologiemonsters van longkanker een beknopt overzicht (2018).

Cai, L. L. & Wang, J. Vloeibare biopsie voor immunotherapie van longkanker (Review) (2019).

Rizzo, S. et al. CT-radiogenomische karakterisering van EGFR-, K-RAS- en ALK-mutaties bij niet-kleincellige longkanker. Europese Radiologie (2016).

Bakr, S. et al. Een radiogenomische dataset van niet-kleincellige longkanker. wetenschappelijke gegevens 5, 180202 (2018).

Bodalal, Z., Trebeschi, S., Nguyen-Kim, T.D.L., Schats, W. & Beets-Tan, R. Radiogenomics: bridging imaging en genomics (2019).

Digumarthy, S.R., Padole, A.M., Gullo, R.L., Sequist, L.V. & Kalra, M.K. Kan ct-radiomische analyse in nsclc histologie en egfr-mutatiestatus voorspellen? Medicijn 98 (2019).

Mei, D., Luo, Y., Wang, Y. & Gong, J. Ct-textuuranalyse van longadenocarcinoom: kunnen radiomische kenmerken surrogaatbiomarkers zijn voor egfr-mutatiestatussen. Beeldvorming van kanker 18, 52 (2018).

Liu, Y. et al. Radiomische kenmerken zijn geassocieerd met egfr-mutatiestatus in longadenocarcinomen. Klinische longkanker 17, 441–448 (2016).

Wang, s. et al. Het voorspellen van de EGFR-mutatiestatus in longadenocarcinoom op computertomografiebeeld met behulp van deep learning. Europees Ademhalingsdagboek (2019).

Gevaert, O. et al. Voorspellende radiogenomics-modellering van egfr-mutatiestatus bij longkanker. wetenschappelijke rapporten 7, 41674 (2017).

Dias, C., Pinheiro, G., Cunha, A. & Oliveira, H. P. Radiogenomics: voorspelling van de mutatiestatus van longkankergerelateerde genen. In IbPRIA 2019: 9e Iberische conferentie over patroonherkenning en beeldanalyse (2019).

Clark, K. et al. Het kankerbeeldvormingsarchief (tcia): het onderhouden en exploiteren van een openbare informatieopslag. Tijdschrift voor digitale beeldvorming 26, 1045–1057 (2013).

Gevaert, O. et al. Niet-kleincellige longkanker: het identificeren van prognostische beeldvormingsbiomarkers door gebruik te maken van openbare microarraygegevens voor genexpressie - Methoden en voorlopige resultaten. Radiologie (2012).

Shen, S., Han, S.X., Bui, A.A. & Hsu, W.Een interpreteerbaar diep hiërarchisch semantisch convolutioneel neuraal netwerk voor classificatie van longknobbeltjes. expert systemen met applicaties (2019).

Mei, D., Luo, Y., Wang, Y. & Gong, J. CT-textuuranalyse van longadenocarcinoom: kunnen radiomische kenmerken surrogaatbiomarkers zijn voor EGFR-mutatiestatussen. Beeldvorming van kanker (2018).

Papadopoulou, E. et al. Bepaling van de egfr- en kras-mutatiestatus bij Griekse niet-kleincellige longkankerpatiënten. Oncologie brieven 10, 2176–2184 (2015).

Varghese, A.M. et al. Longen niet vergeten: vergelijking van het kras- en egfr-mutatieprofiel en overleving van collegiale rokers en nooit-rokers met vergevorderde longkanker. Tijdschrift voor thoracale oncologie 8, 123–125 (2013).

Dogan, S. et al. Moleculaire epidemiologie van egfr- en kras-mutaties in 3.026 longadenocarcinomen: hogere gevoeligheid van vrouwen voor aan roken gerelateerde kras-mutantkankers. Klinisch kankeronderzoek 18, 6169–6177 (2012).

Jip, S.S. et al. Associaties tussen somatische mutaties en metabole beeldvormingsfenotypen bij niet-kleincellige longkanker. Tijdschrift voor nucleaire geneeskunde (2017).

Jip, S.S. et al. Impact van experimenteel ontwerp op PET-radiomics bij het voorspellen van de somatische mutatiestatus. Europees tijdschrift voor radiologie (2017).

Zhang, H., Cai, W., Wang, Y., Liao, M. & Tian, ​​S. CT en klinische kenmerken die het risico op EGFR-mutatie bij niet-kleincellige longkanker voorspellen: een systematische review en meta-analyse. Internationaal tijdschrift voor klinische oncologie (2019).

Hosny, A. et al. Diep leren voor de prognose van longkanker: een retrospectief multi-cohort radiomics-onderzoek. PLoS-geneeskunde (2018).

Wilson, R. & Devaraj, A. Radiomics van longknobbeltjes en longkanker (2017).

Yamashita, R., Nishio, M., Kinh, R., Do, G. & Togashi, K. Convolutionele neurale netwerken: een overzicht en toepassing in de radiologie. Inzichten Beeldvorming 9, 611–629 (2018).

Davidson, M.R., Gazdar, A.F. & Clarke, B.E. De cruciale rol van pathologie bij de behandeling van longkanker (2013).

Doshi, J.A., Hendrick, F.B., Graff, J.S. & Stuart, B.C. Gegevens, gegevens overal, maar toegang blijft een groot probleem voor onderzoekers: een overzicht van toegangsbeleid voor door de overheid gefinancierde gezondheidszorggegevens op patiëntniveau in de Verenigde Staten. eGEM's (bewijzen en methoden genereren om de resultaten voor patiënten te verbeteren) (2016).

Kahn, C.E., Carrino, J.A., Flynn, M.J., Peck, D.J. & Horii, S.C. Dicom en radiologie: verleden, heden en toekomst. Tijdschrift van het American College of Radiology 4, 652–657 (2007).

Bakr, S. et al. Gegevensdescriptor: een radiogenomische dataset van niet-kleincellige longkanker. Wetenschappelijke gegevens (2018).

Kalra, A. Ontwikkeling van bijvoorbeeld menselijke modellen op basis van medische beelden. In Yang, K.-H. (red.) Basis eindige-elementenmethode zoals toegepast op biomechanica van letsel (2018).

Bolliger, S.A., Oesterhelweg, L., Spendlove, D., Ross, S. & Thali, M.J. Is differentiatie van vaak aangetroffen vreemde lichamen in lijken mogelijk door meting van de Hounsfield-dichtheid? Tijdschrift voor forensische wetenschappen 54, 1119–1122 (2009).

Van Griethuysen, J.J. et al. Computationeel radiomics-systeem om het radiografische fenotype te decoderen. kankeronderzoek 77, e104-e107 (2017).

Prochazka, A., Grafova, L., Vyšata, O. & Caregroup, N. Driedimensionale wavelet-transformatie in multidimensionale biomedische volumeverwerking. In Proc. van de IASTED International Conference on Graphics and Virtual Reality, Cambridge, 263–268 (2011).

Fotin, S.V., Reeves, A.P., Biancardi, A.M., Yankelevitz, D.F. & Henschke, C.I. Een multiscale laplacian van gaussiaanse filterbenadering voor geautomatiseerde longknobbeldetectie van lage-dosis ct-scans van de hele long. In Medische beeldvorming 2009: computerondersteunde diagnose, vol. 7260, 72601Q (Internationale Vereniging voor Optica en Fotonica, 2009).

Hansell, D.M. et al. Fleischner Society: woordenlijst voor thoracale beeldvorming. Radiologie 246, 697–722 (2008).

Abdi, H. en Williams, L. J. Hoofdcomponentenanalyse. In Encyclopedie van biometrie (2009).

Maaten, L. v. d. & Hinton, G. Gegevens visualiseren met t-sne. Tijdschrift voor onderzoek naar machine learning 9, 2579–2605 (2008).

Chawla, N.V., Bowyer, K.W., Hall, L.O. & Kegelmeyer, W.P. Smote: synthetische oversamplingtechniek voor minderheden. Tijdschrift voor onderzoek naar kunstmatige intelligentie 16, 321–357 (2002).

Chen, T. & Guestrin, C. XGBoost: een schaalbaar boomversterkingssysteem. In Proceedings van de ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (2016).

Nishi, M. et al. Computerondersteunde diagnose van longknobbels met behulp van gradiëntboomversterking en Bayesiaanse optimalisatie. PLoS ONE (2018).

Zhang, X. et al. Identificatie van kankergerelateerde lange niet-coderende RNA's met behulp van XGBoost met hoge nauwkeurigheid. Voorkant. Genet. 10, 1–14 (2019).


Bekijk de video: PEOPLEu0026connection Pu0026C. Présentation du Concept 2017 (December 2021).