Klima
Nature Communications Band 14, Artikelnummer: 1080 (2023) Diesen Artikel zitieren
3216 Zugriffe
5 Altmetrisch
Details zu den Metriken
Quartäre Klimaschwankungen veranlassten viele Arten dazu, ihre geografischen Verbreitungsgebiete zu verschieben, was wiederum ihre genetischen Strukturen veränderte. Kürzlich wurde argumentiert, dass die Anpassung möglicherweise mit der Verschiebung des Artenspektrums durch das „Sieben“ von Genotypen während der Kolonisierung und Etablierung einhergegangen ist. Dies wurde jedoch nicht direkt nachgewiesen, und das Wissen darüber, wie verschiedene evolutionäre Kräfte, die typischerweise separat untersucht werden, zusammenwirkten, um gemeinsam die Reaktionen der Arten auf vergangene Klimaveränderungen zu vermitteln, sind weiterhin begrenzt. Hier rekonstruieren wir durch die Neusequenzierung des gesamten Genoms von über 1200 Individuen der Nelke Dianthus sylvestris in Verbindung mit integrierten Populationsgenom- und Gen-Umweltmodellen die neutrale und adaptive Landschaft dieser Art in der Vergangenheit, wie sie durch die quartären Eiszyklen geformt wurde. Wir zeigen, dass adaptive Reaktionen gleichzeitig mit den postglazialen Verschiebungen und Erweiterungen dieser Art in den letzten 20.000 Jahren entstanden. Dies war auf die heterogene Siebung adaptiver Allele über Raum und Zeit zurückzuführen, als sich die Populationen aus restriktiven glazialen Refugien in das breitere und heterogenere Spektrum an Lebensräumen ausdehnten, die in der heutigen Zwischeneiszeit verfügbar sind. Unsere Ergebnisse zeigen ein eng verknüpftes Zusammenspiel von Migration und Anpassung bei vergangenen klimabedingten Verbreitungsverschiebungen, was unserer Meinung nach der Schlüssel zum Verständnis der räumlichen Muster der adaptiven Variation ist, die wir heute bei Arten beobachten.
Heutige Arten haben sich über wiederholte Perioden schwankenden Klimas hinweg gehalten, wie zum Beispiel in den quartären Eiszeiten (2,58 Millionen Jahre – heute), die zu erheblichen Verschiebungen des globalen Meeresspiegels, der kontinentalen Eisschilde und folglich der Lebensräume der Arten führten1,2. Arten reagierten auf diese veränderten Bedingungen, indem sie ihr Verbreitungsgebiet verlagerten, sich anpassten oder lokal ausstarben und so die Verbreitungsgebiete und Muster der genetischen Struktur erzeugten, die wir heute sehen1,3,4. Durch die Gestaltung der Verteilung der genetischen Variation, die möglicherweise für klimabedingte Merkmale relevant ist, haben vergangene Klimaschwankungen möglicherweise eine wichtige Rolle dabei gespielt, das Anpassungspotenzial von Arten zu bestimmen, d. h. wie fähig Arten sind, sich an nachfolgende Phasen klimabedingter Selektion anzupassen5,6 . Während es zahlreiche Studien zu den biotischen Auswirkungen des Klimawandels gibt7,8,9, berücksichtigen nur wenige Studien diese genetischen Hinterlassenschaften des vergangenen Klimas, und noch weniger beziehen sowohl vergangene als auch gegenwärtige, neutrale und adaptive Evolutionsprozesse in ihre Bewertungen ein. Ein solcher integrativer Ansatz kann jedoch entscheidend sein, um die evolutionären Reaktionen der Arten auf den Klimawandel zu verstehen und vorherzusagen10.
Frühere Studien zur Reaktion von Arten auf quartäre Klimaschwankungen konzentrierten sich auf Verbreitungsverschiebungen und Verbreitungserweiterungen (im Folgenden gemeinsam als Verbreitungsverschiebungen bezeichnet3), durch Rekonstruktionen früherer Verbreitungen auf der Grundlage fossiler und zeitgenössischer Vorkommensaufzeichnungen und durch Rückschlüsse auf die frühere Demografie auf der Grundlage von Mustern neutrale genetische Variation1,3,11,12. Diese Fokussierung wurde durch die lange gehegte Annahme motiviert, dass Taxa eher dazu neigen, angrenzende Lebensräume zu migrieren und zu besiedeln, als neue Klimatoleranzen zu entwickeln3. Der Grundgedanke war zum Teil, dass Arten, wenn sie sich effektiv an vergangene Klimaveränderungen anpassen könnten, in der Lage gewesen wären, in situ zu überleben, ohne ihre geografische Verbreitung zu verschieben; im offensichtlichen Gegensatz zu den zahlreichen Beweisen für Verbreitungsgebietsverschiebungen zwischen Taxa13,14. Dieses Paradigma wurde in den letzten zwei Jahrzehnten zunehmend in Frage gestellt3,5,9,13,15. Vor allem Davis und Shaw (2001)3 argumentierten, dass die mit Verbreitungsgebietsverschiebungen einhergehende Anpassung möglicherweise von zentraler Bedeutung für die Reaktionen der Arten während Klimaschwankungen im Quartär gewesen sei. Sie schlugen vor, dass eine Anpassung während Verbreitungsgebietsverschiebungen durch selektives „Sieben“3,16 von Genotypen entstehen kann, die während der Kolonisierung und Etablierung gegenüber lokalen Bedingungen intolerant sind3. Mit anderen Worten: Lokale Bedingungen können als Siebe wirken, die bestehende genetische Variationen in der Landschaft3,6,16 im Verlauf von Artenverbreitungsverschiebungen ungleich sortieren (Abb. 1). Dies ist relevant, da Anpassung und Verbreitungsverschiebungen, wenn sie zusammenwirken, zu völlig anderen Ergebnissen der Reaktion der Arten auf Klimaveränderungen führen können, als wenn jeder der beiden Prozesse einzeln abläuft5,15. Empirische Belege für dieses Zusammenspiel von Anpassung und Reichweitenverschiebungen sind jedoch aufgrund früherer Annahmen und methodischer Herausforderungen im Zusammenhang mit der gemeinsamen Rekonstruktion dieser Prozesse nach wie vor rar13.
AA-Verschiebung vom glazialen zum interglazialen Klima führt zu einer Verschiebung der Überlappung der grundlegenden Nische einer Art (der Bereich der von der Art tolerierten Umweltbedingungen; gestrichelte Kontur) mit dem verfügbaren Umweltraum der Periode (der Bereich der Umweltbedingungen, ausgedrückt in einem bestimmten Zeitraum). Fläche und Zeit; blaue Ellipse – glazial, rosa Ellipse – interglazial). B Die realisierte Nische der Art (gestreifte Kurve), die diese Überlappung widerspiegelt, also Verschiebungen zwischen glazialen (oben) und interglazialen (unten) Perioden, eingeschränkt durch die grundlegende Nische der Art (gestrichelter Umriss). Wichtig ist, dass Arten statt einheitlicher Einheiten, die durch eine einzelne Nische beschrieben werden, mehrere Genotypen umfassen können, von denen jeder seine eigene, möglicherweise unterschiedliche Umweltnische hat (mehrere grau schattierte Kurven). C Klimaverschiebungen, die beispielsweise neue klimatische Bedingungen widerspiegeln, denen die Art während postglazialer Verbreitungsverschiebungen oder -erweiterungen ausgesetzt ist, wirken sich daher unterschiedlich auf verschiedene Genotypen aus; ihre Frequenzen ändern. D Dies filtert oder „siebt“ bestimmte Genotypen (Allele) aus dem Pool vorhandener genetischer Variationen, abhängig von der lokalen Umgebung. E Wenn sich die Art aus einem Refugium (schwarzes Kreuz) heraus und über eine umweltheterogene Landschaft ausbreitet, führt dies zu einer adaptiven Reaktion über die räumlich-zeitliche Siebung klimaassoziierter Allele.
Die selektive Siebung von Genotypen im gesamten Raum und die lokale Anpassung im Allgemeinen implizieren, dass Populationen, die in verschiedenen Gebieten des Artenspektrums leben, möglicherweise unterschiedliche Genotypen tragen und daher unterschiedlich auf Klimaveränderungen reagieren5,17,18 (Abb. 1). Dementsprechend haben neuere Studien gezeigt, dass adaptive Reaktionen auf Klimaveränderungen erfasst werden können, indem Genotyphäufigkeiten anhand von Umweltgradienten modelliert werden5,9,17,19, unter der Voraussetzung, dass jeder Genotyp eine Reihe von Umweltbedingungen aufweist, die er tolerieren kann. Unter der Annahme, dass zeitgenössische Gen-Umwelt-Assoziationen, die über den Raum verteilt sind, Gen-Umwelt-Assoziationen über die Zeit widerspiegeln20,21, deuten diese Studien darauf hin, dass Proxys für vergangene oder zukünftige (d. h. nicht abgetastete) Genotypen weiter vorhergesagt werden können;5,9,17,20,21 Voraussetzung dafür ist, dass zukünftige oder uralte Lebensräume heute vorhanden sind und beprobt werden. Während Gen-Umwelt-Modelle Anpassungen in die Bewertung der Reaktion von Arten auf Klimaveränderungen einbeziehen können, integrieren sie derzeit keine anderen evolutionären Prozesse wie Migration und Drift, also solche, die durch die Demographie geprägt sind10. Die Integration dieser demografischen Prozesse ist jedoch mit modernen populationsgenetischen Ansätzen zunehmend möglich10,15 und bietet einen vielversprechenden Weg zur Rekonstruktion der früheren neutralen und adaptiven Artenlandschaften.
Hier verwenden wir einen solchen integrativen Ansatz, um das Zusammenspiel von Anpassung und Verbreitungsverschiebungen als Reaktion auf quartäre Klimaschwankungen bei Dianthus sylvestris aufzuklären. Diese mehrjährige Blütenpflanze, die in den Alpen-, Apennin- und Dinarischen Gebirgszügen Europas beheimatet ist, beheimatet eine ökologisch und topographisch vielfältige Landschaft, die stark von den quartären Gletscherzyklen beeinflusst wurde. Durch die Quantifizierung von Verschiebungen in der adaptiven genomischen Zusammensetzung von vermuteten Vorfahren bis hin zu heutigen Populationen mithilfe der neuartigen Metrik „glazialer genomischer Offset“ zeigen wir, dass adaptive Reaktionen als natürliche Folge der Ausbreitung von Populationen aus glazialen Refugien in die zunehmend heterogene Umweltlandschaft entstanden sind, die mit geschaffen wurde der postglaziale Rückzug der Gletscher. Wir validieren dieses Ergebnis, indem wir die Vorhersagen des glazialen genomischen Offsets anhand beobachteter genetischer Signaturen der Population testen, die auf frühere Selektion und Demographie reagieren. Dies zeigt, dass wir genau vorhersagen können, wo die adaptive Diversität in heutigen Populationen am stärksten eingeschränkt ist. Unsere Ergebnisse bestätigen die Theorie3,13, dass das Zusammenspiel von Anpassung und Verbreitungsverschiebungen eine zentrale Rolle bei der Reaktion der Arten auf vergangene Klimaschwankungen gespielt hat, und unterstreichen die anhaltende Rolle, die vergangene Schwankungen heute bei der Gestaltung evolutionärer Reaktionen auf klimabedingte Selektion spielen.
Wir haben die Genome von 1261 Individuen aus 115 Populationen (5–20 Individuen pro Population) im aktuellen geografischen Verbreitungsgebiet von D. sylvestris mit geringer Sequenzierungstiefe (im Mittel ca. 2x) sequenziert (Abb. 2, Zusatzdaten 1). Die Hauptkomponentenanalyse (PCA) und die paarweisen genetischen Abstände ganzer Genomsequenzen trennen die untersuchten Individuen geografisch in Alpen-, Apennin- und Balkan-Cluster (Abb. 2A, ergänzende Abbildungen S1, S2). Dies wurde durch Beimischungsanalysen gestützt, die an einem ausgewogenen Datensatz durchgeführt wurden, der eine gemeinsame, heruntergestampfte Größe von 125 Personen pro geografischer Region umfasste, um bekannte Verzerrungen im Zusammenhang mit ungleichmäßiger Stichprobe über Cluster hinweg zu berücksichtigen (Abb. 2B, ergänzende Abb. S3). ). Um die geografische Verteilung der drei genetischen Cluster zu visualisieren, projizierten wir Abstammungsanteile und Hauptkomponenten im Raum (Ergänzende Abbildungen S4, S5). Darüber hinaus identifizierten wir geografische Barrieren, die die Divergenz (FST) zwischen Populationspaaren maximieren, mithilfe des Monmonier-Algorithmus24 (Abb. 2A, ergänzende Abbildungen S6, S7) und charakterisierten die effektive Migrationsoberfläche mithilfe von EEMS25, um Regionen zu beschreiben, in denen die genetische Differenzierung relativ erhöht oder verringert ist den Erwartungen basierend auf der geografischen Entfernung (Ergänzende Abbildung S8). Zusammenfassend deuten unsere Ergebnisse darauf hin, dass das Adriatische Meer und die Poebene (Italien) die wichtigsten biogeografischen Barrieren für D. sylvestris darstellen (Abb. 2A). Darüber hinaus stellen wir fest, dass die französischen Voralpen und Seealpen die Kontaktzone zwischen dem Apennin und den Alpenclustern im Westen bilden, während der Brennerpass sowie die Puster- und Gailtäler die Kontaktzone zwischen den Alpen- und Balkanclustern im Norden bilden. Osten (Abb. 2A, ergänzende Abbildungen S4, S5, S8). Letzteres steht im Einklang mit einer bekannten biogeografischen Grenze für Alpenpflanzen26.
Eine Karte der untersuchten Populationen. Proben werden als farbige Formen dargestellt, die entsprechend dem genetischen Cluster definiert sind, wie durch die Hauptkomponentenanalyse (PCA) von Sequenzen des gesamten Genoms abgeleitet (PCA-Ergebnisse für alle untersuchten Personen im Einschub; Eigenwerte in den Achsenbeschriftungen). Die Landschaftsfarbe spiegelt die über EEMS berechneten effektiven Populationsdiversitätsraten (q) wider. Dicke schwarze gepunktete Linien stellen wichtige genetische Grenzen dar, die mithilfe des Monmonier-Algorithmus für den FST von Populationen identifiziert wurden. Die Online-Zahlen sind (1) Französische Voralpen-Seealpen-Grenze, (2) Po-Ebene, (3) Brennerzone, Puster- und Gailtal und (4) Adriatisches Meer. Plus-, Minus- und Sternchensymbole kennzeichnen Individuen und Populationen an Kontaktzonen, die bei der Analyse der Chromosomenbemalung verwendet werden. B Beimischungsanteile von Sequenzen des gesamten Genoms bei K = 3; ausgewogener Datensatz. Die Populationen sind geordnet (von links nach rechts): Apennin-Abstammungslinie (Süden nach Nordwesten), Alpen-Abstammungslinie (Südwesten nach Nordosten) und Balkan-Abstammungslinie (Norden nach Süden). Das systematische CA-Muster in Residuen (rote oder blaue Blöcke; unten), das den Unterschied zwischen den beobachteten Beimischungspaletten für ausgewählte Individuen (oben) und denen, die durch Chromosomenmalerei rekonstruiert wurden, darstellt, stützt ein Szenario kürzlicher Engpässe in den Populationen, die mit einem Minus hochgestellt gekennzeichnet sind ein Szenario der Vermischung zwischen Abstammungslinien in den Populationen, die mit einem hochgestellten Pluszeichen gekennzeichnet sind; für die Gebirgszüge Apennin-Balkan (links) und Alpen-Balkan (rechts) (getrennt bewertet bei K = 2). Die für diese Analyse verwendeten Populationen entsprechen den Populationen, die in A mit ihrem jeweiligen Symbol gekennzeichnet und in B von schwarzen Rändern umgeben sind.
Während Populationen aus den einzelnen genetischen Clustern in den Kontaktzonen in unmittelbarer Nähe vorkommen (dh parapatrische Verteilungen aufweisen), deutet die PCA der genetischen Struktur auf eine tiefe Divergenz und folglich auf eine längere Geschichte der Isolation zwischen Clustern hin (Abb. 2A, ergänzende Abb. S2). . Dies wird durch demografische Schlussfolgerungen bestätigt, die davon ausgehen, dass die drei Cluster (Abstammungslinien) während der vorletzten Eiszeit (PGIP) um ca. 200 v. 200–115 kya (95 %-Konfidenzintervall (KI) für die erste Balkan-Spaltung: 178–217 kya; 95 %-KI für die nachfolgende Apennin-Alpen-Spaltung: 114–132 kya), mit minimaler Migration zwischen den Abstammungslinien in den letzten ca. 115 kya entsprechend der letzten Eiszeit (Ergänzende Abbildungen S9, S10, S11). Diese Ergebnisse stehen im Gegensatz zu den bemerkenswerten Signalen der Beimischung zwischen Abstammungslinien, die in den Beimischungsanalysen beobachtet wurden (Abb. 2B). Allerdings kann es aufgrund von Verstößen gegen Modellannahmen28 auch in Bevölkerungsgruppen ohne Beimischung zu Rückschlüssen auf Bevölkerungsbeimischungen mithilfe von STRUCTURE-ähnlichen Algorithmen27 kommen. Um alternative demografische Szenarien auseinanderzuhalten, haben wir die Güte der Anpassung eines Beimischungsmodells an die zugrunde liegenden genetischen Daten anhand von durch Chromosomenmalerei abgeleiteten Mustern der Allelteilung bewertet28. Wir beobachten systematische Muster in den Residuen, die eher mit jüngsten Engpässen in den westlichen Populationen der Alpenlinie und in den nordwestlichen Populationen der Apenninlinie übereinstimmen als mit jüngsten Vermischungsszenarien zwischen den Linien (Abb. 2C). Mit anderen Worten, die erhöhten abgeleiteten Zustände (Einzigartigkeit) dieser peripheren Populationen mit Engpass verliehen diesen Populationen eine „reine“ Abstammungszuordnung unter dem von STRUCTURE abgeleiteten Algorithmus, was wiederum falsche Rückschlüsse auf eine Beimischung in den Populationen erzeugte, die sie wahrscheinlich gründeten (Abb. 2C). ); ein verwirrendes Signal, das dennoch mithilfe von Mustern der DNA-Verteilung entwirrt werden kann28.
Wenn wir uns auf die alpine Abstammungslinie konzentrieren und ihre dichte räumliche Populationsstichprobe nutzen, finden wir Hinweise darauf, dass die abgeleiteten Engpässe in den Alpen eine räumliche Ausdehnung widerspiegeln, die ihren Ursprung im Osten hat. Entlang des Alpenbogens von Osten nach Westen ist ein Abhang genetischer Diversität zu beobachten, der aufeinanderfolgende Gründerereignisse widerspiegelt und für ein Expansionssignal charakteristisch ist29,30 (Abb. 2A). Dies wird durch eine positive Korrelation des Richtungsindex ψ31 mit dem paarweisen Bevölkerungsabstand bestätigt (ergänzende Abbildung S12). Unter Verwendung eines TDOA-Algorithmus (Time Difference of Arrival) für ψ haben wir den wahrscheinlichsten geografischen Ursprung der Ausdehnung in der Nähe des Monte Baldo und der westlichen Dolomiten abgeleitet (Abb. 3A). Wir haben die Stärke dieser Expansion weiter mit einem Gründereffekt von 1 % pro 139 km quantifiziert. Diese räumliche Ausdehnung hinterließ eine charakteristische klinische genetische Struktur in der Abstammungslinie, so dass die genetische Struktur derzeit die Geographie in den Alpen widerspiegelt (Abb. 3, ergänzende Abb. S13). Dieses Strukturmuster, bei dem die Populationen nach Geografie und nicht nach Ökologie gruppiert sind, impliziert, dass sich die Bildung von Ökotypen entlang von Höhengradienten in den Alpen wiederholt in situ und nicht nur einmal entwickelte und sich anschließend über das gesamte Verbreitungsgebiet ausbreitete (Abb. 3).
Eine geografische Stichprobe alpiner Populationen. Schwarz gestrichelte Konturen und Farbverläufe spiegeln die probabilistische Schlussfolgerung des Ursprungs der Alpenausdehnung wider, berechnet über einen Time Difference of Arrival (TDOA)-Algorithmus auf dem Richtungsindex ψ. Ein östlicher Ursprung des alpinen Stammes um die Gebiete des Monte Baldo (1) und der westlichen Dolomiten (2) wird vermutet. B Die genetische Struktur alpiner Individuen, die mittels Hauptkomponentenanalyse (PCA) von Sequenzen des gesamten Genoms abgeleitet wurde, spiegelt die Geographie wider. C Höhe der Populationen in Metern über dem Meeresspiegel. In allen Panels werden Proben als Dreiecke dargestellt, die entsprechend ihren Koordinaten in den ersten beiden Hauptkomponenten des genetischen Raums gefärbt sind (wie in B gezeigt). Die Bevölkerungsdarstellungen in A und C spiegeln die Bevölkerungsmittelwerte von Einzelpersonen wider.
Die Schlussfolgerung, dass drei Evolutionslinien jeweils getrennte geografische Regionen bewohnten, legt nahe, dass sie während der letzten Eiszeit möglicherweise unterschiedliche Refugien bewohnt haben. Um dies zu testen, haben wir die Verteilung der zusammengefassten Arten sowie jeder Abstammungslinie separat modelliert, basierend auf zeitgenössischen Vorkommensaufzeichnungen und dem heutigen Klima, und diese Verteilungsmodelle auf das Last Glacial Maximum (LGM) projiziert32. Wir haben einen unbeaufsichtigten dichtebasierten räumlichen Clustering-Algorithmus auf die vorhergesagten Vorkommen angewendet, der sowohl in den gepoolten als auch in den abstammungsspezifischen Fällen drei diskrete Refugien ableitete: in den Alpen, im Apennin und auf dem Balkan (Abb. 4A, ergänzende Abbildungen S14, S15). Während des LGM wurde das Verbreitungsgebiet der Alpenlinie stark reduziert und auf die südöstlichen Peripherien der Alpen beschränkt (Abb. 4A), was mit der geografischen Region übereinstimmt, die in unseren genetischen Analysen unabhängig als Quelle der Ausbreitung identifiziert wurde (ψ). ). Im Gegensatz dazu waren die Rückzugsgebiete im Apennin und auf dem Balkan viel größer und erstreckten sich über ausgedehnte Gebiete auf den jeweiligen Halbinseln. Der deutliche Größenunterschied zwischen den vorhergesagten Refugien für die drei Abstammungslinien steht im Einklang mit der geringeren genetischen Vielfalt, die in heutigen Alpenpopulationen im Vergleich zu Apennin- und Balkanpopulationen beobachtet wird (Abb. 2A).
A Abstammungsspezifische Verteilungen, vorhergesagt für das letzte glaziale Maximum (LGM) (links; dh zeigt glaziale Refugien) und die Gegenwart (rechts). Die Vorhersage der heutigen Verteilung rekapituliert beobachtete Muster der genetischen Struktur. Die topografische Höhe wird in Grautönen dargestellt und das Meer wird in Weiß dargestellt. B Verschiebungen des Umweltraums und der Lebensraumverfügbarkeit vom LGM (blau) bis zur Gegenwart (rot), für die Regionen Apennin (links), Alpen (Mitte) und Balkan (rechts). Jede Koordinate in dieser Projektion des Umgebungsraums stellt eine einzigartige Kombination von Umgebungsvariablen dar. Das durch jede Koordinate dargestellte geografische Gebiet (km2) wird als farbige Hex-Bins angezeigt, wobei zunehmende Rot- und Blautöne darauf hinweisen, dass ein größeres Gebiet die angegebene Kombination von Umgebungsvariablen im heutigen bzw. LGM aufweist. Die ökologische Nische der Abstammungslinien, berechnet aus heutigen Vorkommen, wird durch die grünen umschlossenen Linien dargestellt. Der achteckige Einschub erinnert an die in Abb. 1 eingeführten Prinzipien und bietet eine Hilfe bei der Interpretation dieser Ergebnisse. Die rechteckigen Einschübe stellen die Richtungen und Belastungen der Umweltvariablen dar, wobei die Pfeile wie folgt farblich gekennzeichnet sind: Weiß – Temperaturvariablen, Grau – Klimasaisonalitätsvariablen, Schwarz – Niederschlagsvariablen und Braun – topografische Variablen.
Um potenzielle Kolonisierungsrouten zu rekonstruieren, projizierten wir die linienspezifischen Verteilungsmodelle auf Klimaraster in Zeitintervallen von 100 Jahren vom LGM bis zum heutigen Tag32. Wir haben einen Ausbreitungskern angewendet, um die Ausbreitungsrate zu begrenzen und den Wettbewerbsausschluss zwischen Abstammungslinien zu erzwingen, um nicht-abiotische Faktoren zu berücksichtigen, die die Abstammungsverteilung beeinflussen können33,34,35. Im Rahmen dieser Vorwärtssimulation verfolgten wir den zeitlichen Fortschritt linienspezifischer SDMs und generierten die Erwartung, dass die heutigen Linienverteilungen in hohem Maße mit der genetischen Struktur übereinstimmen (Abb. 2A, 4A, ergänzende Abbildungen S4, S5). Diese Übereinstimmung legt nahe, dass die Verbreitungsgrenzen in diesen Abstammungslinien durch das Klima, den Konkurrenzausschluss zwischen Schwesterlinien und Ausbreitungsbeschränkungen bestimmt werden. Insgesamt liefern die Ergebnisse der Verteilungsmodelle Unterstützung dafür, dass die drei Evolutionslinien jeweils unterschiedliche glaziale Refugien bewohnten und jeweils unabhängige glaziale und postglaziale Evolutionsgeschichten erlebten.
Die Verbreitungsverschiebungen zwischen der LGM und der Gegenwart wurden durch gleichzeitige Klimaveränderungen verursacht und spiegeln die Ausbreitung der Populationen aus den Gletscherschutzgebieten in neue Lebensräume und Umweltbedingungen wider. Um die Verschiebungen im verfügbaren Umweltraum von LGM bis heute für jede Region zu quantifizieren und zu visualisieren, projizierten wir sowohl aktuelle als auch LGM-Sätze von Umgebungsvariablen auf einen gemeinsamen, niedrigerdimensionalen Raum und quantifizierten die in dieser Transformation an jeder Koordinate eingenommene Fläche Raum. In den Alpen war der verfügbare Umweltraum während des LGM sowohl stark reduziert als auch durch kältere Temperaturen im Vergleich zu heute gekennzeichnet (Abb. 4B, ergänzende Abb. S16). Infolgedessen kam es zu weniger Überschneidungen zwischen der Umweltnische der Abstammungslinie und dem LGM-Umweltraum, was zu einem stark reduzierten Verbreitungsgebiet (Refugien) während des LGM führte (Abb. 4A). Im Gegensatz dazu kam es in den Apennin- und Balkanregionen während der LGM zu einer geringeren Einschränkung des verfügbaren Umweltraums, wobei letztere eher durch Verschiebungen der Klimasaisonalität als der absoluten Temperatur zwischen den beiden Zeiträumen gekennzeichnet war (Abb. 4B). Zusätzlich zu den für die drei Regionen abgeleiteten Schrumpfungen und Verschiebungen des Umweltraums wurde die von unterschiedlichen Umwelten eingenommene Fläche deutlich umverteilt. Vor allem in den Alpen dehnten sich warme Lebensräume in der Nacheiszeit auf Kosten der alpinen Lebensräume aus (Abb. 4B).
Die heterogene Veränderung der Umwelt zwischen der LGM und der Gegenwart in Verbindung mit der Verbreitungserweiterung aus den Gletscherrefugien führte zu einem räumlich heterogenen und sich zeitlich ändernden Selektionsregime für D. sylvestris. Um zu beurteilen, ob heutige Populationen im Vergleich zu Refugiumpopulationen eine ähnliche oder veränderte Zusammensetzung adaptiver genetischer Varianten aufweisen, haben wir Gradient Forest (GF)17,36 verwendet, um SNP-Allelfrequenzen für die heutige Umgebung zu modellieren und die Struktur zu korrigieren. Wir konzentrieren uns auf die Alpenlinie, nutzen unsere Rekonstruktion ihrer Expansionsdynamik und wenden GF auf ca. an. 400.000 Exon-SNPs, die sich über Alpenpopulationen hinweg aufteilen (ergänzende Abbildung S17). Um den Vergleich der Klimaanpassung im Laufe der Zeit zu erleichtern, haben wir Verteilungsmodelle der klimaassoziierten genomischen Zusammensetzung für die Gegenwart und LGM erstellt, indem wir GF-Modelle auf diese beiden Zeiträume projizierten. GF-Projektionen lassen darauf schließen, dass die in den LGM-Refugien vorhandenen adaptiven Genotypen der Vorfahren den heutigen alpinen Genotypen (dunkelblaue und violette Farbtöne; Abb. 5A, ergänzende Abb. S18) am ähnlichsten sind Refugien, die ein Klima aufweisen, das den heutigen alpinen Lebensräumen am ähnlichsten ist. Der adaptive Genotyp, der für heutige Tieftäler charakteristisch ist (grüne bis bläulich-grüne Farbtöne; Abb. 5A), scheint sich von dem für alpine Lebensräume zu unterscheiden (Abb. 5A, ergänzende Abb. S19). Dies impliziert, dass sich alle heutigen Populationen, ob Tiefland- oder Alpenpopulationen, wahrscheinlich aus einem alpinen Refugiumszustand zu ihren aktuellen Anpassungsoptima entwickelt haben. Dies wird durch die Beobachtung gestützt, dass Populationen in geringer Höhe eine Teilmenge der adaptiven Variation aufweisen, die in Populationen in großer Höhe und in Rückzugsgebieten vorhanden ist (ergänzende Abbildung S19C).
A Projektionen der adaptiven genomischen Zusammensetzung im gesamten geografischen Raum, für das letzte glaziale Maximum (LGM) (links) und die Gegenwart (rechts). Es wird vorhergesagt, dass Gebiete mit ähnlichen Farben Populationen mit ähnlicher adaptiver Genomzusammensetzung beherbergen, während unterschiedliche Farben auf Populationen mit unterschiedlicher adaptiver Genomzusammensetzung hinweisen. Farben basieren auf den ersten drei Hauptkomponenten transformierter Klimavariablen (auch Eigenvektoren genannt, die die Zusammensetzung der genetischen Variation beschreiben), wobei jede Hauptkomponente (PC) als separater Farbkanal im RGB-Raum dargestellt wird (PC1 – Rot, PC2 – Grün, PC3 - blau). Der linke Einschub, der für beide Zeitprojektionen gilt, zeigt die Belastungen (dh Richtung und Größe) aller Umgebungsvariablen in Bezug auf die ersten beiden PCs des transformierten Klimaraums, wobei die Pfeile wie folgt farblich gekennzeichnet sind: Weiß – Temperaturvariablen, Grau - Klima-Saisonalitätsvariablen, Schwarz - Niederschlagsvariablen, Braun - eine topografische Variable (Steigung) und Aqua - Boden-pH. Die Bereiche des transformierten Klimaraums, ausgedrückt im LGM-Refugium und in der heutigen Verbreitung, werden durch die gestrichelten bzw. durchgezogenen Konturen des Einschubs dargestellt. Gestrichelte und durchgezogene Konturen umschreiben in ähnlicher Weise das LGM-Refugium und die heutige Verteilung der Abstammungslinie im geografischen Raum im linken bzw. rechten Hauptfeld. B Vorhersage des glazialen Genomversatzes im geografischen Raum. Diese Metrik quantifiziert die evolutionäre Veränderung heutiger Populationen gegenüber ihrem vorhergesagten angestammten Zustand in den LGM-Refugien, indem sie die Verschiebung der adaptiven genomischen Zusammensetzung zwischen jeder heutigen Population und der ihres nächsten LGM-Refugialvorfahren misst und dabei die Auswirkungen der Expansion berücksichtigt Isolation durch Distanz. Die heutige Verbreitung der Alpenlinie wird durch die schwarze Linie umschrieben.
Um die evolutionären Veränderungen vorherzusagen, die Populationen durchlaufen hatten, haben wir die Unterschiede in der genomischen Zusammensetzung zwischen den Zeitpunkten quantifiziert. Wir haben den Effekt von Expansion und Isolation nach Entfernung (IBD) berücksichtigt, indem wir Vergleiche zwischen der vorhergesagten adaptiven genomischen Zusammensetzung jeder aktuellen Population und der ihrer (geographisch) nächstgelegenen vorhergesagten Zufluchtsquelle während des LGM durchgeführt haben (ergänzende Abbildung S20). Es wird vorgeschlagen, dass diese Vorhersage des evolutionären Wandels, die wir als „glazialen genomischen Offset“ bezeichnen, neben der adaptiven Reaktion auf die auferlegte Selektion sowohl den neutralen Effekt von IBD als auch die Ausbreitung (kollektive Drift) von der Refugium- zur heutigen Bevölkerung widerspiegelt durch Unterschiede in der Umgebung zwischen dem heutigen Standort und dem Refugium. Wir beobachten ein charakteristisches Muster eines geringen glazialen genomischen Offsets in alpinen Gebieten in der Nähe der vermuteten Refugien und hohe Werte des glazialen genomischen Offsets in Tälern und Regionen weit entfernt von den glazialen Refugien (Abb. 5B, ergänzende Abb. S21). Dies impliziert, dass sowohl die ökologische als auch die geografische Entfernung von den Refugien der Grund für die Divergenz der heutigen Populationen von den Populationen ihrer Vorfahren in den Refugien ist.
Die nichtzufällige Entwicklung von Populationen durch Prozesse wie Richtungsselektion und demografische Expansion-Kontraktion kann aus den genetischen Daten zeitgenössischer Populationen über Störungen im Standortfrequenzspektrum (SFS) aufgrund zufälliger Erwartungen abgeleitet werden37,38,39. Um unsere Vorhersagen zu validieren, korrelierten wir den glazialen genomischen Offset mit der populationsgenetischen Statistik heutiger Populationen, die solche SFS-Verzerrungen erfassen. Wir beobachten einen größeren Überschuss an hochfrequent abgeleiteten Allelen – ein charakteristisches Muster, das durch selektive Sweeps erzeugt wird37,38,40 – mit zunehmendem glazialen genomischen Offset (positive Korrelation mit Zengs E37 und negative Korrelation mit Fay & Wus H;38 p < 1 ×). 10−4; Abb. 6A). Während die Demographie diese Statistiken ebenfalls beeinflussen kann37, waren die Korrelationen des glazialen genomischen Offsets bei E und H stärker, die sich um umweltassoziierte Loci konzentrierten (r = −0,57 und 0,63, R2 = 0,31 bzw. 0,38; für HGF bzw. EGF) als bei Genom- breite Schätzungen (r = −0,48 und 0,53, R2 = 0,21 und 0,26; für HGW bzw. EGW).
Ein oberes Feld: Schätzungen der Anpassungsgüte (angepasstes R2) für die Korrelation des glazialen genomischen Offsets mit ausgewählten Statistiken zur genetischen Diversität und Neutralität der Population (lineare Regressionsmodelle; n = 43 Populationen; p-Wert-Schwellenwert: *0,01, **0,001 , ***0,0001; F-Test für lineare Regression). Die Anpassungsgüte (Balken) des Modells wird für genomweit berechnete mittlere Statistiken pro Standort (GW; graue Balken) angezeigt und mit dem R2 der Umweltassoziation des Standorts (GF; grüne Balken) gewichtet. Signifikante Korrelationen mit Fay und Wus HGF (mittleres Feld) und Zengs EGF (unteres Feld) beschreiben einen Überschuss an hochfrequenten, abgeleiteten Varianten – charakteristisch für selektive Sweeps – mit zunehmendem glazialen genomischen Versatz. B Diagramm der genomweit berechneten Nukleotiddiversität (πGW; Kreise) und zentriert um umweltassoziierte Loci (πGF; Dreiecke) für geografisch benachbarte Populationspaare mit einem großen (ca. 1000 m) Höhenkontrast (blau – große Höhe; rot). – niedrige Höhe), geordnet entlang der Expansionsachse. Das Violindiagramm der vollständigen π-Verteilung ist für ein Beispielpaar (am weitesten entfernt) in der ergänzenden Abbildung S22 zu sehen. C Diagramm der Nukleotiddiversität πGW und πGF für alle Alpenpopulationen, unterteilt in hohe (>1500 m; blau), niedrige (<1000 m; rot) und mittlere (1000–1500 m; graue Quadrate) Höhenklassen, geordnet entlang der Expansionsachse .
Um die Auswirkungen postglazialer demografischer und selektiver Prozesse auf die genetische Vielfalt weiter zu beurteilen, haben wir die Werte der Nukleotiddiversität (π) für heutige Populationen in niedrigen und hohen Lagen entlang der alpinen Expansionsachse verglichen. Wir finden ein höheres Maß an Diversität um umweltassoziierte Loci im Vergleich zu genomweit (πGF > πGW, Mann-Whitney-U-Test; p <1 × 10−15; Abb. 6B, C, ergänzende Abb. S22), was auf eine hohe Diversität hindeutet -divergierende adaptive Haplotypen bleiben innerhalb der Populationen erhalten. Wichtig ist, dass wir eine deutlich geringere Diversität (Mann-Whitney-U-Test; p < 0,001) in niedrig gelegenen Populationen im Vergleich zu hochgelegenen Populationen beobachten (unter Berücksichtigung des Abstandseffekts), sowohl für die genomweite Diversität (πGW) als auch für die diversitätszentrierte Diversität um umweltassoziierte Loci (πGF) (Abb. 6B). Dies kann durch die Besiedelung niedrig gelegener Umgebungen durch Populationen hochgelegener Gebiete (Gründereffekt)41 oder alternativ durch polygene Selektion in der niedriggelegenen Umgebung40 oder durch beides entstehen. Bemerkenswerterweise beobachten wir, dass dieser Unterschied in der Diversität zwischen Populationspaaren in niedrigen und hohen Lagen (∆πGF) von Ost nach West entlang der Expansionsachse zunimmt, was darauf hindeutet, dass Populationen gleichzeitig an der Expansionsfront und am Umweltrand der Abstammungslinie die geringste adaptive Diversität aufweisen (Abb. 6B, C).
Die Auswirkungen vergangener quartärer Klimaveränderungen auf Arten wurden typischerweise durch die Linse neutraler genetischer Variations- und Artenverteilungsmodelle untersucht, wobei Anpassungsprozesse entweder ignoriert oder separat behandelt wurden3,13. Die vorherrschende Annahme war, dass Verbreitungsverschiebungen und nicht Anpassung oder ein Zusammenspiel der beiden Prozesse die Hauptreaktion der Arten auf vergangene Klimaschwankungen im Quartär waren3,13. Obwohl dieses Paradigma in den letzten Jahren in Frage gestellt wurde, sind die Argumente, die eine gemeinsame Reaktion auf Anpassung und Bereichsverschiebungen unterstützen, größtenteils konzeptionell geblieben3,13. Indem wir hier die Reaktion klimaassoziierter Allele in der Pflanze D. sylvestris unter postglazialer Erwärmung (20 kya – heute) modellieren, zeigen wir, dass adaptive Prozesse, die mit Verbreitungsverschiebungen einhergehen, von zentraler Bedeutung für die evolutionäre Reaktion dieser Art auf vergangene Klimaveränderungen waren . Insbesondere die steigenden regionalen Temperaturen und der umfassende Rückgang der Gletscher nach der LGM führten zur Entstehung neuartiger warmer Talumgebungen in den Alpen, wodurch ein heterogenes Mosaik aus alpinen und warmen Lebensräumen auf dem Weg der kolonisierenden Arten entstand. Als sich D. sylvestris-Populationen aus alpinähnlichen Gletscherschutzgebieten in diesen breiteren und heterogenen Umweltraum ausdehnten, nahm die Häufigkeit wärmeassoziierter Allele aufgrund der klimabedingten Selektion in den Tieflandlebensräumen zu. Im Gegensatz dazu behielten Populationen in alpinen Lebensräumen Genotypen bei, die denen der Vorfahrenpopulationen näher kamen. Diese räumlich strukturierte adaptive Reaktion stützt die Theorie, dass das durch lokale Bedingungen während der Migration und Etablierung bedingte unterschiedliche Überleben selektiv schlecht angepasste Genotypen aussiebt3. In dieser Studie erfassen wir diesen räumlich-zeitlichen Siebprozess mithilfe von Gen-Umwelt-Modellen und dem glazialen genomischen Offset, der explizit die Auswirkungen vergangener Anpassungen, Migrationen und Expansionen berücksichtigt.
Unser Rückschluss auf adaptive Veränderungen hängt von der Rekonstruktion der Evolutionsgeschichte und der postglazialen Expansionsdynamik von D. sylvestris ab. Die genetische Struktur und demografische Schlussfolgerung zeigen, dass D. sylvestris drei Evolutionslinien umfasst, die während des PGIP (ca. 200–115 kya) auseinander gingen. Nach der Divergenz hatten diese drei Abstammungslinien eine relativ unabhängige Geschichte, was sich aus ihrem Überleben in getrennten eiszeitlichen Refugien und dem Fehlen neuer Vermischungen zwischen ihnen ableiten lässt. Die alpine Abstammungslinie war von der LGM besonders betroffen, was durch ihr im Vergleich zur Gegenwart stark eingeschränktes eiszeitliches Refugium und die relativ geringe genetische Vielfalt in heutigen Populationen belegt wird. Unsere Identifizierung von Gletscherrefugien und Expansionsrouten in den Alpen ermöglicht es, die Auswirkungen von IBD, Expansion und Anpassung gemeinsam in unseren glazialen genomischen Offset einzubeziehen, ein Maß, das Verschiebungen in der adaptiven genomischen Zusammensetzung von vermuteten Vorfahren bis hin zu heutigen Populationen quantifiziert. Ein solcher integrativer Ansatz behebt zuvor hervorgehobene Mängel von Gen-Umwelt-Modellen10 und ermöglicht es uns, sowohl Bereichsverschiebungen als auch Anpassungsreaktionen gleichzeitig zu bewerten.
Unser retrospektiver Ansatz bietet eine einzigartige Gelegenheit, evolutionäre Vorhersagen basierend auf dem glazialen genomischen Vergleich mit realisierten biologischen Ergebnissen zu validieren. Populationsgenetische Signaturen, die bei Populationspaaren in großer und geringer Höhe beobachtet werden, untermauern die Vorhersagen des glazialen genomischen Offsets, indem sie zeigen, dass Populationen, die gleichzeitig am weitesten von glazialen Refugien entfernt sind und Umgebungen bewohnen, die vom angestammten Lebensraum abweichen, den geringsten Grad an adaptiver genetischer Diversität aufweisen, da sie die höchste Evolution erfahren ändern. Korrelationen von Zengs E und Fay & Wus H (populationsgenetische Statistiken, die auf vergangene selektive Sweeps reagieren) mit dem glazialen genomischen Offset liefern eine ergänzende Validierung und zeigen, dass unsere Modellannahmen gerechtfertigt waren. Zusammengenommen verleihen diese Beweise unserer Hypothese Glaubwürdigkeit, dass Migration und Anpassung bei der Reaktion von D. sylvestris auf vergangene Klimaveränderungen gemeinsam wirkten.
Der charakteristische Einfluss, den der konzertierte Mechanismus der Migration und Anpassung auf die Muster der adaptiven genetischen Vielfalt hinterlässt, ist von entscheidender Bedeutung dafür, wie gut Populationen auf zukünftige Klimaveränderungen reagieren können. Für D. sylvestris in den Alpen impliziert der beschriebene Rückgang der adaptiven Diversität, dass Populationen, die in warmen, niedrig gelegenen Umgebungen an der Expansionsfront leben, nur über ein begrenztes Potenzial verfügen, adaptiv auf neue Phasen klimabedingter Selektion zu reagieren, obwohl die Vorhersagen differenziert sein können. Einerseits könnten Populationen in Tieflagen relativ gut an eine weitere Erwärmung angepasst sein, da sie in der Vergangenheit in diese Richtung selektiert wurden. Andererseits beschränken sich die Folgen des Klimawandels nicht nur auf steigende Temperaturen, sondern auch auf neuartige biotische Wechselwirkungen, einschließlich Konkurrenz42,43 und Verschiebungen anderer Umweltparameter (z. B. Niederschlagsregime)44, bei denen der allgemeine Verlust der Vielfalt, wie in beobachtet Tief gelegene Populationen können schädlich sein. Während der Verlust der genetischen Vielfalt an Expansionsrändern gut beschrieben wurde45,46,47,48, zeigen wir, dass die genetische Vielfalt in heterogenen Landschaften auch durch die Umweltdistanz zwischen dem aktuellen Lebensraum einer Population und dem, in dem die Population vorher lebte, bestimmt wird. angepasst an (dh seinen angestammten Lebensraum). Somit kann unsere historische Perspektive zukunftsorientierte Ansätze9,15,17,19 ergänzen, indem sie einen evolutionären Kontext für beobachtete und vorhergesagte Anpassungsmuster bereitstellt.
Die Analyse der adaptiven Variation erleichtert unser Verständnis der Reaktion der Arten auf den Klimawandel, da sie als eine Linse in die Vergangenheit fungiert, die sich von der der stochastischen neutralen Variation, die ausschließlich die demografische Vergangenheit wahrnimmt, unterscheidet und diese ergänzt. Hier bewerten wir gemeinsam Muster neutraler und adaptiver genetischer Variation in einer Alpenpflanze und liefern neue Beweise für das Zusammenspiel von Migration, Anpassung und Expansion in der Quartärgeschichte der Art. Dabei erläutern wir die Art und Weise, wie das Klima die Anpassungsvariation der Arten beeinflusst, und verdeutlichen die Abhängigkeit der Arten von den genetischen Hinterlassenschaften des vergangenen Klimas, um auf zukünftige Veränderungen zu reagieren und sich an sie anzupassen.
DNA-Bibliotheken wurden für 1261 D. sylvestris-Individuen aus 115 Populationen (5–20 Individuen pro Population) nach einem modifizierten Protokoll49 des Illumina Nextera DNA-Bibliotheksvorbereitungskits (Supplementary Methods S1.1, Supplementary Data 1) erstellt. Einzelpersonen wurden mit eindeutigen Doppelindizes (IDT Illumina Nextera 10nt UDI – 384-Set) von Integrated DNA Technologies Co indiziert, um Index-Hopping zu vermeiden50. Die Bibliotheken wurden in vier Spuren einer Illumina NovaSeq 6000-Maschine bei Novogene Co. sequenziert (150 bp Paired-End-Sequenzierung). Dies führte zu einer durchschnittlichen Abdeckung von ca. 2x pro Person. Sequenzierte Individuen wurden auf Adaptersequenzen getrimmt (Trimmomatic Version 0.3551), auf eine Referenzbaugruppe54 (ca. 440 MB) abgebildet (BWA-MEM Version 0.7.1752,53), Duplikate markiert und entfernt (Picard Toolkit Version 2.0.1; http ://broadinstitute.github.io/picard), lokal um Indels herum neu ausgerichtet (GATK-Version 3.555), für Basisqualitätswerte neu kalibriert (ATLAS-Version 0.956) und überlappende Lesepaare abgeschnitten (bamUtil-Version 1.0.1457) (Ergänzende Methoden S1. 1). Populationsgenetische Analysen wurden an den resultierenden BAM-Dateien anhand von Genotypwahrscheinlichkeiten (ANGSD-Version 0.93358 und ATLAS-Versionen 0.9–1.056) durchgeführt, um der Ausbreitung von Unsicherheiten aus den Rohsequenzdaten auf die populationsgenetische Schlussfolgerung Rechnung zu tragen.
Um die genetische Struktur unserer Proben zu untersuchen (Abb. 2A, ergänzende Abb. S2), führten wir nach der Konvertierung der kartierten Sequenzdaten in PCAngsd Version 0.9859 eine Hauptkomponentenanalyse (PCA) für alle 1261 Proben („vollständiger“ Datensatz) durch ANGSD-Genotypwahrscheinlichkeiten im Beagle-Format (Ergänzungsmethoden S1.2). Um PCA-Ergebnisse im Raum zu visualisieren (ergänzende Abbildung S4), wurden die Hauptkomponenten der einzelnen Personen auf eine Karte projiziert, räumlich interpoliert (lineare Interpolation, Akima R-Paketversion 0.6.260) und die ersten beiden Hauptkomponenten wurden als grüne und blaue Farbe dargestellt Kanäle. Angesichts der Tatsache, dass eine ungleichmäßige Stichprobe die Rückschlüsse auf die Struktur in der PCA beeinflussen kann, wurde die PCA auch mit einem ausgewogenen Datensatz durchgeführt, der eine gemeinsame, heruntergestampfte Größe von 125 Personen pro geografischer Region umfasst („ausgeglichener“ Datensatz; Abb. 2B, ergänzende Abb. S3; Ergänzende Methoden S1.2; Ergänzende Daten 1). Individuelle Beimischungsanteile und angestammte Allelfrequenzen wurden mithilfe von PCAngsd (-admix-Modell) für K = 2–6 geschätzt, wobei der ausgeglichene Datensatz verwendet wurde, um potenzielle Verzerrungen im Zusammenhang mit einer unausgewogenen Stichprobe zu vermeiden22,23 und eine automatische Suche nach dem optimalen Sparseness-Regularisierungsparameter (Alpha) durchgeführt wurde. weich begrenzt auf 10.000 (Ergänzende Methoden S1.2). Um die Abstammungsverhältnisse im Raum zu visualisieren, wurden die Abstammungsverhältnisse der Bevölkerung mithilfe eines aus Ref. modifizierten Codes räumlich interpoliert (Kriging). 61 (Ergänzende Abbildung S5).
Um zu testen, ob die Beimischung zwischen Abstammungslinien den von PCAngsd abgeleiteten Beimischungsmustern zugrunde liegt oder ob die Daten besser durch alternative Szenarien wie aktuelle Engpässe erklärt werden können, haben wir Chromosomenmalerei und Muster der Allelteilung verwendet, um Malpaletten über die Programme MixPainter und badMIXTURE (nicht verknüpftes Modell) zu erstellen )28 und verglich dies mit den von PCAngsd abgeleiteten Paletten (Abb. 2B, C; ergänzende Methoden S1.2). Wir haben uns auf Residuenmuster zwischen diesen Paletten bezogen, um Informationen über das wahrscheinlichste zugrunde liegende demografische Szenario zu erhalten. Zur Beurteilung der Reste der Alpen-Balkan-Palette (und damit der Beimischung) wurden jeweils 65 Individuen aus den französischen Alpen (in PCAngsd als rein alpine Abstammung abgeleitet), Monte Baldo (in PCAngsd sowohl mit alpiner als auch balkanischer Abstammung abgeleitet) und Julischen Alpen (in PCAngsd als rein abgeleitet) berücksichtigt Balkan-Abstammung in PCAngsd) wurden unter K = 2 in PCAngsd und badMIXTURE analysiert (Abb. 2C). Zur Beurteilung der Apennin-Balkan-Beimischung wurden jeweils 22 Personen aus den französischen Voralpen (in PCAngsd als reine Apennin-Abstammung abgeleitet), der Toskana (in PCAngsd sowohl mit Apennin- als auch Balkan-Abstammung abgeleitet) und aus den Julischen Alpen (in PCAngsd als reine Balkan-Abstammung abgeleitet) herangezogen. wurden unter K = 2 in PCAngsd und badMIXTURE analysiert.
Um einen genetischen Distanzbaum zu erstellen (ergänzende Abbildung S1), haben wir zunächst mit ATLAS paarweise genetische Distanzen zwischen 549 Individuen (5 Individuen pro Population für alle Populationen) berechnet und dabei ein Distanzmaß (Gewicht) verwendet, das die Anzahl der zwischen ihnen unterschiedlichen Allele widerspiegelt Genotypen (Ergänzende Methoden S1.2; Ergänzende Daten 1). Aus der resultierenden Distanzmatrix wurde über eine durch den BioNJ-Algorithmus definierte Anfangstopologie ein Baum erstellt, wobei nachfolgende topologische Verschiebungen über Subtree Pruning and Regrafting (SPR) in FastME Version 2.1.6.162 durchgeführt wurden. Diese Matrix paarweiser genetischer Abstände wurde auch als Eingabe für Analysen effektiver Migration und effektiver Diversitätsoberflächen in EEMS25 verwendet. EEMS wurde ausgeführt und stellte die Anzahl der modellierten Demes auf 1000 ein (Abb. 2A, ergänzende Abb. S8). Für jeden Fall wurden zehn unabhängige Markov-Ketten-Monte-Carlo-Ketten (MCMC) mit jeweils 5 Millionen Iterationen ausgeführt, mit einem Burn-in von 1 Million Iterationen, wobei jede 10.000ste Iteration beibehalten wurde. Biogeografische Barrieren (Abb. 2A, ergänzende Abb. S7) wurden weiter identifiziert, indem der Monmonier-Algorithmus24 auf einen bewerteten Graphen angewendet wurde, der durch Delauney-Triangulation geografischer Bevölkerungskoordinaten erstellt wurde, wobei Kantenwerte die paarweise FST der Population widerspiegeln; über das adegenet R-Paket Version 2.1.163. Die FST zwischen allen Populationspaaren wurde über ANGSD berechnet, wobei eine gemeinsame Stichprobengröße von 5 Personen pro Population verwendet wurde (Ergänzende Abbildung S6; Ergänzende Methoden S1.2; Ergänzende Daten 1). Es wurden 100 Bootstrap-Läufe durchgeführt, um eine Heatmap der genetischen Grenzen im Raum zu erstellen, aus der eine gewichtete Mittellinie gezogen wurde (ergänzende Abbildung S7). Alle Analysen in ANGSD wurden mit dem GATK-Modell (-GL 2) durchgeführt, da wir mit dem SAMtools-Modell (-GL 1) Unregelmäßigkeiten in den Standortfrequenzspektren (SFS) festgestellt haben, die denen in Lit. ähneln. 58 mit bestimmten BAM-Dateien. Alle oben beschriebenen Analysen wurden am gesamten Genom durchgeführt.
Um Ahnenzustände zu erfassen und Ortsfrequenzspektren für die Verwendung im Richtungsindex ψ und der demografischen Inferenz zu polarisieren, haben wir Ahnengenomsequenzen an jedem Knoten des Stammbaums von 9 Dianthus-Arten rekonstruiert: D. carthusianorum, D. deltoides, D. glacialis, D. sylvestris (Apennin-Abstammungslinie), D. lusitanus, D. pungens, D. superbus alpestris, D. superbus superbus und D. sylvestris (Alpen-Abstammungslinie). Diese Baumtopologie wurde aus einer detaillierten Rekonstruktion der Dianthus-Phylogenie basierend auf 30 Taxa von Fior et al. extrahiert. (Fior, Luqman, Scharmann, Zemp, Zoller, Pålsson, Gargano, Wegmann & Widmer; Artikel in Vorbereitung) (Ergänzende Methoden S1.3). Für die Rekonstruktion der Ahnensequenz wurde ein Individuum pro Art mit mittlerer Abdeckung (ca. 10x) sequenziert, beschnitten (Trimmomatic), anhand der D. sylvestris-Referenzanordnung kartiert (BWA-MEM) und überlappende Lesepaare abgeschnitten (bamUtil) (ergänzende Methoden). S1.3). Für jede Art haben wir dann mit GATK FastaAlternateReferenceMaker ein artspezifisches FASTA generiert. Dies wurde erreicht, indem die Referenzbasen an polymorphen Standorten durch artspezifische Varianten ersetzt wurden, wie sie von freebayes64 (Version 1.3.1; Standardparameter) identifiziert wurden, während Standorte (i) mit einer Tiefe von Null und ( ii) die die angewandten Variantenfilterkriterien nicht bestanden haben (dh die nicht sicher als polymorph bezeichnet werden können; ergänzende Methoden S1.3). Die Arten-FASTA-Dateien wurden dann zu einem FASTA mit mehreren Stichproben kombiniert. Auf dieser Grundlage haben wir über PHAST (Version 1.4) prequel65 probabilistisch Ahnensequenzen an jedem Knoten des Baums rekonstruiert, wobei wir ein von PHAST phylofit unter einem REV-Substitutionsmodell und der angegebenen Baumtopologie erstelltes Baummodell verwendet haben (Ergänzende Methoden S1.3). Anschließend wurden mithilfe eines benutzerdefinierten Skripts FASTA-Dateien für die Ahnensequenz aus den Prequel-Ergebnissen generiert.
Um den Populationspaarrichtungsindex ψ für die Alpenlinie zu berechnen, verwendeten wir Gleichung 1b von Peter und Slatkin (2013)31, die ψ anhand des Zwei-Populations-Standortfrequenzspektrums (2D-SFS) definiert (Ergänzende Methoden S1.4). ). 2D-SFS zwischen allen Populationspaaren (10 Individuen pro Population; Ergänzungsdaten 1) wurden über ANGSD und realSFS66 (Ergänzungsmethoden S1.4) für entfaltete Spektren geschätzt. Die Entfaltung der Spektren wurde durch Polarisation in Bezug auf den angestammten Zustand der Standorte erreicht, die am Ahnenknoten D. sylvestris (Apennin-Abstammung) – D. sylvestris (alpine Abstammung) definiert wurden. Die Korrelation paarweiser ψ- und (Großkreis-)Distanzmatrizen wurde mit einem Mantel-Test (10.000 Permutationen) getestet. Um den geografischen Ursprung der Erweiterung abzuleiten (Abb. 3), verwendeten wir einen Time Difference of Arrival (TDOA)-Algorithmus nach Peter und Slatkin (2013);31 durchgeführt über das rangeExpansion R-Paket Version 0.0.0.900031,67. Wir haben die Stärke des Gründers dieser Erweiterung mithilfe desselben Pakets weiter geschätzt.
Um die demografische Geschichte von D. sylvestris zu bewerten, wurde eine Reihe möglicher demografischer Modelle formuliert. Um die Topologie der getesteten Modelle einzugrenzen, haben wir zunächst abgeleitet, dass der phylogenetische Baum der drei identifizierten Evolutionslinien von D. sylvestris (Alpin, Apennin und Balkan) in die größere Phylogenie der eurasischen Dianthus-Gruppe eingebettet ist (beachten Sie, dass die Phylogenie von Fior et al. (Fior, Luqman, Scharmann, Zemp, Zoller, Pålsson, Gargano, Wegmann & Widmer; Artikel in Vorbereitung) schließt Balkan-Vertreter von D. sylvestris aus). Bäume wurden auf der Grundlage von Daten zur Gesamtgenomsequenz von 1–2 Vertretern jeder D. sylvestris-Linie mit geringer Abdeckung sowie Daten zur Gesamtgenomsequenz von 7 anderen Dianthus-Arten, nämlich D. carthusianorum, D. deltoides und D. glacialis, abgeleitet , D. lusitanus, D. pungens, D. superbus alpestris und D. superbus superbus, die zur Wurzelbildung der D. sylvestris-Gruppe verwendet wurden (Ergänzende Methoden S1.5). Wir haben distanzbasierte Phylogenien mithilfe von ngsDist68 geschätzt, das Genotypwahrscheinlichkeiten bei der Schätzung genetischer Distanzen berücksichtigt (Ergänzungsmethoden S1.5). Genetische Abstände wurden über zwei Ansätze berechnet: (i) genomweit und (ii) entlang 10-kb-Fenstern. Für Ersteres wurden 110 Bootstrap-Replikate durch erneutes Abtasten von Genomblöcken ähnlicher Größe berechnet. Für die alternative Strategie basierend auf 10-kb-Fenstern wurden Fensterbäume mit ASTRAL-III Version 5.6.369 kombiniert, um einen genomweiten Konsensbaum zu erstellen, der potenzielle Genbaumdiskordanz berücksichtigt (Ergänzungsmethoden S1.5). Bäume wurden aus Matrizen genetischer Abstände von anfänglichen Topologien konstruiert, die durch den BioNJ-Algorithmus definiert wurden, wobei anschließende topologische Verschiebungen über Subtree Pruning and Regrafting (SPR) in FastME Version 2.1.6.162 durchgeführt wurden. Wir haben alle resultierenden phylogenetischen Bäume mit D. deltoides als Außengruppe verwurzelt70. Beide Ansätze stellten eine Topologie wieder her, bei der die Balkan-Linie vor der Apennin- und der Alpen-Linie divergierte (ergänzende Abbildung S9). Diese Taxon-Topologie für D. sylvestris wurde durch hohe ASTRAL-III-Posteriori-Wahrscheinlichkeiten (>99 %), ASTRAL-III-Quartett-Scores (>0,5) und Bootstrap-Werte (>99 %) gestützt. Tiefer im Baum liegende Topologien waren weniger gut aufgelöst (mit Quartettwerten <0,4 in basaleren Knoten). Unter der abgeleiteten D. sylvestris-Topologie und einer weniger annehmenden simultanen trichotomen Split-Topologie wurden 18 Modelle formuliert, die von einfach bis komplex reichen (ergänzende Abbildung S10). Komplexe Modelle ermöglichten Änderungen der Populationsgröße und unterschiedliche Migrationsraten (die zudem asymmetrisch sein könnten) zu jeder Zeitepoche. Wir haben bis zu fünf Zeitepochen zugelassen, um (i) die beiden Divergenzereignisse, (ii) den flaschenhalsartigen Effekt der zeitgenössischen Stichprobenziehung und (iii) bis zu zwei zusätzliche Übergänge in der Demographie zu berücksichtigen.
Um die demografischen Parameter dieser Modelle abzuschätzen, haben wir Moments Version 1.0.071 verwendet, um die Häufigkeitsspektren der gemeinsamen Standorte der Populationen auszuwerten. Wir haben über ANGSD und realSFS das entfaltete Drei-Population-Joint-Site-Frequenzspektrum (3D-SFS) geschätzt, das aus jeweils einer repräsentativen Population pro Abstammungslinie besteht, unter Verwendung von 20 Individuen pro Population (Ergänzungsmethoden S1.5; Ergänzungsdaten 1). Die Spektren wurden in Bezug auf den angestammten Zustand der Standorte polarisiert, die am angestammten Knoten D. lusitanus - D. sylvestris (alpiner Stammbaum) definiert wurden (zur Baumtopologie siehe ergänzende Methoden S1.3). Um die Modellauswahl und -optimierung in wenigen Augenblicken zu erleichtern, verwendeten wir ein iteratives Optimierungsverfahren, das von Ref. modifiziert wurde. 72 (Ergänzende Methoden S1.5). Die Modellauswahl erfolgte durch Vergleich der Log-Likelihood-Werte des Modells, des Akaike-Informationskriteriums (AIC) und über einen angepassten Likelihood-Ratio-Test basierend auf der Godambe Information Matrix (GIM) (Ergänzungstabelle S1). Um Konfidenzintervalle für demografische Parameter abzuschätzen, verwendeten wir eine nichtparametrische Bootstrapping-Strategie, indem wir 100 Bootstraps des 3D-SFS generierten und über nicht verknüpfte Genomblöcke ein Resampling durchführten. Parameterunsicherheiten wurden dann berechnet, indem Bootstrap-Datensätze in Sekundenschnelle unter dem beschriebenen Optimierungsverfahren angepasst wurden (Ergänzungsmethoden S1.5). Um die Generationszeit in Kalenderjahre umzurechnen, gehen wir von einer Generationszeit von drei Jahren aus, die aus Populationswachstumsmodellen einer eng verwandten Art (D. carthusianorum) mit ähnlicher Lebensgeschichte abgeleitet wird (Pålsson, Walther, Fior & Widmer; Artikel in Vorbereitung).
Um die Verteilung von Arten und Abstammungslinien in Raum und Zeit zu modellieren, haben wir Daten zum Vorkommen von Arten und Umweltdaten aus verschiedenen Quellen erfasst. Daten zum Artenvorkommen wurden von Conservatoire Botanique National Méditerranéen de Porquerolles (CBNMed; http://flore.silene.eu), Conservatoire Botanique National Alpin (CBNA; http://flore.silene.eu), GBIF (https:// www.gbif.org; https://doi.org/10.15468/dd.zzqdys), iNaturalist (https://www.inaturalist.org), Info Flora (https://www.infoflora.ch), Wikiplantbase # Italia (http://bot.biologia.unipi.it/wpb/italia), Schwedens virtuelles Herbarium (http://herbarium.emg.umu.se), Virtual Herbaria Austria (https://www.jacq.org) und persönliche Mitarbeiter. Die Umweltdaten umfassten einen anfänglichen Satz von 19 bioklimatischen Variablen (CHELSA32) zusammen mit drei topografischen Variablen (Höhe, Neigung und Ausrichtung) (GMTED2010 und CHELSA PaleoDEM32,73), Bodentyp und pH-Wert (in 5 cm Tiefe) (SoilGrids74). Vor der Ausführung von SDMs wurde ein kohärenter Satz (über alle Abstammungslinien hinweg konsistent) der wichtigsten, am wenigsten kollinearen und biologisch relevanten Variablen ausgewählt. Die Variablenauswahl folgte einem iterativen Prozess der Modellanpassung über generalisierte lineare (GLM; ecospat R-Paketversion 3.075), maximale Entropie (maxent;76 dismo R-Paketversion 1.1.477) und zufällige Gesamtstruktur (RF; randomForest R-Paketversion 4.6.1478). (extendedForest R-Paketversion 1.6.136) Modellierung zur Bewertung der Variablenbedeutung, kombiniert mit Varianzinflationsfaktor (VIF; usdm R-Paketversion 1.1.1879) und Korrelationsanalysen. Wir haben die wichtigsten und am wenigsten kollinearen Variablen (VIF < 10 und Pearson-Korrelation r < 0,7) beibehalten, basierend auf empfohlenen Grenzwerten für diese Art von Analyse80. Dies führte zu einem endgültigen Satz von 10 Variablen: (1) Isothermie, (2) Temperatursaisonalität, (3) Temperaturmaximum im wärmsten Monat, (4) mittlere Temperatur im feuchtesten Viertel, (5) mittlere Temperatur im trockensten Viertel, (6) Niederschlagssaisonalität , (7) niederschlagswärmstes Viertel, (8) niederschlagskältestes Viertel, (9) Boden-pH-Wert bei 5 cm und (10) topografisches Gefälle. Verteilungsmodelle wurden sowohl für jede Abstammungslinie einzeln als auch für die zusammengefassten Arten erstellt. Für jeden Lauf wurden Vorkommen zufällig aus einer größeren Menge ausgewählt und disaggregiert, um die Probendichte im geografischen Raum auszugleichen, was zu ca. 420, 260, 170 und 530 erhaltene Vorkommen für die alpinen, Apennin-, Balkan- und gepoolten Arten. Unter Verwendung dieser Vorkommensdaten und des endgültigen Satzes von Umweltprädiktoren haben wir ein SDM-Ensemblemodell erstellt, das aus dem gewichteten Durchschnitt von vier separaten Modellen besteht: (1) einem verallgemeinerten linearen Modell (GLM), (2) einem allgemeinen additiven Modell (GAM), (3) ein Maximum-Entropie-Modell (maxent) und (4) ein Random-Forest-Modell (RF). Die Modellgewichte spiegelten ihre Klassifizierungsleistung wider (d. h. die Fläche unter der Kurve (AUC) der Receiver Operating Characteristic (ROC)-Kurve). Für jedes Modell wurde eine 5-fache Kreuzvalidierung und Modellbewertung durchgeführt. Das resultierende Ensemble-SDM-Modell wurde auf das heutige Klima projiziert und auf das LGM-Klima hindcasted (Ergänzende Methoden S1.6). Für die LGM-Umweltprädiktoren haben wir das Ensemble (Mittelwert) von vier globalen PMIP3-Klimamodellen (GCMs) verwendet, die unter CHELSA32 implementiert wurden: (1) NCAR-CCSM481, (2) MIROC-ESM82, (3) MRI-CGCM383 und (4). ) MPI-ESM-P;84 Auswahl von Modellen, die unterschiedlich sind und nur geringe gegenseitige Abhängigkeiten aufweisen85. Alle Umweltvariablen mit Ausnahme der Bodenvariablen waren für aktuelle und LGM-Prädiktordatensätze verfügbar. Wir gehen daher in unseren Modellen davon aus, dass der pH-Wert des Bodens über die Zeit konstant blieb. Während dies eine starke Annahme ist, würde die alternative Strategie, den pH-Wert auszuschließen, zusätzlich zu einer konstanten Wirkung über den Raum hinaus ebenfalls von einer zeitlich konstanten Wirkung ausgehen. Hier argumentieren wir, dass es besser ist, eine informierte Konstante gegenüber einer uninformierten Konstante zu haben; da derzeit kein Paläomodell des globalen Bodens verfügbar ist.
Um abstammungsspezifische Ausbreitungswege zu rekonstruieren und heutige Populationen ihren wahrscheinlichsten angestammten Refugien zuzuordnen, haben wir zunächst abstammungsspezifische Nischenmodelle auf das LGM-Klima projiziert. Mithilfe eines unbeaufsichtigten dichtebasierten räumlichen Clustering-Algorithmus (DBSCAN) (dbscan R-Paketversion 1.1.286) identifizierten wir unterschiedliche, zusammenhängende Refugien (räumliche Cluster vorhergesagter Vorkommen), die mit geografischen Regionen (Alpen, Apennin und Balkan). Anschließend projizierten wir die linienspezifischen Nischenmodelle nacheinander auf Klimaraster in Zeitintervallen von 100 Jahren für den Zeitraum zwischen der LGM und der Gegenwart. Zu jedem (aufeinanderfolgenden) Zeitpunkt wurde neuen Vorkommen (im Raum) eine Abstammungslinie zugewiesen, die auf dem k-nächsten Nachbarn (k = 1) des vorherigen Satzes (zum Zeitpunkt) der Abstammungszuweisungsvorkommen (FNN R-Paketversion) basiert 1.1.2.187), vorausgesetzt, dass die neuen Vorkommen innerhalb einer definierten Entfernung d liegen (Ausbreitungsparameter, d = 12 km pro Jahrhundert88). Zusätzlich zu dieser Begrenzung der Ausbreitungsrate haben wir einen Konkurrenzausschluss zwischen Abstammungslinien erzwungen, sodass nur eine einzelne Abstammungslinie zu einem bestimmten Zeitpunkt eine räumliche Zelle besetzen kann. Der 100-Jahres-Zeitintervalldatensatz wurde durch lineare Interpolation klimatischer Variablen zwischen dem aktuellen LGM-Modell und dem Ensemble-LGM-Modell generiert. Obwohl bekannt ist, dass sich das Klima zwischen diesen Zeitpunkten nicht linear veränderte, hielten wir diesen Ansatz für aussagekräftiger als die Alternative, heutige Vorkommen anhand von Entfernungsmaßen geografischen Refugien zuzuordnen, da erstere die Heterogenität der Landschaft berücksichtigt eine explizite, wenn auch näherungsweise räumlich-zeitliche Art und Weise. Kürzlich wurde CHELSA-TraCE21k89 veröffentlicht, das das Klima explizit in 100-Jahres-Zeitintervallen vom LGM bis heute modelliert. Die LGM-Hindcasts dieses Modells stimmten jedoch nicht mit denen der anderen vier hier verwendeten PMIP3-Modelle überein, was möglicherweise darauf zurückzuführen ist, dass sie auf dem älteren CCSM3 GCM90 basierten. Daher haben wir hier auf die Verwendung des TraCE-Datensatzes verzichtet.
Um die Verschiebung des Umweltraums und der Lebensraumverfügbarkeit vom LGM zur Gegenwart zu visualisieren, haben wir den Umweltraum des LGM und der Gegenwart auf einen gemeinsamen, niedrigerdimensionalen Raum projiziert, indem wir die PCA-Transformation (Skalierung, Zentrierung und Rotation) des LGM angewendet haben aktuelle Umgebung sowohl in aktuelle als auch in LGM-Umgebungen (Ergänzende Methoden S1.7). Hier umfasste der bewertete Umweltraum die 19 bioklimatischen Variablen (CHELSA) zusammen mit der Höhe (GMTED2010, Chelsa PaleoDEM) und der topografischen Neigung. Die Dichte der Zellen, die jede Koordinate im resultierenden PCA-transformierten Umgebungsraum belegen, wurde durch hexagonales Binning (ggplot2 R-Paketversion 3.3.2) visualisiert, was die Quantifizierung der Fläche an jedem Punkt (im PCA-transformierten Umgebungsraum) ermöglichte. Die geografischen Ausdehnungen, aus denen die Umweltdaten entnommen und auf die sie beschränkt wurden, sind in der ergänzenden Abbildung S16 dargestellt.
Um die Siebung der adaptiven genetischen Variation in Raum und Zeit vorherzusagen, haben wir die Assoziation genetischer Varianten (SNPs) mit Veränderungen in der Umwelt mithilfe von Gradient Forest (GF)17,36 modelliert. Hier gehen wir davon aus, dass zeitgenössische Gen-Umwelt-Assoziationen, die über den Raum verteilt sind, Gen-Umwelt-Assoziationen über die Zeit hinweg widerspiegeln9,17,20,21. GF charakterisiert den Zusammensetzungsumsatz in Allelfrequenzen entlang von Umweltgradienten über monotone, nichtlineare (Umsatz-)Funktionen, die den mehrdimensionalen Umweltraum in einen mehrdimensionalen genomischen Raum umwandeln17,36. Ausgehend von dem vollständigen Satz der oben beschriebenen Umgebungsvariablen wurden Umweltprädiktoren ausgewählt, indem die Bedeutung der Variablen mithilfe von Zufallswäldern (gradientForest R-Paket 0.1.1836) quantifiziert und die Kollinearität der Variablen mithilfe des Varianzinflationsfaktors (VIF) und Korrelationsanalysen bewertet wurde. Wir haben die wichtigsten und am wenigsten kollinearen Variablen beibehalten (VIF < 10 und Pearson-Korrelation r < 0,7), was zu einem endgültigen Satz von 10 Variablen führte: (1) Tageszeitbereich der Temperatur, (2) Temperatursaisonalität, (3) Temperaturminimum im kältesten Monat , (4) Temperaturmittelwert des feuchtesten Viertels, (5) Temperaturmittelwert des trockensten Viertels, (6) Niederschlagssaisonalität, (7) Niederschlagswärmstes Viertel, (8) Niederschlagskältestes Viertel, (9) Boden-pH-Wert bei 5 cm und (10) topografisches Gefälle. Um die genetische Struktur in den Alpen (alpine Abstammung) zu berücksichtigen, haben wir Längen- und Breitengrad als Kovariaten in das Modell einbezogen, da gezeigt wurde, dass diese stark mit den beiden Hauptkomponenten der genomweiten Struktur korrelieren (ergänzende Abbildung). S13). Als alternative Methode haben wir über das adespatial R-Paket Version 0.3.892 eine Moran-Eigenvektorkarte (MEM)91 erstellt, die auf einer räumlichen Gewichtungsmatrix basiert, die die Expansionsgeschichte der Alpenlinie widerspiegelt, und diese als Kovariate in das GF-Modell aufgenommen (anstelle von Längen- und Breitengrad) (Ergänzende Abbildung S21). Hier wurden die Kanten der räumlichen Gewichtungsmatrix durch die Divergenz der Expansionspfade (von den LGM-Refugien) zwischen Bevölkerungspaaren gewichtet (siehe die Pfadüberlappungs- und Divergenzmetriken von van Etten & Hijmans (2010);88 Ergänzende Abbildung S21, Ergänzende Tabelle S2). Dieses Maß für die Divergenz der Expansionsrouten wurde über eine räumliche Übergangsmatrix (d. h. Widerstandsfläche) berechnet, die durch die abstammungsspezifische SDM-Projektion definiert wurde, über das gdistance R-Paket Version 1.2.293 unter Verwendung des Random-Walk-Algorithmus. Proben wurden in der räumlichen Gewichtungsmatrix als Nachbarn betrachtet, wenn ihr paarweiser geografischer Abstand gleich oder kleiner als die längste Kante des minimalen Spannbaums war. Von den drei zurückgegebenen positiven MEM-Eigenvektoren erklärte ein einzelner positiver Eigenvektor (MEM1) den Großteil der Varianz und wurde als räumliche Kovariate verwendet (ergänzende Abbildung S21). Als Antwortvariable verwendet unser GF-Modell Populationsallelfrequenzen. Genetische Varianten (SNPs), die sich über 43 Alpenpopulationen mit jeweils 14 Individuen aufteilen, wurden erstmals mit dem Programm freebayes64 (Version 1.3.1) identifiziert (Supplementary Methods S1.8; Supplementary Data 1). Wir haben den Varianten-Callset auf die Exon-Regionen des Genoms beschränkt. Populationsallelhäufigkeiten wurden aus dem resultierenden VCF über vcflib popStats (Version 1.0.1.1)94 unter Verwendung von Genotypwahrscheinlichkeiten berechnet. Wir haben diesen Datensatz gefiltert, um nur Standorte mit einer Tiefe von ≥7 pro Population zu behalten. GF wurde mit dem resultierenden Satz von 390.262 Exon-SNPs in Chargen von 10.000 SNPs unter Verwendung von 500 Entscheidungsbäumen ausgeführt. Batch-Läufe wurden über CombinedGradientForest {standardise = „before“, method = 2} im GradientForest R-Paket kombiniert. Wenn wir das Ensemble aller genetischen Exon-Variationen betrachten und den Beitrag jedes SNP mit dem Bestimmtheitskoeffizienten (R2) seiner Umgebungsassoziation gewichten (ergänzende Abbildung S17), kann unser GF-Ansatz möglicherweise den Beitrag (Effekte) eines Hauptanteils einbeziehen adaptiver Loci, einschließlich solcher mit geringer Effektgröße, die von der polygenen Selektion betroffen sind. Jüngste Erkenntnisse haben gezeigt, dass ein solcher Ansatz, der auf großen Mengen genomischer SNPs basiert, die Fitness gut widerspiegeln kann19 und eine gleichwertige oder bessere Leistung erbringt als GF-Modelle, die auf a priori identifizierten umweltassoziierten SNPs basieren19. Die resultierenden GF-Umsatzfunktionen – die die Umweltvariablen (Umweltraum) in biologische Variablen des Zusammensetzungsumsatzes (biologischer Raum) umwandeln17,36 – werden auf heutige und LGM-Klimaraster angewendet, um die adaptive genomische Zusammensetzung von Populationen im Raum zu charakterisieren Zeit. Um die adaptive genomische Zusammensetzung im Raum zu visualisieren, haben wir die ersten drei Hauptkomponenten des transformierten Umweltraums ohne die transformierten Längen- und Breitengradvariablen aufgezeichnet, um nur die adaptive Komponente zu visualisieren. Beachten Sie hier, dass die PCA zentriert, aber nicht skaliert wurde, um die GF-berechnete Bedeutung der transformierten Umgebungsvariablen beizubehalten17,19.
Um Unterschiede in der genomischen Zusammensetzung zu bewerten und die evolutionäre Veränderung der Populationen zwischen den untersuchten Zeitpunkten zu quantifizieren, haben wir (genomische) Zusammensetzungsunterschiede (zwischen den Zeitpunkten) ausgewertet, die die Lage der Gletscherrefugien der Populationen berücksichtigen. Insbesondere haben wir den multivariaten euklidischen Abstand zwischen der genomischen Zusammensetzung jeder heutigen Population und der ihrer (geographisch) nächstgelegenen vorhergesagten Zufluchtsquelle zum Zeitpunkt des LGM berechnet (ergänzende Abbildung S20). Wir bezeichnen diese Metrik als „glazialen genomischen Offset“. Im Gegensatz zu unserer vorherigen Visualisierung der adaptiven genomischen Zusammensetzung behalten wir hier die biologischen Variablen bei, die aus Längen- und Breitengraden in unsere Berechnung des glazialen genomischen Offsets umgewandelt wurden, um den Effekt von IBD und entfernungsbedingten Driftprozessen (dh Expansion) zu berücksichtigen. Dies liegt daran, dass wir darauf abzielen, dass der glaziale genomische Versatz die gemeinsamen, realisierten Auswirkungen der Isolation durch die Umgebung, der Isolation durch Entfernung (IBD) und der räumlichen Ausdehnung zwischen der Vorfahrenpopulation in den Refugien und der heutigen Bevölkerung einkapselt. Für unsere alternative Methode unter Verwendung von MEM haben wir MEM-Werte über eine inverse Pfadentfernungsgewichtung über die SDM-definierte Widerstandsoberfläche über das ipdw R-Paket Version 0.2.695 interpoliert, um den Effekt der Entfernung im glazialen Genomversatz einzubeziehen (zu modellieren). Ein solcher Interpolationsansatz ist grob und anfällig für Artefakte; Bietet jedoch eine alternative Möglichkeit zur Modellierung von Distanzeffekten, wenn die genetische Struktur nicht gut durch eine geografische Neigung dargestellt wird. Beachten Sie, dass bei unserer Berechnung der glazialen genomischen Offsets die geografische Ausdehnung der glazialen Refugien auf Verteilungsmodellen beruhte, was einen Nischenkonservatismus voraussetzt. Dies mag dem hier verfolgten Ziel, Anpassungen zu erfassen, zuwiderlaufen. Wir mildern diese methodische Einschränkung jedoch, indem wir linienspezifische und nicht artspezifische Nischen verwenden und uns zusätzlich auf populationsgenetische Schlussfolgerungen (ψ) stützen, um glaziale Refugien zu rekonstruieren. Darüber hinaus sind unsere Schlussfolgerungen früherer Verteilungen konservativ, sodass die abgeleiteten glazialen Refugien kleiner und nicht größer gewesen wären, wenn die Anpassung die postglaziale Expansion erleichtert hätte. Abschließend stellen wir fest, dass unsere Vorhersage der adaptiven Variation während des LGM im gesamten Raum sehr homogen ist, was bedeutet, dass unsere Vorhersagen des glazialen genomischen Offsets auch unter Schwankungen der abgeleiteten geografischen Ausdehnung der glazialen Refugien robust bleiben.
Um die adaptive Beziehung zwischen Individuen in geringer Höhe, Individuen in großer Höhe und Refugial-Proxys (d. h. denen, die derzeit in den vermuteten Gletscher-Refugien im Monte Baldo und in den westlichen Dolomiten leben) zu untersuchen, haben wir Populationen (mit Ausnahme von Refugial-Proxys) in niedrig gelegene Individuen unterteilt. Höhenkategorien (<1000 m) und Höhenlagen (>1500 m). Um Verzerrungen im Zusammenhang mit unausgewogenen Stichprobengrößen zu vermeiden, wurden Kategorien auf eine gemeinsame Stichprobengröße von jeweils 70 Personen (5 Populationen) aufgeteilt (Ergänzungsdaten 1). Anschließend berechneten wir einen genetischen Distanzbaum, ein PCA- und Venn-Diagramm für die Anwesenheit und Abwesenheit von Alleln. basierend auf den obersten (nicht verknüpften) 1000 GF umweltassoziierten SNPs (ergänzende Abbildung S19). Der genetische Distanzbaum und die PCA wurden wie oben für den gesamten Genomdatensatz beschrieben berechnet. Für die Anwesenheit/Abwesenheit von Alleln haben wir einen Mindestschwellenwert für die Allelhäufigkeit von 5 % angewendet.
Um unsere Vorhersagen zum glazialen genomischen Offset zu validieren, führten wir Korrelationen dieser Metrik mit verschiedenen Populationsgenetischen Diversitäts- und Neutralitätsstatistiken durch, darunter Nukleotiddiversität π, Tajimas D, Fu & Lis F, Fay & Wus H und Zengs E. Statistiken wurden für die Stichprobe berechnet Populationen sowohl genomweit als auch um umweltassoziierte Loci zentriert, unter Verwendung von ANGSD (Supplementary Method S1.9). Für Letzteres haben wir die gewichteten Durchschnittsstatistiken von Exon-SNPs mit Gewichtungen berechnet, die durch das Bestimmtheitsmaß (R2) der Umweltassoziation des SNP gegeben sind (wie unter GF angegeben; ergänzende Abbildung S17A). Dieser Ansatz vermeidet die verlustbehaftete Strategie, diskrete adaptive Kandidaten aufzurufen, und spiegelt möglicherweise genomweite (einschließlich polygener) Signale der adaptiven Diversität besser wider. Wir verglichen außerdem die Werte der Nukleotiddiversität (π) für aktuelle Populationen in niedrigen und hohen Lagen (ca. 1000 m Höhenunterschied) in Gebieten, in denen sie in unmittelbarer geografischer Nähe gleichzeitig vorkommen, um die Auswirkungen der Isolation nach Entfernung (IBD) zu kontrollieren ) und die räumliche Ausdehnung (insgesamt vier Paare; Ergänzende Daten 1). Angesichts der geringen Anzahl geeigneter Populationspaare haben wir zusätzlich π für alle Populationen verglichen, die in niedriggelegene (<1000 m) und hochgelegene (>1500 m) Abschnitte unterteilt sind, geordnet entlang der Expansionsachse. π wurde sowohl genomweit (πGW) als auch zentriert um umweltassoziierte Loci (πGF) berechnet. Letzteres wurde als gewichteter Mittelwert π von Exon-SNPs berechnet, wobei die Gewichte durch das R2 der Umweltassoziation des SNP angegeben wurden (wie unter GF angegeben; ergänzende Abbildung S17B).
Der Zugang, die Entnahme und der Import/Export der Proben erfolgten auf verantwortungsvolle Weise und in Übereinstimmung mit allen relevanten lokalen, nationalen und internationalen Gesetzen. Vor der Probenentnahme wurden alle erforderlichen Probenahmegenehmigungen eingeholt. Dazu gehörten Probenahmegenehmigungen der Comunità della Vallagarina für Probenahmen in Monte Baldo, Italien (ausgestellt am 13. Juli 2017, gültig für das Jahr 2017); vom Parco Nazionale Gran Paradiso zur Probenahme im Nationalpark Gran Paradiso, Italien (ausgestellt am 12. Mai 2017, gültig für den Sommer 2017); vom Amt für Natur und Umwelt zur Probenahme in Graubünden, Schweiz (ausgestellt am 21. April 2017, gültig für die Jahre 2017 und 2018); vom Amt für Natur, Jagd und Fischerei für die Probenahme in St. Gallen, Schweiz (ausgestellt am 29. Mai 2017, gültig ab Ausstellungsdatum bis 31. Dezember 2018), und vom Amt für Wald und Landschaft für die Probenahme in Obwalden, Schweiz (ausgestellt am 29. Mai 2017, gültig für Mai-September 2017 und Mai-September 2018). Das Nagoya-Protokoll über Zugang und Vorteilsausgleich wurde in den Ländern befolgt, in denen es zum Zeitpunkt der Probenahme ratifiziert worden war. Dianthus sylvestris ist weder im Übereinkommen über den internationalen Handel mit gefährdeten Arten freilebender Tiere und Pflanzen (CITES) noch in der Roten Liste gefährdeter Arten der Internationalen Union für Naturschutz (IUCN) aufgeführt.
Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.
Rohsequenzierungsdaten für die 1261 Gesamtgenome von D. sylvestris mit geringer Abdeckung sind im Europäischen Nukleotidarchiv (ENA) unter dem Zugangscode PRJEB53522 hinterlegt und verfügbar. Rohsequenzierungslesungen für den artenübergreifenden Datensatz sind bei ENA unter dem Zugangscode PRJEB54098 verfügbar. Die Referenzassemblierung des D. sylvestris-Genoms und die Strukturanmerkung sind im Dryad-Repository verfügbar: https://doi.org/10.5061/dryad.x0k6djhng54. Beispielzugänge und Metadaten finden Sie in den Zusatzdaten 1. Die verwendeten Umweltdaten wurden von CHELSA (Version 1.2; https://chelsa-climate.org) und SoilGrids (Version 2020; https://soilgrids.org) heruntergeladen. Topografische Daten wurden von CHELSA und GMTED2010 (Version 2010; https://topotools.cr.usgs.gov/gmted_viewer/gmted2010_global_grids.php) heruntergeladen. Daten zum Artenvorkommen wurden von Conservatoire Botanique National Méditerranéen de Porquerolles (CBNMed; http://flore.silene.eu), Conservatoire Botanique National Alpin (CBNA; http://flore.silene.eu), GBIF (https:// www.gbif.org; https://doi.org/10.15468/dd.zzqdys), iNaturalist (https://www.inaturalist.org), Info Flora (https://www.infoflora.ch), Wikiplantbase # Italia (http://bot.biologia.unipi.it/wpb/italia), Schwedens virtuelles Herbarium (http://herbarium.emg.umu.se), Virtual Herbaria Austria (https://www.jacq.org) und persönliche Mitarbeiter im Jahr 2017. Diese Vorkommensdaten sind im Github-Repository hinterlegt (https://github.com/hirzi/RhEA; https://doi.org/10.5281/zenodo.7581797)96.
Code zum Durchführen demografischer Inferenz, Ausführen von Verteilungsmodellen, Visualisieren von Verschiebungen im Umweltraum, Durchführen von Gradientenwäldern und Berechnen von glazialen genomischen Offsets ist im GitHub-Repository verfügbar: https://github.com/hirzi/RhEA (https://doi.org /10.5281/zenodo.7581797)96.
Hewitt, G. Das genetische Erbe der quartären Eiszeiten. Natur 405, 907–913 (2000).
Artikel ADS CAS PubMed Google Scholar
Webb, T. III & Bartlein, PJ Globale Veränderungen während der letzten 3 Millionen Jahre: Klimakontrollen und biotische Reaktionen. Annu. Rev. Ecol. Syst. 23, 141–173 (1992).
Artikel Google Scholar
Davis, MB & Shaw, RG Verbreitungsverschiebungen und adaptive Reaktionen auf den quartären Klimawandel. Wissenschaft 292, 673–679 (2001).
Artikel ADS CAS PubMed Google Scholar
Petit, RJ et al. Gletscherrefugien: Hotspots, aber keine Schmelztiegel genetischer Vielfalt. Wissenschaft 300, 1563–1565 (2003).
Artikel ADS CAS PubMed Google Scholar
Exposito-Alonso, M. et al. Genomische Basis und evolutionäres Potenzial für die Anpassung an extreme Dürre bei Arabidopsis thaliana. Nat. Ökologisch. Entwicklung 2, 352–358 (2018).
Artikel PubMed Google Scholar
Barrett, RDH & Schluter, D. Anpassung an bestehende genetische Variation. Trends Ecol. Entwicklung 23, 38–44 (2008).
Artikel PubMed Google Scholar
Scheffers, BR et al. Der breite Fußabdruck des Klimawandels von Genen über Biome bis hin zum Menschen. Wissenschaft 354, aaf7671 (2016).
Artikel PubMed Google Scholar
Pecl, GT et al. Umverteilung der biologischen Vielfalt im Zuge des Klimawandels: Auswirkungen auf Ökosysteme und das menschliche Wohlbefinden. Science 355, eaai9214 (2017).
Artikel PubMed Google Scholar
Capblancq, T., Fitzpatrick, MC, Bay, RA, Exposito-Alonso, M. & Keller, SR Genomische Vorhersage der (Fehl-)Anpassung in aktuellen und zukünftigen Klimalandschaften. Annu. Rev. Ecol. Entwicklung Syst. 51, 245–269 (2020).
Artikel Google Scholar
Aguirre-Liguori, JA, Ramírez-Barahona, S. & Gaut, BS Die evolutionäre Genomik der Reaktionen von Arten auf den Klimawandel. Nat. Ökologisch. Entwicklung 5, 1350–1360 (2021).
Artikel PubMed Google Scholar
Svenning, JC, Fløjgaard, C., Marske, KA, Nógues-Bravo, D. & Normand, S. Anwendungen der Artenverteilungsmodellierung in der Paläobiologie. Quat. Wissenschaft. Rev. 30, 2930–2947 (2011).
Artikel ADS Google Scholar
Avise, JC Phylogeographie: Rückblick und Ausblick. J. Biogeogr. 36, 3–15 (2009).
Artikel Google Scholar
de Lafontaine, G., Napier, JD, Petit, RJ & Hu, FS Aufruf zur Anpassung, um das genetische Erbe des vergangenen Klimawandels zu entschlüsseln. Ökologie 99, 1530–1546 (2018).
Artikel PubMed Google Scholar
Bradshaw, AD & Mcneilly, T. Evolutionäre Reaktion auf den globalen Klimawandel. Ann. Bot. 67, 5–14 (1991).
Artikel Google Scholar
Gougherty, AV, Keller, SR & Fitzpatrick, MC Fehlanpassung, Migration und Aussterben erhöhen das Risiko des Klimawandels bei einer Waldbaumart. Nat. Aufstieg. Chang. 11, 166–171 (2021).
Artikel ADS Google Scholar
Guerrero, RF & Hahn, MW Artbildung als Sieb für Ahnenpolymorphismus. Mol. Ökologisch. 26, 5362–5368 (2017).
Fitzpatrick, MC & Keller, SR Ökologische Genomik trifft auf Modellierung der Biodiversität auf Gemeindeebene: Kartierung der genomischen Landschaft aktueller und zukünftiger Umweltanpassungen. Ökologisch. Lette. 18, 1–16 (2015).
Artikel PubMed Google Scholar
Jump, AS, Hunt, JM, Martínez-Izquierdo, JA & Peñuelas, J. Natürliche Selektion und Klimawandel: Temperaturbedingte räumliche und zeitliche Trends in der Genhäufigkeit in Fagus sylvatica. Mol. Ökologisch. 15, 3469–3480 (2006).
Artikel CAS PubMed Google Scholar
Fitzpatrick, MC, Chhatre, VE, Soolanayakanahally, RY & Keller, SR Experimentelle Unterstützung für die genomische Vorhersage von Klimafehlanpassungen mithilfe des maschinellen Lernansatzes Gradient Forests. Mol. Ökologisch. Ressource. 21, 2749–2765 (2021).
Kirch, M., Romundset, A., Gilbert, MTP, Jones, FC & Foote, AD Alte und moderne Stichlingsgenome offenbaren die demografischen Einschränkungen bei der Anpassung. Curr. Biol. 31, 2027–2036 (2021).
Artikel CAS PubMed Google Scholar
Blois, JL, Williams, JW, Fitzpatrick, MC, Jackson, ST & Ferrier, S. Bei der Vorhersage der Auswirkungen des Klimawandels auf die Artenvielfalt kann der Weltraum Zeit ersetzen. Proz. Natl Acad. Wissenschaft. USA 110, 9374–9379 (2013).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Meirmans, PG Subsampling zeigt, dass eine unausgewogene Probenahme die Struktur beeinflusst und zu einem Datensatz mit mehreren Arten führt. Heredity 122, 276–287 (2019).
Artikel CAS PubMed Google Scholar
Puechmaille, SJ Das Programm STRUCTURE stellt die korrekte Bevölkerungsstruktur nicht zuverlässig wieder her, wenn die Stichprobe ungleichmäßig ist: Unterstichproben und neue Schätzer lindern das Problem. Mol. Ökologisch. Ressource. 16, 608–627 (2016).
Artikel PubMed Google Scholar
Manni, F., Guerard, E. & Heyer, E. Geografische Muster (genetischer, morphologischer, sprachlicher) Variationen: Wie Barrieren mithilfe des Monmonier-Algorithmus erkannt werden können. Summen. Biol. 76, 173–190 (2004).
Artikel PubMed Google Scholar
Petkova, D., Novembre, J. & Stephens, M. Visualisierung der räumlichen Bevölkerungsstruktur mit geschätzten effektiven Migrationsflächen. Nat. Genet. 48, 94–100 (2015).
Artikel PubMed PubMed Central Google Scholar
Thiel-Egenter, C. et al. Bruchzonen in der Verteilung von Allelen und Arten in alpinen Pflanzen. J. Biogeogr. 38, 772–782 (2011).
Artikel Google Scholar
Pritchard, JK, Stephens, M. & Donnelly, P. Inferenz der Populationsstruktur mithilfe von Multilocus-Genotypdaten. Genetics 155, 945–959 (2000).
Artikel CAS PubMed PubMed Central Google Scholar
Lawson, DJ, van Dorp, L. & Falush, D. Ein Tutorial, wie man STRUCTURE- und ADMIXTURE-Balkendiagramme nicht überinterpretiert. Nat. Komm. 9, 1–11 (2018).
Artikel CAS Google Scholar
Austerlitz, F., Jung-Muller, B., Godelle, B. & Gouyon, P.-H. Entwicklung von Koaleszenzzeiten, genetischer Vielfalt und Struktur während der Kolonisierung. Theor. Bevölkerung. Biol. 51, 148–164 (1997).
Artikel MATH Google Scholar
Ramachandran, S. et al. Unterstützung durch den Zusammenhang zwischen genetischer und geografischer Distanz in menschlichen Populationen für einen seriellen Gründereffekt mit Ursprung in Afrika. Proz. Natl Acad. Wissenschaft. 102, 15942–15947 (2005).
Artikel ADS CAS PubMed PubMed Central Google Scholar
Peter, BM & Slatkin, M. Erkennen von Verbreitungserweiterungen anhand genetischer Daten. Evolution 67, 3274–3289 (2013).
Artikel PubMed PubMed Central Google Scholar
Karger, DN et al. Klimatologien in hoher Auflösung für die Landoberflächen der Erde. Wissenschaft. Daten 4, 1–20 (2017).
Artikel Google Scholar
Normand, S. et al. Postglaziale Migration ergänzt das Klima bei der Bestimmung des Pflanzenartenspektrums in Europa. Proz. R. Soc. B Biol. Wissenschaft. 278, 3644–3653 (2011).
Artikel Google Scholar
Guisan, A. & Thuiller, W. Vorhersage der Artenverteilung: Bietet mehr als nur einfache Lebensraummodelle. Ökologisch. Lette. 8, 993–1009 (2005).
Artikel PubMed Google Scholar
Wisz, MS et al. Die Rolle biotischer Interaktionen bei der Gestaltung von Verteilungen und realisierten Ansammlungen von Arten: Implikationen für die Modellierung der Artenverteilung. Biol. Rev. 88, 15–30 (2013).
Artikel PubMed Google Scholar
Ellis, N., Smith, SJ & Roland Pitcher, C. Gradientenwälder: Berechnung von Wichtigkeitsgradienten anhand physikalischer Prädiktoren. Ökologie 93, 156–168 (2012).
Artikel PubMed Google Scholar
Zeng, K., Fu, YX, Shi, S. & Wu, CI Statistische Tests zum Nachweis positiver Selektion durch Verwendung von Hochfrequenzvarianten. Genetics 174, 1431–1439 (2006).
Artikel PubMed PubMed Central Google Scholar
Fay, JC & Wu, CI Trampen unter positiver darwinistischer Selektion. Genetics 155, 1405–1413 (2000).
Artikel CAS PubMed PubMed Central Google Scholar
Tajima, F. Statistische Methode zum Testen der neutralen Mutationshypothese durch DNA-Polymorphismus. Genetics 123, 585–595 (1989).
Artikel CAS PubMed PubMed Central Google Scholar
Maynard Smith, J. & Haigh, J. Der Tramp-Effekt eines günstigen Gens. Genet. Res. 23, 23–35 (1974).
Artikel Google Scholar
Mayr, E. Systematik und Entstehung der Arten. (Columbia Univ. Press, New York, 1942).
Steinbauer, MJ et al. Die beschleunigte Zunahme des Pflanzenartenreichtums auf Berggipfeln steht im Zusammenhang mit der Erwärmung. Natur 556, 231–234 (2018).
Artikel ADS CAS PubMed Google Scholar
Nomoto, HA & Alexander, JM Treiber des lokalen Aussterberisikos bei alpinen Pflanzen unter sich erwärmendem Klima. Ökologisch. Lette. 24, 1157–1166 (2021).
Artikel PubMed PubMed Central Google Scholar
Anderson, JT & Wadgymar, SM Der Klimawandel stört die lokale Anpassung und begünstigt die Bergwanderung. Ökologisch. Lette. 23, 181–192 (2020).
Artikel PubMed Google Scholar
Peischl, S. & Excoffier, L. Expansionslast: Rezessive Mutationen und die Rolle bestehender genetischer Variation. Mol. Ökologisch. 24, 2084–2094 (2015).
Artikel PubMed Google Scholar
Slatkin, M. & Excoffier, L. Seriengründereffekte während der Verbreitungserweiterung: Ein räumliches Analogon der genetischen Drift. Genetics 191, 171–181 (2012).
Artikel CAS PubMed PubMed Central Google Scholar
González-Martínez, SC, Ridout, K. & Pannell, JR Die Erweiterung des Verbreitungsgebiets beeinträchtigt die adaptive Evolution in einer Auskreuzungspflanze. Curr. Biol. 27, 2544–2551.e4 (2017).
Artikel PubMed Google Scholar
DeGiorgio, M., Degnan, JH & Rosenberg, NA Koaleszenzzeitverteilungen in einem seriellen Gründermodell der menschlichen Evolutionsgeschichte. Genetics 189, 579–593 (2011).
Artikel PubMed PubMed Central Google Scholar
Therkildsen, NO & Palumbi, SR Praktische genomweite Sequenzierung mit geringer Abdeckung von Hunderten individuell mit Barcodes versehenen Proben für die Populations- und Evolutionsgenomik bei Nicht-Modellarten. Mol. Ökologisch. Ressource. 1–15 (2016).
Costello, M. et al. Charakterisierung und Behebung von Probenindex-Swaps durch nicht-redundante Dual-Indizierung auf massiv parallelen Sequenzierungsplattformen. BMC Genomics 19, 1–10 (2018).
Artikel Google Scholar
Bolger, AM, Lohse, M. & Usadel, B. Trimmomatic: Ein flexibler Trimmer für Illumina-Sequenzdaten. Bioinformatik 30, 2114–2120 (2014).
Artikel CAS PubMed PubMed Central Google Scholar
Li, H. & Durbin, R. Schnelle und genaue Ausrichtung kurzer Lesevorgänge mit der Burrows-Wheeler-Transformation. Bioinformatik 25, 1754–1760 (2009).
Artikel CAS PubMed PubMed Central Google Scholar
Li, H. Ausrichten von Sequenzlesevorgängen, Klonsequenzen und Assemblierungs-Contigs mit BWA-MEM. Vorabdruck unter http://arxiv.org/abs/1303.3997 (2013).
Fior, S. Entwurf der Genomassemblierung der Alpennelke Dianthus sylvestris (Caryophyllaceae). Dryaden-Datensatz. https://doi.org/10.5061/dryad.x0k6djhng (2023).
Van der Auwera, GA et al. Von FastQ-Daten bis hin zu Variantenaufrufen mit hoher Zuverlässigkeit: Die Best Practices-Pipeline des Genomanalyse-Toolkits. Curr. Protokoll. Bioinforma. 1–33 (2013).
Link, V. et al. ATLAS: Analysetools für Proben geringer Tiefe und aus der Antike. Vorabdruck unter https://doi.org/10.1101/105346 (2017).
Jun, G., Wing, MK, Abecasis, GR & Kang, HM Ein effizientes und skalierbares Analyse-Framework für die Variantenextraktion und -verfeinerung aus DNA-Sequenzdaten im Populationsmaßstab. Genomres. 25, 918–925 (2015).
Artikel CAS PubMed PubMed Central Google Scholar
Korneliussen, TS, Albrechtsen, A. & Nielsen, R. ANGSD: Analyse von Sequenzierungsdaten der nächsten Generation. BMC Bioinforma. 15, 356 (2014).
Artikel Google Scholar
Meisner, J. & Albrechtsen, A. Ableitung der Bevölkerungsstruktur und der Beimischungsanteile in NGS-Daten mit geringer Tiefe. Genetics 210, 719–731 (2018).
Artikel PubMed PubMed Central Google Scholar
Akima, H., Gebhardt, A., Petzold, T. & Maechler, M. Interpolation unregelmäßig und regelmäßig verteilter Daten. R-Paket „akima“ Version 0.6–2. (2016).
Jay, F. et al. Vorhersage von Veränderungen in der genetischen Populationsstruktur alpiner Pflanzen als Reaktion auf die globale Erwärmung. Mol. Ökologisch. 21, 2354–2368 (2012).
Artikel PubMed Google Scholar
Lefort, V., Desper, R. & Gascuel, O. FastME 2.0: Ein umfassendes, genaues und schnelles distanzbasiertes Phylogenie-Inferenzprogramm. Mol. Biol. Entwicklung 32, 2798–2800 (2015).
Artikel CAS PubMed PubMed Central Google Scholar
Jombart, T. Adogenet: AR-Paket zur multivariaten Analyse genetischer Marker. Bioinformatik 24, 1403–1405 (2008).
Artikel CAS PubMed Google Scholar
Garrison, E. & Marth, G. Haplotypbasierte Variantenerkennung durch Short-Read-Sequenzierung. Vorabdruck unter http://arxiv.org/abs/1207.3907 (2012).
Hubisz, MJ, Pollard, KS & Siepel, A. PHAST und RPHAST: phylogenetische Analyse mit Raum/Zeit-Modellen. Knapp. Bioinform. 12, 41–51 (2011).
Artikel CAS PubMed Google Scholar
Nielsen, R., Korneliussen, T., Albrechtsen, A., Li, Y. & Wang, J. SNP-Calling, Genotyp-Calling und Stichproben-Allelfrequenzschätzung aus Sequenzierungsdaten der neuen Generation. PLoS One 7, 1–11 (2012).
Artikel Google Scholar
Peter, BM & Slatkin, M. Der effektive Gründereffekt in einer räumlich expandierenden Bevölkerung. Evolution 69, 721–734 (2015).
Artikel PubMed PubMed Central Google Scholar
Vieira, FG, Lassalle, F., Korneliussen, TS & Fumagalli, M. Verbesserung der Schätzung genetischer Distanzen aus Next-Generation-Sequencing-Daten. Biol. J. Linn. Soc. 117, 139–149 (2016).
Artikel Google Scholar
Zhang, C., Rabiee, M., Sayyari, E. & Mirarab, S. ASTRAL-III: Polynomielle Zeit-Artenbaum-Rekonstruktion aus teilweise aufgelösten Genbäumen. BMC Bioinforma. 19, 15–30 (2018).
Artikel Google Scholar
Valente, LM, Savolainen, V. & Vargas, P. Beispiellose Artendiversifizierungsraten in Europa. Proz. R. Soc. B Biol. Wissenschaft. 277, 1489–1496 (2010).
Artikel Google Scholar
Jouganous, J., Long, W., Ragsdale, AP & Gravel, S. Ableitung der gemeinsamen demografischen Geschichte mehrerer Populationen: Jenseits der Diffusionsnäherung. Genetics 206, 1549–1567 (2017).
Artikel PubMed PubMed Central Google Scholar
Portik, DM et al. Bewertung der Diversifizierungsmechanismen bei einem guineisch-kongolischen Tropenwaldfrosch mithilfe der demografischen Modellauswahl. Mol. Ökologisch. 26, 5245–5263 (2017).
Artikel PubMed Google Scholar
Danielson, JJ, Gesch, DB Globale Geländehöhendaten mit mehreren Auflösungen 2010 (GMTED2010). US-Geol. Überleben. Open-File Rep. 2011-1073, 1–26 (2011).
Hengl, T. et al. SoilGrids250m: Globale gerasterte Bodeninformationen basierend auf maschinellem Lernen. PLoS One 12, 1–40 (2017).
Artikel Google Scholar
Di Cola, V. et al. ecospat: ein R-Paket zur Unterstützung räumlicher Analysen und Modellierung von Artennischen und -verteilungen. Ecography 40, 774–787 (2017).
Artikel Google Scholar
Phillips, SJ, Anderson, RP & Schapire, RE Maximale Entropiemodellierung der geografischen Verteilung von Arten. Ökologisch. Modell. 190, 231–259 (2006).
Artikel Google Scholar
Hijmans, RJ, Phillips, S., Leathwick, J. & Elith, J. dismo: Modellierung der Artenverteilung. R. Paketversion 1, 1–4 (2014).
Google Scholar
Liaw, A. & Wiener, M. Klassifizierung und Regression durch randomForest. RN 2, 18–22 (2002).
Google Scholar
Naimi, B., Hamm, NAS, Groen, TA, Skidmore, AK & Toxopeus, AG Wo ist die Positionsunsicherheit ein Problem für die Modellierung der Artenverteilung? Ecography (Cop.) 37, 191–203 (2014).
Artikel Google Scholar
Guisan, A., Thuiller, W. & Zimmermann, NE Habitat Suitability and Distribution Models: With Applications in R. Ecology, Biodiversity and Conservation (Cambridge University Press, Cambridge, 2017).
Gent, PR et al. Das kommunale Klimasystemmodell Version 4. J. Clim. 24, 4973–4991 (2011).
Artikel ADS Google Scholar
Watanabe, S. et al. MIROC-ESM 2010: Modellbeschreibung und grundlegende Ergebnisse von CMIP5-20c3m-Experimenten. Geosci. Modellentwickler. 4, 845–872 (2011).
Artikel ADS Google Scholar
Yukimoto, S. et al. Ein neues globales Klimamodell des Meteorologischen Forschungsinstituts: MRI-CGCM3: -Modellbeschreibung und grundlegende Leistung-. J. Meteorol. Soc. Jpn. 90, 23–64 (2012).
Artikel Google Scholar
Giorgetta, MA et al. Klima- und Kohlenstoffkreislaufveränderungen von 1850 bis 2100 in MPI-ESM-Simulationen für Phase 5 des Coupled Model Intercomparison Project. J. Adv. Modell. Erdsystem. 5, 572–597 (2013).
Artikel ADS Google Scholar
Sanderson, BM, Knutti, R. & Caldwell, P. Eine repräsentative Demokratie zur Reduzierung der gegenseitigen Abhängigkeit in einem Multimodell-Ensemble. J. Clim. 28, 5171–5194 (2015).
Artikel ADS Google Scholar
Hahsler, M., Piekenbrock, M. & Doran, D. dbscan: schnelles dichtebasiertes Clustering mit RJ Stat. Softw. 91, 1–30 (2019).
Artikel Google Scholar
Beygelzimer, A. et al. FNN: Schnelle Algorithmen und Anwendungen für die Suche nach nächsten Nachbarn. R-Paket 'FNN' Version 1.1.2.1. (2018).
van Etten, J. & Hijmans, RJ Ein georäumlicher Modellierungsansatz, der Archäobotanik und Genetik integriert, um den Ursprung und die Verbreitung domestizierter Pflanzen zu verfolgen. PLoS One 5, 1–12 (2010).
Google Scholar
Karger, DN, Nobis, MP, Normand, S., Graham, CH & Niklaus, E. CHELSA-TraCE21k v1.0. Verkleinerte transiente Temperatur- und Niederschlagsdaten seit dem letzten Gletschermaximum. Aufstieg. Nach 1–27 (2021).
Collins, WD et al. Das kommunale Klimasystemmodell Version 3 (CCSM3). J. Clim. 19, 2122–2143 (2006).
Artikel ADS Google Scholar
Dray, S. et al. Gemeinschaftsökologie im Zeitalter der multivariaten räumlichen Analyse auf mehreren Skalen. Ökologisch. Monogr. 82, 257–275 (2012).
Artikel Google Scholar
Dray, AS et al. Multivariate Multiskalen-Raumanalyse. R-Paket „adespatial“ Version 0.3.8. (2022).
van Etten, J. R Paket gdistance: Entfernungen und Routen auf geografischen Gittern. J. Stat. Softw. 76, 1–21 (2017).
Google Scholar
Garrison, E., Kronenberg, ZN, Dawson, ET, Pedersen, BS & Prins, P. Ein Spektrum kostenloser Softwaretools zur Verarbeitung des VCF-Variantenaufrufformats: vcflib, bio-vcf, cyvcf2, hts-nim und slivar. PLoS Comput. Biol. 18, 1–14 (2022).
Stachelek, J. & Madden, CJ Anwendung der inversen Pfadentfernungsgewichtung für die räumliche Kartierung von Küstenwasserqualitätsmustern mit hoher Dichte. Int. J. Geogr. Inf. Wissenschaft. 29, 1240–1250 (2015).
Artikel Google Scholar
Luqman, H. Klimabedingte Bereichsverschiebungen fördern die adaptive Reaktion durch räumlich-zeitliche Siebung von Allelen. RhEA GitHub-Repository. https://doi.org/10.5281/zenodo.7581797 (2023).
Referenzen herunterladen
Wir möchten Claudia Michel für ihre unschätzbare Arbeit im Labor danken. Wir danken Felix Gugerli, der in den frühen Phasen dieser Studie hilfreiche Kommentare lieferte, und Loïc Pellissier, dessen Feedback uns bei der Implementierung der SDMs unterstützte. Wir danken Karsten Rohweder, Bostjan Surina und Salvatore Cozzolino für die Bereitstellung zusätzlicher Pflanzenproben sowie Ivana Rešetnik und Martina Temunovic für die Weitergabe von Vorkommensaufzeichnungen für den Balkan. Wir danken dem Conservatoire Botanique National Méditerranéen de Porquerolles, dem Conservatoire Botanique National Alpin, GBIF, iNaturalist, Info Flora, Sweden's Virtual Herbarium, Virtual Herbaria Austria und Wikiplantbase #Italia für die Weitergabe weiterer Daten zum Artenvorkommen. Wir danken Domenico Gargano für seine Unterstützung bei der Pflanzenidentifizierung sowie dem Genetic Diversity Center der ETH Zürich und insbesondere Niklaus Zemp für die IT-Unterstützung. Diese Arbeit wurde durch die Stipendien 31003A_160123 und 31003A_182675 des Schweizerischen Nationalfonds (SNF) an AW und die Stipendien 31003A_173062 an DW unterstützt
Diese Autoren haben diese Arbeit gemeinsam betreut: Simone Fior, Alex Widmer.
Institut für Integrative Biologie, ETH Zürich, Zürich, Schweiz
Hirzi Luqman, Simone Fior und Alex Widmer
McDonald Institute for Archaeological Research, University of Cambridge, Cambridge, Großbritannien
Hirzi Luqman
Fachbereich Biologie, Universität Freiburg, Freiburg, Schweiz
Daniel Wegmann
Schweizerisches Institut für Bioinformatik, Freiburg, Schweiz
Daniel Wegmann
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
HL, AW und SF haben die Studie entworfen. HL sammelte Proben vor Ort und führte alle Analysen durch. DW half mit Methoden. HL verfasste das Manuskript, das von allen Autoren überarbeitet wurde.
Korrespondenz mit Hirzi Luqman, Simone Fior oder Alex Widmer.
Die Autoren geben an, dass keine Interessenkonflikte bestehen.
Nature Communications dankt Jonás Aguirre-Liguori, Guillaume de Lafontaine und Stephen Keller für ihren Beitrag zum Peer-Review dieser Arbeit. Peer-Reviewer-Berichte sind verfügbar.
Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.
Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.
Nachdrucke und Genehmigungen
Luqman, H., Wegmann, D., Fior, S. et al. Klimabedingte Verbreitungsverschiebungen fördern die adaptive Reaktion durch räumlich-zeitliche Siebung von Allelen. Nat Commun 14, 1080 (2023). https://doi.org/10.1038/s41467-023-36631-9
Zitat herunterladen
Eingegangen: 17. Juni 2022
Angenommen: 09. Februar 2023
Veröffentlicht: 25. Februar 2023
DOI: https://doi.org/10.1038/s41467-023-36631-9
Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:
Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.
Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt
Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.