Val av DNA-markörer påverkar träffsäkerheten på genomiskt urval inom granförädling
Genomiskt urval är en ny metod inom förädling och avel, i vilken man använder sig av DNA-teknik för att läsa av valda delar av genomet, så kallade DNA-markörer, från ett stort antal individer i en population. Med en kombination av data från dessa DNA-markörer och fenotypiska mätdata, alltså mätdata som samlats in från närbesläktade individer och som beror på både arv och miljö, byggs sedan en statistisk prediktionsmodell, en så kallad genomisk prediktionsmodell. Prediktionsmodellen kan sedan användas för att välja de bästa individerna för vidareförädling. På detta sätt behöver man inte vänta på att individerna ska växa upp för att kunna avgöra deras egenskaper, utan egenskaperna kan bedömas genom att DNA-markörerna läses av, för var och en av dem.
Genomiskt urval har studerats och prövats på både djur, växter och skogsträd. Om den genomiska prediktionsmodellen är välutvecklad kan den bli mer träffsäker än traditionell förädling baserad på stamtavla och mätningar av fenotyp. Men i praktiken är genomiskt urval ofta mindre träffsäkert än metoder baserade på mätdata. Den stora vinsten är tidsbesparingen: man kan korsa utvalda individer med varandra långt innan de är mogna för fenotypmätningar. Denna potentiella vinst är särskilt påtaglig för arter med långa livscykler såsom skogsträd.
Idag använder man sig ofta av tiotusentals, kanske till och med hundratusentals, markörer i prediktionsmodellen, vilket är dyrt. Det finns också tecken på att resultatet inte alltid blir bättre bara för att fler markörer används och att man kan vinna på att välja ut vissa markörer inför utvecklingen av de genomiska modellerna. I denna studie undersökte vi hur många och vilka DNA-markörer som resulterar i bäst urvalsprecision för ett antal egenskaper. Genom en så kallad associationskartering sållades ett urval av DNA-markörer fram som torde ha större betydelse för de valda egenskaperna (Figur 1) än en genomsnittlig markör.
Figur 1: Studerade mätegenskaper. A) Höjdtillväxt, B) tidig skottskjutning och C) sent skottskjutningsmönster med exempel på outvecklade och skott inringade. Bilderna togs vid ett och samma tillfälle i maj då fältförsöket var 6 år gammalt.
Resultat
Resultaten visar att det är vilken förädlingsegenskap man undersöker som avgör huruvida ett urval av DNA-markörer kunde ge bättre träffsäkerhet än att använda sig av samtliga markörer. Som exempel kommer vi visa resultat för egenskaperna höjdtillväxt och tidpunkt för skottskjutning på våren (Figur 1). Höjdtillväxten är naturligtvis en mycket viktig mätegenskap som visat sig korrelera väl med volymproduktionen efter hela omloppstiden. Skottskjutning på våren är däremot en anpassningsegenskap för granen där tidpunkten spelar stor roll. Granen bör skjuta skott så pass tidigt att den kan utnyttjar tillväxtsäsongen maximalt för att växa, men inte så tidigt att den riskerar skador på grund av sena vårfroster.
Som visas i Figur 2 var skillnaden i träffsäkerhet för höjdtillväxt stor mellan referensmodellen baserad på fenotypdata (0,72) och de genomiska modellerna baserade på DNA-markörer (0,42 eller lägre). Det var dessutom tydligt att fler markörer i modellen gav bättre träffsäkerhet för prediktionerna av höjdtillväxt.
Resultaten för tidpunkt för skottskjutning visade att träffsäkerheten för de genomiska modellerna ofta låg närmre referensmodellen baserad på fenotypdata (Figur 2). Dessutom var det en klar fördel att använda sig av associationskarteringsanalys för att välja markörer till den genomiska modellen. Att endast använda sig av de 200 bästa markörerna identifierade i en associationskarteringsanalys gav en träffsäkerhet på 0,73 vilket var högre än att använda sig av alla markörer med träffsäkerhet på 0,67, eller att slumpmässigt välja ut 200 markörer som enbart gav en träffsäkerhet på 0,52.
Figur 2: Trender för hur träffsäker genomisk prediktion utan fenotypdata är med stigande antal DNA-markörer i modellen för en studerad granpopulation testad i fyra fältförsök. Markörerna valdes antingen slumpmässigt (grön kurva) eller systematiskt efter störst effekt i en associationskarteringsanalys (blå kurva). Som referens användes mätta fenotypdata (orange linje). Högre siffra i y-axeln indikerar bättre träffsäkerhet på prediktion.
Varför gav det systematiska markörurvalet synbara fördelar vid genomisk prediktion av skottskjutning men inte vid prediktion av höjdtillväxt? En viktig anledning är hur framgångsrik associationskarteringen blev för respektive egenskap. Associationskarteringen hittade 41 lokus med statistiskt signifikant koppling till skottskjutning men enbart 11 lokus med signifikant koppling till höjdtillväxt. Det mest kraftfulla lokuset för skottskjutning förklarade 5,1 procent av egenskapsvariationen medan det mest kraftfulla lokuset för höjdtillväxt enbart förklarade 1,2 procent. Dessa skillnader bidrog till att det systematiska markörurvalet för prediktionen av skottskjutningen blev mer pålitligt än det för prediktionen av höjdtillväxt. För höjdtillväxt var det bättre att sprida riskerna jämnt och använda så många markörer som möjligt vid genomisk prediktion.
Figur 3: Trend för hur träffsäkerheten i genomisk prediktion beror på hur stort inflytande (förklaringsgrad) ett enskilt kraftfullt lokus har för en egenskap (fenotyp) i en simulerad population. Den blå kurvan visar träffsäkerheten för en modell där det kraftfulla lokuset ej är inkluderad medan orange kurva visar träffsäkerheten där markördata för det kraftfulla lokuset ges en framträdande plats i modellen. Högre siffra i y-axeln indikerar bättre träffsäkerhet på prediktion. Notera att y-axeln inte börjar vid noll.
Datorsimulationer av en virtuell förädlingspopulation gav ytterligare värdefull information om huruvida enskilda gener och lokus kan användas som trumfkort vid genomiskt urval. Dessa datorsimulationer inbegrep påhittade genom där en hypotetisk förädlingsegenskap styrdes av 500 olika lokus som vart och ett bidrog enbart med små effekter. Simulationen lade också till ett kraftfullt brus som härrör från miljövariationer och som utgjorde 75 procent av all variation för egenskapen, en situation som är vanligt förekommande inom skogsträdsförädling. Till detta lade vi till ett 501:a lokus för vilket vi lät inflytandet variera, från att inte ha någon förklaringsgrad/inflytande alls (0 %) till att ha ett kraftfullt inflytande med en förklaringsgrad på 5 procent för egenskapen. Resultaten visade tydligt att en avläsning och inkludering av sådana kraftfulla lokus mycket väl kan vara gynnsamt för träffsäkerheten vid genomiskt urval (Figur 3). Men det var också tydligt att den önskade effekten enbart uppnåddes om det kraftfulla lokuset kunde förklara mer än 2 procent av variationen. I sammanhanget ska det sägas att den individuella förklaringsgraden för de övriga 500 lokusen vanligtvis låg på under 0,25 procent och att enbart enstaka lokus nådde upp till 1,25 procentig förklaringsgrad. Enskilda lokus måste alltså vara exceptionellt kraftfulla för att de ska bidra väsentligt till genomiska prediktionsmodeller. Huruvida sådana lokus kan hittas varierar mellan egenskaper och kan även variera mellan miljöförhållanden som råder där granarna växer.
Slutsatser
Slutsatserna från våra resultat, baserade på både fältmätningar och simulationer, är att genomiska modeller kan bli träffsäkrare om genomtänkta val av DNA-markörer görs för att inkluderas i prediktionsmodellen. Men det var också klart att förutsättningarna för en sådan strategi kan variera mellan vilka egenskaper man vill förädla på samt om miljön som granarna växer i skiljer sig väldigt mycket (t.ex. mellan Götaland och Norrland). Det går alltså inte att säga att förhandsval av DNA-markörer alltid leder till bättre genomiskt urval, utan förutsättningarna måste undersökas för varje egenskap och geografisk region. Simulationerna visade också att det är mest gynnsamt att specifikt inkludera de DNA-markörer med de mest inflytelserika lokusen i modellerna. Tyvärr finns inte alltid så starka lokus, det varierar beroende på vilken/vilka egenskaper man vill förädla för.
Läs den vetenskapliga artikeln här: Preselection of QTL markers enhances accuracy of genomic selection in Norway spruce
Denna studie möjliggjordes och finansierades av Knut & Alice Wallenbergs stiftelse (2018.0272) samt FORMAS (dnr. 2019-00874).
Vi granskar och publicerar din kommentar så snart som möjligt.