
貝葉斯支端定年分析得到的中生代鳥類的時(shí)間樹和特征演化速率

鳥類演化早期五個(gè)關(guān)鍵節(jié)點(diǎn)的分異時(shí)間和演化速率
(神秘的地球uux.cn報(bào)道)據(jù)中國科學(xué)院古脊椎動(dòng)物與古人類研究所:自Zuckerkandl和Pauling提出分子鐘假設(shè)以來,分子鐘模型成為定年演化事件的形態(tài)型改基礎(chǔ)。最早的鐘模深圳寶安區(qū)外圍女模特平臺高端外圍崴信159+8298+6630提供外圍女小姐上門服務(wù)快速安排面到付款分子鐘假設(shè)為嚴(yán)格分子鐘,即演化速率在樹上各個(gè)類群之間恒定不變。善中生代速率嚴(yán)格分子鐘通常只適用于近緣的鳥類類群。為了解釋演化速率在時(shí)間上和類群間的分的估差異,多種寬松分子鐘模型被提出來,異時(shí)演化并被廣泛應(yīng)用于估計(jì)分異時(shí)間和演化速率。間和計(jì)在古生物學(xué)中,混合深圳寶安區(qū)外圍女模特平臺高端外圍崴信159+8298+6630提供外圍女小姐上門服務(wù)快速安排面到付款對應(yīng)的形態(tài)型改模型被稱為形態(tài)鐘模型,用于描述形態(tài)特征的鐘模變化而非核苷酸或氨基酸的替代,但是善中生代速率基本的模型假設(shè)并未改變。這些寬松鐘模型可大致分為兩類:一類為獨(dú)立速率模型,鳥類即各個(gè)樹枝上的分的估演化速率彼此獨(dú)立,它們通常被假設(shè)服從獨(dú)立同分布的異時(shí)演化對數(shù)正態(tài) (ILN) 或伽馬 (IGR) 分布。和IGR模型稍有不同,白噪音 (white noise [WN]) 模型假設(shè)獨(dú)立伽馬分布的方差正比于枝長。另一類為自相關(guān)速率模型,即后代樹枝上的演化速率所服從的分布的均值為相鄰祖先樹枝上的速率。其中幾何布朗運(yùn)動(dòng)模型假設(shè)這些速率服從自相關(guān)的對數(shù)正態(tài)分布 (ALN)。
在定年的分析中,演化速率所服從的模型通常是被預(yù)先選定的。比較不同模型的分析往往是單獨(dú)進(jìn)行的。在貝葉斯統(tǒng)計(jì)學(xué)中,模型選擇和模型平均都可達(dá)到此目的。模型選擇通過估算每個(gè)模型的邊際似然值 (marginal likelihood),然后用它們來計(jì)算貝葉斯因子 (Bayes factor),從而決定哪個(gè)模型最匹配數(shù)據(jù)。邊際似然的估計(jì)通常采用路徑抽樣 (path sampling [PS]) 或步石抽樣 (stepping-stone sampling [SS]) 算法。模型平均則通過可逆跳躍馬爾可夫鏈蒙特卡羅 (reversible-jump Markov chain Monte Carlo [rjMCMC]) 算法在各個(gè)模型間轉(zhuǎn)換,同時(shí)估計(jì)每個(gè)模型的后驗(yàn)概率以及對應(yīng)模型中參數(shù)的后驗(yàn)概率。rjMCMC在計(jì)算時(shí)間上比PS或SS快得多,可同時(shí)比較多個(gè)模型并均一化模型間的不確定性;不過rjMCMC需要仔細(xì)地設(shè)計(jì)以達(dá)到良好的效能。
本研究中,張馳設(shè)計(jì)了一個(gè)rjMCMC算法用于平均ILN和IGR這兩個(gè)獨(dú)立速率模型。該算法利用兩個(gè)模型假設(shè)的相似性,通過直接匹配模型間樹枝上的速率,并線性匹配模型間分布的方差,來實(shí)現(xiàn)模型的跳躍。在估計(jì)ILN和IGR的后驗(yàn)概率的同時(shí),該模型平均方法也估計(jì)了分異時(shí)間和演化速率。為了和ALN這個(gè)自相關(guān)速率模型進(jìn)行比較,則使用SS來估計(jì)ILN,IGR和ALN的邊際似然值。
本研究首先通過計(jì)算機(jī)模擬來驗(yàn)證新的rjMCMC算法能夠正確工作。隨后,該rjMCMC算法被用于分析中生代鳥類的形態(tài)特征矩陣,運(yùn)用貝葉斯支端定年法估計(jì)分異時(shí)間和演化速率 (圖1)。和先前使用WN模型的分析 (Zhang and Wang 2019) 相比,平均化ILN和IGR模型能夠提高分異時(shí)間和演化速率的估計(jì)精度。模型比較的結(jié)果表明,ILN模型比IGR模型更適配數(shù)據(jù) (后驗(yàn)概率Pr[ILN] = 0.6),并遠(yuǎn)優(yōu)于ALN模型。進(jìn)一步地,通過對特征矩陣按照不同骨骼部位進(jìn)行分區(qū),該分模塊的模型平均方法得到和未分模塊的分析一致的分異時(shí)間估計(jì),一致性好于使用WN模型的結(jié)果 (圖2)。其中,ILN模型最適配肩帶和胸骨特征 (Pr[ILN] = 0.98),而IGR模型最適配后肢特征 (Pr[IGR] = 0.83)。這些結(jié)果是對先前分析的完善和改進(jìn),其生物學(xué)意義仍遵從前篇文章,即鳥類在演化早期形態(tài)特征經(jīng)歷了快速的變化,這些變化和鳥類飛行能力的產(chǎn)生和完善密切相關(guān)。
平均ILN和IGR寬松鐘模型的rjMCMC算法由張馳編寫于MrBayes軟件最新的開發(fā)分支 (https://github.com/NBISweden/MrBayes)。具體使用方法參考文章中“軟件實(shí)現(xiàn)”部分。文章還討論了算法的效率以及后續(xù)可能的改進(jìn)。本研究雖然只分析了中生代鳥類一組代表性數(shù)據(jù),這一算法普遍適用于不同生物類群以及節(jié)點(diǎn)或全證據(jù)定年分析,是貝葉斯定年研究中的一般性方法。
本研究發(fā)表于專業(yè)雜志《古生物學(xué)》(Paleobiology)。本研究得到中科院項(xiàng)目的資助。
論文鏈接:https://www.doi.org/10.1017/pab.2021.42