題記:本文以計算藥物半數(shù)抑制濃度(IC50)為例詳細(xì)介紹基于GraphPad Prism軟件實現(xiàn)非線性擬合并繪圖。 1. 背景介紹 這里“非線性擬合”或許名詞太過于專業(yè),對于很多讀者來說可能有些陌生,但我想很多讀者有過制作標(biāo)準(zhǔn)曲線的經(jīng)歷,這也是一種“曲線擬合”,只不過標(biāo)準(zhǔn)曲線制作多為“線性擬合”,擬合的方程也比較簡單,比如:Y=aX b。很多時候兩個變量的關(guān)系并非簡單的直線關(guān)系,這種情況下擬合曲線就顯得復(fù)雜一點。至少要滿足兩點條件才可以進(jìn)行曲線擬合:第一,二維坐標(biāo)系中有適當(dāng)數(shù)量的點,可大體反應(yīng)曲線的形狀;第二,根據(jù)坐標(biāo)系中的點擬合曲線的數(shù)學(xué)公式已知。曲線擬合之后到底有什么作用?我們先從簡單的線性擬合說起,比如我們按照Y=aX b這個方程進(jìn)行線性擬合,當(dāng)我們在坐標(biāo)系中確定兩個點以后,那么這條直線在這個坐標(biāo)系中就是確定的了(兩點決定一條直線),那么方程中的參數(shù)a、b也是確定的了,當(dāng)我們獲得a、b這兩個參數(shù)以后,這個方程對我們來說就是有價值的,我們可以根據(jù)任意X取值而計算出Y值。 當(dāng)然,以上是一個線性擬合的例子,理解起來要簡單一點。再舉一個略顯復(fù)雜的例子,我們需要根據(jù)下面的方程來擬合曲線并計算某化學(xué)藥物的半數(shù)抑制濃度(IC50),方程如下:Y=Bottom (Top-Bottom)/(1 10^((LogIC50-X)*HillSlope)),該方程已不再是簡單的線性關(guān)系,其中有四個參數(shù):Top、Bottom、IC50和HillSlope,如果要確定方程中的這四個參數(shù),我們首先需要在二維坐標(biāo)系中獲得適量的坐標(biāo)點,然后找到一條最佳的曲線,讓這條曲線盡可能通過所有的點,曲線一旦確定那么這幾個參數(shù)就確定了,則可得到IC50的值。讀者朋友們面臨的問題可能比這更復(fù)雜,但處理原則是類似的。下面我們就以案例的形式為大家演示曲線擬合的過程,本案例的數(shù)據(jù)來自筆者本人的研究數(shù)據(jù)[1],為了便于讀者閱讀和理解,筆者對數(shù)據(jù)進(jìn)行了簡化處理。 2. 案例詳解 【案例1】計算藥物IC50。乳腺癌細(xì)胞接種于96孔板中,每孔接種數(shù)量一致。待細(xì)胞貼壁后我們使用不同濃度梯度的藥物A(0~800 μmol/L)處理乳腺癌細(xì)胞24小時,然后通過CCK-8法測定各接種細(xì)胞孔的吸光度值,吸光度值越大表示存活細(xì)胞越多。我們的實驗?zāi)康氖菙M合劑量-存活曲線并計算藥物的IC50值。以0 μmol/L藥物處理孔的細(xì)胞的存活率為1,其他各濃度的吸光度值與0 μmol/L藥物孔的比值即為相對存活率。根據(jù)藥物濃度與對應(yīng)的相對存活率在二維坐標(biāo)系中描點,按照Y=Bottom (Top-Bottom)/(1 10^((LogIC50-X)*HillSlope))方程擬合劑量存活曲線,計算方程中的參數(shù)。該實驗在相同的條件下進(jìn)行了三次獨(dú)立的重復(fù)實驗,假定每次獨(dú)立重復(fù)實驗設(shè)有3個復(fù)孔,那每個藥物濃度應(yīng)該有9個測量數(shù)據(jù),本案例中我們對數(shù)據(jù)進(jìn)行了簡化處理,僅選擇了三次獨(dú)立重復(fù)實驗的單個培養(yǎng)孔的吸光度值并計算相對存活率。試劑空白對照設(shè)置等實驗操作細(xì)節(jié)可參考CCK-8試劑盒的說明書,本案例重點講解數(shù)據(jù)處理與統(tǒng)計分析過程。數(shù)據(jù)整理如下表1所示。 表1.不同藥物A濃度梯度處理乳腺癌細(xì)胞的相對存活率
接下來我們將表1中的數(shù)據(jù)按照如下圖1~圖3所示操作步驟錄入Graphpad Prism 7.0 軟件(San Diego, CA, USA)并繪制散點圖,初步判斷曲線形狀。接下來的分析策略是通過繪制的散點圖進(jìn)行曲線擬合。第一步,我們首先對A的濃度進(jìn)行對數(shù)轉(zhuǎn)換,生成新的數(shù)據(jù)集,如圖4~圖6所示。使用新生成的數(shù)據(jù)集擬合曲線并計算IC50,如圖7~圖11所示。 圖1. 新建數(shù)據(jù)框。依次選擇“XY”-“Enter/importdata”選擇第二行填入數(shù)字“3”,表示每組有3個獨(dú)立樣本或3次獨(dú)立重復(fù)實驗數(shù)據(jù)。 圖2. 錄入數(shù)據(jù)。 圖3. 選擇繪制散點圖。如圖示選擇繪制圖形類型設(shè)置誤差線表示標(biāo)準(zhǔn)差(SD)點擊“OK” 圖4. 對藥物濃度進(jìn)行對數(shù)轉(zhuǎn)換。如圖示依次選擇“Analyze”-“Transform”點擊“OK”。 圖5. 對藥物濃度進(jìn)行對數(shù)轉(zhuǎn)換。如圖示操作,勾選“Standardfunction”-“TransformX values using”選擇對數(shù)轉(zhuǎn)換公式勾選“Newgraph”復(fù)選框點擊“OK”。 圖6. 對藥物濃度進(jìn)行對數(shù)轉(zhuǎn)換后新生成的數(shù)據(jù)集。 圖7. 非線性擬合。如圖示依次選擇“Analyze”→“XYanalyses”→“Nonlinear regression (curvefit)”→點擊“OK”。 圖8. 非線性擬合。如圖示依次選擇“Fit”→“Choosean equation”→“Dose-response-Inhibition”→“l(fā)og(inhibitor) vs. response--Variableslope (four parameters)”→點擊“OK”。其他選項默認(rèn)。假定如果讀者想通過某一藥物濃度計算存活率,可以勾選“Interpolate”。 注意:此處軟件提供了四個公式,筆者推薦選擇第二個公式,即“l(fā)og(inhibitor)vs. response--Variable slope (four parameters)”。選擇第一個公式的操作與本例類似,選擇其他公式與本例操作不同,讀者可自行嘗試。 圖9. 計算IC50公式的細(xì)節(jié)。假定讀者想了解關(guān)于擬合方程的細(xì)節(jié)可以點擊圖8右側(cè)的“Details”,可以了解公式中每個參數(shù)的具體含義。軟件自帶的非線性擬合方程是有限的,假定讀者有特殊要求,有時需要自己定義公式,可點擊上圖8右側(cè)“New”新建公式,并給公式的參數(shù)設(shè)定初始值,在下一篇中筆者將進(jìn)行詳細(xì)講解。 圖10. 曲線擬合計算結(jié)果。軟件會根據(jù)坐標(biāo)系中的描點計算公式中的參數(shù)。 圖11. 最后繪制的劑量存活率曲線。筆者通過在軟件中設(shè)置坐標(biāo)系和圖形參數(shù)獲得上圖,讀者可以自行按照前述章節(jié)方法嘗試。 3. 總結(jié) 本文詳細(xì)講解了基礎(chǔ)實驗數(shù)據(jù)中非線性擬合的實現(xiàn)方法。軟件自帶擬合公式,如果軟件中不提供公式,我們需要自建公式,下一講我們將分享自定義公式的曲線擬合。曲線擬合的難點在于我們對具體方程參數(shù)的理解,而具體操作步驟并不難。當(dāng)我們實驗獲得了一些原始數(shù)據(jù),可以在二維坐標(biāo)系中描出點來,按照既定的方程就可以把曲線擬合出來,到底該選擇什么樣的方程或者自定義什么樣的方程?這些工作需要我們結(jié)合自己的實驗?zāi)康囊约拔墨I(xiàn)回顧來確定。事實上非線性擬合是一個很復(fù)雜的數(shù)學(xué)問題,我們僅僅介紹了其中與我們醫(yī)學(xué)基礎(chǔ)實驗數(shù)據(jù)處理相關(guān)的一些內(nèi)容。 我們提出一個問題供讀者思考:假定,我們有大量的原始數(shù)據(jù),可以在坐標(biāo)系中描出很多點,但我們并不知道這些點背后的數(shù)學(xué)規(guī)律是什么,或者其遵守什么樣的數(shù)學(xué)模型,那該如何擬合曲線呢?這樣的問題應(yīng)該歸于當(dāng)下比較流行的數(shù)據(jù)挖掘、統(tǒng)計建模等范疇,要比我們本章節(jié)講述的要復(fù)雜得多。 4. 參考文獻(xiàn) [1]. 周支瑞,胡志德.聰明統(tǒng)計學(xué). 長沙:中南大學(xué)出版社, 2016. [2]. 周支瑞,胡志德.瘋狂統(tǒng)計學(xué). 長沙:中南大學(xué)出版社, 2018. |
|