隨機(jī)對(duì)照試驗(yàn)(RCT)通常被認(rèn)為是評(píng)價(jià)藥物有效性的金標(biāo)準(zhǔn),但其自身有局限性。一些人將此方法奉為金科玉律,對(duì)其過度依賴,卻忽視了醫(yī)療的復(fù)雜性。
撰文 | Trisha Greenhalgh(牛津大學(xué)基本衛(wèi)生保健科學(xué)教授)我們?nèi)绾瘟私庑卵邪l(fā)的藥物和治療方法是否有效?為了解決這一問題,“循證醫(yī)學(xué)”(Evidence-base medicine,EBM),也就是基于臨床實(shí)踐數(shù)據(jù)的醫(yī)學(xué),衍生出了一些重要工具,比如隨機(jī)對(duì)照試驗(yàn)(Randomized clinical trials,RCT)。雖然類似的工具大大推動(dòng)了醫(yī)學(xué)科學(xué)的進(jìn)步,但我們?cè)谠u(píng)估新療法時(shí),還是應(yīng)該對(duì)單純依靠臨床試驗(yàn)結(jié)論的做法保持謹(jǐn)慎的態(tài)度。試驗(yàn)固然有其價(jià)值,很多情況下甚至被視為驗(yàn)證新治療方法是否有效的“金標(biāo)準(zhǔn)”,但如果試驗(yàn)本身的設(shè)計(jì)不夠科學(xué),結(jié)果可能適得其反——產(chǎn)生具有誤導(dǎo)性的結(jié)論。事實(shí)上,隨機(jī)對(duì)照試驗(yàn)并不肯定比其他類型的臨床證據(jù)更好。循證醫(yī)學(xué),應(yīng)當(dāng)把隨機(jī)對(duì)照試驗(yàn)的數(shù)據(jù)和實(shí)際的觀察結(jié)果結(jié)合,來獲得更為全面和準(zhǔn)確的答案,達(dá)到最終造?;颊叩哪康摹?/span>圖1:隨機(jī)對(duì)照試驗(yàn)的示意圖,在理想狀態(tài)下,研究者希望看到實(shí)驗(yàn)組患者獲得疾病緩解(綠色小人)的百分比比對(duì)照組更高,才能證明試驗(yàn)藥物有效 | 來源:sohu.com
假設(shè)一種情景:你手中有一種可能可以挽救得了某種致命疾病的病人生命的藥物,但是藥物的數(shù)量?jī)H僅夠治療一半患者,你會(huì)如何決定把藥給誰?拋硬幣?按特定順序分配(排序后序號(hào)單數(shù)的患者給藥,雙數(shù)的患者不給)?還是讓大家隨機(jī)抽簽?換一種情景:你知道某種藥物可能可以挽救生病,但療效還沒得到驗(yàn)證,你會(huì)使用上述分配方法之一來進(jìn)行藥物的分配,同時(shí)給一部分患者吃安慰劑(跟藥物外觀一樣,但是吃了沒有任何作用)來測(cè)試藥物的實(shí)際療效嗎?以上場(chǎng)景,就是英國(guó)統(tǒng)計(jì)學(xué)家奧斯汀·布拉德福德·希爾(Austin Bradford Hill,后來被封為爵士)在1947年所面臨的抉擇。他是一位對(duì)方法學(xué)(Methodology)非常嚴(yán)格的學(xué)者,在他所在的時(shí)代,驗(yàn)證新藥療效有兩種對(duì)比方法:一個(gè)是采用“歷史對(duì)照”,對(duì)照組采用的是過去的標(biāo)準(zhǔn)療法,實(shí)驗(yàn)組是在現(xiàn)今的標(biāo)準(zhǔn)療法上加上需要被測(cè)試的全新的療法。因?yàn)楝F(xiàn)今的標(biāo)準(zhǔn)療法大概率已經(jīng)比過去的標(biāo)準(zhǔn)療法效果好,用這種對(duì)照方法來測(cè)試全新的療法并不科學(xué),因?yàn)閮山M病人的基礎(chǔ)治療方案已經(jīng)有了差別。另一種是“順序分配”,可以理解為根據(jù)就醫(yī)順序,按照單雙數(shù)給患者分配藥物和安慰劑,這是上面說的方法的改進(jìn)版本。但這意味著醫(yī)生對(duì)每一位患者的用藥情況是完全知情且可操縱的,可能會(huì)不自覺地改變分配過程,比如出于同情把病情較重但本來應(yīng)該給予安慰劑的患者,換成治療藥物,從而產(chǎn)生臨床試驗(yàn)中所謂的“偏倚”(Bias),也就是系統(tǒng)性的“誤差”。如果治療藥物組的患者比安慰劑組的患者病情更重,那么藥物的效果就可能看起來比實(shí)際情況差。圖2 英國(guó)統(tǒng)計(jì)學(xué)家奧斯汀·布拉德福德·希爾 | 來源:www.bradfordhill.org
對(duì)于以上兩種研究新藥效果的方法,希爾表達(dá)了自己的顧慮。1937,他在《柳葉刀》(The Lancet)上發(fā)表了一系列文章,主張取代上述兩種方法,而采用一種完全隨機(jī)分配的方法(在他那個(gè)年代就是把名字放在密封的信封里面,然后隨機(jī)抽簽分配;現(xiàn)代社會(huì),隨機(jī)分配可以采用更先進(jìn)的計(jì)算機(jī)隨機(jī)數(shù))來進(jìn)行研究。盡管當(dāng)時(shí)他的觀點(diǎn)十分合理,但他的方法在臨床中的真正應(yīng)用卻舉步維艱。第二次世界大戰(zhàn)時(shí)期,肺結(jié)核肆虐,每20個(gè)英國(guó)人就有1人死于結(jié)核。當(dāng)時(shí),一種叫“鏈霉素”的新型抗生素被認(rèn)為是有效的治療藥物,但是它只能在美國(guó)大規(guī)模生產(chǎn),且出口管控極為嚴(yán)格。英國(guó)政府想方設(shè)法從美國(guó)購(gòu)買了一些鏈霉素,移交給英國(guó)醫(yī)學(xué)研究委員會(huì)(MRC),但是藥物總量只夠治療一部分的肺結(jié)核患者。委員會(huì)決定,由希爾領(lǐng)導(dǎo)一項(xiàng)臨床試驗(yàn),采用他倡導(dǎo)的匿名抽簽分配(使用密封信封)的方法。這種方法不僅是分配稀缺藥物最公平的方式,同時(shí)還能可靠地檢驗(yàn)藥物是否真的有效。在這項(xiàng)后來看可以稱之為具有里程碑意義的臨床試驗(yàn)中,沒有用藥的55名對(duì)照組患者中,15人在試驗(yàn)開始后的六個(gè)月內(nèi)死亡,而使用了鏈霉素組的55個(gè)患者中,僅有4人死亡。英國(guó)醫(yī)學(xué)研究委員會(huì)的這項(xiàng)臨床試驗(yàn)成為了改變醫(yī)學(xué)臨床研究范式的轉(zhuǎn)折點(diǎn),原因有二。首先,它證明了鏈霉素是肺結(jié)核的有效初始治療(盡管后來發(fā)現(xiàn),鏈霉素單獨(dú)使用時(shí)長(zhǎng)期治療效果不佳)。其次,它首次確立了隨機(jī)對(duì)照試驗(yàn)的地位,讓其成為檢驗(yàn)藥物相對(duì)于安慰劑(或另一藥物)的療效的金標(biāo)準(zhǔn)。而這個(gè)里程碑事件也被一些醫(yī)學(xué)史學(xué)家認(rèn)為是“循證醫(yī)學(xué)”時(shí)代的序章。在之后的幾十年中,針對(duì)各種藥物和預(yù)防性治療的隨機(jī)對(duì)照試驗(yàn)可謂遍地開花。在試驗(yàn)的實(shí)驗(yàn)組和對(duì)照組的設(shè)置中,只有給不給藥的區(qū)別,把其他所有可能影響結(jié)果的干擾因素(包括病情嚴(yán)重程度、性別、年齡、研究人員的偏好等等)都控制到無限趨近于等同,這樣可以把實(shí)驗(yàn)藥物本身的治療效果和副作用都凸顯出來?,F(xiàn)在已經(jīng)被普羅大眾熟知的一些藥物,比如他汀類藥物能降低心血管病風(fēng)險(xiǎn),化療藥物可以治療癌癥,疫苗可以預(yù)防傳染病,這些結(jié)論無一不是通過嚴(yán)謹(jǐn)?shù)碾S機(jī)對(duì)照試驗(yàn)所得出的。而如果有多項(xiàng)隨機(jī)對(duì)照試驗(yàn)具有同一個(gè)研究目的,還可以使用統(tǒng)計(jì)方法中的薈萃分析(meta-analysis)來進(jìn)行結(jié)果整合,讓結(jié)論更加有信服力。隨機(jī)對(duì)照試驗(yàn)變成了一門科學(xué),而且在不斷發(fā)展,愈發(fā)復(fù)雜,人們逐漸識(shí)別了可能影響試驗(yàn)結(jié)果的其他類型偏倚,并想到了辦法加以解決,包括表現(xiàn)偏倚(Performance bias,指的是實(shí)驗(yàn)藥物治療組接受了比安慰劑對(duì)照組更頻繁和更細(xì)致地觀測(cè))、測(cè)量偏倚(Measurement bias,指的是當(dāng)醫(yī)生知道某個(gè)患者服用的是實(shí)驗(yàn)藥物而不是安慰劑,會(huì)更加關(guān)注和記錄產(chǎn)生的副作用)、失訪偏倚(Attrition bias,指的是兩組中退出試驗(yàn)的患者數(shù)量不同),以及發(fā)表偏倚(Publication bias,指的是臨床試驗(yàn)的藥物產(chǎn)生了“有效”的結(jié)論比“無效”結(jié)論更容易發(fā)表在雜志期刊上)。循證醫(yī)學(xué)的支持者們發(fā)展出了各種“偏倚風(fēng)險(xiǎn)工具”,用于系統(tǒng)全面性地審視這些可能的試驗(yàn)偏倚。其實(shí),分配上的隨機(jī)還不能最大程度的避免偏倚。如果分配的結(jié)果被參加試驗(yàn)的患者知道了,或者被研究人員知道了,仍然可能會(huì)導(dǎo)致一些潛意識(shí)的主觀偏倚。這里就又要提到兩個(gè)名詞:安慰劑效應(yīng)(placebo effect)或者觀察者偏倚(observer bias)。安慰劑效應(yīng)是指當(dāng)患者接受一種實(shí)際上不含有任何活性成分的治療(安慰劑,如假藥、假治療)后,由于心理或生理因素而產(chǎn)生積極的治療效果,從而干擾實(shí)驗(yàn)藥物真實(shí)效果的判定。而觀察者偏倚指的是研究人員在收集、記錄或分析研究數(shù)據(jù)時(shí),因其主觀期望、假設(shè)或先入為主的觀點(diǎn)而導(dǎo)致的系統(tǒng)性偏倚,可能會(huì)無意中影響研究結(jié)果的準(zhǔn)確性和客觀性。也就是說,研究者和被研究者雙方的知情都會(huì)潛在影響實(shí)驗(yàn)結(jié)果。為了進(jìn)一步避免這個(gè)問題,“盲法”應(yīng)運(yùn)而生?!皢蚊しā敝秆芯恐幸环讲恢婪纸M情況,通常是受試者,而“雙盲”是研究中的受試者和研究人員均不知道分組情況,“三盲”是在雙盲的基礎(chǔ)上,后續(xù)的數(shù)據(jù)分析人員自己也不知道分組信息,所有分組信息在試驗(yàn)結(jié)束后才揭曉。實(shí)際上,雖然隨機(jī)對(duì)照試驗(yàn)的產(chǎn)生和后續(xù)各種改進(jìn)的初衷是避免所有偏倚,但在實(shí)踐中并非完美無缺。同時(shí)也不是說只要提到了“隨機(jī)”和“盲法”,結(jié)論就一定比非隨機(jī)的臨床研究更靠譜。盡管如此,循證醫(yī)學(xué)變革有些幼稚的支持者,高舉隨機(jī)對(duì)照試驗(yàn)的“錘子”,對(duì)他們來說每個(gè)問題都是釘子。當(dāng)他們快樂地把錘子砸向家具、貓,甚至是早餐的雞蛋時(shí),他們封閉了自己的思想,不會(huì)考慮他們最愛的工具在這一系列環(huán)境中的局限性。當(dāng)隨機(jī)對(duì)照試驗(yàn)用來研究更加復(fù)雜的干預(yù)方式時(shí),結(jié)論可能具有較強(qiáng)的誤導(dǎo)性,比如研究某種教育方式、某種建議、新型的服務(wù)工作結(jié)構(gòu),數(shù)字技術(shù)的使用,都需要人的主觀參與、學(xué)習(xí)和操作。除非干預(yù)方式本身已經(jīng)極致優(yōu)化,保證參與者可以完全按照理想狀況來行事,不然最后的結(jié)論就是干預(yù)方式幾乎或者完全沒效果。圖3:蘇格蘭母乳喂養(yǎng)臨床試驗(yàn):與事實(shí)相反的“科學(xué)”結(jié)論 | 來源:www.gcph.co.uk
在蘇格蘭進(jìn)行的一項(xiàng)多試驗(yàn)測(cè)試中心隨機(jī)對(duì)照試驗(yàn)顯示,給愿意嘗試母乳喂養(yǎng)的母親社區(qū)支持和服務(wù)非但沒有提高當(dāng)?shù)氐哪溉槲桂B(yǎng)率,甚至在某些地方“母乳喂養(yǎng)支持”組的喂養(yǎng)率低于對(duì)照組。實(shí)地調(diào)查分析表明,在這些地方,所謂的母乳喂養(yǎng)支持并非是人們想象中那樣由經(jīng)驗(yàn)豐富的工作人員無條件隨時(shí)待命地來幫助新手媽媽調(diào)整嬰兒姿勢(shì)來哺乳,提供個(gè)體化的、溫柔的、不帶偏見的鼓勵(lì);事實(shí)上是在寒冷、吵鬧、不友好的工作環(huán)境中,由一名超負(fù)荷的工作人員根據(jù)工作手冊(cè)照本宣科,提供建議,嚴(yán)格按照規(guī)定執(zhí)行操作。那里的“母乳喂養(yǎng)支持”組織沒有什么組織力、領(lǐng)導(dǎo)力可言,所謂的母乳喂養(yǎng)“支持”團(tuán)隊(duì)也沒什么工作激情,對(duì)幫助新手母親建立母乳喂養(yǎng)缺乏興趣和動(dòng)力。這也就解釋了,為什么做了母乳喂養(yǎng)支持工作還不如不做,不如讓媽媽們自己去找找姐妹或鄰居們幫忙更行之有效。然而,一些人對(duì)這種顯而易見的事實(shí)視而不見,還堅(jiān)持認(rèn)為,已經(jīng)有“科學(xué)證明”,母乳喂養(yǎng)支持是沒用的。在數(shù)字技術(shù)開發(fā)領(lǐng)域,醫(yī)學(xué)領(lǐng)域以外的標(biāo)準(zhǔn)研究方法是迭代設(shè)計(jì),也就是早期開發(fā)的原型會(huì)逐步在實(shí)驗(yàn)室和實(shí)際應(yīng)用場(chǎng)景中進(jìn)行測(cè)試,逐步改進(jìn),秉承的理念是“早失敗、常失敗”,失敗來得越早、越頻繁,開發(fā)和改進(jìn)的代價(jià)就越低。聰明的設(shè)計(jì)師會(huì)采用廣泛的方法來提高研發(fā)效率,比如民族志(Ethnography,仔細(xì)觀察人們使用產(chǎn)品的過程)和出聲思維技巧(Think-Aloud Technique,鼓勵(lì)用戶在使用產(chǎn)品時(shí)直接表達(dá)體驗(yàn)和不滿)。遺憾的是,雖然類似的方法在一定程度上也被應(yīng)用于醫(yī)學(xué)技術(shù)的開發(fā),但這些產(chǎn)品往往隨后會(huì)進(jìn)行隨機(jī)對(duì)照試驗(yàn),與安慰劑對(duì)照組進(jìn)行對(duì)比,又燒錢,又浪費(fèi)時(shí)間,更重要的是沒什么意義,因?yàn)榧夹g(shù)版本迭代很快,試驗(yàn)過程中所用的版本,在試驗(yàn)結(jié)束前就已經(jīng)變成“老古董”淘汰了。你會(huì)在手機(jī)系統(tǒng)更新之前要求做一個(gè)隨機(jī)對(duì)照試驗(yàn),來測(cè)試新版本與舊版本的差異嗎?明顯不會(huì)。當(dāng)然這并不是說軟件不需要經(jīng)過實(shí)驗(yàn)性的測(cè)試,只是說隨機(jī)對(duì)照試驗(yàn)這種只在藥物研究中有重要地位,注重“證據(jù)級(jí)別”高低的研究模式,套用到快速發(fā)展的數(shù)字技術(shù)領(lǐng)域,既不合邏輯,也不切實(shí)可行。人們對(duì)隨機(jī)對(duì)照試驗(yàn)還有一個(gè)常見的錯(cuò)覺,那就是認(rèn)為用其可以獨(dú)立指導(dǎo)政策和指南的制定,天真地認(rèn)為,任何決策應(yīng)該尊重和崇尚科學(xué), 不受政治因素影響。如果真是這樣,那就好了!無論來源于隨機(jī)對(duì)照試驗(yàn)還是其他類型研究的科學(xué)發(fā)現(xiàn),常常都是模糊、不完整、有爭(zhēng)議的甚至相互矛盾的。一種藥物或療法可能在醫(yī)學(xué)上行之有效,但患者或公共醫(yī)療提供者負(fù)擔(dān)不起。在公共醫(yī)療的背景下,機(jī)會(huì)成本可能顯得尤為重要。一位患者使用了價(jià)格很貴但是能醫(yī)保報(bào)銷的心臟病藥物,可能意味著另一個(gè)患者無法通過醫(yī)保報(bào)銷髖關(guān)節(jié)置換的手術(shù),畢竟公共醫(yī)療的預(yù)算支出總額是有限的。還有在一些情況下,治療可行但人力不足,例如當(dāng)時(shí)需要一名具有豐富經(jīng)驗(yàn)的技術(shù)專家來實(shí)施治療,但當(dāng)?shù)貨]有這樣的資源。此外有些干預(yù)措施,比如口罩、阿片類藥物替代品、體外受精(試管嬰兒)等在醫(yī)學(xué)上可行,但是社會(huì)輿論或道德不支持。實(shí)際上,政策辯論中的各方往往都會(huì)引用所謂的“科學(xué)證據(jù)”。比如,對(duì)于一些特定的惡性腫瘤到底是需要藥物治療,還是放射治療,還是手術(shù)切除,不同科室的??拼蠓蚨純A向于援引支持自己專業(yè)方向的研究結(jié)果,來證明某種治療方法具有優(yōu)勢(shì),換而言之,“公說公有理,婆說婆有理”有些循證醫(yī)學(xué)的極端擁護(hù)者常常把布拉德福德·希爾的名字當(dāng)成擋箭牌,企圖將隨機(jī)對(duì)照試驗(yàn)的模式強(qiáng)加于所有醫(yī)學(xué)、社會(huì)研究領(lǐng)域,甚至政策制定。布拉德福德·希爾要是知道自己的名字被當(dāng)成這些人的“免死金牌”,可能棺材板都?jí)翰蛔×?。盡管他對(duì)隨機(jī)對(duì)照試驗(yàn)的價(jià)值有著深刻的認(rèn)識(shí)和研究,但他同樣堅(jiān)信,這種簡(jiǎn)單粗暴的實(shí)驗(yàn)方法(將錯(cuò)綜復(fù)雜的真實(shí)世界簡(jiǎn)化為A與B兩者間的單純對(duì)比)并非金科玉律,而只能為現(xiàn)實(shí)世界的決策提供一部分的證據(jù)支持。對(duì)此,他還提出過“干預(yù)性研究九問”,又名布拉德福德·希爾標(biāo)準(zhǔn)( Bradford Hill criteria),要求人們?cè)诮庾x研究結(jié)果之前,必須先一一回答這些問題。這九個(gè)問題中一部分需要用隨機(jī)對(duì)照試驗(yàn)產(chǎn)生的證據(jù)來回答,其他問題的答案則來源于對(duì)現(xiàn)實(shí)世界的觀察。圖4:臨床試驗(yàn)的布拉德福德·希爾標(biāo)準(zhǔn) | 來源:joshualoong.com如果布拉德福德·希爾活到今天,他肯定會(huì)瞠目結(jié)舌,因?yàn)樽约阂话倌昵疤岢龅?、用于?yán)謹(jǐn)測(cè)試藥物效果的隨機(jī)對(duì)照研究方法,現(xiàn)在已被循證醫(yī)學(xué)的極端擁護(hù)者當(dāng)作一把被濫用的武器,他們?cè)噲D把臨床研究的證據(jù)固化成一個(gè)“金字塔”結(jié)構(gòu),而隨機(jī)對(duì)照試驗(yàn)就在塔尖,完全不承認(rèn)臨床研究其實(shí)是一個(gè)多元化的證據(jù)體系?,F(xiàn)實(shí)世界日新月異,循證醫(yī)學(xué)領(lǐng)域需要重新審視自己,聽取布拉德福德·希爾曾經(jīng)的諄諄教誨,采取一種更謙遜、更加多元的科學(xué)證據(jù)方法,才能更好地為人類健康服務(wù)。感謝渤健公司科學(xué)總監(jiān)史雋對(duì)本文的審核和修訂。
Trisha Greenhalgh教授是英國(guó)著名的初級(jí)衛(wèi)生保健專家,現(xiàn)任牛津大學(xué)初級(jí)衛(wèi)生保健科學(xué)教授,英國(guó)醫(yī)學(xué)科學(xué)院院士。她在劍橋大學(xué)獲得社會(huì)與政治科學(xué)學(xué)士學(xué)位,隨后在牛津大學(xué)完成醫(yī)學(xué)學(xué)位。在學(xué)術(shù)界,Greenhalgh教授以其在循證醫(yī)學(xué)和醫(yī)療創(chuàng)新領(lǐng)域的研究而聞名。她著作等身,其中《如何閱讀論文:循證醫(yī)學(xué)基礎(chǔ)》(How to Read a Paper: The Basics of Evidence-Based Medicine)自1997年首次出版以來,已成為評(píng)估醫(yī)學(xué)研究的重要參考書。研究興趣方面,她涉獵初級(jí)衛(wèi)生保健、醫(yī)療創(chuàng)新和全球健康等領(lǐng)域。此外,她還積極參與醫(yī)療政策的討論和制定,曾與其他科學(xué)家和政策制定者聯(lián)名致信英國(guó)首相,呼吁對(duì)國(guó)家衛(wèi)生服務(wù)(NHS)周末服務(wù)質(zhì)量的聲明進(jìn)行調(diào)查。Greenhalgh教授多年來的研究成果在全球范圍內(nèi)被廣泛引用和應(yīng)用,對(duì)初級(jí)衛(wèi)生保健和循證醫(yī)學(xué)的發(fā)展產(chǎn)生了深遠(yuǎn)影響。
本文主要譯自Trisha Greenhalgh, Medical trials are not the whole truth,原文地址:
https:///articles/medical-trials-are-not-the-whole-truth-auid-2989?_auid=2020