Circulation:高影响变异期刊上发表的那些非劣效性试验
近年来发列于的非劣效性K-越来越多,然而,这些科学研究的程序语言质量如何,我们还知之甚少。全因,《Circulation》杂志发列于了一项科学研究,以心肌梗死领域为例,对极高影响因子学报上发列于的非劣效性K-的相似性、程序语言质量等完成了深入探讨。科学研究确定了1990-2016年发列于在JAMA、Lancet和NEJM上的非劣效性K-。两位分立评审员提取了资料。注目的资料原素最主要非劣效性界值,哪些科学研究的结果超过了非劣效性,哪些K-不存在不太有可能影响非劣效性相具备结果的主要或次要诱因。主要的程序语言或许诱因最主要:并未同时展览品ITT统计分析(意向性统计分析)和PP统计分析(具备科学研究新设计方案统计分析)的结果,α>0.05,新外科手术手段未能与最佳外科手术新设计方案完成比较,并未断定非劣效性界值的更进一步,队列排除次数或失访率≥10%。次要诱因最主要次优盲法,否三组除去等。科学研究结果科学研究医务人员在PubMed上完成参考资料,合计参考资料到2,544篇短文,其里110篇(最主要111项K-)具备获选常规(列于1)。列于1 获选的非劣效K-的必需科学研究相似性科学研究发列于的期中从1992年到2016年。这些K-里,样本量里位数为3,006(IQR:1,021-6,068)。可检查到非劣效性的相容性(power)里位数为86%(IQR:80%-90%)。可带入主要终点统计分析的病人里位数为2,707(IQR:1,021-5,966)。9项科学研究(8.1%)原定终止(4项科学研究由于稳定性问题,3项由于入组较快,1项科学研究发掘不止无益两处,1项科学研究由于一致性受损)。非劣效性界值60项(54.0%)K-的非劣效性界值是基于ARD(并不一定不确定性关联性,absolute risk difference)决定的,50项(45.0%)K-基于相比关联性(29项基于HR,14项基于RR,7项K-基于OR)。1项K-的界值基于相比关联性但并未作大幅度细分,1项K-并未调查报告非劣效性界值。各项K-的非劣效性界值关联性太大(ARD在0.4%~25%,HR在1.05~2.85,RR在1.1~1.8,OR在1.1~2.0)。在发列于过科学研究新设计/科学研究新设计方案特别程序语言短文的K-里,科学研究医务人员发掘不止有7篇K-的科学研究新设计/新设计方案与最终发列于的科学论文二者之间不存在关联性或有个人信息其会。有的在最终发列于的短文里更为改了非劣效性界值,有的则发挥作用如何选择非劣效性界值特别的一小或全部确实。主要终点的结果111项K-里,有2项K-,无法分析报告置信区间。在109项具备常规的K-里,86项(78.9%)的K-看不止具非劣效性(其里20项K-的结果也看不止不止优效性);23项(21.1%)K-未能超过非劣效性(16项科学研究的结果不确定,7项科学研究看不止默许紧急措施的结局更为差)(左图1)。 左图1 不属于科学研究的主要终点的结果在95项(85.6%)K-里,主要终点统计分析是基于ITT统计分析或扫描ITT统计分析,11项(9.9%)K-运用于PP统计分析,5项(4.5%)运用于其他或未能定义的统计分析种类。绝大多数(90%)K-在简要里适当地调查报告了科学研究结果,即是非劣效,优效或劣效性,科学研究如果并未超过,则宣称未能超过非劣效性。但是,还有一些K-,要么是简要给不止的个人信息和科学研究结果二者之间不存在关联性,要么是简要提供的个人信息不足。程序语言和调查报告的或许列于2和左图2看不止了不存在主要和次要或许诱因的K-的比例。70项K-(63.1%)通过对另一个队列人群的二次统计分析(例如,如果首次统计分析是ITT统计分析,则便做一次PP统计分析)来展览品主要科学研究终点,其里66项K-的结果明确,而4项K-的两次统计分析结果不明确。 列于2. 不属于的科学研究里否不存在不太可能加剧偏倚的诱因左图2 不存在主要和次要或许诱因的K-产自情况68项K-(61.3%)提供了如何确定非劣效性界值,而43项K-(38.7%)并未。110项(99.0%)K-的脊柱α≤0.05,其里44项K-的脊柱α≤0.025。随即统计分析(post-hoc ysis)发掘不止,与医疗器械K-远比,药物K-的α水平更为极低(Wilcoxon秩和检查P = 0.02)。在27项科学研究里(24.3%),有> 10%的旁观者原定退不止,最主要随访失访,原定停止默许或其他原因(列于2)。 总体而言,基于所有主要的偏倚诱因,27项K-(24.3%)被认为具极低偏倚不确定性。97项(87.3%)K-的标题或简要里调查报告了非劣效性新设计。67项(60.4%)K-,除了最终的科学研究科学论文,还同步发列于了科学研究新设计或科学研究新设计方案的程序语言短文。在这67项K-里,8项(11.9%)K-的非劣效性界值在最终投稿科学论文与新设计方案二者之间不存在关联性或在其里一篇短文里未能透露。大多数K-(n = 60,54%)是开放标签K-,12项K-(10.8%)为单盲,39项(35.1%)为安慰剂。100项K-完成了三组除去(90%)。91项K-(82%)对主要终点完成了盲法认定。总之,基于所有的次要偏倚诱因,25项K-(22.5%)具极低偏倚不确定性(左图2)。根据所有主要和次要诱因,有7项K-(6.3%)具极低偏倚不确定性。随即统计分析未能看不止不止三种学报的短文在主要诱因(Kruskal-Wallis检查P = 0.28)或次要诱因(Kruskal-Wallis检查P = 0.11)上的关联性。然而,对非劣效性K-的科学研究新设计或科学研究新设计方案的可获得性完成分析报告,在三种学报里,NEJM发列于的K-里,有74.2%发列于过特别的程序语言短文或有Skype的科学研究新设计方案,JAMA为53.3%,Lancet为33.3%(Fisher正确地检查P = 0.001)。小时21世纪近年来,这些学报上发列于的心肌梗死非劣效性K-略有增加(P<0.001 for trend,左图3)。一项随即统计分析看不止,在111项不属于的K-里,发列于小时在2010年后的有52项(46.8%)。2010年此后发布的K-,不存在程序语言或科学研究调查报告或许的不确定性略有减极低(2010年之前 vs 2010年此后,主要偏倚诱因和次要诱因的P = 0.03和0.002)。讨论心肌梗死领域里的非劣效性K-越来越多地发列于在极高名望的学报上,这些K-里非劣效性K-主要用做对新默许紧急措施的检查。并且大多数是大型多里心科学研究。鉴于许多非劣效性K-已踏入同意新疗法的基础性,很有前提对他们完成科学研究。尽管大多数K-声称新外科手术手段远比对照组的非劣效性,但很多科学研究不存在具偏倚不确定性的程序语言或科学研究调查报告或许,不太有可能弱化其论据的可信性。有前提提极高对这些或许诱因的了解到,更为好遵从FDA和CONSORT须知关于非劣效性K-新设计、实施和调查报告的劝告。独有不止两处:Behnood Bikdeli, et al. Non-Inferiority Designed Cardiovascular Trials in Highest-Impact Journals: Main Findings, Methodological Quality and Time Trends. Circulation. Jun 2019.