中华医学会
地址: 中国北京东四西大街42号
邮编: 100710
人工智能与非整倍体产前筛查
文章导读:
1、常见人工智能技术的研究方法可以初步分为两大类,即统计学习算法与深度学习算法。
2、对于非整倍体筛查,目前我国仍以孕中期三联筛查为主,而NIPT因其高检出率和低假阳性率正逐步替代传统血清学筛查。但目前无论哪种筛查技术都是使用传统统计方法判定目标疾病,统计的效能将直接影响最终的判定。
3、人工智能预测模型是替代传统血清学预测模型的适宜方案,同时能有效整合现有筛查资源、优化NIPT和染色体芯片检测技术性能,在产前超声筛查标准化和生化指标筛查同质化方面也表现出巨大潜力。
4、虽然人工智能技术未来在多源异构数据融合、提高疾病预测能力、实现数据增值、降低社会医疗费用总支出等方面潜力巨大,但在追逐新兴研究方向的同时,更需客观、理性地看待它。
本文引用格式: 何法霖, 王治国, 刘俊涛. 人工智能与非整倍体产前筛查 [J] . 中华围产医学杂志, 2021, 24(11) : 868-871. DOI: 10.3760/cma.j.cn113903-20210325-00258
摘 要 本文就新兴的人工智能技术及在非整倍体产前筛查领域的应用进行综述,简述了人工智能技术及研究方法、产前筛查现状,详细介绍了利用人工智能技术在整合产前筛查指标、提高筛查性能、优化筛查策略方面的研究,说明人工智能在融合各类筛查数据提高疾病预测能力、实现数据增值、降低社会医疗费用等方面具有很大潜力,但也需要科学、理性、全面地看待人工智能技术,否则人工智能在产前筛查领域难以达到理想的效果。 【关键词】 人工智能;非整倍性;产前诊断 基金项目:国家重点研发计划(2019YFC1005105)
人工智能(artificial intelligence,AI)是当前科学技术迅速发展新思想、新理论、新技术不断涌现的形势下产生的学科,也是一门涉及数学、计算机科学、哲学、认知心理学、信息论的交叉和边缘学科[1]。人工智能的概念于1956年在达特茅斯会议上提出,之后的几十年里,人工智能在实验室中慢慢孵化,被誉为第四次技术革命。2017年Nature杂志上发表一项斯坦福大学人工智能的研究成果,其通过深度学习的方法,用近13万张痣、皮疹和其他皮肤病变的图像训练机器,以识别其中的皮肤癌,并与21位皮肤科医生的诊断结果进行对比,结果发现人工智能模型的诊断准确率与人类医生相当[2],该成果在医学界引起了极大的反响。统计学专家Crown指出,随着信息更新加速,临床数据量猛增,且很多属于非结构化数据,临床工作者需要更多关注人工智能这项新技术[3]。本文综述了人工智能在非整倍体产前筛查中的应用,希望能对有效整合现有筛查资源、降低总体筛查成本提供理论依据及科研思路。
一、人工智能及研究方法分类
人工智能是利用大数据通过机器学习的方式训练得到较好的匹配参数,从而形成较好的决策系统。在临床科研活动中,大量数据的综合价值需要经过临床医生长时间反复实践、总结才能被发现,并形成一种临床经验,而机器学习恰是致力于通过计算的手段,学习数据中蕴含的经验而获得某项“类人的智能”。因此,人工智能所研究的主要内容,是通过大量数据来确定一种运算模式,这一过程称为“训练”,所得到的运算模式就是算法模型,算法模型是人工智能的核心[4]。通过训练确定的算法模型在面对新的数据时,能进行有效地判断和预测,且模型提供的预测信息可以提高临床医生对数据的认识及工作效率。
常见人工智能技术的研究方法可以初步分为两大类,即统计学习算法与深度学习算法。统计学习算法的过程为提取数据特征、建立数学模型、通过算法对数据进行分类和预测[5]。常用的统计学习算法包括线性回归算法、决策树算法、支持向量机算法、最大期望算法、概率图模型、贝叶斯算法等。深度学习算法是对人工神经网络(artificial neural network,ANN)的研究,通过模拟人类神经网络的连接方式,将目标数据输入神经网络进行特征提取,从而进行数据分类和预测的算法。近几年还出现了多种算法融合的模型,这些算法的协同使用让人工智能技术更加准确、高效地解决复杂场景问题。无论何种算法,人工智能的作用都是实现两类功能,即分类和预测。
二、非整倍体产前筛查现状
产前筛查是指通过经济、简便和无创的检测方法,从孕妇群体中寻找有某些先天缺陷胎儿的高危者,以便进一步明确诊断,最大限度地减少出生缺陷,是一种有效的二级干预措施[6]。对于21-三体、18-三体、13-三体等非整倍体染色体疾病,根据产前筛查方法的不同,可以分为基于检测母血清生化标志物的母血清生化产前筛查,检测胎儿游离DNA的无创产前检测(non-invasive prenatal testing,NIPT),以及基于超声检查的产前筛查[7-10]。
产前筛查的生化指标主要包括血清绒毛膜促性腺激素(human chorionic gonadotropin, hCG)、妊娠相关血浆蛋白A(pregnancy associated plasma protein A, PAPPA)、甲胎蛋白(alpha fetoprotein, AFP)、游离雌三醇(unconjugated estriol, uE3)、抑制素A(inhibin A, Inh A)。超声检查指标主要为胎儿颈项透明层(nuchal translucency,NT)厚度。常用的产前筛查方案包括:孕中期二联[AFP、hCG/β-hCG/游离β-hCG(free β-hCG)]筛查、孕中期三联(AFP、hCG/β-hCG/free β-hCG、uE3)筛查、孕中期四联(AFP、hCG/ β-hCG/free β-hCG、uE3、Inh A)筛查、孕早期联合(hCG/β-hCG/free β-hCG、PAPPA、NT)筛查[11-12]。目前我国仍以孕中期三联筛查为主,21-三体检出率仅为60%[13]。而NIPT因其高检出率和低假阳性率正逐步替代传统血清学筛查[14-15]。但目前无论哪种筛查技术都是使用传统统计方法判定目标疾病[16-17]。通过利用本地化标志物中位数的倍数(Multiple of Median, MOM)值、本地化体重校准方程和年龄风险曲线,使用多变量对数高斯模型或logistics回归模型计算得到患病风险似然比,而NIPT筛查是通过提取游离DNA,进行扩增及纯化,然后与参考序列比对,并使用Z比分数或t检验结果判定,可见统计的效能将直接影响最终的判定。
三、人工智能与非整倍体产前筛查技术的“碰撞”
人工智能预测模型是替代传统血清学预测模型的适宜方案,同时能有效整合现有筛查资源。2015年荷兰学者Neocleous教授首次利用51 208例单胎孕妇的超声数据和血清生化指标进行训练,开发ANN算法模型。该模型对21-三体的检出率为100%,假阳性率为3.6%,其他非整倍体(如18-三体和Turner综合征)检出率为84.2%,假阳性率为6.4%[18]。2017年该团队扩大训练数据量和特征值优化模型,优化后的模型21-三体检出率为100%,假阳性率降至2.7%,而针对其他非整倍体检出率提升至85.2%,假阳性率为4.8%[19]。芬兰研究团队同样证明在不增加新指标的情况下,仅使用传统早孕联合筛查指标(PAPPA、NT和free β-hCG)开发的ANN模型,预测21-三体的效能也明显高于传统方法,并提出人工智能模型是替代多变量对数高斯模型或logistics回归模型的适宜方案[20]。本课题组通过回顾北京协和医院2007年至2019年中孕期筛查数据建立中孕期筛查人工智能算法模型,该算法模型对21-三体的检出率达75%,因完全基于真实世界建模,该算法模型具有很好的外推性,并在其他筛查机构得到很好的验证[21]。2018年Neocleous等[22]收集了 72 054例整倍体、295例21-三体和305例其他染色体异常孕妇的数据,开发二阶模型进行序贯预测,一阶模型使用孕早期(11~13周+6)筛查数据(NT、PAPPA、free β-hCG)进行预测,当预测结果显示为高风险的孕妇进入二阶模型。在一阶段模型的基础上,二阶模型增加了静脉导管、三尖瓣血流和鼻骨指标,预测结果分为无风险、中风险和高风险,无风险孕妇进行临床随访,中风险孕妇进行NIPT检测,高风险孕妇行产前诊断,结果显示模型预测21-三体的灵敏度为97.1%,特异度为99.5%,不仅提高了21-三体检出率,而且降低了接受介入性产前诊断或NIPT检测的孕妇数量。
人工智能技术能优化NIPT和染色体芯片检测技术性能。2018年Teder等[23]利用决策树和支持向量机2种算法均提高了NIPT筛查21-三体的准确度,尤其在胎儿游离DNA浓度低至2%时,准确度也能达98%。我国学者亦证明了支持向量机算法能直接降低NIPT筛查21-三体、18-三体和13-三体的假阳性率,检出率达100%[24]。浙江大学研究团队利用315例正常和63例21-三体孕妇的单核苷酸多态性(single nucleotide polymorphism,SNP)检测结果,开发双层数据流卷曲神经管模型预测21-三体,结果显示该模型预测21-三体的平均准确度达99.3%,且假阳性率为0.6%,假阴性率为1.1%[25]。
人工智能技术将在产前超声筛查标准化和生化指标筛查同质化方面展现巨大潜力。对于产前超声检查,只有获得优质的超声图像和准确的结果才能保证临床诊断的质量。已有研究者初步探索通过构建人工智能模型来获取标准图像,对超声图像进行质量控制,提高产前超声检出率,保证不同超声医生结果的同质化[26]。另外,由于我国血清学产前筛查风险计算所使用的年龄风险曲线仍来源于国外多中心数据研究,该数据库主要来源于高加索人群,我国并没有多中心合作研究的权威数据,这将影响筛查的质量。但人工智能模型具有直接从本地孕妇生化结果和孕妇临床信息提取学习特征值的能力,更适用于我国孕妇人群的筛查,并为血清学筛查同质化提供一种有效途径。
四、人工智能技术在非整倍体产前筛查领域研究存在的问题与展望
虽然人工智能技术未来在多源异构数据融合、提高疾病预测能力、实现数据增值、降低社会医疗费用总支出等方面潜力巨大,但在追逐新兴研究方向的同时,更需客观、理性地看待它。(1)人工智能预测模型主要利用大量有明确诊断结局的数据进行训练,目前每一机构累计的阳性病例数据偏少,单独建模难以达到最佳效果。尽管多中心合作是一个有效的途径,然而其带来的数据异质性问题可能会降低模型的预测性能。(2)只是讨论“哪种学习算法更好”并无意义,应针对具体的筛查项目进行预实验,可能会发现在解决血清学产前筛查上表现好的模型,在NIPT筛查或产前超声筛查上却不尽如人意,算法自身的归纳偏好与筛查指标及人群特征是否相匹配,往往会起到决定性的作用。(3)亟需加快人工智能预测模型的质量控制研究。通常人工智能预测模型被认为是“黑盒子”,缺乏通用的理论解释,需要第三方评价机构对其临床预测能力进行合理、有效监控,降低临床使用风险和隐患。(4)目前我国产前筛查数据本身存在一些问题,包括临床数据混乱、信息不完整、质量参差不齐、标准不统一等,也将阻碍人工智能预测模型的推广应用。
随着国家医疗数据治理工作推进,质量评价体系不断升级,相信中国的筛查数据越来越规范,更多信息完整、准确的医疗数据有望被纳入训练,人工智能预测模型将不断优化产前筛查策略和效率,使更多的孕妇与家庭从中收益。同时,人工智能技术在预测妊娠期高血压疾病、妊娠期糖尿病等围产期不良结局也有独特优势。总而言之,人工智能技术正在或即将整合到各种产前筛查技术和妊娠不良结局预测的研究中,为优化现有资源提供了重要技术支撑。
参考文献
[1] 丁世飞. 人工智能导论[M].北京:电子工业出版社, 2020: 10.
Ding SF. Introduction to artificial intelligence[M]. Beijing: Publishing House of Electronics Industry, 2020:10.
[2] Esteva A, Kuprel B, Novoa RA, et al. Corrigendum: Dermatologist-level classification of skin cancer with deep neural networks[J]. Nature, 2017,546(7660):686. DOI: 10.1038/nature22985.
[3] Crown WH. Real-world evidence, causal inference, and machine learning[J]. Value Health, 2019,22(5):587-592. DOI: 10.1016/j.jval.2019.03.001.
[4] 史忠植. 智能科学[M]. 北京: 清华大学出版社, 2019: 23-24.
Shi ZZ. Artificial intelligence science[M]. Beijing:Tsinghua University Press, 2019: 23-24.
[5] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016: 21-22.
Zhou ZH. Machine learning[M]. Beijing: Tsinghua University Press,2016: 21-22.
[6] 吕时铭. 产前筛查与产前诊断[J]. 现代实用医学, 2001,13(4):158-160. DOI:10.3969/j.issn.1671-0800.2001.04.003.
Lyu SM. Prenatal screening and prenatal diagnosis[J]. Modern Pract Med,2001,13(4):158-160. DOI:10.3969/j.issn.1671-0800.2001.04.003.
[7] 朱瑞芳, 李洁, 段红蕾, 等. 五种产前筛查策略对唐诗综合征检出的卫生经济学评价[J].中华围产医学杂志,2018,21(9):632-638. DOI: 10.3760/cma.j.issn.1007-9408.2018.09.012.
Zhu RF, Li J, Duan HL, et al. Health economic evaluation of five prenatal screening strategies for Down's syndrome[J]. Chin J Perinat Med, 2018,21(9):632-638. DOI: 10.3760/cma.j.issn.1007-9408.2018.09.012.
[8] 王淑娴, 马京梅. 染色体微阵列分析技术的适宜产前诊断应用策略[J].中华围产医学杂志, 2019,22(1):26-29. DOI: 10.3760/cma.j.issn.1007-9408.2019.01.006.
Wang SX, Ma JM. Clinical pathway selection based on chromosomal microarray analysis in prenatal diagnosis[J]. Chin J Perinat Med, 2019,22(1):26-29. DOI: 10.3760/cma.j.issn. 1007-9408.2019.01.006.
[9] Krstić N, Običan SG. Current landscape of prenatal genetic screening and testing[J]. Birth Defects Res, 2020,112(4):321-331. DOI: 10.1002/bdr2.1598.
[10] Temming LA, Macones GA. What is prenatal screening and why to do it?[J]. Semin Perinatol, 2016,40(1):3-11. DOI: 10.1053/j.semperi.2015.11.002.
[11] 戚庆炜, 边旭明. 产前筛查——从血清学筛查到无创产前检测[J].中国实用妇科与产科杂志,2020,36(9):793-796. DOI: 10.19538/j.fk2020090101.
Qi QW, Bian XM. Prenatal screening:from serum screening to NIPT[J]. Chin J Pract Gynecol Obstet, 2020,36(9):793-796. DOI: 10.19538/j.fk2020090101.
[12] Cuckle H, Benn P, Wright D. Down syndrome screening in the first and/or second trimester: model predicted performance using meta-analysis parameters[J]. Semin Perinatol, 2005,29(4):252-257. DOI: 10.1053/j.semperi.2005.05.004.
[13] Cuckle H, Maymon R. Development of prenatal screening--A historical overview[J]. Semin Perinatol, 2016,40(1):12-22. DOI: 10.1053/j.semperi.2015.11.003.
[14] Cuckle H, Benn P, Pergament E. Cell-free DNA screening for fetal aneuploidy as a clinical service[J]. Clin Biochem, 2015,48(15):932-941. DOI: 10.1016/j.clinbiochem.2015.02.011.
[15] Cuckle H. Strategies for implementing cell-free DNA testing[J]. Clin Lab Med, 2016,36(2):213-226. DOI: 10.1016/j.cll.2016.01.010.
[16] Cuckle H. Biochemical screening for Down syndrome[J]. Eur J Obstet Gynecol Reprod Biol, 2000,92(1):97-101. DOI: 10.1016/s0301-2115(00)00431-0.
[17] Kagan KO, Wright D, Nicolaides KH. First-trimester contingent screening for trisomies 21, 18 and 13 by fetal nuchal translucency and ductus venosus flow and maternal blood cell-free DNA testing[J]. Ultrasound Obstet Gynecol, 2015,45(1):42-47. DOI: 10.1002/uog.14691.
[18] Neocleous AC, Nicolaides KH, Schizas CN. First trimester noninvasive prenatal diagnosis: a computational intelligence approach[J]. IEEE J Biomed Health Inform, 2016,20(5):1427-1438. DOI: 10.1109/JBHI.2015.2462744.
[19] Neocleous AC, Nicolaides KH, Schizas CN. Intelligent noninvasive diagnosis of aneuploidy: raw walues and highly imbalanced dataset[J]. IEEE J Biomed Health Inform, 2017,21(5):1271-1279. DOI: 10.1109/JBHI.2016.2608859.
[20] Koivu A, Korpimäki T, Kivelä P, et al. Evaluation of machine learning algorithms for improved risk assessment for Down's syndrome[J]. Comput Biol Med, 2018,98:1-7. DOI: 10.1016/j.compbiomed.2018.05.004.
[21] He F, Lin B, Mou K, et al. A machine learning model for the prediction of down syndrome in second trimester antenatal screening[J]. Clinica Chimica Acta, 2021,521(7):206-211. DOI: 10.1016/j.cca.2021.07.015.
[22] Neocleous AC, Syngelaki A, Nicolaides KH, et al. Two-stage approach for risk estimation of fetal trisomy 21 and other aneuploidies using computational intelligence systems[J]. Ultrasound Obstet Gynecol, 2018,51(4):503-508. DOI: 10.1002/uog.17558.
[23] Teder H, Paluoja P, Rekker K, et al. Computational framework for targeted high-coverage sequencing based NIPT[J]. PLoS One, 2019,14(7):e0209139. DOI: 10.1371/journal.pone.0209139.
[24] Yang J, Ding X, Zhu W. Improving the calling of non-invasive prenatal testing on 13-/18-/21-trisomy by support vector machine discrimination[J]. PLoS One, 2018,13(12):e0207840. DOI: 10.1371/journal.pone.0207840.
[25] Feng B, Hoskins W, Zhang Y, et al. Bi-stream CNN Down Syndrome screening model based on genotyping array[J]. BMC Med Genomics, 2018, 11(Suppl 5): 105. DOI: 10.1186/s12920- 018-0416-0.
[26] Dong J, Liu S, Liao Y, et al. A generic quality control framework for fetal ultrasound cardiac four-chamber planes[J]. IEEE J Biomed Health Inform, 2020,24(4):931-942. DOI: 10.1109/JBHI.2019.2948316.