中华医学会
地址: 中国北京东四西大街42号
邮编: 100710
中文版Hammersmith新生儿神经学检查量表的信度与效度研究
本文刊发于 中华实用儿科临床杂志,2025,40(9):668-674
引用本文:李翌鸣,李庆红,段仕涛,等.中文版Hammersmith新生儿神经学检查量表的信度与效度研究[J].中华实用儿科临床杂志,2025,40(9):668-674.DOI:10.3760/cma.j.cn101070-20241206-00824.
摘要
目的 探究中文版Hammersmith新生儿神经学检查(C-HNNE)量表的信度与效度。
方法 前瞻性队列研究。选取2022年10月至2023年8月在深圳市龙岗区妇幼保健院出生,出生后于新生儿科和产科住院,符合纳入标准的114例新生儿作为研究对象,按不同出生胎龄分为早期早产儿组(34例)、中晚期早产儿组(50例)、足月儿组(30例)。于出生24 h内完善首次C-HNNE评估,并从3组中各自抽取20例进行评分者信度检测;首次C-HNNE评估48 h后,各组随机抽取20例再次完善C-HNNE评估,用于重测信度检测;矫正4月龄时由儿童康复科医师通过临床检查结合全身运动(GMs)评估判断其短期神经发育结局。通过计算组内相关系数(ICC)检测评分者信度与重测信度,通过绘制受试者工作特征(ROC)曲线确立C-HNNE在各组的最优分数,通过计算灵敏度、特异度、阳性预测值(PPV)和阴性预测值(NPV)确定预测效度。
结果 早期早产儿组、中晚期早产儿组与足月儿组C-HNNE最优分数分别取22.25、25.25、29.25分时,其预测新生儿矫正4月龄神经运动发育结局的敏感性最高。3组C-HNNE总分及各子量表的评分者ICC均在0.7以上,评分者信度较好;C-HNNE 中部分条目重测ICC<0.6,重测信度一般。效度方面,3组C-HNNE总分与GMs评分的相关系数分别为0.550、0.483、0.473(均P<0.01),C-HNNE预测新生儿矫正4月龄神经发育结局的敏感度为82.9%,特异度为70.4%,PPV为58.0%,NPV为89.3%。
结论 C-HNNE量表的信度和效度良好,可作为新生儿早期床旁常规检查项目使用。
关键词 婴儿,早产;中文版Hammersmith新生儿神经学检查;信度;效度;神经发育结局
妊娠满28周但不足37周就分娩出生的新生儿为早产儿[1]。近年来由于围生医学水平的提升、产前激素的应用、外源性肺表面活性物质的应用以及新生儿重症监护结构化的发展,使得出生胎龄越来越小、出生体重越来越低的早产儿得以存活。全球范围内,每年约有 1 500 万早产儿出生,但这些早产儿发生神经发育障碍的发病率并未下降[2-4]。需要注意的是,早产儿神经发育障碍往往是功能上的损害,而不是一种延迟,并不会随着时间的推移而正常,需要尽早干预[5]。
大脑具有可塑性,这也是进行早期干预的重要基础[6]。婴幼儿时期是神经系统代偿与可塑的关键时期,干预时机越早,效果越好。因此,需要结合临床特征、神经影像学和神经发育学检查,在出生早期识别需干预的婴幼儿[7]。目前国内常用的神经发育学检查工具适用年龄较宽泛,可用于新生儿时期神经发育筛查的工具仍存在不足。Hammersmith新生儿神经学检查(Hammersmith Neonatal Neurological Examination,HNNE)量表适用于矫正胎龄24周以上早产与足月新生儿的神经发育学检查,且对于新生儿的神经发育结局具有预测意义,在国外广泛应用于新生儿的神经发育学检查与研究[8]。目前中文版HNNE(Chinese version of Hammersmith Neonatal Neurological Examination,C-HNNE)量表相关临床应用与研究甚少,原版的最优分数是否适用于中国婴儿尚不明确[9]。本研究探索中国婴儿C-HNNE量表的最优分数,并进行信效度评价,为C-HNNE量表在国内的推广使用提供临床与理论基础。
1 资料与方法
1.1 研究对象 前瞻性队列研究。选取2022年10月至2023年8月于深圳市龙岗区妇幼保健院出生的早期早产儿(28~31+6周)34例、中晚期早产儿(32~36+6周)50例、足月儿(37~41+6周)30例,共114例新生儿纳入研究。本研究通过深圳市龙岗区妇幼保健院医学伦理委员会批准(批准文号:LGFYKYXMLL-2024-01),新生儿监护人均知情同意。
纳入标准:(1)出生胎龄28~36+6周,出生后转入新生儿科的早产儿;(2)出生胎龄37~41+6周,出生后转入产科的足月儿。
排除标准:(1)先天性中枢神经系统结构异常;(2)围生期因缺氧缺血或感染等因素导致的中枢神经系统结构异常;(3)患有基因或遗传代谢性疾病者;(4)出生后合并严重的心肝肾等系统性疾病;(5)合并癫痫;(6)合并甲状腺功能减退。在后续随访过程中,因发生严重器质性病变(先天性视网膜障碍1例)、代谢性疾病(先天性高血糖1例)以及无法在规定时间随访,共失访8例,最终完善矫正4月龄全身运动(general movements,GMs)评估者106例,平均随访时间为足月后矫正4月龄。
1.2 研究工具
1.2.1 C-HNNE C-HNNE包含6个子量表:姿势与肌张力、肌张力模式、反射、运动、异常体征/模式、定向力和行为,共34项[8-9]。每个项目均将1~5分的原始分转化为0~1分的最佳分,总分为0~34分。
1.2.2 GMs评估 GMs评估是一种观察胎儿至4~5月龄婴儿自发运动以预测其神经发育结局的评估方法,可较好预测新生儿脑性瘫痪及运动与认知发育障碍[10-13]。因此本研究选取矫正4月龄作为随访时间节点,采用GMs评估入组新生儿的短期神经发育结局,以检测C-HNNE的有效性。矫正胎龄9~20周的不安运动缺乏(absence of fidgety movements,F-)对于后期发展为中枢神经系统功能障碍,尤其是脑性瘫痪,具有较高预测价值,是早期脑损伤和功能障碍的一个最佳标志[10]。矫正4月龄的GMs检查结果为正常不安运动(normal fidgety movements,NF)记为正常,F-记为异常,若出现临界性的异常不安运动,则继续随访,直至该婴儿出现NF或F-的结果。
1.3 实施过程 入组新生儿出生24 h内完成首次 C-HNNE 施测,评估者A进行测试时,评估者B和C进行独立评分,以检测C-HNNE的评分者信度。首次施测48 h 后,采用简单随机抽样法在3组中各自抽取20例新生儿,由第1次评估者再次完善C-HNNE评估,分析前后2次结果得到C-HNNE的重测信度。选取矫正 4月龄作为随访时间节点,选取GMs评估作为结局指标,以检测C-HNNE的效度。
1.4 质量控制 本研究评估人员均为有评估新生儿与婴儿临床经验的专业人员,且均获得包括C-HNNE与GMs评估在内的婴幼儿评估相关资质证书。C-HNNE与GMs的施测需在明亮、安静、温暖的场所下进行,婴儿应处于生理和医学状态稳定、安静、清醒的状态,选取婴儿两餐之间的2/3时段进行评估与检查。检查结果由专人出具报告并登记记录,GMs评估人员不知晓受试婴儿C-HNNE的得分情况。
1.5 统计学处理 采用SPSS 26.0软件进行数据分析,连续变量采用平均值或中位数进行描述性统计;分类变量采用频率或百分比进行描述性统计,采用Pearson χ2检验比较组间差异;采用组内相关系数(intra-class correlation coefficient,ICC)对测试者进行评分者信度与重测信度检测;采用Spearman相关性分析C-HNNE评分与GMs评分的相关性。
准确性评价指标:采用受试者工作特征(receiver operator characteristic,ROC)曲线及ROC曲线下面积(area under receiver operator characteristic curve,AUROC)评价C-HNNE对新生儿神经发育结局的预测能力,并分析C-HNNE在各组用于预测神经发育结局的最佳截断值。当AUROC≥0.5时,AUROC越接近于1,诊断效果越好;0.5≤AUROC<0.7为诊断性较低,0.7≤AUROC<0.9为有一定诊断性,AUROC≥0.9为有较高诊断性。采用敏感度、特异度、阳性预测值、阴性预测值分析C-HNNE 预测新生儿短期神经运动发育结局的有效性。P<0.05为差异有统计学意义。
2 结果
2.1 一般情况 共纳入114例新生儿,男69例(60.5%),女45例(39.5%);其中早期早产儿34例,平均出生胎龄29+6周,平均出生体重1 358.53 g;中晚期早产儿50例,平均出生胎龄34+3周,平均出生体重2 237.20 g;足月儿30例,平均出生胎龄38+6周,平均出生体重3 073.67 g。3组性别、出生胎龄、出生体重≥2 500 g 比例的差异均有统计学意义(均P<0.05)。见表1。
2.2 短期神经运动发育结局 早期早产儿组、中晚期早产儿组与足月儿组C-HNNE得分中位数分别为22.25、24.50、30.50分;3组在矫正4月龄时GMs评分结果异常分别为14例(46.7%)、13例(28.3%)、8例(26.7%),见表2。
2.3 信度分析
2.3.1 早期早产儿组评分者信度 早期早产儿组 C-HNNE评估量表总分与6个子量表均具有良好的评分者信度(均P<0.001),见表3。
2.3.2 早期早产儿组重测信度 在早期早产儿组前后2次C-HNNE检查中,总分与子量表中的姿势与肌张力、肌张力模式、反射、异常体征/模式均表现出良好的重测信度(均P<0.01);运动、定向力和行为子量表的重测信度差异均无统计学意义(均P>0.05),见表3。
2.3.3 中晚期早产儿组评分者信度 中晚期早产儿组C-HNNE评估量表总分与6个子量表均表现出良好的评分者信度(均P<0.001),见表4。
2.3.4 中晚期早产儿组重测信度 在中晚期早产儿组前后2次C-HNNE检查中,总分与子量表中的反射、异常体征/模式、定向力和行为表现出良好的重测信度(均P<0.01);运动子量表的重测信度差异也有统计学意义(P<0.05),姿势与肌张力、肌张力模式子量表的重测信度差异均无统计学意义(均P>0.05),见表4。
2.3.5 足月儿组评分者信度 足月儿组C-HNNE评估量表总分与6个子量表均表现出良好的评分者信度(均P<0.001),见表5。
2.3.6 足月儿组重测信度 在足月儿组前后2次 C-HNNE 检查中,总分与子量表中的姿势与肌张力、反射、运动、异常体征/模式、定向力和行为表现出良好的重测信度(均P<0.01),肌张力模式子量表的重测信度差异无统计学意义(P>0.05),见表5。
2.4 最优分数 早期早产儿组的ROC曲线见图1A,AUROC为0.806(P<0.01),C-HNNE的界限分为22.25分(敏感度81.3%,特异度78.6%)。C-HNNE各子量表的AUROC在0.355~0.768,其中姿势与肌张力、运动子量表对于GMs评估具有一定的预测价值(均P<0.05),见表6。
中晚期早产儿组的ROC曲线见图1B,AUROC为0.763(P<0.01),C-HNNE的界限分为25.25分(敏感度87.1%,特异度80.0%)。各子量表的AUROC在0.572~0.711,其中反射、运动子量表对于GMs评估具有一定的预测价值(均P<0.05),见表7。
足月儿组的ROC曲线见图1C,AUROC为0.795(P<0.05),C-HNNE的界限分为29.25分(敏感度81.8%,特异度75.0%)。各子量表的AUROC在0.384~0.784,其中运动子量表对于GMs评分具有一定的预测价值(P<0.05),见表8。由于国内没有进行常模的制定,参考国外足月儿的最优分数,总分取30.50分时,其敏感度为68.2%,特异度为75.0%。
2.5 效度分析 早期早产儿组C-HNNE得分与矫正4月龄GMs评分结果显著相关(r=0.550,P<0.01);在C-HNNE各子量表中,姿势与肌张力和运动与矫正4月龄GMs评分结果均显著相关(均P<0.01),见表9。
中晚期早产儿组C-HNNE得分与矫正4月龄GMs评分结果显著相关(r=0.483,P<0.01);在C-HNNE各子量表中,姿势与肌张力、反射、异常体征/模式得分与矫正4月龄GMs评分结果均相关(均P<0.05),见表9。
足月儿组C-HNNE得分与矫正4月龄GMs评分结果显著相关(r=0.473,P<0.01);在C-HNNE各子量表中,姿势与肌张力和运动得分与矫正4月龄GMs评分结果均相关(均P<0.05),见表9。
2.6 C-HNNE对新生儿神经运动发育结局的预测性 C-HNNE预测新生儿矫正4月龄神经运动发育结局的敏感度为82.9%,特异度为70.4%,阳性预测值为58.0%,阴性预测值为89.3%,见表10。
3 讨论
早产是引起神经发育障碍最重要的风险因素之一[14]。研究报道,早产儿中约25.2%后期会发生轻度神经发育障碍,10.9%会发生中至重度神经发育障碍,且发病率随着出生胎龄的降低而增高[15]。本研究纳入早期早产儿、中晚期早产儿及足月儿114例,各组 C-HNNE 得分的中位数分别为22.25、24.50、30.50分,在矫正4月龄的GMs检查中,出现F-分别为46.7%、28.3%、26.7%。结果显示,随着出生胎龄的降低,C-HNNE 的得分越低,其后续GMs出现F-的可能性越高,这与国外相关研究相似[4,15]。本研究参考HNNE原版最优分数的制定过程,主要依据出生胎龄对低危新生儿进行分组并纳入研究。但早产常伴随低出生体重,由于宫内储备不足,该类新生儿体重低、胎龄小,胃肠道发育尚不成熟,难以依靠自身从外界获得足够的营养,易出现生长迟缓、中枢神经系统发育滞后等各种并发症。这提示在后续的研究中需要针对出生体重进行分组研究。
HNNE是一种可靠、简便、经济、省时的早期神经发育学检查工具,国外研究证实其对预测新生儿神经发育方面有价值[16-19]。在本研究中,各组C-HNNE评分者ICC值均在0.7以上,表现出良好的评分者信度。George等[20]的研究中,早产儿和足月儿HNNE总分的评分者信度分别为0.94与0.99,本研究结果与其相似。本研究中C-HNNE部分子量表间隔48 h重测信度偏低,分析其外部原因可能为:(1)前后2次评估所处的环境难以完全保持一致,无法避免周围灯光刺激、监护仪报警刺激以及评估者人脸对新生儿注意力的分散,这可能造成与追视、追听有关子量表的偏差;(2)新生儿评估时的活跃状态无法保持一致,新生儿尚未形成规律的睡眠与觉醒周期,且大脑中髓鞘形成尚不完全,神经冲动易于泛化,即使在觉醒状态下,也可能处于高活跃或低活跃的状态,这对与自发运动数量和质量有关的子量表造成较大影响;(3)早产儿相对于足月儿,其兴奋性更高、自我调节能力更差、受到周围环境影响时激惹性更高,更难安慰,这会引起与定向力和行为有关子量表的偏差。从C-HNNE条目设计角度出发:(1)反射子量表编入了各种具有明确出现时间的原始反射,通过描绘这些神经学特征,可以显示早产儿神经系统随着发育而不断成熟的过程。若在某些原始反射开始出现的时间内进行间隔评估,其得分会出现波动;(2)C-HNNE采用五分制法对每个条目的反应从最低到最高进行评分,相较于二分制法的有或无,五分制法使得每个反应的中间状态也可以被准确定义并识别。无论是早产儿还是足月儿,出生后其神经系统的结构与功能仍处于快速发展时期[3]。随着时间的推移,婴儿的功能也是处于动态的、不断进步的状态,其每个子量表的得分也会呈现增高趋势。因此本研究中C-HNNE的重测信度偏低,并不能说明其可靠性低,在未来的研究中应针对不同出生胎龄的新生儿进行分组,缩短2次评估之间的时间间隔以及增加样本量来进一步探索C-HNNE的重测信度。
本研究结果显示,早期早产儿与足月儿组的 C-HNNE 总分及子量表中的姿势与肌张力、运动与矫正4月龄GMs评分具有显著相关性。这可能是由于神经系统在正常的发育过程中会自发产生各种各样的运动模式,如全身性运动、单独肢体运动、牵伸运动等,这些最早出现在妊娠9~12周,无论何时出生,这些运动模式不会改变,并在出生后持续存在。而早产及早产并发症会中断或损害神经系统的发育,如皮质脊髓束和网状脊髓束受损会影响GMs的数量和质量,继而在后续GMs的扭转阶段或不安运动阶段出现异常结果[21]。
本研究中中晚期早产儿组C-HNNE总分与子量表中的反射、异常体征/模式与矫正4月龄GMs评分具有显著相关性。这与George等[7]的研究结果一致,该研究在颅脑磁共振成像深灰质评分和GMs评分基础上增加早期反射评估,加强了对矫正24月龄时运动发育的预测性。Huf等[5]也发现,HNNE的反射子量表对早产儿矫正12月龄时认知损害的预测具有较高的敏感性(敏感度85.7%,特异度58.2%)。
由于种族、地理位置、经济发达程度和医疗水平之间的差异,英国原版HNNE的最优分数不一定适用于中国婴儿,且原版HNNE仅有针对足月儿的最优分数。针对上述问题,本研究采用ROC曲线分析,得出早期早产儿、中晚期早产儿及足月儿组C-HNNE最优分数分别为22.25分、25.25分、29.25分,其预测新生儿矫正4月龄神经运动发育结局的敏感性最高。在足月儿组,当最优分数取29.25分时,敏感为81.8%,特异度为75.0%;参考HNNE原版中足月儿的最优分数取30.5分时,其敏感度为68.2%,特异度为75.0%,原版最优分数不适用于中国婴儿。通过使用上述最优分数,C-HNNE预测新生儿矫正4月龄神经运动发育结局的敏感度为82.9%,特异度为70.4%,阳性预测值为58.0%,阴性预测值为89.3%。国外研究中,HNNE在早产儿中应用的敏感度为57%~86%,特异度为45%~83%;足月儿中的敏感度为68%~96%,特异度为52%~97%,本研究结果与国外研究相似[22-25]。
综上,C-HNNE的信度和效度良好,具有方便、省时、经济的特点,不受特殊设备与场地的限制,且与神经影像学也表现出一定的相关性,可作为床旁常规检查工具使用。通过婴儿C-HNNE各子量表的得分情况,还可帮助小儿神经内科、儿童康复科等科室制定相应的早期干预计划。在基层医院或医疗资源受限的地区,颅脑磁共振成像无法成为新生儿出生后的普查项目,通过结合C-HNNE 与临床特征,可筛选出需要密切关注或转诊的婴儿。
本研究由于随访时间的限制,在矫正4月龄时未能完全评估婴儿的语言、社会交往、认知等领域的发展,无法进一步探究C-HNNE对于上述能区发育的预测性。样本的选取仅来自一家医院,也限制了研究结果的普适性。未来的工作可以评估新生儿随着时间的推移其C-HNNE 的评分轨迹和最优分数,并在全国范围开展多中心研究确立适合中国婴儿的常模,以期为C-HNNE在国内的推广使用提供更多的依据。
作者贡献声明:李翌鸣:试验设计、数据收集、数据分析、文章撰写;李庆红:试验设计、数据收集;段仕涛、李威、钟增泉、黄明杰:数据收集、数据整理;吕智海:试验设计、研究指导、论文审阅、经费支持
参考文献略
作者单位: