当前位置:首页 > 详细信息
同济大学林思劼团队创新发展了一种基于深度学习的斑马鱼仔鱼形态分析方法DLMA
作者:CZRC 发布时间:2023/4/6 9:00:00
在以斑马鱼为模式生物的毒理学研究过程中,形态分析(morphometric analysis)是快速筛查新污染物、化学品、药品等物质对生物造成异常影响过程或探究致病机理的重要分析手段。除胚胎致死率和孵化率外,污染物对斑马鱼幼鱼所产生的多种毒性终点和亚致死影响等是探索该物质毒性作用模式的有效途径。
近日,同济大学林思劼团队在Environmental Science & Technology上在线发表了题为“Deep Learning-Enabled Morphometric Analysis for Toxicity Screening Using Zebrafish Larvae”的科学论文。该研究创新发展了一种基于深度学习的斑马鱼仔鱼形态分析方法(Deep Learning-enabled Morphometric Analysis,DLMA),该方法基于高通量筛选(High Throughput Screening, HTS)和深度学习技术实现客观且高效地分析毒性物质对斑马鱼幼鱼生长发育的影响(图1)。
图1 DLMA工作流程
图1 DLMA工作流程
研究选用包括重金属、内分泌干扰物以及代表性新污染物等九种化学物质(PFOS,BPA,CdCl2,PbI2,APAP,27-DBCZ,36-DBCZ,3-BCZ,1368-TBCZ)进行斑马鱼胚胎的暴露实验,并采用自动化成像装置(EVOS M5000, Thermo Fisher Scientific)采集并构建了超过2500张具有最普遍代表性的仔鱼(120 hours post-fertilization)表型畸形数据库。随后,利用AI辅助标注Labelbox对其中1328张图像标注了具有16种类别的实例,其中包括8种经典畸形形貌:头部出血、下颚畸形、鱼鳔未膨起、心包水肿、卵黄囊水肿、脊柱弯曲、死亡和未孵化;以及8种重要器官:眼睛、下颚、卵黄囊、心脏、头部、脊柱、鱼鳔和尾部。研究基于两种深度学习视觉模型,Mask R-CNN和TensorMask,以Res-Net 50/101为主干网络,对上述数据集在开源深度学习目标检测框架Detectron2上进行训练并优化,经过3万次迭代得到的预训练模型的全类平均准确率(mAP,mean average precision)高于95%。与传统机器学习模型相比,基于Mask R-CNN建立的DLMA方法能够同时处理斑马鱼仔鱼的畸形检测和分类以及重要器官的语义分割,因此在对上述16种类别进行分类和检测的同时,能够实现对每个类别的精确分割,得到每个重要器官的量化数据(如眼睛大小,心包面积等),其检测速率利用NVIDIA RTX 2080 GPU能够达到13 FPS(0.075s每张)。此外,该方法分别在未训练过的120 hpf的斑马鱼图像(1080张)和公开数据集斑马鱼仔鱼图像(870张)进行了统计学验证,分别达到了93%和86%的正确率,且量化数据的误差均低于10%(图2)。
图2 模型训练,器官分类和量化参数
图2 模型训练,器官分类和量化参数
该方法的建立还使构建物质种类与畸形表型和重要器官受影响程度的构效关系成为可能(图3)。研究发现APAP和PbI2分别诱导产生了色素缺失和头部出血,被单独分为一簇;BPA和PFOS两种内分泌污染物产生了明显的发育延迟效应,被分为一个子簇;PHCZs(polyhalogenated carbazoles)系列化学物质由于具有与二恶英(TCDD)类似的化学结构而产生了相似的心脏毒性效应,诱导产生了明显的心包水肿畸形,包括3-BCZ、27-DBCZ、36-DBCZ和1368-TBCZ等四种新污染物被分类在一个父簇之下。
图3 化学物质与表型终点之间联系的关系图
图3 化学物质与表型终点之间联系的关系图
这项研究通过发展DLMA分析方法和实例验证了深度学习在传统毒理学筛选领域的应用潜力,结合人工智能领域的技术有助于加速环境毒理学研究的进展。考虑到大量层出不穷的人工化学品和新污染物种类,利用深度学习及其他自动化装置构建筛选和评估物质毒性的自动化平台具有重大意义。DLMA工作流程能够作为高通量分析的基础框架,推动构建一个可以快速评估并预测新污染物毒性作用的环境健康评价系统,从而更好地了解化学物质对环境和生物健康的影响,并制定更恰当的管控治理策略。
同济大学环境科学与工程学院硕士研究生董公卿为该论文的第一作者,同济大学环境科学与工程学院林思劼教授为该论文的通讯作者。本研究获得了国家自然科学基金(No. 21777116;No.22176150)和中央高校基本科研业务费专项资金等项目的资助。