AI和高性能计算,如何赋予医疗创新“超能力”? | 榕汇 X NVIDIA初创加速计划
变革医疗行业,革新人们的生活。
NVIDIA在人工智能和加速计算领域的创新研究成果,正在改变多个万亿美元级行业,其中就包括关乎人类命运与福祉的医疗健康行业。
“AI正在学习生物学和化学,正如AI已经学习了理解图像、声音和语言”。在今年的NVIDIA GTC大会中,黄仁勋分享了如何与广泛的生态系统合作来推进医疗和药物研发的进程,从而拯救生命,甚至帮助拯救我们的地球。
今天,NVIDIA正为全球领先的医疗机构提供先进工具,并帮助影像分析、科学研究和药物研发等领域实现加速。
近期,高榕资本榕汇联合NVIDIA初创加速计划,共同举办医疗创新线上研讨,与高榕投资医疗创新企业以及NVIDIA初创加速计划成员,一同围绕AI和高性能计算如何加速医疗行业创新展开对话。

读懂NVIDIA医疗领域创新布局

AI加速医疗创新前景
赵文雄 NVIDIA医疗行业销售总监
医疗健康行业数据量占全球数据量的30%,且2020-2025年将保持36%的年均复合增长率。目前医疗领域仍面临医疗水平与效率参差、药物研发速度慢等困局。不断攀升的数据量与行业巨大的需求,共同推进AI在医疗与生命科学领域的应用与落地。

就医疗行业创新趋势来看,我们看到**数字生物学正在革新,进化为信息科学。**一方面,随着全基因组测序成本降到1000美金以下,基因测序市场迎来爆发拐点,可以应用在基因组装、群体测序、变体识别、精准医疗等方向。药物研发方面,从前端靶点发现,到化合物筛选、临床前试验、临床试验,都可以利用AI和数据驱动的方式帮助加速开发。
医疗设备领域,小型化、便携化、可移动是大势所趋,每台医疗设备都将是一个边缘端的AI终端。此外从医疗设备的商业化角度,未来绝不只是卖设备,甚至可以像SaaS公司一样,通过软件方式持续交付和销售。值得关注的细分领域包括手术机器人、内窥镜、超声、诊断成像、放射治疗、显微镜等。在这些领域共有16000家医疗器械品牌、超过200万设备在全球运行,这将是一个广阔的市场。
NVIDIA自2018年推出专门针对医疗场景的NVIDIA Clara平台,目前已经在**"模型训练-模型-应用-AI边缘计算平台"**的重要节点上完成了布局。

AI训练方面,已推出世界上最先进的医疗AI开源框架MONAI,以及利用联邦学习机制解决医疗领域数据隐私问题的NVIDIA Flare。
此外,NVIDIA已推出超过40个医疗行业预训练模型,涵盖影像、药物发现、NLP和计算机视觉四大领域,其中包括BioMegatron以及与阿斯利康合作的MegaMolBart。MegaMolBART主要用于反应预测、分子优化和分子生成,实现了高正确性和特殊性的分子生成。
应用角度,推出基因组分析工具套件Clara Parabricks。不久前,NVIDIA与斯坦福大学、牛津纳米孔公司等合作伙伴一同发布研究,基于Clara Parabricks,开发了名为"UNAP"的第三代基因测序AI工作流程工具,可以在短短7小时18分钟内表征致病变异。
面向医疗设备,NVIDIA推出医疗设备AI计算平台Clara Holoscan,包含医疗级别的软、硬件,Clara Holoscon基于Orin这一在自动驾驶领域取得巨大成功的模块,用于医疗设备的实时分析。2022年,NVIDIA发布Clara Holoscan MGX,这是一个可供医疗设备行业在边缘开发和部署实时AI应用的平台,通过处理高吞吐量数据流来提供实时洞见,将最新的传感器创新带到了边缘计算,此外为医疗设备行业提供软件即服务业务模式。

2021年7月,NVIDIA与合作伙伴推出英国最强大的超级计算机Cambridge-1,拥有80个DGX A100系统,凝聚了NVIDIA在加速计算、AI和生命科学领域数十年的工作成果,研究人员和科学家可以利用其进行药物研发工作。在国内也能看到类似的趋势,即政府主导建立公共药物研发平台,赋能当地企业利用公共算力加速药物研发。

NVIDIA计算平台在医疗初创
生态应用实践与启示
张天静 NVIDIA资深开发者关系经理
在医疗设备与生命科学行业,目前已经有一批全球前沿企业利用NVIDIA计算平台实现研发加速。
工业界级别大规模基因测序分析 | UK Biobank 再生元遗传学研究中心(Regeneron Genetics Center)与英国生物样本库(UK Biobank)合作,采用Clara Parabricks对所有生物库参与者的外显子组进行测序和分析。在DNAnexus平台上使用Clara Parabricks有助于减少这种基因组分析的时间和成本,基于8张V100 GPU在5分钟内就能完成在32-vCPU机器上需要花费一小时计算的全外显子组分析,同时也能降低大约40%的成本。
使用GNN进行药物分子特征预测 | Absci 药物研发公司Absci依靠NVIDIA A100 GPU运行优化过的图形和转换器内核并使用该内核加速神经网络。Absci的机器学习模型能够预测曲妥珠单抗的各种变体如何与目标结合,另一个模型可以衡量可开发性,即候选药物在测试和临床开发中取得成功的可能。
AI赋能外科手术 | Kaliber Labs
在关节镜手术中,Kaliber Labs构建了解析内窥镜视频的AI模型,帮助外科医生高水平地进行手术,降低手术当中的可变性。使用Clara AGX将模型性能提高5倍以上,并可以对视频进行实时解析。
高通量数字化血液细胞分析 | Scopio Lab
以色列医疗技术公司Scopio Lab原本每年在显微镜上手动分析超过6亿份外周血涂片。利用NVIDIA企业级GPU,开发了大规模目标监测模型,以最高分辨率扫描样本,将分析效率提高60%,帮助医生快速基于血液进行疾病早诊。
随着AI和高性能计算在医疗初创生态应用的不断深化,行业中也涌现新的趋势。
首先,医疗设备行业实时分析需求正在井喷,值得关注的应用包括4K 3D内窥镜、基于手术机器人行业的AI应用、有底层系统级设计能力的手持超声、手术显微镜、血管机/放疗设备国产替代等。
第二,生命科学行业AI关注度不断提升,其中值得关注的创新力量包括给药企提供实际低代码服务能力的AI制药软件、拥有HPC/AI能力的干湿结合能力及优异管线的biotech、差异化CRO/CDMO、AI及实验室自动化在合成生物学的应用,以及单细胞测序平台。

对于人工智能赋能医疗的角色,本质上是将自然语言处理、计算机视觉等方向的成熟技术应用于行业。初创企业需要提高对TensorRT、Triton、Jetson、CUDA等方向的技术认知和实践。惊艳的初创价值往往在于深耕医药行业,DL技术栈可以靠资金、时间弥补。
此外,医疗开发者社区兴起,医学影像行业已有数个知名开发者社区,医药行业开源社区氛围逐渐在形成。
回顾NVIDIA成长史,对初创企业也可以提供若干启示。
首先,要深刻理解自己的商业模式,NVIDIA一直坚持在industry AI领域用软件去定义计算平台,不断拓展行业的边界。其次,明确自己的能力边界。NVIDIA在人工智能时代选择去赋能行业,而不是下场比赛。例如医疗行业采取不拿注册证、只做行业SDK和计算平台的战略,与医疗初创形成真正意义的行业互补。最后,不忘初心。这也是NVIDIA打造初创加速计划的原因,敬畏创业者并与他们一起成长。


迈向商业化之路

AI+医疗商业化破局3大关键点
杨昆 高榕资本合伙人
2018年以来,高榕积极布局专业医疗赛道,目前已成为中国医疗投资行业的重要参与方之一。我们积极看好医疗健康与前沿技术的结合,高榕多家被投企业正在利用AI、加速计算等技术,推进医疗健康界关键问题的解决,已经应用在新药研发、影像、基因检测与编辑、健康管理、医疗信息化、蛋白质组学等方向。未来从产业链和临床应用方向看,AI还将在更多医疗场景落地。
未来AI和医疗的结合,有潜力贯穿产业链的各个角度。 今天已经有国内影像类AI产品率先获得NMPA 三类证批准,开始商业化之路;AI制药也方兴未艾,不断改写药物发现和开发过程。
新技术往往在启动商业化之路的时候,它的真正挑战刚刚开始。如何实现AI+医疗的商业化破局?我们认为有三个关键点。
关键1:数据 AI医疗商业化的数据面临合法性、规范性、持续性等问题。合法性上,需要政府推动医疗数据互通,商业机构与医疗机构进行数据共享,保证数据安全;持续性上,除了人工收集,也可以打通智能化的数据端口,同时必须始终关注合规性;规范性方面,需要关注行业标准、临床规范,拓展采集端口,有效进行样本处理。
关键2:团队和商业模式 需要思考:聚焦哪个产业环节?例如是新药开发、临床试验、生产工艺还是医疗服务,定位不一样,团队的组成和方向就不一样。做一家产品公司还是服务公司?产品公司未来就以产品为估值依据,服务公司考验能否连续输出创新。需要什么样的团队?包括如何让AI和医疗两拨团队更加有效对话与沟通,同时要在公司内部资源分配上有战略性考量。
关键3:支付 从产品定位上,是消费类产品还是医疗类产品?支付端,未来是走医保、商业保险还是自费?临床方面,需要打磨临床的差异化竞争优势,如果想收取一定的费用,临床依据在哪里?能不能从健康经济学维度算一笔账来证明用AI的方式就是比传统手段更省钱、更有效?
今天我们很高兴看到AI+医疗的生态已经初步建立,未来需要各类参与方一同搭建产业生态,共同面向未被满足的临床和产业需求。

研讨:医疗创新力量如何利用AI和计算加速研发

未知君:加速微生物药物研发
胡双威 未知君人工智能高级总监
未知君致力于肠道微生物AI制药,是目前行业中唯一实现FMT(肠菌移植)、配方菌、基因工程微生物、菌衍生分子四大微生物药物形态研发的企业。四种微生物药物形态的背后,都有一个统一的逻辑:向微生物亿万年演化学习。
未知君将人工智能与肠道微生物技术相结合,实现数据高质量分析、沉淀与产出,提高了药物开发的效率和成功率。
在微生物的分析中,大家关注菌和菌之间的关系,以及和代谢物之间的关系,进而去看和疾病的关系。面对维度高、相互作用形式难以统一计算的问题,未知君开发预训练语言模型,描述微生物群落里菌和菌之间复杂高阶的关联关系。目前,在下游任务上相对传统的机器学习有比较好的提升。同时预训练模型也有很好的迁移价值,在不同的疾病上都可以共享这一底层数据设施,有助于对配方菌的不同管线进行并行推进。
在比菌更细的粒度上,我们也从蛋白质角度来理解微生物。在典型的宏基因组分析中,蛋白质功能注释是限速步骤,需要优化其计算速度;同时对远程同源性建模欠缺。目前未知君单样本宏基因组分析平均处理时间从去年年初48小时降低到9到12个小时,并夯实并发能力,总体成本较行业里平均水准能够低5到10倍。在此基础上,我们正在尝试使用蛋白质序列预训练语言模型和图神经网络相结合的方式,来同时提升功能注释的速度和能力。速度提升方面,不再需要在很大的reference database里做相似性搜索,改为模型预测计算。能力提升方面,深度学习模型体现了很好的泛化能力,有助于扩大对远程同源性的搜索能力,提升宏基因组分析的全面性。

齐碳科技:助推纳米孔
基因测序技术飞速发展
卓远 齐碳科技算法研发总监
齐碳是国内首家自主研发纳米孔基因测序仪,成功研发出原理样机、工程样机、产品样机及商业化产品的高科技企业,于2021年推出了国内首台实现量产的纳米孔基因测序仪QNome-3841,目前这台测序仪已经面向市场发售,并陆续交付使用。纳米孔基因测序是最新一代商业化的基因测序技术,它有一个很大的特点就是和AI有非常强的关联,需要深化芯片和AI技术的耦合。
纳米孔非常微观,涉及大量数据分析、数据挖掘以及理论模型求解等算法工作。也因是多专业耦合,算法是最后一个环节,有一个环节变化都会影响到最终的结果,需要针对系统变化不断进行验证和分析,因此需要强大的AI技术和计算能力作为支撑。
在实际算法工作中,我们针对纳米孔信号开发了更适合的主干网络、解码器,并在轻量化方面做了比较多的工作。目前使用10兆以下的小模型就可以实现95%以上的测序准确率。

MemVerge:大内存软件
助力医疗行业
陈明 MemVerge中国区业务负责人
MemVerge专注大内存计算领域,开发了业界首个、目前也是业界唯一的大内存软件。大内存计算是持久内存硬件和大内存软件技术的结合,其特点是使内存容量更加充足、具有持久性且高度可用,让所有应用程序都将能在内存中运行。
医疗行业(包括单细胞测序、单细胞基因分析、基因组装、新药研发等)对内存资源容量以及内存数据访问性能、持久化、高可靠有强烈诉求,除了需要NVIDIA这种高性能计算平台,实际上对内存也是非常敏感的。
MemVerge在中国区第一个成功落地的项目就是应用于单细胞测序领域的数据分析,为单主机或者多主机供给融合和持久化的内存资源来消除磁盘I/O。未来MemVerge希望将基础设施革命性的技术和价值通过医疗健康行业的合作伙伴,把价值传递到最终用户。
NVIDIA初创加速计划
NVIDIA初创加速计划是NVIDIA提供的加速创业公司发展的全球生态项目,该项目培养尖端的创新企业,为各个行业带来革命性的变化。该计划联合了国内外知名的风投机构、创业孵化器、创业加速器、行业合作伙伴以及科技创业媒体等,打造创新创业加速生态系统,为成员提供产品折扣、市场宣传、技术支持、融资平台、客户推荐等一系列服务,帮助公司快速发展。

向下滑动查看




