烧了那么多钱,还是不知道怎么做AI辅助诊断
这篇文章探讨了AI辅助诊断在医疗领域的应用现状及其面临的挑战。作者指出,尽管AI技术在辅助诊断中展现出巨大潜力,但其成功实施不仅依赖于技术复杂性,更需要结合循证医学和临床观点。
人工智能医疗设备就像将新药推向市场一样。
首先,两者都必须在“临床实验环境”中开发。然后,进行严格的功效和安全性测试。
最后,必须说服医生使用该产品并说服医院对其进行付费。沿着这条道路,绝大多数表面上有前途的药物都失败了,因为商业成功的门槛很高。对于AI辅助诊断来说,这个赛道跟医疗器械和药品没有什么不同。
也是为什么辅助诊断产品一开始就用试用为主,满意才付费的商业路径了。
然而,在很多峰会的讨论中,我们过多地关注了辅助诊断的技术复杂性,而不是成功实施所需的内容。
医疗领域很复杂,产品开发决策应根据现实环境进行定制,而不是针对不同用例设计的现有算法。
这种技术硬塞可能是 Ai辅助诊断成功案例稀少的原因之一。为了弥补这一差距,仍然缺乏的是采用循证医学概念和临床观点来部署 Ai辅助诊断。没有它们,那我们可能永远不会看到医疗实践发生有意义的变化。
在这篇文章中,我通过Optellum的技术总监Timor的交流来聊聊。以及其人工智能 (AI) 心脏成像产品“基于计算机断层扫描的血流储备分数”为案例。
在美国,每年有超过 870 万名患者接受 CAD 筛查,这是一种可能危及生命的疾病。对于可预测发生胸痛(稳定型心绞痛)的患者,心脏病专家将选择非侵入性筛查以确定通向心脏的动脉是否存在阻塞(心肌缺血)。
发现堵塞的最佳方法是插入导管来测量血流量,但这是一种侵入性且存在潜在风险的操作。因此,首先采用非侵入性筛查来识别可能的 CAD 病例。根据检查结果,医生可以:
1) 监测患者
(2) 通过药物治疗寻求最佳治疗,
(3) 使用侵入性导管插入术确认非侵入性结果,和/或
(4) 进行血运重建手术例如经皮冠状动脉介入治疗(PCI)。
非侵入性筛查有多种选择。传统上,心脏病专家使用运动压力测试。然而,最近,由于整体诊断准确性的提高,心脏血管成像技术越来越受欢迎。其中一种成像技术是计算机断层扫描血管造影 (CCTA),这是一种可以生成详细的动脉 3D 图像的诊断测试。
Optellum的人工智能 (AI) 心脏成像产品是通过使用 AI 解释计算机断层扫描收集的图像来改进对稳定的疑似冠状动脉疾病 (CAD) 的无创筛查,我们统称为FFRCT。
FFRCT 建立在 CCTA 筛查的基础上,通过使用根据高质量 CCTA 图像模拟冠状动脉血流的生理模拟技术来估计通过血管的血流(即血流储备分数 (FFR))。
而FFRCT 商业路径是这样的通过订购Optellum进行异地分析 CCTA 的额外费用,可以为临床医生提供更完整、更准确的信息以供诊治方案。替代成像技术包括正电子发射断层扫描 (PET) 和单光子发射计算机断层扫描 (SPECT)。但是,必须订购 CCTA 才能使用 FFRCT。
以下的案例是Optellum前期赞助了某一些医院而得出来有关诊断准确性、临床终点和成本效益的高质量数据证据。
Optellum的产品已纳入现行 CAD 临床指南,并由医保报销。尽管美国医疗保健范例越来越接受 FFRCT,但我们发现,目前的证据并不支持在CCTA 之上广泛采用 FFRCT 来治疗稳定的疑似 CAD 患者。
诊断证据未能证明 FFRCT 相对于其他成像方法的优越性,而临床证据也未能清楚证明将 FFRCT 添加到临床实践中的直接效果,部分原因是试验设计的限制。
一般来说,辅助诊断有两大要点。首先,精确定义设备最适合的服务对象是至关重要。这需要仔细考虑诊所数据采集的技术限制以及设备在医疗管道中的首选位置。其次,对于目标患者,应该进行随机、对照良好的试验来明确确定 MAMD 的影响。相比之下,大型、务实的试验可能无法给出明确的答案。
也就是说,固定的设备对应固定的对象,面对随机的实验,出来的效果不能直接说明受FFRCT的影响。
临床证据不足。
临床证据是证明我们治疗患者方式的任何拟议改变值得做的基础;理论上可行的方法在实践中可能行不通。就筛查而言,主要的责任有两个:
1)所提出的方法比其他方法更准确,2)所提供的信息有助于医生为患者做出更好的或至少更具成本效益的决策与护理标准相比。诊断性能数据回答了第一个问题,而良好对照的临床试验回答了第二个问题。
这种区别至关重要。
但就AI辅助诊断而言却常常被忽视。出色的预测性能并不意味着临床有效性,这才是最致命的。Optellum为同行提供了三个建议,希望能用的到。
首先,重要的是确保要分析的数据在实践中可以合理获得,就是说明前期免费送给医院试用这个条路必须走。
AI辅助诊断的开发人员应明确说明哪些患者和医疗中心可以实际使用他们的设备,还要为产品迭代制定了明确的后续步骤。在
Optellum的时间经验说明,能否访问 FFRCT 取决于中心是否配备适当的技术规格来持续生成高质量的 CCTA 图像。这就引出了一个问题:与功能测试相比,医院需要多少投资才能确保 FFRCT 的顺利进行?与其他替代方案相比,即使筛查可能失败,医生也会在实施的过程中必须对因 CCTA 导致辐射增加的患者接受度。在什么情况下患者值得接受这样的辐射程度?
其次,为了清楚地证明临床效果,必须在医疗实践中使用随机研究对 其进行检验。有效果不仅包括临床结果,还包括成本效益、利用率和卫生系统的负担。这样,即使医疗结果没有改善,也可以证明成本效益和临床效率的好处。
从产品的角度来看,对重点人群进行良好对照的试验比大型、差异大的实用试验要好得多,因为在大型、差异大的实用试验中很难将因果关系归因于AI辅助诊断影响的结果。
最后,就是当前的定价模型。Optellum选择了由保险公司报销的按使用价格模型。这是否是软件的最佳定价模型尚不清楚。
例如,如果 FFRCT 筛查失败该怎么办?与医保报销的每次使用模式相反,筛查中心的Saas模式可能更合适。AI辅助诊断最好封装在一个总体平台中,直接出售给医院,前提是它们可以提高效率并节省成本。采购方在订阅场景中的角色尚不清楚,我认为需要制定新的政策才能推动。
跟Timor交流完后,能感受到的是产品与市场的契合度更多的是在于是否易于集成到当前的临床工作流程,而不是基础技术的复杂性。
因此,产品决策应注重实用性和易于证明有效性。这涉及到数据科学家、统计学家、临床医生、采购方、患者和医疗政策制定者之间的利益和激励措施的协调,我们是很难执行这一点。
本文由人人都是产品经理作者【罗福如】,微信公众号:【罗福如】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!