你今天早上吃的药从实验室到你的药盒经历了一条漫长的道路。首先,有广泛的实验室研究。然后是动物试验。但在一种药品被批准使用之前,它必须在人类身上进行测试--在一个昂贵的、复杂的过程中,被称为临床试验。
基础知识
在最简单的形式下,临床试验是这样的。研究人员招募患有实验性药物所针对的疾病的病人。志愿者被随机分为两组。一组得到实验药物;另一组,称为对照组,得到安慰剂(一种看起来与被测药物相同的治疗方法,但没有效果)。如果得到活性药物的病人比得到安慰剂的病人有更多的改善,这就是该药物有效的证据。
设计试验的最具挑战性的部分之一是找到足够的符合研究确切标准的志愿者。医生可能不知道有哪些试验可能适合他们的病人,而愿意参加的病人可能不具备特定试验所需的特征。但人工智能可能会使这项工作变得更容易。
认识你的双胞胎
数字双胞胎是模拟现实世界物体或系统的计算机模型。在统计学上,它们的行为几乎与它们的物理对应物相同。美国国家航空航天局(NASA)使用了阿波罗13号飞船的数字孪生体,在一个氧气罐爆炸后帮助进行维修,使地球上的工程师在20万英里外争相进行维修。
如果有足够的数据,科学家可以利用机器学习制作人的数字双胞胎,这是一种人工智能,程序从大量的数据中学习,而不是为手头的任务专门编程。临床试验中病人的数字双胞胎是通过对以前的临床试验和个别病人记录中的病人数据进行机器学习模型训练而产生的。该模型预测在试验过程中,如果他们被给予安慰剂,病人的健康状况将如何发展,本质上是为特定的病人创建一个模拟的对照组。
因此,它是如何工作的。一个人,我们叫她莎莉,被分配到获得活性药物的小组。萨利的数字孪生兄弟(计算机模型)在控制组。它预测了如果莎莉不接受治疗会发生什么。萨利对药物的反应和模型对萨利服用安慰剂后的反应的预测之间的差异,将是对治疗对萨利的有效性的估计。
还为对照组的病人创建了数字双胞胎。通过比较得到安慰剂的数字双胞胎与实际得到安慰剂的人的预测结果,研究人员可以发现模型中的任何问题,并使其更加准确。
用数字双胞胎取代或增加对照组,可以帮助病人志愿者和研究人员。大多数参加试验的人都希望得到一种新的药物,在已获批准的药物失败后可能对他们有所帮助。但是,他们有50/50的机会被归入对照组,不会得到实验性治疗。用数字双胞胎取代对照组可能意味着更多的人有机会获得实验性药物。
意想不到的事情
这项技术可能很有前途,但它还没有被广泛使用--也许是有原因的。纽约大学的Daniel Neill博士是机器学习方面的专家,包括其在医疗方面的应用。他指出,机器学习模型依赖于大量的数据,而要获得高质量的个人数据可能很困难。有关饮食和运动等方面的信息通常是自我报告的,而人们并不总是诚实的。他说,他们倾向于高估他们的运动量,低估他们吃的垃圾食品的数量。
他补充说,考虑到罕见的不良事件也可能是一个问题。"最可能的是,那些是你在对照组中没有建模的事情。" 例如,有人可能对某种药物有意外的负面反应。
但尼尔最大的担忧是,预测模型反映了他所谓的 "照常工作"。假设一个重大的意外事件--比如说像COVID-19大流行病--改变了每个人的行为模式,人们就会生病。"这是这些控制模型不会考虑到的事情,"他说。这些未曾预料到的事件,在对照组中没有得到考虑,可能会歪曲试验的结果。
斯克里普斯研究转化研究所的创始人兼主任、在医疗保健中使用数字技术的专家埃里克-托波尔认为这个想法很好,但还没有准备好进入黄金时间。"我不认为临床试验会在短期内改变,因为这需要健康记录以外的多层数据,如基因组序列、肠道微生物组、环境数据,等等。" 他预测,需要多年时间才能利用人工智能进行大规模的试验,尤其是针对一种以上的疾病。(Topol也是医生的姐妹网站Medscape的主编)。
Unlearn.AI的创始人兼首席执行官查尔斯-费舍尔博士说,收集足够的高质量数据是一个挑战,Unlearn.AI是一家为临床试验开拓数字双胞胎的创业公司。但是,他说,解决这种问题是公司长期目标的一部分。
费舍尔说,关于机器学习模型的两个最常见的担忧--隐私和偏见--已经得到了考虑。"隐私问题很简单。我们只使用已经被匿名的数据"。
当涉及到偏见时,问题并没有得到解决,但它是无关紧要的--至少对试验的结果而言,费希尔说。机器学习工具的一个有据可查的问题是,它们可以在有偏见的数据集上进行训练--例如,那些对某一特定群体代表性不足的数据。但是,Fisher说,由于试验是随机的,结果对数据中的偏见不敏感。试验根据与对照组的比较来衡量被测试的药物如何影响试验中的人,并调整模型以更接近于真实的对照组。因此,据费舍尔说,即使试验对象的选择有偏差,而且原始数据集有偏差,"我们能够设计试验,使其对这种偏差不敏感。"
尼尔认为这并不令人信服。你可以在狭义上消除随机试验中的偏差,通过调整你的模型来正确估计研究人群的治疗效果,但当你试图在研究之外进行推广时,你只会重新引入这些偏差。Unlearn.AI "不是将接受治疗的人与对照组进行比较,"Neill说。 "它是将接受治疗的人与基于模型的估计进行比较,即如果他们在对照组中,个人的结果会是什么。 这些模型中的任何错误或它们未能预测的任何事件都可能导致系统性偏差--即对治疗效果的高估或低估。
但是unlearn.AI正在开拓进取。它已经在与药物公司合作,设计神经系统疾病的试验,如阿尔茨海默氏症、帕金森症和多发性硬化症。关于这些疾病的数据比其他许多疾病的数据要多,所以它们是一个很好的开始。费舍尔说,这种方法最终可以应用于每一种疾病,大大缩短将新药推向市场的时间。
如果这项技术被证明是有用的,这些看不见的兄弟姐妹可以使病人和研究人员都受益。