2020年1月,当医生们在努力治疗首批新冠病毒患者时,BenevolentAI的数据科学家和生化学家转向了人工智能,寻找一种可以帮助他们的药物。
对于这种新病毒如何运作,研究人员只有很少的线索。他们将这些数据输入自己的算法,让它在短短几小时内搜索5000万篇医学期刊文章。科学家和算法一起加深了他们对药物应该针对哪些生物通路的理解,并寻找已批准的药物来重新利用。
在短短四天内,他们把范围缩小到巴利西替尼(baricitinib)。这种美国礼来公司(Eli Lilly)通常用于治疗风湿性关节炎的药物可以同时治疗病毒和身体的炎症反应。这是人工智能首次发现一种可以重新利用的药物,然后被广泛使用。
这家总部位于伦敦的初创公司的药理学副总裁彼得·理查森(Peter Richardson)表示,人工智能对这种药物如何对抗新冠病毒的预测——从其生物机制到抗病毒效果——现在已经得到了验证。世界卫生组织强烈建议使用巴利西替尼治疗严重的新冠肺炎,而英国的康复试验——一项针对该病毒治疗方法的全国性研究——发现它能显著降低死亡率。
理查森说:“这一切都在两年内实现。这是令人惊讶的。”
一种药物从最初的发现阶段到获得批准,平均需要10年时间,而且由于失败率很高,制药业估计,每一种药物的上市成本为27亿美元。临床试验占据了大部分时间和成本,但发现和临床前试验仍然需要三到四年的时间。
在大流行期间,人工智能主要被用作节省科学家时间的工具,加速这一以缓慢著称的发现过程,同时经常使用为类似病毒(如Mers)设计的药物和疫苗作为起点。
但人工智能的支持者认为,危机期间人工智能的广泛应用,只是一场药物发现革命的开始。这场革命将利用生物和化学数据、计算能力和更智能算法的增长,从而降低不断飙升的医疗费用,并为我们的疾病创造此前不存在的治疗方法。
他们认为,人工智能在这场危机中证明了自己。AbCellera在三天时间里筛选了600万个细胞,找到了一种可以大规模生产的抗体——这是由礼来公司生产的——这种名为bamlanivimab的药物已经帮助了超过100万名新冠患者。一台超级计算机帮助辉瑞公司寻找一种可以口服的抗病毒药物。
虽然人工智能没有设计Covid疫苗,但它对它们进行了优化。Moderna的平台——该公司用于所有疫苗的技术——是从生产2万个独特的mRNA序列中学习到的,这帮助该公司在42天内设计和制造了第一批用于测试的Covid疫苗。
风险投资家认为这仅仅是个开始。PitchBook的数据显示,过去5年,用于人工智能药物研发的资金增长了3800倍,达到20亿美元,风险资本支持的初创企业已与数十家大型制药公司签署了合作伙伴关系。
投资生命科学领域人工智能公司的Air Street Capital普通合伙人内森•贝奈奇(Nathan Benaich)表示,大流行强化了制药商需要加快发现过程的想法。他表示:“这一切带来的明显好处是,由于对快速创新的明显需求,该领域的人工智能公司现在正在向制药行业推进一扇更加开放的大门。”
但是,就连贝奈奇也认为,这并没有达到大流行开始时人们膨胀的期望——而且他并不是唯一这样认为的人。
《深度医学》(Deep Medicine)是一本关于医疗领域人工智能的书,该书的作者埃里克•托波尔(Eric Topol)表示:“我认为(药物的)再利用仍然值得追求。但我们没有很多东西可以展示。在大流行中,我们肯定有一种药…但人工智能的整体理念是找到药物,并以我们从未见过的高速度进行发现。”
在监管机构批准完全由人工智能发现的药物之前,肯定会有人持怀疑态度。目前有15种由人工智能设计的候选药物正在进行临床试验,但正是因为药物开发可能需要10年以上的时间,所以要等待结果将是一个漫长的过程。
理查森说:“仍然有相当多的人不相信,认为这都是炒作。”
安全阀
随着疫情的发展,世界各地的临床医生都在寻求英国康复试验的建议,以指导他们的处方。牛津大学医学和流行病学教授马丁·兰德雷(Martin Landray)帮助开展了Covid药物的随机对照试验。但他说,在选择在病人身上测试什么时,他发现人工智能“用处不大”。
他表示:“问题是(药物发现算法)都会按照不同的顺序列出(治疗方法)的优先顺序。”他补充称,“数学原理”往往没有考虑到实用性。
康复试验的调查人员选择药物的依据是有一些证据表明它们可能有效,比如应对之前的新冠病毒或在临床前测试中证明有效。但他们也考虑了该药物是否供应充足,以及对其副作用的了解程度。
兰德雷表示,安全几乎具有人工智能难以预测的“无限维度”,远比人工智能取得的一些最大成功要复杂得多,比如在古老的manbetx3.0 游戏围棋中学会击败人类。他表示:“(人工智能在药物研发中的应用)不是试图玩围棋,而是试图玩所有被发明出来的游戏,其中有些甚至没有规则。”
在生物世界中,人工智能也可能是危险的。研究人员最近展示了他们的算法是如何在不到6小时的时间里发现4万种有毒化合物的,其中许多可以被用作生物武器。
Covid-19表明需要快速开发药物,但最初缺乏有关这种疾病的信息,这意味着它不是人工智能的完美证明点。一开始,可供算法学习的数据很少,这意味着即使是Benevolent的科学家也不得不采取一种更亲力亲为的方法——将人工智能作为一种互动工具——而不是像对待其他疾病那样。
位于硅谷的人工智能初创公司Insitro的首席执行官达芙妮•科勒(Daphne Koller)专注于药物发现,她称赞Benevolent公司证明了找到一种可以重新利用的药物是可行的,但她警告说这与发现一种全新的化合物不同。
她说:“我不喜欢随便许下什么我们将在三年内改变一切的奢侈承诺。人类生物学很难:干预可能导致人死亡的事情是一个非常危险的命题。”
另一家名字相似的人工智能初创公司Insilico设计了自己的Covid药物。这家位于香港的公司在2020年4月发表了一篇关于其发现的论文,供任何人使用。当没有人决定开发它时,该公司在同年9月自己合成了这种药物。但由于没有大型制药公司的设施,它不得不等待9个月,在一个足以处理病毒的安全实验室进行测试。而且它仍未进入人体试验阶段。
这场大流行凸显了人工智能在药物发现领域未来的两个最大障碍:使零散但日益丰富的数据变得有意义,以及改变对与人工智能合作持谨慎态度的大型制药公司的策略。
赛诺菲(Sanofi)首席科学官弗兰克·内斯特尔(Frank Nestlé)正积极拥抱人工智能。最近,他与总部位于牛津的Exscientia和医疗人工智能公司Owkin签署了两项重大协议。他说,人工智能依赖三大支柱——计算能力、算法和数据。
他补充道:“数据是最需要改进的地方,也是未来需要改变的地方。”
由于收集基因和蛋白质的序列变得更加容易和便宜,数据已经出现了爆炸。制药商拥有大量来自人类和动物试验的数据,但这些数据往往是人工智能难以消化的形式,从手写的实验笔记到Excel电子表格。
内斯特尔表示,标记这些数据需要艰苦的精确性:例如,隔夜运送的实验室样本应与其他样本区分开来,因为它们有不同的分子足迹,可能会促使算法根据运送方式而不是病人组织中的内容得出错误结论。
这样的工作需要时间。BioNTech首席执行官乌格•沙欣(Ugur Sahin)表示,这家德国生物技术公司在4年时间里使用了一种“中间人”的方法来进行机器学习,由人类帮助培训算法。“人工智能就像孩子。你必须教他们很多东西,直到他们开始得出结论,”他说。
对数据进行投资的公司已经看到了回报。2020年,辉瑞(Pfizer)无法自动筛选其拥有45亿种商业可用化合物数据的数据库之一。现在,它可以在48小时内扫描整个数据库,大大加快了它识别潜在新药的能力。
另一些人则强调雇用能够在人工智能和更传统的科学方法之间架起桥梁的员工的重要性。强生(Johnson & Johnson)的制药部门杨森(Janssen)的首席数据科学官兼研发战略主管纳贾特·汗(Najat Khan)说,它正在建立一个“双语人才”库。
她补充说:“我们的数据科学家精通机器学习、人工智能、数字健康和真实世界证据,并且对药物发现科学和医学有深刻的了解。”
但一些制药公司仍在摸索如何最好地纳入人工智能,不确定应该在新领域投资多少,以及应该在花多大力气继续推进他们目前的管道,并难以从技术公司招聘人才。
伦敦大学国王学院药物化学教授米拉兹·拉赫曼(Miraz Rahman)说,该行业曾经因为向组合化学倾注资金而被遭受重挫,这种建立化合物库的方法在最近几十年里一直很有用,但并不像承诺的那样具有变革性。
但他认为,在未来5至10年内,所有大型制药公司都将把人工智能整合到药物研发中。拉赫曼补充道:“所有数据都表明,人工智能将继续存在。如果你能成功采用人工智能,它将使发现变得更流畅,并节省三到四年的时间。”
解锁科学
Owkin首席执行官托马斯•克洛泽尔(Thomas Clozel)表示,将药物重新利用只是一种“修修补补”,人工智能的长期希望在于,它可以改变我们对疾病的理解。
“今天的人工智能还没有准备好更好地治疗病人。它已准备好加速药物研发的投资回报,”他说。“但如何扩大它呢?你什么时候才能发现制药公司失败的地方?”
他认为,真正的创新将来自于从“患者数据”中挖掘出的实证证据。Owkin建立了来自医院的数据集,并分析细胞层面的信息,以发现新的患者亚群。该公司利用计算机视觉(一种能够理解和读取图像的人工智能)来研究活组织检查,可以预测侵袭性肿瘤间皮瘤患者的存活率。间皮瘤主要影响肺部粘膜。这可能会为制药商打开开发复合药物的大门,从而提高存活率。
我们理解得越深,药物的个性化程度可能就越高。在因新冠病毒疫苗而出名之前,BioNTech专注于开发“癌症疫苗”,利用提取的肿瘤数据,定制个性化的“癌症疫苗”,引导个人的免疫系统攻击他或她自己的疾病。目前,该公司正以人工智能为核心,努力推进这项工作。
“问题是:如果每个患者都有不同的突变,我们能否构建机器学习程序,让我们能够在每个患者身上选择最佳目标?”沙欣问道。
他补充说,这是一项“极其复杂的任务”,涉及到权衡因素,包括肿瘤发生突变的可能性和免疫系统的T细胞识别突变的可能性。但他补充说,机器学习已经变得“越来越好”,现在人类干预只是为了保证质量。
其他创新可能会加速进步。去年,谷歌的DeepMind发布了一款名为Alphafold2的人工智能工具,它可以预测所有人类蛋白质的形状。通过解决这个生物学上的巨大难题,它有助于科学家了解每种蛋白质的作用以及如何改变它。制药商可以利用它来了解药物可能需要在人体的哪个部位与目标结合。DeepMind正计划这样做,成立一家新公司同构实验室(Isomorphic Labs),以“找到治疗人类最具破坏性疾病的方法”。
大型制药公司对使用这个工具很感兴趣。强生公司的汗说,由于一种棘手的蛋白质,有很多蛋白质被认为是“无药可治”的。她说:“这将解开许多以前不可能的科学之谜,并使之成为可能。”
量子计算的进步也可以大大增加可用的计算机能力,以帮助解决药物发现方面的问题。但就目前而言,人工智能可能对下一代抗疫药物和疫苗更有帮助。
这种病毒现在是有史以来最受关注的病毒之一。BioNTech已与人工智能初创公司InstaDeep合作,预测下一个高风险变异,因此其灵活的mRNA疫苗平台可以领先于它。由此产生的算法提前识别出了90%以上的担忧变种,包括奥密克戎(Omicron)毒株。AbCellera利用人工智能选择了最强大的抗体,这种抗体能够更好地抵御变异,而Exscientia希望创造一种广谱抗病毒药物,可以用来对付下一种大流行病毒,无论它最终会是什么。
Exscientia首席执行官安德鲁•霍普金斯(Andrew Hopkins)表示,随着大型制药公司对投资人工智能更感兴趣,他开始看到一种“巨变”。
他表示:“我们已经认识到了如何利用数据和算法。该行业为新冠病毒患者所做的,实际上我们应该适用于所有患者。我们迫切需要为所有患者带来所有药物。”
Madhumita Murgia伦敦补充报道