从自动驾驶到疾病诊断,人工智能正在重构一个又一个行业。
“倒摩尔定律”中,医药研发的成功率每况愈下。而将AI技术引入新药研发后,似乎开辟了全新的洞天。
早在1981年,美国《财富》杂志就对计算机辅助的药物发现进行了专题报道。到了2021年,AlphaFold已可以预测完整的人类蛋白质组结构,AI正在储备着颠覆整个生命科学行业的力量。
从2012年最早与AI公司达成合作的默沙东,到2017年与Numerate合作的武田以及与Exscientia合作的赛诺菲,再到2019年与BenevolentAI合作的阿斯利康和宣布成立AI创新实验室的诺华。纵观制药巨头与AI公司的合作情况可以发现,AI+新药研发已可为“药物发现和临床前研究阶段”及“临床研究阶段”各节约50%左右的研发周期,也因此为全球每年的新药发现节约了30%左右的成本。
在此过程中,AI研发的落地场景也日趋多元,除了在药物靶点的化合物匹配中能够提高寻找药物分子的效率之外,在化合物的优化过程和临床研究后期数据的积累,甚至在临床试验患者招募的过程中,也都发挥着非常重要的作用。
2015年,中国诞生了第一家人工智能药物研发科技公司晶泰科技。此后,在资本的强力驱动之下,中国的AI制药业也拉开了自己的历史大幕。如今,从MNCs和药明康德等药企,到云深智药、百图生科等互联网巨头背景的企业,再到后劲十足的AI创企新秀们,百花齐放中,企业们正努力用技术和资源构建自己的护城河。
不过需要承认的是,中国的AI制药公司虽然享受到了资本和技术的红利,但并没有享受到市场的红利。他们仍要经历从起初只需要用独有的技术解决很小的问题,到持续性交付能力的挑战;经历从起初只需要通过大量计算模拟来获得更多虚拟数据,到后期必须构建自上而下的数据获取能力和商业模式的挑战。
01 突破降临
2021年,人工智能向生物界投下了一枚核弹。
7月,谷歌旗下的Deepmind宣布,AlphaFold2已预测出35万种蛋白质结构,涵盖了98.5%的人类蛋白质组以及20种生物的蛋白质,并开源了它的数据库。
“长久以来,蛋白折叠都是一个重要的科学命题,被称为第二半的遗传密码。第一半是由DNA到氨基酸序列,而由氨基酸到蛋白质构象目前则还没有一个相应的解。纯化蛋白质、形成晶体、X射线衍射和解析结构也需要多年的工作才能完成。”健新原力CEO李玉玲对E药经理人表示。
这一次,AlphaFold无疑为研究者们叩开了新世界的大门。
和铂医药董事长王劲松就用“人类从石器时代向铁器时代的迈进”,来形容AlphaFold的蛋白结构预测技术带来的划时代意义。这也让他在研发药物、战胜疾病的道路上倍感任重而道远。
截至目前,FDA每年获批的First-in-class新药数量在20款左右,靶点发现和候选药物开发已然成为制药行业发展的瓶颈。AlphaFold2的开源,有望给各大药企提供一个弯道超车的机会。
“如果在AlphaFold的帮助下,能够全面准确地掌握蛋白质结构,每年获批的新药将可能达到现在的2倍甚至更多,这将让更多患者受益。”臻格生物CEO陈建新表示。
根据他的推测,Deepmind把它的数据库开源后,算法精度和执行速度会得到更好提升,也许很快就能迭代出一批AlphaFold++,并在未来诞生一个“金标准”,用此算法来测定人类的蛋白质结构。
尽管AlphaFold对生命科学和生物医药领域的影响深远,但需要直面的是,目前它仅对人类蛋白质组中30%~40%的蛋白质结构完成了比较准确的预测,在这一部分,它确实能够帮助科学家更快更好地完成药物发现和筛选,但对于剩下的60~70%的蛋白质结构,AlphaFold的帮助还比较有限。
“比如对于抗体的结构预测,AlphaFold的精度就远不能达到预期。人类免疫系统可以产生1012的不同抗体。这些需要通过Deepmind和整个学术界、产业界以及开源社区来共同努力,优化迭代。”陈建新表示。
在开拓药业创始人、董事长兼CEO童友之看来,AlphaFold的应用目前会受到两个因素的限制:
一是想要确认这个计算模型解析出来的结构预测是否准确,还需要试验来验证;
二是它只能提供蛋白质的三维结构,但还不能告诉我们这个蛋白质在细胞中的功能性注解。
“未来的场景应该是,AlphaFold等计算软件在算出大致蛋白质结构基础上,再通过其他实验技术手段,更精确地了解蛋白质的作用机理和调控机制。”童友之表示。
康宁杰瑞董事长徐霆也认为,现在AI在药物,特别是小分子药物的开发过程中,对于蛋白质结构的依赖性还不是特别强。但未来5~10年内,会看到整个行业由此发生的深刻变化。
“目前,新靶点、新机制还有候选药物的开发,主要瓶颈还是在于我们对复杂疾病的了解及干预方式有限。此外,大量三维结构的运用所需的算力以及对研发人员的要求都非常高。”
根据徐霆的分析,Alphafold短期内对行业的推动主要体现在四个方面:
一是由于蛋白质结构相对精准的预测,我们可以获得大量同源蛋白的结构信息,对于蛋白质结构功能的进化和深入理解提供很大帮助;
二是可以在短时间内对于蛋白质突变做出结构模型,对于致病的突变可以找出或者快速定向筛选出小分子或者单抗药物;
三是对于AI辅助的蛋白质的定向进化和合成生物学起到极大推动作用;
四是对于蛋白质和抗体的Denovodesign(全新设计)提供指引,为AI辅助蛋白质设计提供基础和Trainingset(训练样本)。
“有这个数据库和开源为基础,蛋白质结构预测会更加精准,特别是对于单个蛋白的结构解析。但是传统的结构生物学,比如晶体衍射、冷冻电镜等不会很快退出舞台,而是会演变进化到蛋白质修饰、复合物、弱相互作用。新的技术也会出现,用来获得蛋白质在完成其功能的过程中的动态变化。”徐霆说。
李玉玲也表示,基于靶点结构的药物设计在理论上是一项可行的举措,但在真实应用中取得的成功有限。未来治疗疾病的靶向治疗药物会越来越多,那些很难表达和纯化的靶点,可能会通过AlphaFold来解决这个结构。
“我认为,新药研发最终仍然需要依靠人的能动性和创造性。”劲方医药董事长吕强指出,人工智能深入药物设计领域,已大大提升研发效率和化合物成药性。但业界更期待重磅的跨界技术成果和真实世界数据,能证明AI靶标筛选及分子设计可以沟通早期发现和转化科学,甚至超越传统开发模式的疗效和安全性。
02 “最终是没有AI”
Alphafold打开了AI在生物医药产业的想象空间。但IT与BT的结合之路上,“欲善其事”只“利其器”是不够的,“悟其道”更加重要。
晶泰科技CEO马健曾经说,一个外援性技术进入一个行业,它的增长曲线不是单纯的一条,而是好几条曲线推进,可能天花板很低,要不断提升。
而AI药物研发面对的周期是很长的,AI在药物研发中究竟该如何落地,如何产生对应的价值,对AI制药企业来说至关重要。
“AI最终应该变得没有AI,这才是未来的发展方向。”说这话的是未知君创始人谭验。
在谭验看来,生命科学过去一直被认为是实验科学,是一种单一实验的做法,会因为不同操作者而出现不同的结果。而未来,整个制药行业一定会走向更标准化的实验,或者自动化、标准化的实验流程,通量也会极大地提高。从中得到的数据,可以更好的去阐释生物学的原理。
“未来这种模式可能不能仅仅称作AI制药,而是要发展成依靠数据和高通量实验本身,来驱动生命科学的发展,也就是‘没有AI’的境界。”
谭验2015年获得美国波士顿大学生物信息与计算生物学博士学位,2017年,回国后的他创办了专注于肠道微生态治疗的AI制药公司未知君。
去年,未知君因连续两轮获得数千万美元的融资,而受到市场广泛关注。最近,公司也获得美国FDA对于其FMT(肠道菌群移植)药物IND申请的正式批准,这是中国微生态制药企业首次获美国FDA批准的IND申请,未知君的发展也正式进入临床阶段。
虽然是科学家出身,但谭验在创业之初就已明白,掌握了前沿技术,也不意味着就一定能做成公司,技术如何在国内的商业环境下落地是更值得思考的问题。
最终,谭验决定从国内尚属空白的微生物药物研发切入。这一选择,注定了未知君在药物研发上与AI密不可分的关系。
人的肠道里有500~1000种菌,随着认识的深入,这一数量还在增加。如果按传统筛药物的方法,一个一个菌株去筛选,几乎是做不到的,这也是益生菌用了上百年,却依然只有几组菌在用的原因。
“现在我们有了测序的方法,可以先不用培养,就能从数据端知道人的肠道里有哪些菌,然后通过机器学习的建模方法去推测,看哪些菌或菌的组合是跟某种疾病相关的,最后再去进行筛选。这时AI在里边就起到了一个很强的驱动性作用。”谭验表示。
如今在AI端,未知君积累了两种能力,一是多组学的数据分析能力;二是围绕序列进行的功能预测的能力。这些能力也可以迁移至现在一些很新的技术平台,所以公司对自己的定位,就是用AI去赋能新的疗法。
在此过程中,数据的获取变得很重要。
谭验承认,数据对整个AI制药行业都是一个痛点,但长期看,它可能又会是一个增长点。他自己的体会是,从创业之初到现在,随着数据增加,很多计算越来越精准,越来越有生物学意义。
未知君目前获取数据的做法是以公共数据集为基础,通过与医院的合作收集自有数据,包括病人肠道菌群移植前后的临床表现数据等;同时,通过数据分析的方法去缩小搜索的范围,推测哪些代谢产物具有治疗性的作用,然后进行药物研发。
“我们通过与医院的合作采集到的自有数据,主要是反映人的肠道微生物与它疾病相对应的情况,特别是在肿瘤病人接受PD-1的治疗上,我们在多个项目中与第三方合作,合计收集了上千个样本,这应该是全球范围内体量名列前茅的数据集之一。如果加上公用数据集,体量应该是几十万条,目前还在不断增大。”谭验称。
03 源头创新
最早的AI药物研发大多集中在小分子领域,它也是目前发展最为成熟的领域。而随着对大分子药物的研发逐渐增多,AI正在给制药行业带来新的想象力。目前,AI已全面进入RNA、免疫、基因治疗等细分领域。
焕一生物就是国内首家AI+系统免疫公司。6月,公司获得天使+轮投资,目前累计融资近千万美元。
虽然公司起步不久,但创始人文雯却对焕一的发展有着清醒的认识。“我本身是医疗和TMT投资以及互联网的跨界背景,团队有很多临床背景的同事,所以对于AI制药,我们有两个层面的目标:一是解决底层的医学问题,满足未被满足的临床需求;二是在整个商业链条里,去解决最有价值的问题。”
文雯是AI制药领域为数不多的女性创始人,行业投资人的经历也给了她看待产业不同的视角。文雯认为,目前中国生命科学研发最大的痛点,是缺乏原始创新的生态。
“很多公司希望做差异化的管线研发,可如果在靶点和机制层面没有创新的话,还是要跟着热门靶点去做分子设计,很难真正做到差异化。”
在她看来,新药研发中,最大的难点是对于复杂生物调控网络的理解,对于适应证或者精准用药人群与靶点的匹配。传统单靶点,从体外实验到动物实验这样的研发模式使药物研发人员在药物进入临床阶段之前无法判断它进入人体会有什么样的系统性反应,需要投入大量的时间和金钱去反复试错,成功率非常低。所以适应证与靶点的匹配性是最需要解决的问题。
“这一问题的解决将对药物的临床成功产生关键影响,并从源头上解决目前制药同质化的问题。结合中国的临床患者、数据优势及最前沿的AI及生物计算技术,我们有信心在源头创新获得突破。”文雯表示。
她为焕一选定的赛道是利用AI+多组学解码免疫,从生物标志物和靶点发现切入。
免疫是一个庞大的调控网络,与大多数疾病都有着紧密的联系。但免疫又是异常复杂的,无法单纯凭借人为的建模去模拟整个免疫系统与疾病和药物的互作机制。
“人做不到的事情,AI可以做到。这种数字化的趋势在航天、半导体等行业已经相当成熟,但在生物医药领域的应用还不完全。相对于在动物身上做实验,一个利用AI模拟人体数据建立数字化模型做出来的假设,经过验证进入临床阶段,效率上势必会有一个显著提升。目前,传统研发模式中,从IND到临床试验到新药获批的转化率是5%~8%。如果利用数字化模型赋能的研发模式加快假设的生成与验证,将有机会大大提升临床阶段的成功率。”文雯指出。
最近五年,数据可及性的提高让AI解码免疫成为可能。结合基因组、代谢组、蛋白质组、脂质组的多组学技术能够获取到更多维的数据,为数字化人体细胞的胞内调控打好基础。“系统性地理解某个系统的调控通路也不再只是一个概念,AI+多组学技术可以帮助我们建立更为精准的模型去探索免疫。”
而对于商业模式的探索,文雯表示,她们目前仍以科研服务和产品的联合研发为主。其中一项合作中,用AI计算出来的一组联合疗法靶点对肿瘤杀伤性的排序在体外实验和动物实验均得到了验证。
6月底,焕一生物和剂泰医药宣布达成战略合作,在自体免疫疾病领域开展差异化药物的联合研发,希望推出全球最快AI驱动研发的新形态药物。
“焕一生物来筛选靶点,剂泰进行药物递送,双方联手实现老药新用,是一个非常理想的合作方式,也会开发出全新的商业价值。”
04 数据之痛
需要承认的是,到目前为止,全球还没有一款真正意义上通过AI技术设计出的药物。大家都在期待,AI与药物研发的结合究竟能带来哪些颠覆性价值。
“AI未来需要在海量数据之下,发现隐藏于临床前研发和临床阶段研究之中的规律。”吕强指出。
数据是AI建模的基础,可在AI药物研发领域,数据亦是最大的挑战。
从上世纪80年代起,医药行业就开始呼唤AI,但直到今天仍处在探索阶段,数据就是其中重要的“卡脖子”因素。新药研发领域的数据基本掌握在药企手里,有高壁垒、高成本、高机密的特性,获取的成本十分昂贵,这也成为AI药物研发发展的一大障碍。
王劲松就指出,AI的三大核心—算法、算力和数据中,数据是相对更难解决的问题,这涉及了每家药企的核心机密、专利技术、患者隐私等一系列问题,无法轻易共享。企业间也在利用合作寻求各种解决方案。
“我们今年5月与百图生科达成了战略合作协议,目的就是开拓AI技术与研发平台的深度融合。但在此之外,我们更期待顶层设计的介入,以及后来者的智慧,共同解决这一难题。”王劲松表示。
陈建新也直言,目前解决这一问题的有效方法并不多,这不仅有企业之间的博弈,也有各国政府之间的合作与抗衡问题。
“一个思路是药企和AI-tech公司深度合作,通过投资人或者直接收购、合资等方式解决数据归属问题,这相当于是变相地购买了数据。另一个思路是尝试通过算法的优化和突破来减少对有效数据量的依赖,达到小量有效数据也能得到高质量的结果。不管哪种办法,都不容易,需要长时间的探索。国外的一种做法是成立联盟,大家共同贡献数据,分享结果。”陈建新建议。
童友之也认同通过建立联盟的方式来共享数据,打破数据孤岛的现象。“现在有很多药企已在各自组建或者加入一些联盟,在药企之间共享数据,从而促进整个行业的发展。”
徐霆提出,应该排除零和博弈,通过社区学习,加密计算和正向的奖励机制来鼓励数据分享。除此以外,还应实现数据采集模式和质量标准的统一。
徐霆口中的数据标准,目前正在被大家所正视。事实上,AI药物研发落地的过程,也是一个长期的数据能力建设的过程,这种研发数据体系的完善,的确需要某种标准。
“AI只是新药研发的一种技术策略,传统新药研发过程中对数据的标准不应该被降低。”启德医药CEO秦刚指出。
陈建新也认为,制药行业关乎生命。首先,一旦AI在药物研发中发挥主导作用,必然需要在数据的质量、管理、使用和追溯等方面建立标准,规范数据和AI算法的使用不造成不良后果。其次,类似GMP的标准,一般只在原则上规定什么需要做,什么不能做,而不会在实际操作上做具体的规范,这也意味着,各个企业不管是制药公司还是AI技术公司,都要自己根据标准来制定切合自身实际可操作的规范。
王劲松进一步指出,不同的研发公司数据格式、种类、分类等都不尽相同,只有以统一的标准来建立并完善数据体系,才能实现企业间的数据互通、互联及整合。
“一些龙头企业应该率先担起责任,牵头建立好行业标准,促进整个行业更健康、更有序地发展。”童友之说。
然而数据标准的制定,也需要顶层设计。
翰森生物执行副总谢岳峻就认为,这一工作需要由跨国GMO组织,如WHO或者WTO来协调,可以从资料库的数据结构规划开始。
吕强也同意数据应有标准,但他同时认为,AI药物研发才刚刚开始发展,标准究竟该如何设置尚需要仔细考量,还是应以发现新分子实体、探索适应证的结果为导向,鼓励更多创新、防止垄断。
05 打破“黑箱”
随着AI研发技术的不断发展,如何理解AI制药结果的确定性,正成为判断AI制药公司成长潜力的关键部分。而这除了要追踪其前期模型产出环节的精准度,也要对后期决策证据的可靠性和结果的确定性进行验证。
可一个矛盾是,生物医药是一个高度严谨,且需要确定性的行业,而AI技术的很多细节则很难解释,更像一个黑箱。如何让这一对矛盾体更加和谐地发挥作用,真正地提高创新效率,成为摆在AI制药企业面前的一大难题。
对此,童友之认为,一方面可以通过将关键决策过程中使用的AI算法开源,增加透明性;另一方面则通过行业的伦理规范和标准、政府的鼓励和支持、适当的法律责任分配以及监管机制等多种途径,来推动AI药物研发行业的健康发展。
星亢原创始人陈航则以自己的公司举例称,他们的理念就是AI+生物物理+高通量实验,将这三者有机地结合起来,在顶层设计上构建一个创新药研发平台,然后随着药物研发实战的经验积累,不断激发平台的创新力。
“生物物理提供了第一性原理的认知,高通量实验不仅仅为AI提供了更多维的数据,也暗含了大自然生物的力量。我们的AI+噬菌体展示这一大分子筛选平台,就实现了抗体的定向进化。”陈航说。
目前,AI制药赛道已愈发火热,各路资本和科技巨头纷纷跑步进场。自2020年3月以来,已有十几家AI制药公司完成了1亿美元以上的融资。
其中英矽智能今年6月获得2.55亿美元的C轮融资,晶泰科技则在8月初完成了4亿美元的D轮融资,企业们正不断地刷新着AI制药领域的融资纪录。除了美国之外,中国也正成为该领域第二大融资交易地区。
可另一个现实是,目前在国内,除了少数头部公司,大部分AI制药企业距离商业化仍有距离,短期内想有大规模收入几乎不现实。他们每天仍需面对一种抉择——是做最懂AI的Biotech,还是做最懂Biotech的AI,是自己开发药,还是做CRO?
徐霆认为,从历史上看,Genomic、Combichem、基因治疗、CAR-T的投资几乎都与AI制药有着类似的投资路径。行业外,光伏产业也有同样情况。投资人对新技术有一个“学习曲线”,这种学习有时还可能是滞后的。“但滞后对于产业发展往往不是坏事,对于AI制药这一行业,资本可以多些谨慎,也多些耐心。”
而对于商业模式问题,谭验则认为,这应该是一件“水到渠成”的事。AI制药是一个新领域,从第一性原理去思考,要去加快药物的发现,就需要更好、更多的数据和更好的算法,而企业先在这两端去打基础肯定是没错的。这两端做好了,商业模式自然就会出来。
“你有好的分子、好的药物,总会有人支付。License-out是很好的出路,在资本的支持下也可以自己做管线。但是企业首先解决的还是活下来的问题,所以很多公司目前必须要更多地去提供服务,然后在摸索中建立自己的管线,真正地去加强自己的能力。这方面我还比较乐观。”谭验说。
在这个新兴赛道上,除了商业模式,人才问题亦是一大瓶颈。AI制药需要更多既懂科技又懂制药的跨界人才,但目前,这部分人才是稀缺的。
“AI和药物研发都是专业性很强的领域,各具独特的知识体系,行业壁垒极高,很难培养出AI+医药研发的复合型人才,目前的捷径,还是人才合作。”王劲松建议。
“纯粹的BT人才确实不能解决效率的问题,而目前行业里计算背景的人才,可能又普遍对实验的理解少些,还没有建立统计学的思考逻辑。我们公司内部也在积极促进BT和IT人才的融合。”谭验表示。
谢岳峻也认为,“斜杠人才”的培养,需要从产,学,研,甚至于政府层面介入着手解决。
不过在徐霆眼中,人才问题并无必要太悲观。“AI药物研发现在看起来需要很多跨界人才。但是很快,随着AI的普及以及各种工具包的开发,AI药物研发会平民化。DavidBaker的Rosseta就是很好的例子。”
AI制药人才瓶颈如何如破?如何理解AI制药结果的确定性?AI与药物研发的结合究竟能带来哪些颠覆性价值?