01 当前中国蛋白组学格局如何?
D一,中国还没有一家蛋白组学上市公司。
欧美二级市场有几家蛋白组学上市公司,包括Quanterix、Olink、SomaLogic、Seer。国内A股还没有一家蛋白组学公司,很接近的是杭州景杰生物。根据其招股书,景杰成立于2011年,2023年初刚刚过会创业板,目前还在排队中。
同时也可以看到,中国蛋白组学目前营收以质谱服务为主,跟国外Olink、Quanterix等公司通过售卖试剂盒和自动化设备有很大区别。
第二,中国市场上的蛋白组学公司,处于混沌状态,没有产业链分工。
今天的自称蛋白组学的公司,大致两个来源:一是传统存在的质谱服务商,强于服务和渠道,二是新兴的生物科技公司,强于技术和产品。本来这两类公司应该是处于产业链上下游的关系:生物科技公司给服务商提供产品。
但由于中国蛋白组学市场处于早期萌芽阶段,出于各种原因,这两类公司目前基本都自己既做服务,又做产品。
第三,中国蛋白组学市场格局,以质谱路线占据主导地位。
这跟欧美蛋白组学以亲和试剂占主导地位形成明显差异。欧美蛋白组学市场,以Olink和SomaLogic为代表的亲和试剂路线占主导地位,大多数蛋白组大队列都是用这两家公司的产品开展的,以至于质谱蛋白组行业大牛,德国马普所Matthias Mann教授都写文章感慨:亲和试剂远比质谱要贵,为啥大队列都用亲和试剂呢?
质谱仪对于蛋白组学,就如同测序仪对于基因组学。但是蛋白组学大队列竟然质谱都不占上风,其中的原因,值得所有质谱蛋白组学人反思。
02 蛋白组学限速因素还有什么?
蛋白组学zui大的一个应用场景就是多重蛋白生物标志物发现,基于多重蛋白标志物,可以开发疾病早筛、诊断、临床病人分层、伴随诊断、用药指导等诸多应用。但多重蛋白标志物发现是D一位。蛋白标志物发现有一个“倒三角”框架,分为三个阶段。
D一阶段:未知蛋白标志物筛选 (biomarker discovery)。这个阶段目的就是从样本中发展潜在的蛋白质标志物,常用的方法是不需要标记的非靶向质谱蛋白组学 (DIA)。特点是要在尽可能多的样本中(1000个以上)尽可能地筛选更多的蛋白(比如5000种)。
第二阶段:标志物验证(biomarker validation)。D一阶段可能从5000个蛋白里面筛选到50个潜在蛋白标志物,就需要在第二阶段进一步验证。常用的方法是基于有标记的靶向质谱法(PRM)或者基于抗体的免疫分析法(immunoassay)。通常第二阶段得到验证的蛋白标志物能用于科学研究,但是想进一步成为临床指标,则需要到第三阶段。
第三阶段:临床标志物验证(clinical biomarker validation)。这个阶段通常需要多个中心的样本来验证蛋白标志物的可靠性、稳定性、标准化流程。常用的方法包括基于标记的靶向质谱法(SRM)或者基于抗体的免疫法(如化学发光)。
如上文所述,质谱仪对于蛋白组学,就如同测序仪对于基因组学。但目前蛋白组学没有被大规模应用,主要是长期以来三个要素的不到位而导致的,即:高通量、标准化、低成本。
要素一:高通量。质谱的通量一直是一个被长期诟病的大难题。在2023年6月份之前,蛋白组学样本都需要耗费一个小时的质谱时间,无论是用布鲁克的g端版质谱仪Tims TOF Pro2和赛默飞的Orbitrap 480。一台价值800万的高分辨质谱仪一天只能跑20个样本,低通量的问题同时带来了高成本。假设一年一台能跑300例样本,每年折旧200万,则平摊到每例样本的费用就超过300元。
但是质谱通量的问题随着今年6月份赛默飞发布新款的Orbitrap Astral而被解决了。Astral一台一年能够处理2万个样本,未来3年,中国市场上会有100台Astral,每年能处理的样本量超过200万个。
未来3年,世界将会有超过1000台Astral装机量,每年能处理的样本超过2000万个。即便有世界20家药企和英国样本库加持,Olink在世界也不过做了100万个样本。随着Astral的快速普及,质谱能满足市场上任何想做的大队列样本。
同时,每个样本大概产生4个Gb的蛋白组学数据,未来每年将有可能产生8000万个Gb的蛋白质数据。在如此浩瀚的蛋白大数据面前,将产生非常丰富的蛋白组学的大模型。类似于DeepMind这样的公司将层出不穷。
要素二:标准化。质谱蛋白组学被人长期诟病的第二个问题就是前处理流程麻烦,难以自动化标准化。随着实验室自动化行业的发展,以及新冠带来的自动化的认知普及,目前这个问题已经得到解决。国外行业巨tou包括哈Hamilton、Tecan都推出了自己的蛋白组学前处理工作站,但目前价格还是太贵,没有得到很好的市场普及。国内自动化工作站产品的面世,前处理标准化正在得到普及。
要素三:低成本。基因组学的发展,也是伴随着二代测序成本的断崖式下降而发展起来的。根据美国国家卫生研究院(NIH)公布的数据,2007年人类全基因组测序的成本是100万美元,到2020年这个成本降低到1000美元,到现在已经接近1000人民币。
数据来源:ARK Invest 2023 Big Ideas
从中心法则来讲,蛋白质组的确可以做很多基因组做不到的事情。但是蛋白组学行业的发展,也必须要跟基因组一样实现成本的快速下降。2023年的今天,蛋白组学的成本还是相对比较高。
拿芝加哥大学质谱蛋白组学平台的对外服务报价来举例,对工业客户,常规的DIA蛋白组分析就需要378美元/例,用TiO2富集的全磷酸化蛋白组收费是535美元/例,如果是酪氨酸磷酸化修饰蛋白组,则费用达到了惊人的1417.5美元/例。
数据来源:Rates | Proteomics Platform
对于组学来说,没有几百个样本,很难做出非常令人信服的数据。这样高的成本,对于大多数研究机构和企业研发,都是一笔需要仔细考量的支出。
有没有一种可能,通过技术创新,让蛋白组成本进一步降低,使得蛋白组成为一个不由分说的选项,默认就要去做的选项?这需要全行业的参与者来共同努力实现。
03 中国蛋白组学向何处去?
预测未来永远都是一个自找打脸的事情。麦肯锡和中金的行业精英们也从来没有预测准确过。但有些行业趋势,又似乎已经非常明显。
D一,中国蛋白组学产业链分工会更加明细。
未来5年,中国蛋白组学公司将会迅速分化。一部分企业将会专注做上游工具(试剂、设备、软件),一部分企业将会专注做中游服务(服务商),还有一部分企业将会专注做下游应用(诊断、制药)。没有核心技术的、想做大而全的蛋白组学公司将被市场出清。
未来5年,形势依旧不容乐观。每一家蛋白组学公司,必须要想清楚自己在产业链的定位是什么?自己团队zui大的优势在哪里?如何做大自己的优势,选择在哪里建设自己的护城河,是每家公司需要考量的决定生死的D一要素。
第二,质谱蛋白组大队列将井喷式激增。
随着质谱蛋白组三要素(高通量、标准化、低成本)同时得到满足,基于质谱的蛋白组大样本队列将呈现井喷式发展。1000例、2000例、3000例的大队列将成为常规,1万人甚至10万人的质谱蛋白组大队列将会涌现。
在今年的中国蛋白组学大会上,国家蛋白质科学中心就宣布,未来10年,国家将在蛋白组学上投入330亿人民币。这足以媲美任何一个欧美大科学项目。
第三,中国蛋白组学公司将会出海竞逐海外市场。
中国企业在基因组学上吃过的亏,在蛋白组学上会长一智。基因组学快速发展的时候,中国生命科学行业尚在襁褓之中,从来都是欧美企业跑到中国来销售产品,中国企业只有接受他们定价的份。
现在蛋白组学发展的时候,中国整个基础领域(物理、化学、材料、自动化)已经发展起来,硬科技实力比20年前大幅增强。优质的中国蛋白组学公司,尤其掌握核心技术的上游产品,将有机会抢占海外市场。同时,海外客户更高的产品要求、更好的付费意愿和付费能力,也能反过来要求中国企业打磨更优质的产品、培养更优秀的团队。
第四,围绕基因蛋白组的AI for Omics将成为热点。
未来5年,随着海量蛋白组数据的积累,结合过去积累的基因组数据,以基因组-蛋白组为中心的多组学将成为创新的热点,AI for Omics将成为生物大数据新的研究范式。届时,基于多组学的大模型将出现,行业将诞生类似DeepMind这样的公司,配合强大的算力和优异的算法来整合海量多组学数据,把现在在各个高校实验室里面的技术带入到现实应用场景中来,就如当年的蛋白质结构预测工具AlphaFold。
本文转载自 吴昊 nanomics bio
多元利器,助力类器官研究全面突破
(暂无发布时间 浏览数:3773)
生物3D打印:解锁类器官奥秘的科技钥匙
(暂无发布时间 浏览数:3328)
外泌体提取“高手”——EXODUS系列产品
(暂无发布时间 浏览数:4490)
EFL生物3D打印机在骨再生领域的应用
(暂无发布时间 浏览数:5469)
外泌体提取“高手”——EXODUS系列产品
(暂无发布时间 浏览数:4680)
中国蛋白组学向何处去?
(暂无发布时间 浏览数:12973)
欧美下一代蛋白质组学NGP三家标杆公司对比
(暂无发布时间 浏览数:11489)
Science综述 | 深入揭秘空间组学革命,未来科学新篇章将展开!
(暂无发布时间 浏览数:11990)
类器官模型:未来已来,将至已至,远方不远
(暂无发布时间 浏览数:14334)
MIHC多色组化分析平台
(2023-08-24T00:00 浏览数:11366)