两个首富，一起迎来“至暗时刻”doc格式文档免费下载-菜科网

【菜科解读】

曾几何时，HPV疫苗还是个很赚钱的生意。

最火热时，许多人不惜长途往返香港，花费数万元完成接种流程。

这般火热，让巅峰时的HPV疫苗玩家，如万泰生物、智飞生物等都坐拥数千亿市值，两家企业的掌门人更是一个中国首富，一个重庆首富。

一切变得太快。

近日，万泰生物发布了2025年年报：营收18.19亿元，同比下滑18.99%；

且归母净利润为-3.98亿元，由盈转亏。

这也是其上市以来第一次出现年度亏损。

智飞生物表现更糟，去年归母净利润亏损了超147亿元，同比下降834.03%，就绝对值来算，在A股所有医药企业中年度亏损排行第一。

这个结果倒并不令行业意外，毕竟随着接种率提升，竞争者增加，整个HPV疫苗行业赚钱都变得越来越难。

比起过去的成绩，当下行业更关注的问题是，当老生意开始“过时”，这些企业又该靠什么重新站稳？

图/视觉中国

怎么了

梳理年报，两家企业面临的难题很像，都在于支柱业务下滑。

2017年，作为默沙东的代理商，智飞生物正式在国内开售四价HPV疫苗（佳达修），一年后又将九价HPV疫苗（佳达修9）引入国内，该业务最多时曾占据公司超过90%的收入。

2020年，万泰生物的二价HPV疫苗“馨可宁”上市，填补了国内市场长期依赖进口的空白。

2022年的高峰期，疫苗业务就贡献了84.92亿元营收，占全公司当年总收入超75%。

然而到了2025年，整个疫苗业务仅为万泰生物创造了4.57亿元收入，不到五年时间，缩水近95%。

智飞生物也好不到哪儿去，去年全年批签发量约423万支，同比下降86.39%。

缩水之所以如此剧烈，原因是多方面的。

首先，HPV疫苗保护期较长，数据显示至少可以维持6—8年，随着接种率不断提升，潜在客户会越来越少。

中国疾控中心研究数据显示，2024年中国9—45岁女性HPV疫苗首针覆盖率为27.43%，相比2022年的10.15%大幅提升。

虽与欧美国家约67%的接种渗透率相比仍有差距，但这部分人群恰好以高端自费人群为主，这对以四价和九价HPV疫苗为主的智飞生物产生巨大影响。

而价格较低的二价疫苗市场早已被卷入了竞争红海。

2022年，即万泰生物业绩最好的一年，沃森生物的二价HPV疫苗亦获批上市，此后双方打起了“价格战”，导致二价HPV疫苗的中标价一路下探。

政策又助推了一波。

2025年9月，国务院新闻办发布会表示，将推出面向适龄女性的HPV疫苗接种服务，并且将HPV疫苗纳入国家免疫规划，保护女性的健康。

北京中医药大学卫生健康法学教授、博士生导师邓勇曾对中国新闻周刊指出，将HPV疫苗纳入国家免疫规划，长期来看对行业发展有好处，短期却可能让政府采购价格进一步压低，导致企业的毛利率下降，稀释自费市场高利润空间，进入“量增价跌”的局面。

中国政府采购网显示，2025年国家免疫规划项目将集中采购二价HPV疫苗，采购数量为1544.65万支，预算金额约4.25亿元。

换算下来，单支价格仅27.5元，与当初超300元的零售价差距超过90%。

面对价格与市场双双缩水的情况，万泰生物将宝押在了九价HPV疫苗“馨可宁9”上，试图冲击高端。

2025年年中，这款产品正式推出，价格仅499元/支，三针方案费用仅约1500元。

但该策略暂时还没能转化成业绩，对此万泰生物在年报中解释：“九价HPV疫苗虽已成功上市，但尚处市场准入阶段，暂未形成规模化利润贡献，难以有效对冲二价HPV疫苗库存处置及政府采购降价带来的业绩影响。

”

市场预计，即使“馨可宁9”完全铺开，对营收的贡献依旧有限。

毕竟除了高端市场近饱和，智飞生物代理的“佳达修9”还已经提前开始了降价。

据媒体报道，去年多个城市进口九价HPV疫苗接种价格大幅下降，原价1300元/针的疫苗，如今打一送一（9—14岁女性）、打二送一（35—45岁女性），算下来，接种者可节省约1300元。

二价疫苗早已是“白菜价”，九价疫苗供大于求，夹在中间的四价疫苗彻底无人问津——智飞生物年报显示，去年其代理的四价疫苗2025年全年批签发量已经归零。

销售端大幅缩水，导致库存上升，而HPV疫苗的保质期普遍只有36个月，由此引发了巨额减值吞噬利润。

以智飞生物为例，全年合计计提141.28亿元资产减值，其中HPV疫苗相关存货跌价准备高达136.18 亿元。

面对巨大的库存压力，智飞生物不得不和默沙东重新签订销售协议。

按原计划，其已经和默沙东约定了2024年至2026年超700亿元的基础采购额。

而在4月初，智飞生物发布公告称，与默沙东重新签订协议，不再约定疫苗的基础采购金额，后续将根据市场预期需求和实际接种情况滚动采购。

怎么办

光节流不够，还要开源。

万泰生物表示，已经启动了九价HPV疫苗男性III期临床试验，并完成首例受试者入组，进一步拓展目标人群与长期市场空间。

女性市场增长见顶，从男性市场突围，一直是HPV疫苗行业流行的叙事。

只不过这一叙事如今越来越经不起推敲。

早在去年1月，默沙东宣布，佳达修四价HPV疫苗多项新适应证已获得国家药品监督管理局的上市批准，适用于9—26岁男性接种，成为中国境内首个可适用于男性的HPV疫苗。

去年4月，九价疫苗佳达修9亦获批适用于16—26岁男性接种。

这些疫苗都由智飞生物代理销售，但从智飞生物去年九价HPV疫苗批签发量来看，男性适应证的获批对销售量的提振极为有限。

业内看来，男性HPV疫苗之所以卖不动，除了长期的宣传空白，导致男性普遍认为自己是局外人，缺乏花费数千元接种的动力外，还有男性HPV疫苗适应年龄过于狭窄，少数有接种意愿和经济能力的男性亦因超过了26岁而被迫作罢。

中国新闻周刊走访北京一家医院，医生告知，接种疫苗前须先录入身份证信息，若处于年龄范围外，则系统无法下单。

两家公司不约而同都将目光转向了出海，可疫苗行业出海一直是个难题。

E药经理人研究院研究员储雷对中国新闻周刊指出，疫苗出海，不仅要通过各个国家长达数年的准入审批，还受限于各国公共卫生政策的差异，效率较低。

智飞生物年报表示，报告期内，其持续向印度尼西亚、巴基斯坦、乌兹别克斯坦等国供应四价流脑多糖疫苗；

23价肺炎球菌多糖疫苗在菲律宾完成GMP认证，同步在多个国家推进上市注册；

结核诊断产品宜卡在菲律宾等结核高负担国家开展注册工作。

然而上述国家购买力相对有限，天花板较低。

2025年，智飞生物的出口收入约3470万元，仅占总营收的0.39%，

相比之下，万泰生物出海成绩较好，原因在于其除了疫苗外，还拥有诊断试剂和仪器业务，包括系列全自动化学发光免疫分析仪及配套的100多项试剂等。

尽管在国内，受集采降价、医保政策调整等因素影响，这块业务2025年的总收入同比下滑了18.65%，但境外收入却从2024年的2.16亿元猛增至2025年的4.12亿元，同比上升90.85%。

储雷建议，短中期内，万泰生物应平衡好疫苗和诊断试剂业务的投入，靠后者维持现金流，推动业绩增长。

智飞生物有一定资金与管线积累，研发兑现速度应适当加快，找到新的增长点。

虽然收入大幅下滑，但所幸二者依旧维持住了研发强度。

万泰生物2025年研发费用约5.6亿元，同期智飞生物研发费用约9.3亿元。

从绝对值看，相比前一年都有所下滑，但降幅均小于营收降幅。

有趣的是，中国新闻周刊梳理发现，两家公司的研发管线存在不少重叠部分，例如水痘疫苗、肺炎疫苗、呼吸道合胞病毒疫苗等。

不过谁能接力HPV疫苗，成为下一个爆品，还有待观察。

关于年报亏损及未来战略规划等问题，中国新闻周刊向万泰生物、智飞生物发去采访函，截至发稿尚未获回复。

作者：石若萧

编辑：余源

这群年轻人投身沪剧20年，茅善玉钱思剑等名家为他们助阵

近日，“申声不息——上海沪剧院06级‘崇艺’20年”演出在上海天蟾逸夫舞台圆满举办。

本次演出分为5月5日折子戏专场、5月6日主题演出两场，恰逢2026年沪剧入选国家级非物质文化遗产名录20周年，亦是上海沪剧院06级演员从艺20载的重要节点，以一场跨越代际的沪剧传承盛会，为沪上观众献上了兼具情怀与实力的戏曲盛宴。

2006年，沪剧入选首批国家级非物质文化遗产名录，同年上海沪剧院面向全国广觅生源，28位学子通过层层考核汇聚上海戏剧学院附属戏曲学校，与沪剧非遗传承同频开启艺术征程。

20年间，这批演员从开蒙学唱《三国开篇》《西厢开篇》的青涩学子，成长为沪剧舞台的中坚力量，在《回望》《江姐》《罗汉钱》《家·瑞珏》等数十部经典与原创剧目中磨砺蜕变，成为沪剧艺术薪火相传的核心生力军。

本次演出阵容堪称沪剧传承的重磅集结，不仅有06级沪剧班全员登台，更汇聚了韩玉敏、陈瑜、汪华忠、张杏生、王明道、王珊妹、王明达、茅善玉、钱思剑等多位艺术家，他们学生时期的老师们、师哥师姐们、13级优秀青年演员、25级沪剧班新生代学员同台献艺。

非遗传承不是陈列，而是活态的生命，在舞台上呼吸，在生活中生长。

5日的折子戏专场演出中，06级演员们以经典重温从艺初心，演绎了《庵堂相会·看龙舟》《日出·重逢》《画女情·离别》《雷雨·撕支票》《白鹭·碧绿枝叶鲜红花》《女看灯》《家·鸣凤之殇》《露香女·愿君展翅去扬帆》等诸多骨子老戏与经典名段，以沪剧独有的“人间真情”，照见“时代的纹理”。

而6日的代际同台、以戏会友的演绎形式，不仅完成了沪剧艺术薪火相传的接力，更向前辈名家致敬。

从《阿必大回娘家》《大雷雨》等看家戏，到《红灯记》《芦荡火种》等红色经典，再到《敦煌女儿》等新时代原创剧目，经典唱段串联起20年成长之路，师徒同台的动人演绎、集体拜师的温情回溯，更将沪剧口传心授的传承内核展现得淋漓尽致。

20载薪火相传，作为与沪剧国家级非遗传承同起点成长的一届演员，06级沪剧班的成长历程，正是上海沪剧院数十年来坚守人才培养、筑牢非遗传承根基的生动实践。

多年来，上海沪剧院始终坚持“守正创新、以戏育人”的培养理念，构建起“名家传艺、以演代练、梯队接续”的完整人才培养体系。

以经典剧目复排、原创大戏创排、常态化惠民演出为抓手，为青年演员搭建起全方位的成长历练平台，让青年演员在舞台实践中打磨演唱功底、沉淀角色底蕴。

演出现场熟悉的沪韵乡音引得观众数次掌声雷动，有相伴多年的老戏迷动情表示，“看着这批孩子成长至今，20年坚守不易，更让我们看到了沪剧的未来”。

英伟达力荐，小团队两个月开源一款「光速级」智能体推理引擎

机器之心编辑部智能体时代的核心是算力。

尤其是在 Coding Agent 爆发之后，算力问题变得前所未有地尖锐。

Claude Code、Codex、Cursor 等产品正在把 AI 从「问答工具」变成「持续运行的软件协作者」，单次会话轻松突破 50K tokens，系统负载转向了更极端、更复杂的智能体负载。

最近有关算力的大新闻层出不穷。

今天的最新消息：马斯克的 SpaceX 与 Anthropic 宣布达成了重磅协议，超过 22 万块英伟达 GPU 将为 Anthropic 所用。

而 Anthropic 对与 SpaceX 合作开发未来的太空算力体系「表示有兴趣」。

在如此庞大的算力需求下，除了开源还有节流。

也是今天的最新消息：OpenAI 发布了多路径可靠连接 (MRC)，可帮助大型 AI 训练集群更快、更可靠地运行，并减少 GPU 时间的浪费。

我们知道，即便只是单 GPU 吞吐率上的微小提升，一旦应用到生产级集群中，也能够在服务持续增长需求的同时，节约相当可观的算力。

来自 LightSeek Foundation 的一个小团队，在两个月时间内打造了一个全新的，号称「光速」的大模型推理引擎 TokenSpeed。

这一引擎拥有 TensorRT LLM 级别的性能，vLLM 级别的易用性。

并且拥有 NVIDIA Blackwell 上最快的 MLA 注意力内核。

一经发布，TokenSpeed 就受到了英伟达发推文力荐。

目前，该引擎已经开源。

让我们参阅其技术博客，来深入了解「光速」引擎的技术细节。

博客标题：TokenSpeed: A Speed-of-Light LLM Inference Engine for Agentic Workloads 博客链接：https://lightseek.org/blog/lightseek-tokenspeed.html Github 链接：https://github.com/lightseekorg/tokenspeed TokenSpeed 技术简介 TokenSpeed 从第一性原理出发，专门为智能体推理场景设计。

它为智能体负载提供接近「光速级」的推理能力，核心包括：基于编译器的并行建模机制、高性能调度器、安全的 KV 资源复用约束、支持异构加速器的可插拔分层 kernel 系统，以及用于低开销 CPU 侧请求入口的 SMG 集成。

建模层采用本地 SPMD（Single Program, Multiple Data，单程序多数据）设计，在性能与易用性之间取得平衡。

TokenSpeed 允许开发者在模块边界指定 I/O placement 注解。

随后，一个轻量级静态编译器会在模型构建过程中自动生成所需的 collective operation，从而无需手动实现通信逻辑。

TokenSpeed 调度器将控制平面（control plane）与执行平面（execution plane）解耦。

控制平面使用 C++ 实现，并被构建为一个有限状态机（FSM），结合类型系统，在编译期而非运行期强制执行安全资源管理，包括 KV cache 状态转移与使用。

请求生命周期、KV cache 资源以及重叠执行时序，都通过显式 FSM 状态迁移与所有权语义进行表示，因此系统正确性并非依赖约定，而是由一个可验证的控制系统来保证。

执行平面则使用 Python 实现，以保持开发效率，使研究人员与工程师能够更快进行功能迭代，并降低整体认知负载。

TokenSpeed 的 kernel 层将 kernel 从核心引擎中解耦，并将其视为一级模块化子系统。

它提供了可移植的公共 API、集中的注册与选择机制、组织良好的实现结构、面向异构加速器的可扩展插件机制、经过整理的依赖体系，以及统一的快速迭代基础设施。

与此同时，团队还针对 NVIDIA Blackwell 架构进行了大量性能优化。

例如，他们构建了当前智能体负载场景下速度最快的 MLA（Multi-head Latent Attention，多头潜在注意力）kernel 之一。

在 decode kernel 中，由于部分场景下「num_heads」较小，团队通过对「q_seqlen」与「num_heads」进行分组，以更充分利用 Tensor Core 的计算能力。

而 binary prefill kernel 则包含了经过精细调优的 softmax 实现。

目前，TokenSpeed MLA 已被 vLLM 采用。

TokenSpeed 性能预览 Coding Agents（编码智能体）带来了异常严苛的推理工作负载，上下文通常会超过 50K tokens，对话也经常跨越数十轮。

大多数公开基准测试并不能充分捕捉这种行为。

研发团队与 EvalScope 团队一起，基于 SWE-smith 轨迹对 TokenSpeed 进行评估，这些轨迹密切反映了生产环境中 Coding Agents 的流量情况。

由于生成速度对 Agent 的用户体验至关重要，因此，团队的目标是在维持单用户 TPS（每秒 token 数）下限的同时，最大化单 GPU 的 TPM（每分钟 token 数）—— 通常是 70 TPS，有时是 200 TPS 或更高。

此外，研发团队针对 TensorRT-LLM（目前 NVIDIA Blackwell 平台上的最高水平）对这一设计进行了基准测试，并在认为针对 Agentic workloads 存在更好权衡的地方，采取了与之不同的设计方案。

下图展示了在不同部署配置下（无 PD 解耦），TokenSpeed 与 TensorRT-LLM 的 Kimi K2.5 性能帕累托曲线（Pareto curves）。

每条曲线都以 TPS/User（横轴）作为延迟指标，以 TPM/GPU（纵轴）作为吞吐指标，并通过扫描并发数绘制而成。

对于 Coding Agents（高于 70 TPS/User），最佳配置是 Attention TP4 + MoE TP4。

在这一配置下，TokenSpeed 在整个帕累托前沿上均优于 TensorRT-LLM：在最低延迟场景下（batch size 1）大约快 9%，在 100 TPS/User 附近吞吐量大约高 11%。

团队表示，他们的核心优化之一是 TokenSpeed MLA。

下图对比了 TokenSpeed MLA 与 TensorRT-LLM 的 MLA，后者是目前 NVIDIA Blackwell 上的 SoTA。

可以看出来，优化后的二进制版本预填充内核（prefill kernel），使用 NVIDIA 内部旋钮来微调 softmax 实现，在 Coding Agents 的五种典型预填充工作负载（带长前缀 KV cache 的 prefill）中，都超过了 TensorRT-LLM 的 MLA。

解码内核则将查询序列轴折叠进头轴，以更好地填充 BMM1 的 M tile，从而提升 Tensor Core 利用率。

结合其他优化，在带有 speculative decoding 的典型解码工作负载中（batch size 为 4、8、16，且带长前缀 KV cache），这使得相对于 TensorRT-LLM 来说，延迟几乎降低了一半。

最后，研发团队也表示，该项目于 2026 年 3 月中旬启动开发，虽然目前展示了惊人的性能，但仍有大量底层代码（如 PD 分离、KV 存储等）正在合并和完善中，接下来将继续推进。

从上述性能表现来看，不难看出，TokenSpeed 的出现旨在通过更现代化的架构设计，打破传统推理框架在易用性与极致性能之间的平衡点，为大规模 Agent 部署提供了一个高性能、开源的底座。

而英伟达的力荐，也说明推理引擎正在成为 Agent 时代基础设施竞争的一个新焦点。

更多信息，请参阅原博客！参考链接： https://x.com/lightseekorg/status/2052048105412141376 https://x.com/NVIDIAAI/status/2052061195381911806