褪去光环的闫俊杰与MiniMax:一场被算力、成本与商业现实倒逼的千亿进化







随着 MiniMax 在 2026 年初正式登陆港交所,市值历史性地反超前东家百度,37 岁的创始人闫俊杰(花名:IO)被外界塑造成了“预见 AGI 大时代的先知”。

然而,如果我们剥离掉这些充满幸存者偏差的公关滤镜,去翻看他早年的履历和创业第一天的真实白板,你会发现一个极其骨感且符合商业逻辑的真相:闫俊杰并非提前拿到剧本的“神”,而是一个底色极佳、被商业现实的瓶颈与算力成本的屠刀一次次逼上牌桌,并凭借极其冷酷的战略计算能力做出最优解的“超级产品经理”。

没有那么多改变世界的浪漫主义,只有极限生存中的精打细算。要看懂他后来的疯狂豪赌,必须先看懂他在前十年的“练级之路”。

1. 启蒙与战功:在百度看见算力,在商汤操盘“军火”

闫俊杰的底层逻辑,是在 2014 到 2021 年这七年间彻底成型的。

2014 年,深度学习刚刚爆发,25 岁的闫俊杰进入百度深度学习研究院实习。在那里,他第一次真切地看到了“大规模算力+深度学习”结合后产生的暴力美学,并凭借出色的研究拿下了“百度奖学金”。这颗“算力即权力”的种子,从那时起就深深种下。

随后他加入了刚成立的商汤科技。在早期的 AI 1.0 时代(计算机视觉),初创公司拿融资的唯一硬通货就是“国际比赛刷榜”。闫俊杰带队在多项国际顶级视觉挑战赛中击败微软、谷歌,拿下了冠军。在这个阶段,他极其敏锐地掌握了将“技术指标”转化为“资本筹码”的游戏规则。

但他没有止步于做一个“刷榜写论文”的科学家。他在商汤一路狂飙升至副总裁、智慧城市事业群 CTO,更关键的是,他深度参与甚至主导了商汤底层算力平台(SenseCore大装置)的建设。 这段经历至关重要:它让闫俊杰跨越了纯算法的壁垒,掌握了调度庞大算力集群的工程能力。更残酷的是,执掌商汤最赚钱的 B 端/G 端业务,让他彻底看清了上一代 AI 公司的宿命——本质上是在做重度依赖客情、需要大量工程师驻场的“高端 IT 外包”。边际成本极高,规模化效应递减。 正是因为看透了这种“苦力活”的天花板,他才会在商汤上市前夕、期权即将套牢的关键时刻,决绝地选择跳船。

2. “大模型底座”的偶然:为了造车,被迫手搓发动机

外界声称 MiniMax 在 2021 年底就预判了 OpenAI 的路线。但闫俊杰创业第一天(2021.12.09)的白板上,赫然写的是:“接近图灵测试的智能体”、“Jarvis”、“闲聊 -> Goal-Driven”。



这揭示了 MiniMax 最初的商业原点:他们一开始瞄准的根本不是底层的通用大模型,而是 C 端的“超级 AI 伴侣”应用。 2022 年 4 月,他们之所以要自研跑通文本模型 abab 1,是因为当时市面上根本没有成熟、廉价且支持深度性格定制的第三方 API,来支撑他们即将推出的爆款虚拟社交产品 Glow。 为了做出一款好用的 C 端应用,在没有现成工具的情况下,他们被迫“手搓”了一个底层模型。直到 2022 年底 ChatGPT 横空出世,全球资本疯狂寻找“中国版大模型”时,投资人才惊讶地发现:MiniMax 为了支持自家应用顺手打磨出来的模型,恰好是当时国内最成熟的底座。他们是顺水推舟,被时代直接推上了“大模型独角兽”的王座。

3. 孤注一掷押注 MoE:一场化解破产危机的算力保卫战

2023 年夏天,MiniMax 投入 80% 的算力资源押注 MoE(混合专家模型)。技术圈赞誉其具有前瞻性,但这更像是一场被逼到悬崖边上的绝地反击。

当时,MiniMax 刚经历了硅谷银行倒闭的资金链惊魂,更面临着幸福的烦恼:其主打的 C 端产品(Talkie、星野)用户量呈爆炸式增长。海量用户每天在应用内进行极高频的免费闲聊交互,如果继续使用传统的稠密模型(Dense Model),巨大的推理算力消耗足以将公司刚融来的数亿美金迅速抽干。 押注 MoE,并非纯粹的学术探索,而是因为 MoE 具有“推理成本极低”的核心优势。 这是关乎公司生死的单元经济学(Unit Economics)问题。闫俊杰赌赢了这一把,才换来了后来的毛利率转正。

4. 叫停流量采买:戳破“数据废料”的繁荣幻象

2024 年 8 月,在手握充裕资金、按理应大肆买量推高估值的时候,闫俊杰在内部果断叫停了产品投流,并得出一个极其反直觉的结论:“更好的应用和更多用户不会导向更好的模型。”

这是一个斩断移动互联网惯性思维的痛苦领悟。在星野和 Talkie 中,用户虽然贡献了千万级的日活,但他们产生的海量“角色扮演”、“情感闲聊”数据,对于提升大模型真正的核心智力(如数学、编程、复杂逻辑推理)几乎毫无增益。 用真金白银买来的泛娱乐流量,非但不能反哺 AGI 的进化,反而会造成巨大的算力损耗。看透这一点后,闫俊杰拒绝了虚假的繁荣,选择回归技术驱动的本质。

5. 远赴海外的战略闪避:避开国内 B 端的“绞肉机”

如今,MiniMax 的海外收入占比极高。这并非简单的“全球化愿景”,而是一次极其高明的战略闪避。

面对国内大厂发起的 API 价格战(甚至趋近于免费)以及 B 端客户要求苛刻、利润微薄的泥潭,曾在商汤结结实实吃过 B 端苦头的闫俊杰选择了敬而远之。依靠海外市场的 Talkie 等 C 端产品,直接向全球用户收取美元订阅费,MiniMax 成功避开了国内惨烈的内卷,构建了极其健康的现金流壁垒。这也解释了为什么在 MiniMax 内部,近 400 人的精英团队能爆发出如此强劲的商业势能。

结语

回顾闫俊杰的跃升之路,你会发现他的每一步决策都带着极其浓厚的“实战烙印”:因为在百度见识过算力的威力,才敢于在后期疯狂建立算力集群;因为在商汤吃过 B 端定制化的苦,才死死咬住 C 端出海战略不放;因为算力账单逼近临界点,才孤注一掷蹚平了 MoE 架构。

在这场波澜壮阔的 AI 浪潮中,活到最后、笑得最响的,从来不是盲目的布道者,而是像闫俊杰这样:在残酷的商业现实中算清每一笔账,防住最坏的风险,并在夹缝中精准切中“相对最优解”的顶级务实派。

评论