晚点聊 LateTalk cover image

晚点聊 LateTalk

Latest episodes

undefined
May 28, 2025 • 2h 38min

118: 天生卷王郭人杰:从97年的扫地机总裁到创业做家庭通用机器人

「竞争起来,我才最开心。」 本期我们同时拍摄了播客视频,将稍晚在 bilibili B站发布。 今天的嘉宾,是一位去年底被一级市场争抢的明星创业者,乐享科技创始人郭人杰。他 15 岁进入西安交大少年班,专业是能源与动力工程,后在伦敦政经学院获得金融硕士学位。 图注:郭人杰和乐享的小型舵机机器人,这是乐享今年将上市的产品之一,目标场景是让极客们做开发。2025 年 1 月,乐享团队将十几台原型机背到美国,用于和美国具身智能公司 K-Scale 联合举办黑客松。 2021 年加入追觅后,郭人杰在不到 4 年的时间里,从营销负责人做到了追觅中国区执行总裁。 去年 11 月,郭人杰离职,到 12 月底,他就拿到了来自 IDG 、经纬、真格、Monolith 和绿洲等机构的天使轮投资。其实那时,他只是想好了一个大的创业方向:要做面向消费市场的智能机器人。 在没有产品和数据的极早期阶段,投资的逻辑是看人。郭人杰有非常强烈的个人特质。 他极致接受高频试错和快速迭代,不到 4 年里,他和团队把追觅自有品牌在中国市场的销售额从 1 亿人民币做到了 60 亿。 他像创业那样去上班,倾尽全力、能上能下,4 年里,他两次被降级,又重新得重用。 这期节目的前半部分,我们聊了郭人杰在宝洁和追觅的职业生涯——一个“卷王”,能在不到 6 年的职场经历中如何学得更多、成长更快。 后半段,我们聊了郭人杰这次创立乐享的思考,郭人杰的理念是“赚钱养梦想”,他并不会声称,自己要做最前沿的探索,而是希望找到出于 0-1 之间的 “0.5 的机会”,它既不是那种大公司会一齐涌入的强共识,也是一个长周期里都不会有商业结果的方向。 图注:乐享科技将推出的机器人之二,用于家庭场景的“瓦力”,计划今年秋天上市。 乐享即将上市的机器人产品也体现了这种思考:比如其中一款,是给家庭市场做的户外陪伴机器人,它还原了 瓦力 的形象,非常可爱,这期封面,就是这款机器人。郭人杰在描述需求时,主要讲了信息交互和陪伴,并没有提到让机器人干活,这确实是目前技术还很难达到的状态。 在攻克具身大脑和寻求底层系统的突破之外,乐享是另一种智能机器人的创业路径。 本期嘉宾: 郭人杰,乐享科技创始人 & CEO 时间线跳转: -去宝洁,为了了解实业 02:17 少年班经历→伦敦政经金融经济学→2021年加入追觅,参与自有品牌0-60亿增长→2023年11月离职创立乐享科技。 04:01 加入宝洁时,如何为创业做准备 10:05 宝洁为何长寿:SOP/数据库/组织架构)、"敢为天下后" -追觅 4 年:从营销负责人到中国区总裁 16:06 俞浩(追觅创始人)面试时讲:高频试错+快速迭代;敢用年轻人 21:06 破格用人,"高激励+高淘汰",让大专主播月入 5 万 23:21 2021 年首战 618 成功,押对了抖音电商红利 32:08 结果备货没跟上,第一次被降级 34:47 重被任用后:先做洗地机,再快速做扫地机,功能全包围+差异化(烘干)+便宜15%,以B站长内容引爆扫地机品类 37:16 开始全渠道布局:不依赖抖音单一红利,拓展天猫/京东/社区团购 41:39 2022 年中国区销售额达 30 亿,但亏损,再次降级 51:21 新“军令状”:3 个月扭亏,高价 & 高端化转型 -创立乐享科技 55:50 离开追觅:生病、管理千人团队超出能力边界、想要新挑战 01:10:58 乐享科技不追求技术颠覆,寻找"0到1之间的0.5机会" 01:18:08 选择创业方向的 3 个标准: 避开纯技术探索和红海市场; 全球市场可行性,海外营销+国内研发; 与AIGC结合,延长创新周期,避免功能被快速复制 01:24:00 早期探索:从“机器人玩具”切入 → 发现“可定义动作”是核心价值 01:42:01 首款产品定位调整,与 K-Scale 合作开发平台机器人(售价$1000):满足学生/极客的 Sim2Real 需求 痛点:高校买不起更贵的机器人,不敢做高风险实验,年轻极客更买不起 产品逻辑:舵机方案实现基础运动(行走/跌倒爬起),开放硬件+软件平台供二次开发。 02:16:01 未来核心愿景“家庭移动终端”:解决拟人化交互(情感连接)+ 全场景移动(室内外地形适应) 拟人化:替代冰冷硬件(如用“哪吒声音讲古诗”比平板更有温度); 移动性:突破扫地机地形限制(如履带结构适应台阶/户外)。 02:18:43 第二款产品:履带式瓦力机器人(预计 2025 年 9-10 月上市):迪士尼IP授权,一比一电影还原设计 创业策略与行业竞争 01:53:57 “赚钱养梦想”:短期,教具产品保现金流,长期,家庭终端产品探索。 02:00:00 拉来科沃斯前 CTO,招募 AI 背景年轻人:创新+经验组合 02:04:00 与 K-Scale 的分工:互补短板 → “他把我们硬件工程师的照片挂墙上致敬”。 02:13:40 完全没有竞品的赛道可能没活力:“我创业第一天就渴望竞争” 02:21:54 多产品并行逻辑:“发挥快速迭代基因,广泛洞察→收敛需求→快速验证”。 02:25:03 中国硬件公司三代演进:代工仿制→性价比出海→定义新品类和标准 02:28:43 拓竹启示:3D打印机从极客工具到家庭设备的跨越 ,“重新定义品类是硬件公司的最高追求”。 相关链接: 《晚点独家丨追觅前中国区执行总裁郭人杰创业做机器人,接近完成首轮融资,估值约 5 亿元》 晚点聊 112:与千寻科技高阳聊具身:一个像机器人的人,怎么做像人的机器人 晚点聊 86:We,Robot-2,清华叉院/星海图许华哲看“Optimus”的门道 晚点聊 65:信仰充值的威力,与逐际谌华聊 GTC 和人形机器人新进展 晚点聊 40:与梅卡邵天兰聊通用机器人,AI 的下一个浪潮? 《梅卡曼德邵天兰:“通用机器人” 的吹牛竞赛与现实路径丨具身智能对话#9》 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
undefined
15 snips
May 20, 2025 • 2h 7min

117: 印奇的AI创业14年:所有不能闭环的辉煌都是暂时的

「Business model is the best model.」 本期的嘉宾是 A 股上市公司,千里科技的董事长印奇。他今年 37 岁,已 AI 创业 14 年。在 2011 年,印奇和同为清华姚班的同学,杨沐、唐文斌一起创立旷视科技时,3 人都在 22 岁上下。 图注:旷视的三位创始人(从左至右):杨沐、印奇、唐文斌 上一轮 AI 热潮中,这群年轻人打造的旷视,后来和商汤、云从、依图并称为 AI 四小龙。四家公司曾累计融资 80 亿美元,不过至今无一家规模盈利。从 2020 年到 2024 年,旷视一度在科创板上市流程里等待了 3 年多。 去年年中,印奇得到一个新机会,入股力帆科技,担任董事长,继续做与硬件终端结合的 AI,第一阶段是做 AI+车,即智驾和智舱的完整方案。力帆科技在今年初改名千里科技,千里股东之一的吉利会成为其重要的合作伙伴。 从年少成名、高歌猛进,到被资本追捧,再到公司被美国制裁、两次上市遇阻、苦寻商业闭环未果——印奇完整经历了上一轮 AI 热潮的起落。 本期包含了今年 3 月中旬和 5 月初,我们与印奇的两次访谈: 其中 3 月这次访谈,我们集中聊了从旷视到千里的转变,印奇对过去 AI 创业的总结,和千里的新进展; 最后一部分则是 5 月的访谈,我们更多聊了 AI 大模型的创业机会,和正在快速涌现的 Agent 应用市场。 印奇仍在追求 AGI,但不再是以 22 岁时那种一往无前的方式。这是一个有关 AI 创业的非爽文故事。 本期嘉宾: 印奇,千里科技董事长 时间线跳转: 3月中旬的访谈 - 从旷视到千里 03:17 AI 是 lifelong 的方向,一直想走软硬结合的 AI 05:55 继续推动旷视上市、大模型创业、AI+车(千里),三个选项里为何最终选了千里? 08:34 更倾向 AI in physical,AGI 必须有物理支撑 13:16 智能机器人未到爆发时机 - 只有技术信仰是不够的 17:43 DeepSeek 破圈,不代表能形成商业闭环 18:41 搜狗、旷视、DeepSeek,前沿科技创新的“天才少年”组织模式 20:47 技术信仰 vs. 价值务实:所有不能闭环的辉煌都是暂时的 25:24 一代版本一代神,组织能否迭代决定未来 - 千里新战略 26:10 千里战略关键词:AI 加车,差异化,聚焦智驾 28:43 开放 + 国际化,与吉利的合作不是绑定,而是起点 30:25 供应链开放:寻找各环节最优产品,组成完整方案 35:21 深度绑定车企才能形成数据闭环和技术支点 40:40 对 VLA 的判断:具身更需要 VLA,车的动作(action)很有限 44:41 中国智驾要回归基本功,提升模型化比例 49:39 技术品味来自背景积累,但也不用神话技术背景 52:17 智驾合适的商业模式是 2B2C,消费者要为软件付费,软件才能持续迭代 - 卡在上市流程的 5 年 54:46 低谷的 5 年反而是成长最快的 5 年 58:29 价值务实 + 精细经营 + 战斗型组织 01:06:01 调整研发与销售投入比例的过程——客户导向不是说出来的,而是价值链压出的 01:08:16 管理没那么多新概念,因为人没变;世界是连续的,不存在真正的突变式创新 01:11:13 好的科研关键是定义好问题,创业也一样 01:14:15 在互联网领域,what 很重要;但在大部分其它行业,how(执行力)比 what(认知) 重要。 - 节奏比方向更重要,智驾已进入冲刺期 01:17:54 节奏比方向更重要,要判断冲刺时机 01:20:04 智驾冲刺信号已出现,赢下冲刺所需的 3 个体系 - 见世界、见众生,然后见自己 01:26:50 比以前更狠了?——更追求结果了 01:30:51 聪明人用笨办法,不奢求用小的力获得大成功 01:33:50 为何在少年时就找到 lifelong 的方向? 01:35:30 姚班的科研价值观 01:41:38 人类会选择虚拟世界吗? 01:45:34 艺术家徐冰,科技边界扩大,艺术边界缩小 01:47:57 当你对这个世界有认知,跟一群人做成了很多事,最后可能才能真正知道内心支点,见自己是最后的。 5月的访谈 01:48:31 AI 现在是一个大周期的决赛环节,各公司的积累 01:52:05 Super App,短期有爆发势能,长期上限高 01:54:42 第二阶段的 Super App 方向:Agent——四种分类(办公、内容创作、生活、情感陪伴)& 机会比较 相关链接: 《晚点对话印奇:AI 1.0 的教训是,所有不能闭环的辉煌都是暂时的》 《旷视印奇入主力帆始末:放下上市执念,赌汽车智能化》 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
undefined
May 17, 2025 • 1h 39min

116: 当AI研究者写科幻,与Meta田渊栋聊他的智能想象:我们终会“所思即所得”

「到那时,高级文明最想要的宇宙资源会是:good idea.」 这是「I,AI」的第二期,这个系列中,我们会讨论 AI 和我们日常工作与生活的关系。 这一期的嘉宾是 Meta GenAI 研究总监,田渊栋。他是 AI 研究者,先后于上海交大、卡耐基梅隆大学机器人研究所获学士、硕士和博士学位。田渊栋自 2005 年开始探索智能和人工智能,最近 10 年,他一直在 Meta 从事 AI 研发。 他还有另一重职业身份——小说家。博士生期间,田渊栋就开始写小说。他在 2021 年连载完了第一部长篇科幻小说《破晓之钟》,这本书在 2024 年正式出版。 《破晓之钟》写作于 ChatGPT 热潮之前,全部内容都是田渊栋自己写的,没有借助 AI。而书里的核心科幻概念和科幻点子,则体现了一个 AI 科学家的技术思维。田渊栋认为,每个技术时代——蒸汽时代、电气时代、信息时代、智能时代——都对应的不同科幻命题和故事。他想写出有 AI 内核的科幻。 几年后再看,书里的一些设计,“预言”了后来围绕算力与智能的攻防战,本书也讨论了当人类不再需要工作时,可能带来什么危机。 这一期,我们会从《破晓之钟》这本科幻长篇开始聊,延展到田渊栋对未来 AI 技术、社会与人类命运的想象。 图注:《破晓之钟》2024 年出版版。 因为本书的主角和英雄们是一群研究者,我们也由此聊了 AI 研究人员的生活与选择。田渊栋也分享了 2023 年之后,他如何尝试在写作工作流里引入更多 AI,AI 现在能帮他做什么,还不能做什么。 由于本期节目是远程录制,音质有一些瑕疵,请听友见谅。 本期嘉宾:田渊栋,Meta GenAI 研究总监,他的个人网站 时间线跳转: -《破晓之钟》写作意图 & 故事设定 05:03 《破晓之钟》想写AI时代的科幻,融合少年热血与中年反思 07:35 主要情节:外星人非暴力入侵,以“完美虚拟生活”诱惑人类;一群研究者如何寻找出路 *-书中的 AI 思维和未来文明想象 * 12:34 灵界立方灵感来自英伟达 GPU 互联,20 年的科幻点子现在照进现实 16:44 人们的两种选择:进入虚拟世界 or 拥抱未知星海 19:38 “虚拟永生”带来的不可忍受之轻和平庸 23:24 结尾悬念:人类真的逃离灵界虚拟世界了吗? 26:03 高级文明银河联盟的动机:寻找独特的智慧和宇宙角落里的其它更优解 29:44 技术终会发展到“所思即所得”,好的发展思路被渴求 35:11 人类进入虚拟世界已成趋势,服务器更适宜星际旅行 39:53 虚拟世界带来短期冲击、中期内卷、长期机会——当我们从常规工作中被解放,创造力可能爆发 -研究者的处境与生活 45:34 AI 未来能否做科研?现阶段仍不具深层推理能力 48:50 田渊栋早年在深度学习相对冷门阶段的研究经历 55:10 小改进 vs 大革新,两类科研者的贡献与角色都很重要 01:00:04 技术 leader 的任务:掌握方向,识人用人,制定策略 01:03:02 从埋头苦干到战略设定,再回归 hands-on 的转变 01:06:08 借助 AI,现在的研发团队可以更小、更精悍 -AI 研究者 & 小说创作者的双重生活 01:12:27 AI 生成的内容,仍缺乏对人物关系的理解和长线逻辑 01:14:40 不同 AI 模型的使用体验:Claude 相对擅长人物关系;给定大纲后,Gemini 可以完成具体情节;DeepSeek 适合“脑洞”,用来写小说“很麻烦” 01:17:28 自制写作工具:人机协作,用 AI 补空、润色,保持人类创意主导 01:25:19 人类独一无二的经验,短时间内无法被 AI 替代 01:26:32 就像银河联盟想要全宇宙的好想法,大模型现在也最需要人的智慧(数据) 相关链接: 《幽夜星火》连载页面 晚点聊 115:华为发布超节点,如何搅动AI算力市场?与魔形智能徐凌杰聊芯片层新变化 晚点聊 109:数字生命卡兹克如何用 AI:把任何要重复 3 遍的事 AI 化 晚点聊106:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q 题图:ChatGPT 生成,prompt 是《破晓之钟》里的一段描述: “人类遗产信息已编辑完成,若计划失败则发送:“我们是人类,曾于银河系悬臂太阳系第三行星居住,被银河联盟毁灭。我们知道四种基本力及一百一十八种由不同原子核构成的元素,目前模式识别方式为多层非线性神经网络……我们存在过、进步过、抗争过!感谢您的收听。” (ChatGPT-4o 并未生成正确的元素周期表。) ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
undefined
19 snips
May 11, 2025 • 1h 28min

115: 华为发布超节点,如何搅动AI算力市场?与魔形智能徐凌杰聊芯片层新变化

「从拼单颗芯片的性能,到优化多芯片互联的系统。」 AI 算力,现在是中美都最关注的 AI 底层竞争力。约 1 个月前,华为推出由 384 块昇腾 910 互联而成的/超节点 AI 集群,CloudMatrix 384。 图注:这是超节点发布会上展示的 CloudMatrix 服务器机柜组,如播客中介绍的,一共是 12 台机柜(每台机柜里又有 4 个服务器),中间有光纤、交换机等部件连接。 华为超节点发布后不久,我邀请有 20 多年芯片从业经验的徐凌杰来一起聊一聊这项算力底层的新变化。 自 2000 年代中期,徐凌杰先后在英伟达、AMD 和三星,参与设计 GPU 架构。后来加入阿里云,领导GPU 云计算基础设施的搭建;2019 年与张文等人联合创立国产 GPU 公司壁仞科技;2024 年开始新创业,成立魔形智能,专注 AI 算力集群产品设计和优化。 超节点本身就是一种从拼单芯片性能,到优化整个节点和机架的算力思路变化,徐凌杰的从业经验正好匹配了这一趋势。 本期节目的第一部分,我们聊了华为 CloudMatrix 384 是什么,它和英伟达 2024 年开始重磅推出的集群方案 NVL72 的异同。不止英伟达、华为,把节点做得越来越大,从集群芯片数量要性能,以网络能力弥补计算和存储的瓶颈,已成为算力市场的共识性趋势。 在第二部分,我们则主要讨论了超节点趋势,对英伟达、对其它国产芯片,对整个 AI 算力市场的可能影响,和一个“经典问题”:下一个改变算力格局的变量可能是什么? 节目录制后不久,华为超节点开始出货。据《金融时报》报道,一套完整的 CloudMatrix 384 售价约 800 万美元,是售价约 300 万美元的 NVL72 的 2 倍多。但要注意,这并不是华为的官方价格信息。 5 月 7 日,华为盘古大模型团队又在预印本平台 Arxiv 发表了一篇论文,称在 6000 多块昇腾芯片组成的超大集群上,实现了 7180 亿(718B)参数 MoE 模型的长期稳定训练。 本期嘉宾: 徐凌杰,魔形智能CEO,邮箱:lingjie@magikcompute.ai 时间线跳转: - 华为 Cloud 384 集群 & 把节点做大的趋势 03:15 CloudMatrix 384 是什么?Scale up vs Scale out 08:33 算力底层构成,不止 GPU,还有互联、网络、冷却等综合系统 11:09 NVLink、NVSwitch 是英伟达的另一重壁垒,69 亿美元收购 Mellanox 前后开始布局 18:22 广义与狭义的 AI Infra 20:38 第三方系统优化公司的机会?——同时掌握计算、网络能力的芯片原厂是少数 22:51 “超节点”好坏,看什么指标? 29:08 黄仁勋想推“训推一体”,实际上业界在怎么用 GPU? 33:17 模型越大,显存压力越大——显存正成为芯片主要成本 36:02 华为超节点功耗高,但中国电费成本相对小,以总量换性能 38:11 华为的多卡互联来自什么积累 ——华为在成为 Nvidia 之前已是一个 Mellanox 42:57 NV Switch 为何难?去年 AMD 49 亿美元收购 ZT 补能力 - 超节点趋势,对英伟达和 AI 算力市场的影响 45:43 华为超节点,短期不冲击英伟达,压力给到其它 AI 国产芯片商 47:51 英伟达 H20 已计提 55 亿美元损失,但可能通过技术手段提升部分性能 51:19 华为在阿里 Qwen3 发布当天宣布支持 55:12 英伟达上游有全球供应链支持,下游有客户生态,危险之一是客户集中 01:00:44 为什么 Google TPU 没有动摇英伟达的地位? 01:04:23 可能是 Nvidia 的“防守措施”:已成立“半定制”部门 01:06:17 为什么离开英伟达,十年前的老黄是什么样? 01:12:01 2024 年选择创业:看到芯片周边集群优化能做出差异化,也是长坡厚雪 01:18:44 新硬件架构的苗头?——存算一体、类脑计算(脉冲神经网络) 相关链接 一文洞悉超节点:解密AI时代的算力基 Pangu Ultra MoE: How to Train Your Big MoE on Ascend NPUs(盘古超级混合专家模型:如何在昇腾 NPU 上训练超大规模混合模型 晚点聊 103:用 Attention 串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进 晚点聊 49:3nm 是谎言?光刻工厂真能造芯片?与汪波聊芯片行业那些流传的误解 晚点聊 32:最怕客户来参观的行业:和谈三圈仔细谈谈芯片 附录: GPU、GPGPU、ASIC、NPU:都是可以做 AI 模型训练和推理的 AI 芯片。GPU 是图形处理器,GPGPU 是针对通用计算(而非图形任务)优化的 GPU,AISC 是专用集成电路,它的性价比理论上比GPU 更好,但不如 GPU 通用;NPU(Neural Processing Unit)也是一种 ASIC。 DPU(Data Processing Unit)::数据处理单元,用于优化网络通信、安全和存储操作,减轻 CPU和 GPU 的负担,提升AI 算力中心整体性能。 GPU 的精度:如节目中提到的 FP8((8位浮点数)、INT8((8位浮点数) 都是 GPU 精度的一种,是不同的数据格式标准。DeepSeek-V3 和 R1 就是在预训练阶段使用了以 FP8 为主的混合低精度训练方法。 总线(Bus):计算机内部用于传输数据、地址和控制信号的通信系统,连接 CPU、内存和外设等组件,确保信息在各部分之间高效传递。 高速互联协议:用于在计算系统内部或系统之间实现高速、低延迟的数据通信的协议,如英伟达的NVLink、InfiniBand(由 IBTA 协会开发)和 PCIe (由 Intel、Dell、HP、IBM 等公司成立的联盟 PCI-SIG 开发),支持大规模并行计算和数据中心的高效运行。 Mellanox:一家提供高性能互联解决方案的以色列公司,英伟达在 2019 年以 69 亿美元收购了 Mellanox。 ZT Systems:2024 年,AMD 则以 49 亿美元收购了 ZT Systems,为云计算厂商设计、制造和部署复杂的计算、存储和加速器解决方案。 NVSwitch:英伟达推出的高带宽交换芯片,支持多 GPU 间的全互联通信,可提升系统整体性能和可扩展性。 NVLink:英伟达开发的高速互联技术,提供高带宽、低延迟的 GPU 与 GPU、GPU 与 CPU 之间的通信,支持大规模并行计算和深度学习任务。 Dynamo:英伟达推出的开源推理软件平台,支持多种 AI 框架和硬件架构。在谈到英伟达收购 Lepton.ai 的背景时提及。 英伟达的费米(Fermi)架构:英伟达 2010 前后开发、推出的 GPU 架构,开发过程很不顺利,经历两次流片失败。 神经脉冲(Neuromorphic Computing):模拟人脑神经网络结构和功能的计算方法,用脉冲神经网络处理信息,特点是高效能、低功耗。(人脑的功耗就比较低,只有 20 W 左右) 存算一体(Compute-in-Memory):将计算功能集成到存储器中的计算架构,减少数据在存储器和处理器之间的传输,提高计算效率和能效,适用于大规模数据处理和人工智能应用。 剪辑制作:甜食、Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
undefined
May 5, 2025 • 1h 56min

113: 秘塔闵可锐1:回到故事开始,那些「神预言」

「我现在有一个判断,很多人会认为是胡说八道:在这一轮大模型热潮里,中国投资人很可能会集体 miss。」 今天,《晚点聊》一次发了两期节目,嘉宾都是秘塔创始人,闵可锐。一次访谈发生在 2023 年年初,另一次是在最近。本期,是 2023 年 3 月中旬的那一次访谈。 那是中国大模型热潮的开端,王慧文刚自己投资 5000 万美元,成立光年之外,月之暗面还在组建,六小龙的名号还没有兴起,DeepSeek 还没有正式成立,字节等大公司也没有充分展现对 AI 的志在必得和激进投入。 秘塔当时已是一家成立近 5 年的公司,推出了法律翻译、秘塔写字猫等多款 AI 应用。现在更为人熟知的秘塔搜索则还没有上线。 回顾这次发生在热潮开端的讨论,恍若隔世,也有很多先见之明。那时可锐就有一些犀利的观察和观点,包括: 中国 VC 可能会集体 miss 掉一位最有雄心的中国大模型创业者。 在大模型领域,传统的组织人才方式不work。 真正的天才想法很难被媒体和大众所认知。 预训练很重要,是范式转变,具体到Transformer架构,其实没那么重要。 (2023 年上半年)未来半年各大厂商将密集发模型,但热潮不可持续,拿不到正反馈的团队将很快退场,速生速死。 AI 产品领域的创业是战国时代,不论个人开发者和大厂之间,还是大厂和大厂之间,进入到一个所有人在PK所有人的状态。 研发投入 95% 是浪费,而且你不知道哪 95% 是浪费的。一流 researcher 能节约 80% 的成本,但大部分组织没能力知道谁是一流的 researcher。 在秘塔刚成立的 2018 年,闵可锐就写过一篇文章,叫《关于机器学习的前尘往事》(见 shownotes “相关链接”部分),这篇文章已经提到了当时 Anthropic 创始人,Dario 在百度工作期间,发现的 Scaling Laws 的雏形。这篇文章开头,是模仿《百年孤独》经典开篇的一个 AI 小故事。其中提到了 108 期节目中,马毅老师也聊到的 50 年代 AI 热潮中的“感知机”。 闵可锐是马老师在伊利诺伊大学任职时的博士研究生,后肄业创业。此前他获得了复旦计算机学士学位,和牛津大学数学硕士学位。 这期节目,我们完整聊了可锐的职业经历、秘塔创业故事、他在 2023 年年初对大模型格局的思考。而今天发的另一期节目,是最近秘塔发布新产品“今天学点啥”之后的访谈,我们从这个产品切入,聊了这两年的变化。 本期嘉宾: 闵可锐,秘塔科技创始人,@「AI秘塔」公众号 ID:METASOTA2018 时间线跳转: 00:05 开场介绍 -预训练的想法很重要,而非具体架构 02:20 秘塔的重心在应用;竞赛→复旦→牛津→伊利诺伊→第一次创业→猎豹→创立秘塔的简要回顾 05:48 2017 年前后的真正技术转折是:预训练想法的出现 12:36 2018 年,预训练到来后的创业选择:在特定领域做出价值→法律翻译 12:14 OpenAI 难以效法;ChatGPT 之前,行业没有技术秘密 14:41 GPT-3 刚出来时,参数规模大到短期内难以应用;没必要神话某一个架构 22:14 一些 idea 的引用次数很高,但不是真正天才的想法 25:25 Ilya 的成就:不是视觉背景的人做出了 NLP 突破,而是深度学习的不同领域在合流,AI 本身的泛化性在提升 - 创业两条路:大故事、很多钱 vs 服务好能服务的用户 27:17 Jasper 的贡献:找到一个机器贵、但人更贵的切入口 30:58 从法律翻译到秘塔写作猫,垂直领域到更泛 C 的转变如何发生 36:16 AI to C、to B,商业模式切身体验 40:42 “创业公司的差异化是什么?”——要“做着瞧” 45:56 AI 应用是战国时代,是所有人和所有人的 PK 47:43 AI Native 应用的突破很可能在交互上 52:16 秘塔也在自己训练模型,应用为重心的情况下,怎么做模型? 01:01:28 开源模型的影响 - “坦白来讲,大模型热潮也不是什么好事” 01:08:02 AI 热潮对秘塔发展节奏的影响 01:11:15 中国投资机构会集体 miss 模型层投资;开源是另一股力量 01:16:13 中国有雄心更大的人,但还没有进入人们的视野 01:19:14 这次热潮对比 2016 年 AlphaGo 之后的 AI 热,有何不同? 01:24:11 秘塔当时的新融资推进:战投比较积极,财投很谨慎 01:27:19 两种 AI 研究机构:手作坊 vs 工业化 01:33:24 95% 的研发投入是浪费的,而且不知道浪费在哪儿;OpenAI 的成功经验是找到会花钱的少数研究者,让他们花很多钱 01:37:14 短期 vs 长期,当前应用 vs 追求 AGI——“你以为的平衡,实际上是平衡不了” 01:44:13 AI 热潮给算力成本带来的变化 01:51:27 市场存在大的资源错配 相关链接: 关于机器学习的前尘往事(闵可锐) 晚点聊110:与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 晚点聊107:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 附录 BERT(Bidirectional Encoder Representations from Transformers):Google 于 2018 年提出的一种预训练语言模型,首次引入双向 Transformer 编码器来理解上下文,显著提升了多个自然语言处理(NLP)任务的表现。 T5(Text-to-Text Transfer Transformer):Google Research 2019 年提出,它将所有 NLP 任务统一建模为文本到文本的转换问题。 Vision Transformer (ViT):Google Research 2020 年提出,它是首个成功将纯Transformer 架构应用于图像分类任务的模型,将图像分割为小块并视为序列输入 Transformer。 剪辑制作:甜食 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
undefined
14 snips
May 5, 2025 • 2h 2min

114: 秘塔闵可锐2:“我不是演员”

「你得相信,最坏的事情会发生。」 今天我们一次发了两期节目,嘉宾都是秘塔创始人,闵可锐。 113 期,是我和可锐在 2023 年年初的一次访谈,那次大模型热潮初期的漫谈中,有不少此后被印证的预言。本期,是 2025 年 4 月底,秘塔发布新产品“今天学点啥”之后,我和晚点科技组作者与桐,一起对闵可锐的访谈。 我们从“今天学点啥”这个新产品切入,聊了秘塔探索新产品的方法、思路和执行,以及闵可锐对 AI 应用发展的思考。 秘塔持续推出了一些有口碑和用户的 AI 产品,包括秘塔写作猫、秘塔搜索等。与之形成反差的是,在 2023 年的大模型热潮后,秘塔并没有加速扩张和融资,仅在 2024 年新融了 1 亿多人民币。整个公司的估值也是低得保守。 可锐是一个直言、坦诚,甚至有些“我行我素”的创始人。我问他为什么不融更多钱?他说,他当不了一个演员,他也不知道,为什么一些在他看起来拙劣的故事,不少投资人会 buy in,这超出了他的“能力范围”。 他说最初看到 DeepSeek 的人才组织方式,就觉得这样非常对。我问他为什么秘塔不是这么组织的,他说,因为“我们没钱”。 一方面,可锐的一些观点似乎有些悲观,他会说:“我们摸着石头过河,大厂摸着我们过河”;任何有潜力主要依靠大模型能力达到 1000 万 DAU 的软件应用,大模型厂商和大公司一定会自己做。另一方面,他依然在持续经营秘塔这家已经成立 7 年的小 AI 公司,拒绝了去年的一些收购机会。 这是一期小 AI 公司创始人的生存之道,也是一个“没有偶像包袱”的 AI 从业者的一手观察。 本期嘉宾: 闵可锐,秘塔科技创始人,@「AI秘塔」公众号 ID:METASOTA2018 时间线跳转: - 今天学点啥 03:05 今天学点啥:黑神话冯骥自来水,闵可锐自己打 70 分;马上会推出新优化 09:09 其实秘塔 80% 的产品决策是“我拍脑袋”的 11:18 to C、to B AI 产品秘塔都做过,不同的决策方式 18:14 “为什么没做 Agent 方向产品”——为什么做大家都在做的事? 20:32 Manus 的很多效果得益于 Claude;25 年的模型来做通用 Agent,成功率仍是问题 25:58 秘塔为何没沿着法律场景、做垂直 Agent? 27:56 收入是产品决策的重要指标;过去 7 年多少名噪一时的 AI 公司,要么死了,要么大幅收缩 29:45 我融不了很多钱;我讲真话大家也不信,也做不了演员 - 再聊两年前的「预言」 34:44 模型做不到全球 top 的 foundation model 创业公司挑战重重 36:14 做基础模型就应该是 DeepSeek 的人才组织方式 37:27 AI 战场都是聪明人,不要奢望兼顾 8 个产品、同时开几条模型线,还能在某个方向碾压别人 38:11 AI 一定要算 ROI 吗?AGI 也可以是消费 41:46 Llama4 再次证明,“一流资源、二流团队”打不过“二流资源、一流团队”;字节人才密度很高,关键是怎么发挥价值 42:55 梁文锋最懂什么? - 模型和应用的边界 44:56 to B、to C 应用,基础模型,我都可以做,不过没人相信 49:48 法律翻译、秘塔搜索,都不适合出海,但“今天学点啥”之后会出海 52:48 我们的对手会是 1 万亿的公司,你得相信,最坏的事情会发生 54:30 因为保守错失了哪些机会? 57:36 去年为什么拒绝被收购? 01:01:21 谨慎与抛弃沉末成本,闵可锐的双面性 01:03:28 Jasper 没死,但大家都要“踩一脚” 01:05:06 所有主要依靠大模型有潜力到 1000 万 DAU 的软件应用,大(模型)公司都会自己做 -模型技术讨论 01:10:19 大模型和小模型结合,只是个很简单描述;整体思路是:1.服务自己的用户 2.及时跟进下一代模型解锁的能力 01:16:46 o 和 R 真的在推理吗?智能的形式比本质更可验证 01:23:58 用强化学习做推理模型之后,很多人低估了好的预训练的重要性 01:25:42 Grok3 和 Llama4 是两件事,Grok3 成功证明了一个后出发的团队,能快速追赶一线能力 01:29:55 Scaling Laws 不是线性外推,很可能到了新卡点,又会有新突破 01:32:59 过去曾有哪些技术误判,导致错失机会? -过去两年,我各方面都更会了 01:37:26 我们摸着石头过河,大厂摸着我们过河,创业公司得更快找到下一个石头 01:38:43 一个足够灵敏的组织,理想 vs 现实 01:41:03 目前秘塔的团队分工、协作 01:45:52 为什么没找产品合伙人? 01:49:33 热潮前后,秘塔团队节奏的变化 01:55:25 23 年至今的变化:自己“更会了”,接下来希望能和整个组织一起成长 相关链接: 晚点聊108:与马毅聊智能史:DNA是最早的大模型,智能的本质是减熵 晚点聊110:与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 晚点聊107:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 剪辑制作:甜食 *本期主播: *小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q **即刻 @王与桐 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
undefined
Apr 29, 2025 • 1h 22min

112: 与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人

「伯克利 BAIR 博士、清华叉院助理教授,跳进具身创业。」 高阳是清华大学交叉信息研究院的助理教授,同时也是具身智能公司千寻的联合创始人和首席科学家。 高阳在具身智能领域深耕多年,他是清华计算机系本科,UC Berkeley 博士,师从国际计算机视觉大师 Trevor Darrell。在 2016 年时,他就和许华哲一起做了端到端自动驾驶的课题,这在当时是个小众的方向,但如今已经成为自动驾驶行业的共识。 这几年在具身智能领域崭露头角的早期公司,多多少少有 UC Berkeley 学子的身影——刚才提到的许华哲是星海图的首席科学家,星动纪元的创始人陈建宇、最近刚刚加入估值最高的智元机器人的罗建兰,都曾在 UC Berkeley 深造过;创立边塞科技的吴翼也是毕业于 UC Berkeley。 在 2024 年,高阳与有产业经历的韩峰涛共同创立了千寻,千寻在非共识中找到的切入点是端到端+具身大脑+机器人本体+互联网视频预训练、模仿学习、强化学习。成立至今,千寻已经获得了四轮融资。最近他们也发布了VLA Spirit v1 的 demo,机器人可以叠衣服了。 这次我们不仅聊到了高阳的技术理解,也聊到了他的思维方式和过往经历。 创业者们都在尝试怎么把机器人做得更像人,而高阳像一个融入人类世界的机器人:他从不熬夜,早晨七点半“开机”,每天骑 31-33 分钟的共享单车前往工作地点,在每周固定时间健身;他相信 COT(Chain-of-Thought,思维链),认为所有事情都可以按照 COT 一步一步走向结果,不仅是生活,也包括学术研究和创业,甚至“一步一步,每一个链条都做好,自然会导向具身智能的 L2、L3 的实现”。 这位 91 年出生的具身研究者和创业者,不倾向输出斩钉截铁的结论,但他相信他推理出的一切,不管和别人的声音是否一致。 本期嘉宾: 高阳,千寻智能首席科学家,清华叉院助理教授,个人主页(内有邮箱联系方式) 时间线跳转: -“中国速度”在具身智能的体现:修机器 02:02 创业 moment:科学家能做的探索越来越少,这在大语言模型领域已经发生 04:09 团队搭建:产业老炮+年轻科学家 07:18 Figure 02 的 demo 很好,展示了快慢系统 09:38 中国相对美国优势在于修机器人快,不然修机器人的速度赶不上做实验的速度 12:12 具身智能的阶段划分 14:23 现在中国具身智能在从 L1 到 L2 的路上 -机器人必须得是“人”形吗? 14:41 机器人不一定是人形,但 L2 以后可能需要双臂+轮式底盘 15:31 没有操作、只有移动,不能解决主要矛盾 18:52 双足不难,没有本质的卡点 21:31 虽然操作重要,但一定得有上半身吗?其实是从成本角度考虑的,像“人”一定可行 23:53 人形机器人,到底是更精细分工,还是更泛化? -“端到端是走向具身智能的共识,分层只是短期工程选择” 27:00 端到端(VLA,Vision-Language-Action)是现在具身智能的共识吗? 28:53 训练过程:互联网视频预训练、模仿学习、强化学习 29:51 为什么叠衣服这样的操作会成为具身智能领域的“智商测试”? 34:14 快慢系统在叠衣服这件事里怎么配合的? 35:35 当前机器人的主要挑战是泛化性 -“人是分布式,机器人是中心式” 36:28 视频数据的可用量只有 1%,机器人学习怎么操作、预测轨迹 38:44 人类的肌肉记忆,机器人也有 43:33 跨任务泛化:强化学习成功率取决于基模的训练和 SFT(监督微调 Supervised Fine-Tun-ing) 45:00 具身智能也有 Scaling Laws 吗?做到 GPT3.5,可能需要 100 亿条有效数据、1 亿遥操数据、几千万强化学习数据 49:05 Scaling Laws 在仿真数据不成立 -“具身智能做到 GPT-4 那种程度还得5年” 50:32 为什么只做大脑不行?驯化新的躯体很难的 51:55 为什么只做本体不行?价值在大脑端,现在有了大脑能力才引起的风潮 53:06 机器人未来会像汽车产业链 55:10 关于朱啸虎说的没有商业化,高阳觉得现在最重要的还是把技术做好 56:41 行业何时收敛?当具身智能走向 L2 时 57:57 现在具身智能的瓶颈还是在 AI,要补齐才能成为“木盆” -个人成长:一位信奉 COT 的“小天才” 59:35 伯克利“归国几子”的介绍 01:01:27 同一个实验室的,还有许华哲、贾扬清等 01:03:22 2016 年博士最开始做自动驾驶,那时端到端自动驾驶还不被相信 01:06:41 学术不需要灵光乍现,个人的思考方式就是 COT 01:07:11 所以在明年 6 月具身智能会到 L2,再过一年半到两年 L3 01:07:34 读书时在 waymo 实习三个月:感觉脑子要坏掉了 01:10:15 读博想创业,但没好机会;毕业后回国做科研,伯克利“归国几子”兼职“HR” 01:12:43 跟许华哲最近讨论:看起来具身智能是个非共识行业,但这已经是坍缩、收敛后的结果 01:15:54 大学教授出来创业,会拍拍屁股走人吗? 01:17:37 一个崇尚规律的 ISTJ:不熬夜、骑共享单车上下班、规律健身 相关链接: 晚点聊 86:We,Robot-2,清华叉院/星海图许华哲看“Optimus”的门道 晚点聊 65:信仰充值的威力,与逐际谌华聊 GTC 和人形机器人新进展 晚点聊 40:与梅卡邵天兰聊通用机器人,AI 的下一个浪潮? 剪辑制作:甜食 本期主播:即刻 @王与桐 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
undefined
Apr 22, 2025 • 1h 35min

111: Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端

「长期看,LLM 是 Agent 和人类之间交互的前端,后端则靠 RL 模型完成工作。」 几乎所有主流 AI Agent 产品,都把大语言模型(LLM),或者它的多模态升级版当作“大脑”,靠一个或几个 LLM 编排工作、调用工具。 但也有不同的路。这期节目的嘉宾,Pokee.ai 的创始人朱哲清(Bill),认为 LLM 只是 Agent 理解人类需求、向人类递交产出的“前端”,后端决策、完成任务则可以靠用强化学习方法训练的、不依赖自然语言的模型完成。 Bill 提到,把 LLM 当作大脑时,Agent 调用工具的能力有限。这是因为 LLM 使用工具时,需要先把工具描述、输入、输出等相关信息传入上下文,而 LLM 支持的上下文长度有限。把 Agent 的决策中枢换成另一个强化学习模型可以解决这个问题。 本期节目中,Bill 还聊到优秀的通用 Agent 需要具备四个要素:实现任务比人快、无需人工干预、能读取信息也能写入信息、成本低。Agent 产品的壁垒不在技术,而在于和用户的工作流深度绑定。 此外,我们还和 Bill 聊了他对通用 Agent 接下来竞争态势的判断,以及他在强化学习还并没有成为显学时,便相信强化学习潜力的原因。 Bill 本科开始便在海外留学,不熟悉、常用一些专业术语的中文表达。节目中高频提及的英文术语,可参考 Shownotes 文末附录。 本期嘉宾: Pokee.ai 创始人,前 Meta 应用强化学习负责人、工程经理朱哲清 时间线: -创业前,花近十年研究、落地强化学习算法 04:02 一边在斯坦福读博士,一边在 Meta 上班,每周工作 110 个小时 07:20 拒绝 LLM 创业机会,留在强化学习主航道上 10:17 刚开始研究强化学习的时候,强化学习还并不是显学 16:52 DeepSeek R1 带火了强化学习,让投资人意识到强化学习重要性 -强化学习做 Agent 的优势 19:26 现有 LLM 写入能力较弱,调用工具数量有限 23:51 长期看,LLM 可能只是模型和用户的交互层,Agent 之间沟通不一定用语言 -如何设计一款 Agent 产品,服务专业用户 31:02 保留用户控制节点,避免“自由落体”的失控感 36:36 Pokee.ai 想服务专业用户,未来还要进入企业工作流 43:46 一项子任务失败,不一定挡住 Pokee.ai 完成其他子任务 45:33 抛开 browser-use,强化学习 Agent 完成一项任务只需要数十秒 46:53 Pokee.ai 最初没用 MCP,团队自己设计更简单的协议 48:47 目前主流做 Agent 的方法还是以 LLM 为核心 50:00 优秀 Agent 的四要素:速度快、无需干预、能读能写、成本低 -创业故事:从垂直 Agent 回归通用 Agent 58:20 Pokee.ai 团队全职员工只有四人,成员主要来自 Meta 59:30 早期产品:旅行规划助手 / Shopify 助手 01:02:07 强化学习爆火后,回归创业初衷做通用 Agent 01:07:33 Manus 出圈是意料之内 01:09:54 Pokee.ai 发布产品不会用邀请码,单次任务成本是同类产品的 1/10 01:10:59 技术不是 Agent 的护城河,重要的是和用户工作流绑定 01:20:24 Pokee.ai 在做通用 Agent,但也能帮垂直 Agent 落地 01:22:15 Agent 行业最后会存留三到五家公司,接下来是各个通用 Agent 差异化的时候 01:26:03 判断技术潜力的好方法:Toy Example(玩具案例) 附录: RL(Reinforcement Learning):强化学习; policy:策略,强化学习语境下指模型完成任务的方式; exploration:探索,强化学习语境下指探索可能完成任务的新路径; exploitation:利用,强化学习语境下指利用已知信息,选择最优的动作,和 exploration 相对; reward model:奖励模型,是强化学习算法的一部分,用于评价某个动作的好坏; ground truth:真值,指训练强化学习模型时使用的标准答案; prosumer(professional consumer):专业用户,本期节目语境下指用 Agent 产品完成工作需求的用户; context length:大模型的上下文长度; browser-use:使 AI 能够像人类一样浏览、操作网页的开源工具; Monte-Carlo Tree Search:一种基于随机模拟的搜索算法,用于在决策过程中评估不同选择的潜在结果,常用于需要策略规划的情境中; API:应用程序编程接口,是一组允许不同软件系统之间通信、交换数据的规则; SDK:软件开发工具包,旨在帮助开发者为特定平台或系统构建应用程序。 剪辑制作:甜食 本期主播: 孙海宁(微信 @_HaydenSun) 程曼祺 小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
undefined
Apr 14, 2025 • 1h 40min

110: 与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专

「与模型公司的主航道保持距离。」 2022 年初,夏令在 AI 热潮之前,投资了大模型创业公司 MiniMax 的天使轮。明势创始合伙人黄明明后来曾在暗涌组织的活动上,和 MiniMax 创始人闫俊杰一起回忆投资故事:在米哈游联创刘伟介绍下,明势第一次见了闫俊杰,那会儿其实大家都没太明白闫俊杰要做什么。“好在,夏令听懂了,回来后说,这个项目一定要投”。夏令也是文生图应用 LibLib.ai 和具身智能明星公司逐际动力的早期投资人。 这一期,我和夏令聊了 Agent 行业的竞争形势推演。 在他的认知里,Agent 横跨软硬件——除了 DeepResearch、Devin 这些主要在云端的Agent,以及接下来可能会进入白热化竞争的与手机结合的 Agent;和车结合的自动驾驶,和机器人结合的具身都是 Agent。它们各自处于不同的成熟阶段和竞争形势中。 夏令的观察和判断是,今年下半年开始,围绕入口级 Agent 的大战就会拉开。最为焦灼的战场会是以手机为终端的通用 Agent 产品竞争,主要玩家是掌握超级 App 或流量的大厂和自己能迭代模型的头部大模型公司。OpenAI、Google、Meta、字节、阿里、腾讯都不会放过这个机会,美团、小红书,乃至智能汽车领域的理想也都跃跃欲试。 而在早期投资视野里,大多数创业公司的机会可能在于垂直和专业的 Agent。更通用的 Agent 很可能会因处在模型公司主航道上而备受挑战。模型公司的主航道边界在哪儿?今年 2 月 Google 的一份白皮书有一个比较清晰的框架,我们在节目中有展开。 图注:Google Agents 白皮书中的能力框架图。 夏令已经投资了一些不同的垂直 Agent 商业模式,这也是中美差异所在——在中国,一些新公司不再用做工具的思路做 Agent,来赚订阅的钱,而是用 Agent 直接做服务,获取收入分成。因为中国客户更愿意为结果本身付费,而不是为效率付费。 至于近期被朱啸虎的言论推到风口浪尖的具身智能,夏令投资了这个行业,也从他的角度讲了风险:具身最大的危险,并不是朱啸虎提到的目前没有商业化的 PMF,不能去工厂和商店打工、搬砖,而是具身模型的技术还没有收敛,机器人大脑还没来到它的 GPT-3 的时刻。 本期嘉宾: 夏令,明势创投合伙人,邮箱:xialing@future-cap.com 时间线跳转: 00:06 开场介绍 跨软硬件视角的 Agent & Google 白皮书的里的技术框架 04:57 OpenAI 提出 5 级分类,推理是 L2、Agent 是 L3,DeepSeek 爆火是 L2 对 L1 的降维打击,所有人开始提前想 L3 11:14 Agent 技术框架:模型+编排层(目标理解、推理、记忆)+工具使用 14:23 OpenAI 全局记忆功能上线,新的 wow 时刻 16:19 更强推理能力,会削减 workflow 优势 19:52 MCP 成为工具使用的主流生态,更利好模型公司而非应用公司 通用入口大战,下半年就拉开序幕 22:57 已经逃离九宫格的美团等公司,不想再回到“九宫格” 25:21 美团、滴滴最初可以拒绝接入其它公司的 Agent,但这也许会给身后的第二名创造机会 27:25 云端→手机→新终端,通用 Agent 的入口数量递减;Agent 也会冲击互联网传统的广告商业模式 32:22 大厂布局眼镜端 Agent,Meta 牌面最好 36:07 B(字节)AT 三家,生态相对封闭,互通可能性是什么?一个待验证的预言:下半年就会看到巨头间的入口 Agent 竞争 模型大厂 vs 应用创业,边界在哪儿? 37:45 创业要和模型主航道保持距离 43:20 GPT 4o 对泛 C 文生图应用冲击大,却能帮 to 专业人群的文生图应用打 Adobe 50:44 模型大厂和 Agent 应用的边界在于前者都有泛 C 野心,后者更擅长服务精准人群,做“最后一公里” 53:24 离模型主航道太近的通用 Agent,壁垒不能在技术本身 垂直 Agent 创业机会 54:52 Agent 概念火后,一批已存在的 RPA 公司先受益 57:31 新公司机会:重塑流程(如 Shein)、规模化原本不能规模化的行业、找到低垂的果实(如满帮) 01:02:04 实例:用 AI 帮银行起诉坏账,1 个月发起超 1 万起案件,分收入提成 01:08:30 为什么不是律所+AI,而是原生 AI 公司来做这件事? 01:12:29 这类项目的团队画像:懂行业+懂 AI 01:15:10 Kill time 的内容型 Agent,内核不是解决任务,而是有一定自主性;在当前记忆受限的情况下,还提供不了长期关系 01:17:18 短期机会是做新型内容平台 01:22:12 远期想象:工具 Agent 和陪伴 Agent 的融合 01:24:35 未来 3 年再不到“GPT-3 时刻”可能是个大泡沫,但这是早期投资可以容忍的风险 01:31:42 结尾分享,那些创业公司和开源历史的启发——《九胜一败》、《安卓传奇》、《与开源同行》 01:37:39 本期连点成线 相关链接: Google Agents 白皮书原文 晚点聊106:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
undefined
Mar 30, 2025 • 2h 29min

109: 数字生命卡兹克如何用 AI:把任何重复3遍的事AI化

“AI 殿堂的门童”更先看到了什么?今天的嘉宾,是不少关注 AI 的听友都很熟悉的一位朋友——“数字生命卡兹克”。 这期也是 《晚点聊》想做的一个系列 「I,AI」的第一期,会探讨更多 AI 和“人”,和“我”,和“你”,也就是 AI 和我们的日常工作与生活的内容。 从 2023 年 2 月开始,卡兹克在“数字生命卡兹克”这个公众号上发布了第一篇 AI 文章,此后吸引了大量想了解 AI 和把 AI 用起来的受众。之后卡兹克在 2024 年 3 月开始全职运营这个账号,也陆续做起了视频,见同名视频号。 我本来想和卡兹克聊他广泛使用和测评各种 AI 产品的感受,以及他对那些想更好使用 AI 的人的建议。不过谈话在流动中触及了更多话题。 这期前半部分,卡兹克分享了自己在 2023 年用 AI 做产品的经历。其实 24 年全职做数字生命卡兹克之前,他在一家做公募基金数据分析平台的创业公司担任设计总监。在 22 年底 ChatGPT 刚上线后,他们就开始在公司内全面使用 AI,甚至在 23 年 9 月第二批拿到了算法备案,也是金融领域的第一个。但当他们试图用 AI 赋能业务,做一款想卖给基金公司和券商等机构的 toB 产品后,进展却并不顺利。 24年3月,公司收束和调整业务后,卡兹克离开,变身“肝神卡兹克”。我们从卡兹克怎么用 AI 来改造自己的工作流聊了现在各方向的 AI 产品。这对同样是做内容的我有很多启发。 卡兹克能精准、快速挖掘选题,和高频产出,当然和他“肝”有关,但也和他利用 AI 做了大量自动化有关,比如他们会每天搜集全网 AI 资讯,然后用 AI 模型帮助打分、筛选,挑出最重要的 10 条发到 30 多个社群里,作为早报。他们也会用 AI 分析社群里的讨论焦点,帮助产生选题。 一个特别有意思的案例是,前不久,卡兹克做了一次线下活动,有 2000 多人报名,但只能容纳 200 人。要筛选报名者和分组,在以往组织线下活动时是浩大工程,而这次 AI 帮了大忙。 卡兹克说,他现在想做“AI 殿堂的门童”:让更多人看到 AI 原来能做这么多有意思的事,能帮我们解决问题。 本期结尾最,我们一起回顾、对比了 2023 年和 2025 年卡兹克分别发的两次 AI 产品推荐: 图:2023 年,卡兹克写的的 AI 工具推荐。 2025 年,卡兹克写的 AI 工具盘点,见文章:2025最好用的AI产品大全推荐,看这一篇就够了。 这篇开头没有全览图,我自己用 Manus 做了一个简单的交互网页: https://hhlxioqr.manus.space/mindmap 产品名和公司名是我自己输入的,上线时间是请 Manus 自己查找的,可以看到并不太准确,比如 TripoAI 应该是 23 年 12 月上线的。 *本期头图:卡兹克 2023 年用 Midjourney 制作的 AI《流浪地球3》预告片截图。 本期嘉宾: 数字生命卡兹克,公众后 ID:Rockhazix 时间线跳转: 00:23 开场总结 - 交互设计师-用 AI 做金融分析产品-成为“数字生命” 02:25 交互设计师到首次参与创业 10:23 全公司开始用 AI(代码翻译、UI 设计)→用 AI 做基金分析产品→拿到备案,但客户推广不顺 25:23 兼职做 AI 内容的两次出圈大火:AI 流浪地球3预告片,开始协助郭帆导演在电影制作流程中用 AI;发布 Pika 文章第二天,一天做了 13 个券商线上路演 32:42 AI 内容变难做,一是用户阈值变高,二是一些新进展已离普通人较远(数学、AI for Science 等);DeepSeek 出圈不是因为数学、逻辑,中国人的“ChatGPT”时刻 41:32 想做 “AI 殿堂的门童” 56:26 最近被喷最多是因为 Manus,“我真的没收钱” - 卡兹克怎么用 AI:模型找选题、做分析,DeepResearch 真香! 01:01:09 别人问我怎么用 AI,我先问:你觉得什么东西浪费时间、不相干? 01:03:49 AI 总结社群焦点,用字节 Trae 写数据分析工具,ChatGPT 干“大活”靠谱,DeepResearch 真香! 01:12:09 AI帮助全网筛选提:早 8 早报,晚 8 “内参”,深夜 12 点再汇总外网新动态——干跑两个实习生后搭建的 AI 提效流程 01:18:55 多模态 AI 使用:做海报和设计,但视频内容目前想保持“人味” 01:24:36 用 AI 的坑:错估 AI 能力边界,但不要受挫就放弃;DeepResearch 写小说能力惊人,但现在秒不了乔治·马丁;第一部分账模式的 AI 短剧《兴安岭诡事》已出现 01:31:31 各 Agent 使用体验,大部分偏玩具,因为多步任务中错误会叠加,规划、执行和整合能力最重要 01:39:00 23 年用 Coze 和 Dify 多,但这部分需求后来被 Cursor、Trae 满足 01:41:15 一个用飞书多维表格跑工作流的例子;最近办线下活动,DeepResearch 11 分钟干了去年 11 个人一起做的活:筛选报名者和现场分组 01:51:49 今夕对比,2023 年 3 月的 AI 产品推荐 VS 2025 年 2 月 AI 产品推荐;Jasper 怎么了?音频、视频全部大洗牌,豆包、元宝的崛起,字节系产品多类开花 02:05:50 卡兹克的“焦虑”:AI 会不会正在精英化?AI 还没有出现手机之后的新终端 02:18:36 AI 对更多普通人的意义,群友们的故事 02:26:06 本期「连点成线」 相关链接: 你要的AI工具大全都在这里了!(上) 你要的AI工具大全都在这里了!(下) 2025最好用的AI产品大全推荐,看这一篇就够了。 我用AI做了一部《流浪地球3》的预告片... 贤者之石(卡兹克 DeepResearch 撰写的 3 万字小说) 剪辑制作:甜食 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app