
晚点聊 LateTalk
《晚点聊 LateTalk》是《晚点 LatePost》出品的播客节目
由曼祺和汉洋主持
片言可以明百意,坐驰可以役万景
Latest episodes

Nov 27, 2024 • 1h 4min
91: 成庆:佛学不是精神的止痛药
「原子化的现代人个体,很难去体会他人的苦。导致佛教真正去强调助人利他的一面始终浮现不出来。」——成庆
佛学火了,但它为什么会火?本期节目来自于汉洋研究佛学与佛教后的一系列问题,他与上海大学历史系副教授成庆聊了聊佛学与佛教。成庆老师目前关注明清禅宗思想史,以及汉传佛教的现代化转型问题。同时他也在看理想 App 主持了《人生解忧:佛学入门 40 讲》并且基于该节目出版了新书《人生解忧》。
汉洋的问题很简单:佛学在今天多大程度上被当成了一种心灵疗愈的精神止痛药,成为了身心灵的一种?青年人在消费佛教,到底是在消费什么?学佛,到底要学什么?
佛教,是帮助我们成为更好的自己,还是消除对自己的执念?佛陀是已经觉悟的众生,众生是尚未觉悟的佛陀——今天我们还相信自己也可以取得和佛陀一样的知见吗?
本来自由人。
相关链接:
人生解忧:佛学入门40讲
成庆老师的新书《人生解忧》
永福普贤讲习社
新展|虚堂雨滴声:近代佛教的转型与重生
登场人物:
成庆:非典型大学老師,一切事物的好奇探索者
汉洋:大法应化,随缘盛衰。盛衰在迹,理恒湛然。
后期:甜食
封面:汉洋拍摄成庆老师于《虚堂雨滴声》展览

Nov 20, 2024 • 48min
90: 当每个国家都想要自己的大模型?与云启陈昱聊主权 AI
「不安、野心、机会,与过度投资的风险。」
上周三,黄仁勋和孙正义,相拥于日本东京英伟达 AI 峰会(本期封面)。
这两人除了商业互吹和共叙往事,也提到了一个合作计划:软银正在使用英伟达的新一代 Blackwell GPU 平台,构建日本最强大的 AI 超级计算机。
差不多一周前,日本政府还承诺,未来十年会为日本半导体和 AI 行业,提供超过 650 亿美元的支持。
不光日本,从去年到今年,全球多个政府,包括欧盟、新加坡、沙特、印度、甚至肯尼亚都提出了数十亿美元到 1000 亿美元不等的 AI 投资计划。
他们指向同一个目标——“主权 AI”。
在今年 2 月的“世界政府峰会”上,黄仁勋如此描述主权 AI 的必要性。他说:“每个国家都要占有自己的智力生产,它包含了你的文化、社会智慧、常识和历史,因此你必须拿到和完善这些数据,并拥有自己的国家情报,你不能容许其他人这么做。”
这期节目,我们邀请了长期投资基础软件和 AI 的云启资本合伙人陈昱,和我们一起聊主权AI。
陈昱是约翰霍普金斯大学计算机硕士,芝加哥大学布斯商学院 MBA。与毛丞宇、黄榆镔一起成立云启资本之前,陈昱自己完整经历过创业到退出。
他也是 MiniMax、元戎启行、Zilliz 等知名 AI 公司的首轮投资人。
当每个国家都想有自己的大模型和 AI 基础设施,这带来了哪些机会,又可能有哪些潜在风险?
时间线传送:
·主权 AI,一个有需求的 to G 市场
02:47 国家想自己掌握 AI 基础设施:从中国到沙特到日本
05:35 英伟达 Q1 电话说,其主权 AI 相关收入今年会从 0 增长到 100 亿美元
07:05 为什么过去不讲“主权互联网”,现在讲“主权 AI”?——AI 有价值观,也直接关系生产力
09:03 即使没有地缘政治变化,主权 AI 的需求依然成立
·全球 AI 基建潮的机会:芯片、算力中心与 Infra
09:53 直接的机会在算力层,中国公司缺产能
10:54 AI Infra 也是机会,云启投资了壁仞联创徐凌杰的新项目
13:36 每个国家都想要大模型,肯尼亚都在做斯瓦西里语大模型
14:47 中国模型的人才出海也是机会
16:03 李开复在中东人脉深;不少海外政府也会和阿里、字节等大厂合作
18:11 中国芯片层出海暂时没条件,但未来可能对外输出
22:06 智算基建也有技术机会,如液冷和互联互通 Infra
23:38 支持民间公司 or 政府主导?各国政府有不同选择
25:05 到 2024 年 5 月底,中国大陆建成/在建智算中心已有 280 多座
26:27 大厦里的智算中心,就在晚点三里屯办公室旁
26:49 地方政府招商需求带来智算中心建设竞争
29:56 GPU 更新很快,建设可能跟不上换代
30:26 283 个项目,4300 亿+投资额,36.93 万 P 算力,够训好多大模型
·更好的政务服务?更无处不在的管理?
32:50 多少政府能实现目标?
33:59 政府怎么算收益?
35:57 重点 to G 的应用公司也在拥抱大模型
36:18 讯飞用不了英伟达,和华为昇腾有更好适配
37:42 “如果连 7 年耐心都没有,那就不应该投 AI”
38:17 主权 AI 打开新蛋糕,也带来新竞争,英伟达市占率已到顶点
41:54 国内 to G 账期长是个突出问题
44:45 普通人如何被影响?——更好的政务服务 or 更无处不在的管理
相关链接:
主权AI,对于英伟达成立吗?
283座智算中心布局及东西部差异分析
登场人物:
陈昱 云启资本合伙人
程曼祺 《晚点 LatePost》科技报道负责人(即刻:曼祺 _ 火柴Q)
剪辑:甜食

Nov 13, 2024 • 1h 14min
89: 当技术遇上艺术:与 NVIDIA 和新片场聊 AI 如何重塑创作
移动互联网降低分享门槛,生成式 AI 降低创作门槛。
本期《晚点聊》,关注当技术遇上艺术,聊一聊计算机技术和正蓬勃发展的 AI 技术,如何与 M&E,也就是 Media and Entertainment 媒体娱乐产业相互影响、相互塑造。
围绕这个话题,我们邀请了两位嘉宾一起对谈:一位是 NVIDIA 中国区高级技术市场经理施澄秋(Searching),另一位是新片场的董事长兼 CEO 尹兴良(Ethan)。
他们刚好站在技术塑造内容这个链条的两头:NVIDIA 是人工智能计算领导者,同时 NVIDIA 也会开发大量的软件去帮整个生态更好的使用 GPU。NVIDIA 起家就是依靠计算机图形技术,最初也主要是用在游戏和影视行业。
成立于 2012 年的新片场,则是中国最大的高质量短片和视频素材分享平台,此后也进入制片业务,制作了大热 IP 剧集《鬼吹灯》(怒晴湘西、精绝古城、南海归墟等)系列。
内容创作或者说讲故事,是人类文明最早的活动之一。在 AI 技术之前,这个行业已是一个有长链条的技术工业体系。本期节目中,我们回顾了 AI 之前,计算机图形等技术对内容制作的影响与渗透,进一步展开了生成式 AI 浪潮带来的新变化。
如果说移动互联网大大降低了分享内容的门槛,生成式 AI 的发展则将进一步缩短从创意到表达的距离,让更多人有表达自己的方便工具,未来还可能进一步衍生出新的社区与平台。
影视和内容行业是一个万亿级的全球大市场,AI 带来的新一轮变化才刚开始。
时间线传送:
· AI 之前,影视内容工业已高度技术化
02:07 《南海归墟》怎么制作?重特效剧集的基本生产流程
03:45 从前期概念图到特效拍摄、后期制作,计算机技术已在影视多环节降本增效
04:57 LED 拍摄从昂贵到普及,新版《狮子王》重映,GPU 让光影毛发的更精细渲染成为可能
11:16 从千禧年到现在:拍摄、制作的技术变革
· 移动互联网降低了分享门槛,生成式 AI 将降低创作门槛
22:04 打开视频软件,也许你已经看到过大量 AI 生产的短剧海报
28:09 一个实用案例:NVIDIA Omniverse,数字资产在线协作平台如何提高影视拍摄的效率
32:41 制作方视角:不怕技术新,怕找不到熟练使用的人
35:51 生成式对抗网络(GAN)、NeRF (神经辐射场)、ACE 数字人,前沿技术渗透影视行业
39:48 2021 年 NVIDIA GTC 大会中,黄仁勋“数字分身”的台前幕后
48:45 新片场与国内 AI 厂商有多元合作:即提供训练素材,也在测试、使用各家的模型
50:40 渲染器领域的国产替代机会,D5 已被很多中国团队使用
52:55 Maxine 软件,在网络会议场景实现的眼神聚焦和画面校准功能,使得远程交流更加自然流畅
54:22 大型网络会议、户外直播等复杂场景如何实现高质量流程
57:10 NVIDIA 有两个不直接“带货”,却被黄仁勋视为核心的团队:“开发者关系”和“开发者技术”
59:29 Ethan 的 NVIDIA 总部参访感受
· 工具与灵魂:“内心的想法是一切的根源”
01:02:34 AI 的魅力在于降低创作门槛,普通人也能通过科技工具更好表达创意
01:05:25 NVIDIA Omniverse 的创作者比赛,已涌现出许多优秀的非专业创作者
01:06:21 AI 创作需要数字围栏,人类的意图表达更为重要
01:07:46 教育端已出现学科调整,AI 会催生更多新岗位
01:08:48 普通人拥抱 AI 创作,创作热情和想法仍然是最重要的
01:10:06 AI 可以打动人类,但是不会被打动,人类情感仍然是推动内容创作的本源动力
相关链接:
一位 AI 画家的成长历程丨TECH TUESDAY
争夺 AI 入场券:中国大公司竞逐 GPU
附录:本期播客里提及的技术与产品等
M&E
Media and Entertainment 的缩写,指的是媒体与娱乐产业。
特效回插
在影视剧的生产链条中,特效镜头常常由协力公司单独制作,后期制作阶段会将这些特效镜头插入到影片中相应的位置。
CG
计算机图形学(Computer Graphics,简称CG)是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学。
Diffusion 模型
这是一种生成式模型,主要用于生成高质量的图像、文本和其他类型的数据。
B-roll
是指在影视制作中用来补充主镜头(A-roll)的辅助视频或图像素材。通常,A-roll 包含主要的叙事内容,比如采访、对话等直接涉及故事主线的画面。而 B-roll 则是用来丰富视觉效果、提供背景信息或增强情感氛围的额外镜头。
NVIDIA Omniverse™
是一个提供 API、SDK 和服务的平台。借助此平台,开发者可以轻松地将通用场景描述 (OpenUSD)和 RTX 渲染技术集成到现有软件工具和仿真工作流中,以构建 AI 系统。
NVIDIA ACE
即 Avatar Cloud Engine,是一套可帮助开发者利用生成式 AI 创建栩栩如生的虚拟数字人物的技术。
SIGGRAPH
是由 ACM SIGGRAPH(美国计算机协会计算机图形专业组)组织的计算机图形学顶级年度会议。
RAG
即检索增强生成(Retrieval-augmented Generation),简称 RAG。检索增强生成是一种使用从外部来源获取的事实,来提高生成式 AI 模型准确性和可靠性的技术。
登场人物:
施澄秋 Searching,NVIDIA 中国区高级技术市场经理
尹兴良 Ethan,新片场的董事长兼 CEO
程曼祺,《晚点 LatePost》科技报道负责人(即刻:曼祺_火柴Q)
剪辑:阿鲸Hval
封面:NVIDIA 创始人兼CEO黄仁勋的“数字分身”Toy Jensen。现在,新的生成式 AI 技术可以让数字人的生成过程更简单、低成本、高效。
图片来源:NVIDIA

Nov 7, 2024 • 1h 11min
88: SpaceX 星舰第五飞:“即便成功,也没想到是如此完美的成功”
“为什么要太空旅行?” “因为很酷呀!”
由马斯克创立的 SpaceX 在前 10 月 13 日完成了星舰(Starship)的第五次试验发射。马上又会在 11 月 18 日进行第六飞。
我们邀请了中国某家商业航天公司的前总体设计师陈亮,来与我们一起聊一聊取得重大进展的“星舰第五飞”。陈亮是北京航空航天大学航空宇航推进理论与工程博士,主要研究液体火箭动力系统的流动传热问题,曾参与多项新型飞行器热防护技术攻关和相关国家级预研项目,曾任可重复使用商业运载火箭总体副总师。
(图片来源:BBC)
我们也会就此展开 SpaceX 的研发逻辑,它作为商业公司给航天领域带来的变化,以及中国近年来商业航天领域的一些实践。
陈亮提到,他和很多同行其实没有预料到,星舰这次正式回收 Super heavy ,能如此完美地成功,如此干脆利落,好比在 100 公里时速下,精准倒车入库。Super heavy 就是星舰的推进器部分,星舰第五次实验发射的最大进展,就是成功地用像筷子一样的发射架塔臂稳稳夹住了掉头回到地面的 Super heavy 推进器。
星舰的全部模块可回收,意味着将进一步大幅降低发射成本,包括制造成本和发射时间成本。
低成本,也是 SpaceX 高频发射、快速迭代的前提。低成本和高频次相辅相成,打破了航天业过去奉行的“像飞行那样去测试,像测试那样去飞行的原则”。
SpaceX 的逻辑不一定谁都合适模仿,但这个搅局者已带来实实在在的改变。
时间线传送:
·星舰第五次发射: “即便成功,也没想到是如此完美的成功”
03:02 星舰的整体任务要求:一子级(推进器 Superheavy)回收到发射场,二子级(Starship)部分海上溅落
04:14 一般火箭的组成;星舰其实已超出传统火箭的范畴:介于火箭和航天飞机之间
06:32 火箭从准备到点火、发射、着落的几道关卡
09:06 看直播:超出预料;“即便成功,也没想到是以这种方式成功”
12:08 Starship 的软着陆:第四次跌宕起伏,第五次热防护做得更好
15:18 SpaceX 的逻辑:低成本+高频次发射=快速迭代;传统航天业则是:像飞行一样测试,像测试一样飞行
17:42 不建议初创公司模仿 SpaceX,猎鹰的失败当年也差点拖垮公司
19:56 蓝色起源的标志是乌龟,它相信快就是慢
21:40 NASA 新火箭项目 SLS,从项目上不成功,但它是满足美国载人登月时间表的唯一火箭
24:15 马斯克也许很疯狂,但 Space Age 时更疯狂:二战末期人类还开着螺旋桨飞机开战,69 年就登上了月球
27:58 科学狂人的激进:FAA(联邦航空管理局)一度推迟星舰发射,马斯克试图在特朗普上台后主持技术发展提效部门
32:07 在 SpaceX 做研发,得文武双全、不恐高
·SpaceX 的航天矩阵:猎鹰、星舰、龙飞船、星链
33:00 猎鹰+龙飞船的组合:为空间站送货、送人
34:20 美国一度不能送人到空间站,要靠俄罗斯
35:08 美国两位宇航员仍滞留空间站;SpaceX 没去接,因为 NASA 没钱接
36:30 星舰和猎鹰的区别:星舰是为了去火星;目前方案需要在近地轨道 5 次加注燃料
38:20 火星不一定有经济价值,但太空旅行很酷
39:33 人类去火星,马斯克说 5 年,悲观看 10 年,NASA 的设想是 2050 年
41:46 星舰降成本的法宝:回收+使用民用部件+培养多面手
45:40 SpaceX 一个结构工程师,可以既做火箭结构也做卫星结构
47:51 全球火箭发射竞争格局:中美最强,欧洲最近扶持力度增大
·中国的商业航天实践
50:51 2010 年到 2020 年,中国航天陆续启动重要项目
51:52 北航的“宇航学院”每年招生在 150-160 左右,近年 60%-70% 毕业生进入航天业
53:03 中国空间站发射、嫦娥五号探月工程、天问火星探测器,近年中国航天成果密集
55:18 商业航天公司能让个人更快速、全面成长,但整体人力资源有限
58:30 中国商业航天和 SpaceX 的差距——中国公司取得 Milestone 的时间更短;政策支持+航天基础+人才储备是只能怪过的优势
01:00:54 但 SpaceX 也在指数级发展,星舰出世开启新一轮追赶
01:01:41 从 SpaceX 身上学到的:回收模式+工程实现的启发
01:02:02 SpaceX 并未公开任何图纸,它的开放在于不会追究学他的人
01:03:09 从 SpaceX 获得启发的例子--猎鹰回收时的辅助支撑腿
01:05:12 中国商业航天发展需要的更多支持——资金+更多容忍失败;国内管理部门现在已经有很多支持
01:07:40 平民进入太空会成为趋势
相关链接:
星舰成功发射,SpaceX 如何在美国打败航天旧体系
登场人物:
陈亮,中国商业航天公司前总体设计师
程曼祺,晚点 LatePost 科技报道负责人(即刻:曼祺_火柴Q)
剪辑:甜食

Oct 30, 2024 • 54min
87: 家里又多了个“怪东西”!与云鲸聊新消费电子品的诞生
扫帚、吸尘器、扫地机器人,为什么还不够?
近年来,消费电子市场不断出现一些新品类,骨传导耳机、洗地机、vlog 相机、智能眼镜等等,这些新品开始在市场上找到了自己的位置,也带动消费电子市场复苏。
每年都会有新品出现,但最终能被市场接受的不多。一个新的消费电子产品品类是如何出现的?它要满足哪些条件才能在市场上立足?
本期《晚点聊 LateTalk》由云鲸智能赞助,我们邀请了云鲸洗地机产品线负责人庄彬来分享一款新消费电子品从 0 到 1 的诞生过程。
庄彬是消费电子行业资深从业者,曾领导扫地机器人、智能洗地机、消费无人机、云台、激光雷达等多款、多品类的产品研发工作。2021 年加入云鲸,孵化了云鲸洗地机品类线。2023 年 5 月,云鲸正式发布第一代洗地机 S1,今年 9 月又正式发布第二代洗地机 S2 Island 光辉版。在整个中国洗地机市场,云鲸今年 9 月的市占率首次跻身前三。
洗地机在吸尘器、传统清洁工具和扫地机器人的夹缝里生长,它的市场规模从 2019 年的 0.9 亿快速增长到了 2022 年的 100 亿。
我们与庄彬聊了他近几年印象最深的消费电子新品,为什么行业不断有新的消费电子产品出现,他们满足了怎样的需求,一家消费电子公司是如何调研需求、拆解需求、立项并把产品做出来,以及云鲸的产品理念是如何在洗地机这款产品上落地的。
消费电子行业一直以来最核心的理念就是 PMF 产品与市场的匹配,云鲸作为一家年轻的公司,成立几年时间就就切入扫地机器人主流市场。他们的经历与思考对于行业可能是一个参考。
时间线传送:
·新的消费电子品类如何产生
01:48 印象最深的几款新的消费电子品类
03:58 消费级无人机为什么能成功
07:01 成功的消费电子品类满足什么条件
07:49 不成功的案例,创新没有匹配需求
·调研→立项→研发全流程
09:45 立项前最重要的几个问题
11:32 产品经理如何分辨真伪需求,如何给需求的重要性排序
13:12 要去挖掘用户表面需求背后真正的底层需求是什么
15:23 云鲸怎么解决洗地机毛发缠绕的问题
·洗地机为什么会出现,解决了什么需求
18:17 洗地机是一个舶来品,最早是清洁海外用户的毛毯地面
20:56 疫情期间智能清洁产品火爆
23:44 洗地机是取代吸尘器,和扫地机器人不冲突
29:00 云鲸为什么做洗地机比较晚
·个人经历与转型,从研发转型产品的经历与思考
32:51 为什么从研发转型为产品经理
35:52 最初怎样规划这款新的洗地机产品
·清洁产品的未来
45:27 智能清洁产品共同面对的问题
47:43 最终会有一个终极的清洁产品出现,类似通用机器人
51:59 给产品新人的三点建议
相关链接:
新新访谈|云鲸张峻彬:只有创始人走出低谷,公司才能走出来
本期人物:
庄彬,云鲸洗地机产品线负责人
张家豪,晚点科技报道作者,即刻:Erlade
剪辑:
甜食

Oct 27, 2024 • 1h 5min
86: We, Robot-2,清华叉院/星海图许华哲看“Optimus”的门道
“人类最大的科学幻想之一,怎么一点点变得现实。”
今天的节目还是和特斯拉近期的 We,Robot 发布会有关,主角从与侯晓迪那期(见《晚点聊》ep84)聊的自动驾驶来到另一个全场焦点:特斯拉人形机器人 Optimus。
我们邀请了清华大学交叉信息研究院助理教授、同时是清华叉院具身智能实验室负责人许华哲来与我们分享他的观察和实践。去年开始,许华哲也参与创立了一家具身通用机器人公司——星海图。
许华哲本科毕业于清华大学电子工程系,在伯克利 AI Research Lab(BAIR)获得博士学位,后在斯坦福做博士后,2022 年回国加入清华大学交叉信息学院。博一做过自动驾驶后,他在博二开始关注机器人领域,伯克利也是较早尝试把强化学习和机器人结合的重镇之一。
这期节目里,我们从 We,Robot 发布会出发,解释了有争议的“遥操”到底是什么,现在有什么用;许华哲也详细介绍了这次具身智能变革的一些关键技术推动因素,如强化学习、模仿学习、多模态大模型、世界模型等等;他还分享了 BAIR 的教授与博士生的工作方式。
通用智能机器人是一个交叉学科,也是人类最大的科学幻想之一。AI 知名学者 Marvin Minskey(马文·明斯基)曾预测, 3-8 年后,我们就会看到通用智能体,不过他说这话时是 1970 年。新一轮 AI 热潮为何会不同?最前线的人提供了他们看到的可能。
时间线传送:
·许华哲的求学经历
01:04 从清华电子系到伯克利 AI Research 博士,再到斯坦福博后
02:10 三在多伦多大学交换,机缘巧合下开始接触 AI 研究。
·WeRobot 上的 Optimus,到底怎么理解遥操?
04:50 很马斯克风格的发布会
05:40 丝滑遥操作也有实用价值:远程劳动力转移;同时能帮助获得更多数据,使系统进化。
06:46 判断机器人好不好的两个小 trick:机器人走路时,周围人越少越好;机器人操作使,周围人离机器人越近越好
07:51 遥操目前有三种常见方式:从视频映射、人带着 VR 设备遥操、用与机器人同构的专用遥操设备遥操,斯坦福 Aloha 就使用了第三种
10:01 从遥操到机器人自己动需要:更多的数据,更好的模型
12:47 马斯克拉高大众对机器人的期待,整体是好事,但专业人士也许有时生气——2017 年的一个活动中,马斯克大谈明年实现自动驾驶,Andrej Karpathy(特斯拉自动驾驶前负责人,后回到 OpenAI,今年自己创业了)“脸都绿了”
·通用具身机器人照进现实,变化并不始于 Optimus
-强化学习、模仿学习和多模态大模型
14:56 伯克利 AI Research:较早关注强化学习;这里鼓励一起合作,不同老师和博士间自由组合,很适合机器人交叉领域
20:28 斯坦福、伯克利、MIT 机器人谁最强?美国高校的人才的轮动机制
21:41 一个标志性工作:ETH(苏黎世联邦理工)让机器狗在仿真环境里学会爬山,这是是强化学习在机器人中的应用
23:37 许华哲自己的项目:机器狗学会在软垫上走,通过改进一个强化学习算法,让机器人不是在仿真里学,是在真实环境里学
25:20 算法和模型架构是两个概念,同一个算法可用不同架构的神经网络实现;强化学习两个最典型的算法范式:基于值的学习(Q学习)和基于策略的学习。
28:51 接下来谁能做出非常有效果的“具身大模型”,会是一个进展
29:23 除了强化学习,其它重要进展:模仿学习、多模态大模型 & 三者的不同作用
32:54 目前具身智能公司,自己做强化学习、模仿学习多,多模态大模型一般使用外部的,如 GPT 等。
-世界模型
34:11 目前是个笼统概念——根据目前状态能推断未来状态,都可以是世界模型
35:24 为什么 Sora 不是世界模型,而 YX (也是一个视频模型)是一个世界模型?
36:52 机器人包饺子的例子:当时用到的“世界模型”就是一个神经网络,不过是一个很局限的版本。
38:04 实现通用机器人,世界模型一定是组成部分,但其实现在大家并不完全知道怎么做世界模型;目前 AI 界提出的几种主要思路
-触觉(感知里被忽略的一个部分)
39:14 触觉是个被忽略的模态,而人最大的器官是皮肤;触觉缺失的患者很难抓东西
41:00 触觉和力控传感的区别
-本体
42:29 机器人本体形态目前五花八门,为什么星海图觉得当前操作(双臂)更重要
45:28 关于灵巧手:在清华有各种尝试,但并不适合现在就放在公司里做,要做好灵巧手,难度不亚于做好一个完整人形机器人
47:53 目前星海图“力出一孔”要做好的事:移动操作的本体、遥操作和智能。
·从机器人的现在到未来
48:19 明斯基 1970 年的乐观,3-8 年后就会有通用智能体
49:26 清华姚班本科生关于 AGI 的预期小调查:今年比去年悲观
52:03 从现在到未来的瓶颈:数据;目前行业里还没有清晰的数据采集成本,因为采集方法也没有定型;星海图自己获得数据的 3 种方式
55:30 未来机器人上的模型,是一个端到端大模型,还是在不同层次用不同模型来组合?——许华哲相信类似 VLA 的端到端模型是未来趋势,但不一定最适合现在来落地。
58:14 目前大模型范式有缺陷,但可以一边先用,一边改进
59:07 UBI(无条件免费发钱)计划不一定能解决未来的社会危机
59:51 要警惕人类不经意间丧失权利,你有可能失去“在健康日吃炸鸡的权利”
01:02:17 一致性与对齐:机器以会实现我们设定的目标,但可能以我们想不到的方式,使我们付出想不到的代价
相关链接:
特斯拉 Optimus 机器人进展:已经生产数百台、还拧不好螺丝
到底什么时候AI才能帮我把麻烦事都做了啊啊啊啊?|许华哲 一席第1037位讲者
晚点聊 LateTalk-84:与侯晓迪聊特斯拉 We,Robot:烟雾与现实
附录:播客中提及的一些 AI 领域人物(按提及顺序)
Andrej Karpathy,AI 研究者,曾任特斯拉自动驾驶负责人,今年创立了人工智能教育公司 Eureka Labs。
Trevor Darrell,Berkely AI Research Lab(以下简称 BAIR)教授,Caffee 的搭建者之一,许华哲的博导。
Sergey Levine,BAIR 副教授兼谷歌 DeepMind 研究员,今年参与创立研发机器人大脑的 PI。
Pieter Abbeel,BAIR 教授,智能协作机器人 Covariant 的创始人之一,2021 年 ACM 计算奖获得者,Amazon 后收购了 Covariant 的部分团队。
Anca Dragan,BAIR 副教授,运营 Interact 实验室。
Jitendra Malik,BAIR 教授,其团队在机器人视觉触觉结合等方面有突破。
Alexei Efros,BAIR 教授,计算机视觉专家,在图像合成、风格迁移等方面成果突出。
Chelsea Finn,斯坦福助理教授,研究智能体学习交互能力,曾在谷歌大脑工作。
Yann LeCun,图灵奖获得者,Meta FAIR(the Foudamental AI Research)负责人。
David Ha,AI 研究者,2018 年 3 月曾发布论文“World Models”
Marvin Minskey,麻省理工教授,“人工智能之父”,推动 AI 早期发展的重要学者。
Dieter Fox,华盛顿大学教授,研究机器人感知规划学习等,对复杂环境应用有贡献。
登场人物:
许华哲,星海图联创、清华交叉信息学院助理教授
程曼祺,晚点科技报道负责人。即刻:程曼祺_火柴Q
剪辑:甜食
封面:Screenshot from Robert Scoble on X

Oct 23, 2024 • 45min
85: 国家从无到有,拢共分几步?|工业化之路 01
丰泽汉洋空口从零模拟国家工业化:泽洋波利斯的崛起之路!开局 5000 万人口、资源有限、生育率极高,该如何夺取天下?
建议点赞收藏转发,以后你和朋友穿越到异世界建国的时候能用的上。
晚点聊新系列,工业化之路第一期节目。
相关资料:
想要发电,要先有电:一个总工在中国和非洲修水电站的故事
国在水电站方面基本上处于天顶星级别存在:和非洲回来的曹工唠唠
人民币上的水电站,为啥炸了重建?清北打灰佬,探访「水电站之母」【吉林·丰满大坝】
【番外】没人能在钢铁厂想小事儿:伯利恒
登场人物:
丰泽:在非洲打了三年灰的博士
汉洋:万古长风,一朝风月
制作:甜食
封面:汉洋拍摄于七台河

Oct 16, 2024 • 1h 9min
84: 与侯晓迪聊特斯拉 We,Robot:烟雾与现实
「一切以 CPM(每英里综合运营成本)为纲。」
本期《晚点聊 LateTalk》,我们邀请无人驾驶资深从业者侯晓迪探讨刚刚结束的特斯拉无人出租车(Robotaxi)发布会 We,Robot。
侯晓迪本科毕业于上海交通大学,后在加州理工大学获博士学位。他曾是自动驾驶第一股,图森未来的联合创始人,历任 CTO、CEO 和董事长。去年他开始了新创业,成立 Bot Auto,继续做自动驾驶。
马斯克式爽文的惯常叙事是:提出一个不切实际的想法→给出一个激进时间表→苦苦挣扎、多次延迟、陷入绝望→最后绝地反击。
无人驾驶也不例外,2016 年至今,特斯拉已数次跳票承诺。但今年初开始,特斯拉的一系列进展让外界期待大增,尤其是 FSDv12 的惊艳表现。
但 10 月 10 日的这场发布会,信息过于模糊,它短期带来的更多是失望:发布会第二天,特斯拉股价下跌约 9%,Uber 则大涨 10%。
侯晓迪说,这次发布会使他略感意外之处是,在全无人驾驶领域,部分人对马斯克的宗教式狂热正在减弱。
侯晓迪分享的核心观点是:L4 自动驾驶现在更多是一个多个问题组合而成的复杂系统工程,目前到了以 CPM(Cost Per Mile),即“每英里综合运营成本”为指引的阶段。
各公司的关键赛点,是怎么在保证安全的情况下降低 CPM,从而能比现有运力网络更有优势。马斯克在发布会中也提到了 CPM 这一指标,不过侯晓迪非常不同意马斯克说的具体数字。
我们也与侯晓迪聊了他对自动驾驶行业近年的一些热点技术,如「端到端」和「世界模型」的理解和看法;以及他在离开图森之后,再次创业做 L4 自动驾驶的新认知和选择。
时间线跳转:
·We,Robot 发布,马斯克的现实扭曲力在减弱
04:07 人们对 Musk 的宗教式狂热在消退
07:10 高科技发展中始终有两面,技术客观规律 VS 公众意志与期待,特斯拉擅长拉满期待
10:29 0.2 美元每英里运营成本为何是胡说,一个简单的计算题
12:13 CPM(每英里成本)应该是一个统一标准,就像会计准则
16:31 运营的魔鬼在细节,一个例子:胎压检测
19:26 Cruise CEO 发布会前给出 15 条要点,马斯克则都没讲
22:40 技术发展和 CPM 下降并不矛盾
26:14 机器人的遥操:从大众到业内人士的 3 层观点
29:07 Robotaxi 领域闯入新玩家的影响——也许没那么大影响
·认可端到端大方向,不认可技术被宗教化
30:55 FSD 休斯顿体验,运气好 10 分钟接管一次
31:10 端到端,是一种技术的“意识形态化”
34:50 Scaling Laws 原初论文里有诸多限定条件,愚者的问题是无节制地外推
38:31 端到端的新网络架构有优点,也增加了限制因素,如不可解释→难以合规
41:41 车主的车撞死了人,算谁的?——Cybercab 量产前,用 Model 3、Y 接单的“Airbnb”模式也难以实现
42:29 ”世界模型“,学术上的更早源头是内蕴表征
47:48 世界模型要解决的问题:包含各种物理规律,因而是一个做具体任务的宝箱
49:56 L5 是永远达不到的地平线,L4 是产品,产品就谈挣钱,不寒颤。
51:50 赚钱路上的眼见瓶颈:远程遥控 1:3 怎么走到 1:10
·从硅谷到休斯顿,远离 Breaking News Overflow,靠近产品和运营
53:21 Bot Auto 的 2000 万美元融资,什么人还愿意投入自动驾驶?
57:17 回顾上段创业:不要过早扩张,重要的不是收入,而是利润
01:01:32 休斯顿 VS 硅谷,离投资人和喧嚣远了,离产品近了
01:06:46 Bot Auto 年内小计划
相关链接:
《马斯克 19 分钟发布会,PPT 是一回事,现实是另一回事》
15 key things to look for from new robotaxi players(Kyle Vogt)
(Robotaxi 新玩家需要注意的 15 个关键点——Cruise CEO Kyle Vogt)
登场人物:
侯晓迪,Bot Auto 创始人 & CEO。
程曼祺,晚点科技报道负责人。即刻:程曼祺_火柴Q
剪辑:甜食

Oct 10, 2024 • 1h 16min
83: 《智人之上》:没有AI,寻找意义也是每个人的必解题 | 串台《知本论》
与人类学者袁长庚聊“文科生”赫拉利的技术观察。大历史下,也可寻找小空间。
封面:一战中的英雄军鸽谢尔·阿米(Cher Ami)。赫拉利用阿米的例子说明了故事和人造符号如何深入人心,甚至改变了当事人的记忆。
这是一期串台节目,感谢中信出版旗下中信书院的播客《知本论》的邀请,我和知本论主播孙冰洁,一起与人类学家袁长庚聊了尤瓦尔·赫拉利的新书《智人之上》。
袁长庚是香港中文大学人类学博士,先后任教于南方科技大学和云南大学。他从自己的角度简单总结了这本书和赫拉利的写作与论证思路。赫拉利擅长“大历史”写作,甚至被批评立论先行,这被学院派的研究者警惕,但他的洞察和担忧常常直击要害。
在《智人之上》这本新书中,赫拉利提出的问题是:人类要如何应对信息网络里人工智能这个空前强大的新变量?我们如何避免人工智能的失控?
在这次对谈的开端,赫拉利抛出的问题仿佛是无解的,他在《智人之上》的结尾提出了一个设想:提前构建一个有制衡机制的信息网络;这有些书生意气,缺少执行路径。
而随着对话深入,我们更多聊了个人可以做什么,袁老师对身边学生、年轻一代的观察,他从深圳到云南的新生活和感受,都给了我们书之外的更多联想和启发。
其中最重要的一点可能是——哪怕没有新的 AI 技术,寻找意义也是每个现代人都要解的一道题。这与我们的上期播客《人活着有啥意思》形成了有趣的互文。
研究近代军事史出身的赫拉利是一个“文科生”,人文学者的技术评论会不着边际吗?也许恰恰是跳出学科分类抽屉的赫拉利,会有更锋利的目光。归根结底,技术总与人相关。
《知本论》已上线《智人之上》的电子有声书,可点击链接:https://www.xiaoyuzhoufm.com/podcast/66de6cffee04007d8826f53e
此次串台中,《知本论》的节目直接从延展讨论部分开始,《晚点聊》这期也放了更多有关《智人之上》书籍本身的介绍和讨论。
时间线传送:
·《智人之上》,一部信息简史
02:47 《智人之上》的三段论:赫拉利对人类信息网络的观察+当 AI 新变量进入信息网络+警示与提醒
12:45 人文学科出身,但赫拉利有立场谈技术和 AI
17:23 赫拉利是一个“跳出抽屉”(学科分工)的人
21:02 科学家的天真:可能过于简单地理解了技术和社会的关系
·身边的信息观:天真的 VS 民粹的
23:36 身边的“天真信息观”:更多的信息,反而带来了更低的信息素养
28:26 “不反思”也许才是自在状态,信息里存在错误、盲目是人性使然
31:10 “民粹信息观”和“天真信息观”的一体两面
36:41 赫拉利也许夸大了 AI 的能力,但即使没有 AI 进化,新技术对信息网络的影响已是一个真实命题
40:42 韩国换脸事件、东欧小镇女孩的遭遇,事情为何难办
·哪怕没有人工智能,找到意义也是一个挑战
44:58 担忧“被取代”,本质是现代性之后难寻意义感
47:51 用工作来建构意义和“我是谁”的认同,这不是历史常态
51:56 种咖啡、种大米,重新建立身体与世界的连接?
55:31 一场“假葬礼”,如何让学生选定了工作 offer
58:23 不要轻易让渡权利,妙鸭的风波
59:47 沉溺“社交网络”,这也许是阶段性现象
01:05:29 从云南到深圳,云南人身体里有另一个闹钟
01:12:27 技术快速变化,我们可以做什么“日课”
相关链接:
《知本论》此前已经与人大新闻系教授刘海龙,和复旦国际关系学者包刚升,从信息和大国竞争等角度聊了《智人之上》。大家如果对这本书和它讨论的议题有更多兴趣,可听相关节目,补充更多视角:
关于“意义感”的更多讨论:
晚点聊 LateTalk-e82:人活着有啥意思
关于 “AI 威胁论”的更多讨论:
晚点聊 LateTalk-e71:对谈港大计算机系主任马毅:如果相信只靠 Scailing Laws 就能实现 AGI,你该改行了
登场人物:
袁长庚,人类学者。
孙冰洁,知本论主播。
程曼祺,晚点科技报道负责人。即刻:程曼祺_火柴Q
剪辑:甜食

Sep 26, 2024 • 48min
82: 人活着有啥意思
「大家都是牛马,凭啥你加夜草」——轶轩
和节目的老朋友丰泽聊聊人活着有啥意思,可以算是和王小伟老师那期《每个人活着都难受》那期的另一个版本。大部分问题想清楚很简单,想开了很难。意义的神圣感和吃饭喝水一样,是人的刚需。人活着有啥意思不是个虚无缥缈的问题;尤其是当代社会充斥着各种各样的「以工代赈」,工作意义早已被掏空。但人的价值不(光)是靠工作体现的。评价指标出了问题,不是人出了问题。
相关链接:
每个人活着都不舒服
圣山与山
没有签证怎么去非洲干活:和丰泽聊聊在非洲不同国家打灰的体验
是理想也是现实:一个清华博士的非洲选择|文化纵横
登场人物:
丰泽:海洋于他们而言如同河流
汉洋:现前一段西来意,一片西飞一片东
后期:甜食
封面:烟火,汉洋拍摄于日本
Remember Everything You Learn from Podcasts
Save insights instantly, chat with episodes, and build lasting knowledge - all powered by AI.