视觉传达考研(视觉传达考研考什么)




视觉传达考研,视觉传达考研考什么

更深刻了解汽车产业变革

出品: 电动星球News

作者:星球君

10 月 17 日,极越搞了个大新闻。

当天上午,极越官方发布了两个视频:一个是极越PPA 点到点领航辅助驾驶,在上海外滩陆家嘴的「纯视觉」一镜到底视频,另一个则是基于 Occupancy Network 占用网络的感知技术 DEMO 视频。

截止到 2023 年末,一镜到底的城市智驾不少见,但官方发布 OCC Demo 的例子并不多,展示纯视觉城市领航的主机厂,在中国更是几乎没有。

尽管今年城区智驾卷得不可开交,BEV、Occupancy Network 等技术底座大家都在讲,但「讲」和极越直接「秀」,还是两个概念。

关键在于,从极越当天所展示的 Demo 来看,这是一套基于纯视觉路线的高阶智驾。

这意味着,极越已经具备了量产纯视觉高阶智驾的能力——在「摆脱 LiDAR 」这件事上,极越和特斯拉有着同样的追求——甚至这次国内首发纯视觉+OCC 双视频,已经让极越的本土化智驾能力,抢先了特斯拉一步。

从概念车到实际跑通城区智驾,极越的纯视觉能力走到了哪一步?如果这套纯视觉方案真的量产,又能否让极越在 2023 年末,与特斯拉,又或者是其他新造车正面对垒?

我们 17 日下午在北京采访了极越 CEO 夏一平和百度智能驾驶事业群组技术委员会主席王亮。

结合访谈内容,我们今天来聊聊极越的「后发先至」

丢掉拐杖

想要聊清楚为什么行业内很多玩家都在「密谋」摆脱激光雷达,我们先要了解当初激光雷达为什么上车

回到 2015 年,自动驾驶的洪荒时期,激光雷达同时获得了 L4 技术公司,以及乘用车工程路线两边的认可。

原因很简单,当时纯视觉路线还没有得到 BEV、Transformer 等新技术的助力,提取信息极其困难。特别是对于「3D 可达空间」,也就是覆盖真实物理世界行车环境的感知来说,当年的纯视觉远谈不上成熟。

而激光雷达直接能得到 3D 立体感知,并且无论是理论研究还是工程落地,感知层面都简单直接得多。

于是激光雷达成为了量产自动驾驶第一个七年之痒的「肌肉记忆」,直到2023 年末,带有激光雷达的量产智驾方案,仍然是主流

但同样是 2023,我们观察到一些变化。

比如供应链端,今年大疆车载的成行平台、毫末智行的第二代 HPilot,都提出了不依赖激光雷达,只用纯视觉实现城区领航驾驶的方案;博世 9 月份也已经表示,不再投入任何资源开发激光雷达。

前不久,10 月 11 日毫末智行 AI Day 上,董事长王凯接受采访时也对我们表示,长远来看,激光雷达是要去掉的。

再比如车企层面,前小鹏汽车自动驾驶副总裁吴新宙也曾透露,尽管他们不确定激光雷达是否一定需要,但在实际的建图、定位等功能上,都跟激光雷达没什么关系。

「我们用激光雷达一直非常收敛」,吴新宙 7 月份接受晚点 Auto 采访时这样说。

激光雷达开启了自动驾驶感知进化的滚滚洪流,但随着技术进展,我们发现纯视觉路线正在补全立体感知曾经的劣势,而从供应链到主机厂,逐步减轻,甚至尝试摆脱激光雷达的依赖,也在行业头部玩家的讨论当中。

于是回到一个问题:为什么偏偏是极越,国内首个发布了纯视觉方案跑通点到点城区智驾的视频?

事实是,极越的速度,4 年前就有迹可循。

早在 2019 年初,马斯克就曾表示「激光雷达就像是拐杖」,当年 4 月份 Autonomous Day 上那句「你会开车不是因为眼睛发射激光」,更是纯视觉路线的名场面。

冷知识:那时大洋彼岸的中国,同样有着纯视觉自动驾驶方案的探索者。

2019 年 CVPR 国际计算机视觉会议上,4 年前的王亮这样说:

「相比成像原理和时空采样密度各异的激光雷达,视觉成像技术的发展趋势清晰,视觉感知在数据标注、数据复用和模型泛化技术上都更加成熟可控」。

2023 年 10 月 17 号的王亮这样说:「我们想办法戒掉激光雷达」。

从 2019 年的探索,再到 2021 年极越正式成立,这条纯视觉之路远在大众视野之外延伸。

极越成立的最早阶段,伴随着 BEV、transformer 等新技术的出现,夏一平和王亮就打算对纯视觉路线做彻底的技术重构。

但站在 2021 年那个节点,纯视觉还不够成熟,BEV+Transformer 路线尚未得到足够充分的检验,大家都需要激光雷达把好最后一关。

所以第一个版本的极越智驾研发方案,是有激光雷达的——这可以算是极越的「1.0」时期,凭借激光雷达的本征安全,弥补纯视觉算法和算力的暂时不足。

伴随着这次双视频的公布,我们看到了极越的「2.0」时期,也就是纯视觉能力具备较高成熟度的时期。

在一镜到底的城区智驾视频里,极越展示了不借助激光雷达的纯视觉能力,跑完上海陆家嘴-外滩-南浦大桥等路段,全程零接管

从路段选择上,我们能看到极越的信心,这是上海的核心繁华地段,同时 9 分钟的视频里,极越的纯视觉方案展示出了全面的能力:

包括机动车/非机动车/桩桶的避让,以及城区内的变道、上下匝道、隧道分流等极其考验感知和处理能力的「老司机」级别场景。

一镜到底的背后,也代表着极越 BEV+Transformer 的纯视觉技术方案,正在走向成熟。

虽然不是最早的新造车,但极越的纯视觉智驾方案,却是和特斯拉同一时间,向纯视觉高阶智能驾驶发起冲击的先行者。

后发先至的信心

除了展示纯视觉方案以外,极越 17 号还公开了号称「国内首个」的占用网络技术(Occupancy Network,下面简称 OCC)DEMO 视频,这是纯视觉智驾能力的又一次「秀肌肉」。

视频中,极越展现了完整而清晰的 OCC 能力,包括栏杆、绿植、路障的标准障碍物以外,还另外识别出了施工中的工程车、树木中被遮蔽的路灯等等异形障碍物。

OCC 是智能驾驶感知领域的关键技术,基于 BEV 鸟瞰视觉的 OCC 占用网络,是真正实现 3D 可达空间感知的「利器」——纯视觉 OCC 的终极目的,就是不依赖激光雷达,甚至也不依赖毫米波雷达和超声波雷达,实现复杂环境下的智能驾驶功能。

那么,OCC 如何帮助纯视觉摆脱对 LiDAR 的依赖?

占用网络技术(Occupancy Network),以视觉信号为基础,在传统3D目标识别能力之上,通过体素(Voxel)化的方式理解和处理空间信息。

体素,可以简单理解为立体的「像素」,像素组成计算机眼里的平面世界,体素则组成车辆识别的立体物理世界。

由于增加了体素占用的感知,感知系统可以对 3D 物理空间的可通行区域进行高保真度还原,不需要考虑物体是什么,只考虑体素是否被占用,从根本上避免传统视觉对非训练集内物体的漏检问题,使模型的泛化能力大幅提升,能更好适应不同场景和环境

相比激光雷达产生的稀疏且不连续的点云,高清摄像头采集的信息内容更丰富,让占用网络更好地将 3D 几何信息与语义信息融合,帮助汽车机器人更准确还原 3D 场景。

另外,在如今智驾摄像头信息丰度持续提升的背景下,OCC 能更好地将 3D 几何信息与语义信息融合,帮助智驾系统更准确还原 3D 场景,和视觉+激光融合的方案比起来,泛化和模型迭代的速度都更优异。

从终局回到现在,夏一平表示速度决定胜负。

他采访时透露,实际上纯视觉方案的模型能力提升速度、泛化速度,都超过了极越团队的预期。

极越的 OCC 也同样争分夺秒,为了长期竞争力,团队选择尽快上线,然后形成「BEV+Transformer 的纯视觉方案+OCC 占用网络」的技术体系——极越官方表示,这套架构已经具备了量产能力,激光雷达不再是唯一的解决方案

「这是一套未来几年都撑得住的架构」,王亮这样形容极越自 2021 年开始重写的这套纯视觉技术底座。

2021 发生的另一件事,是 1 月份马斯克开了一场会,他说「我们应该用纯视觉方案解决(自动驾驶)问题,如果我们能做到,我们就能颠覆游戏规则」。

很多现在看来足够激进的技术路线,都源自当初一次更加激进的拍板。两个大陆,同一时间,两个团队同时向纯视觉发起冲击,于是两年后,我们看到了极越的纯视觉+OCC 速度。

速度的背后不止有拍板的坚决,还有智能体系化能力,进场两年的极越怎么「卷」嬴「老牌新势力」?

夏一平给出的答案是:如果你认为汽车是智能设备,需要非常庞大的软硬件生态支撑,极越背靠的技术体系,是最完美的

不论是 AI 算力、数据能力、原子化能力,他认为这些技术能力,都可以成为极越的「后场发动机」。

高阶智驾的中场战事

本周,特斯拉在华正式推送 32.9 软件,更新 Tesla Vision。

从 17 号极越公布去激光雷达城区智驾,正式版 Tesla Vision,大家对这两家公司在中国、在纯视觉路线正面对垒的期待,被连续激发。

夏一平前段时间去了美国,开了 FSD Beta,他觉得不错。但是他提了一个关键问题:美国的不错,是不是就等于中国的不错?

他强调为极越赋能的百度智驾深耕国内多年,对于中国的法规、路况、行车习惯来说,无论是城市间的泛化能力和本地化适配,一定比特斯拉更好、更快,「我们的 NOA 一定比他强」

特斯拉 FSD 和极越 PPA,是目前基于占用网络+纯视觉 BEV 路线的两大高阶智驾功能。而在中国本土化道路上,目前PPA已经抢先落子,继上海之后,其他主要城市也已经在并行检验。

当基于 OCC 占用网络和 BEV+Transformer 组成的技术底座,组成了新时代的纯视觉路线,这同样是极越和百度作为本土企业,在交通理解、数据闭环方面的速度优势。

虽然官方尚未透露 OCC 占用网络的具体量产节点,但夏一平表示,极越 01 的 PPA 点到点领航驾驶功能,会是「开箱即用」级别的迅速。

开箱即用的意思,是极越 01 从第一台交付开始,就将踏入高阶智能驾驶的擂台,从上海开始铺向全国

从「开箱即用」开始积累的起点加速度,能否让曾经与特斯拉同一梯队冲击纯视觉智驾的技术先驱,转变为极越在城市智驾功能落地上的超越和领先?

我们量产车见。

(完)

视觉传达考研(视觉传达考研考什么)

未经允许不得转载:考研培训机构 » 视觉传达考研(视觉传达考研考什么)

赞 (0) 打赏

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏