洞察财经脉动 · 引领数码未来

科金社 - 连接财经智慧与科技创新的专业资讯平台

小鹏断杖突围,AI王冠争夺战升级

小鹏智斗巨头,AI战场硝烟再起

科金社2025年11月13日 20:07消息,小鹏拆掉语言拐杖,挑战AI王冠,引领智能汽车新未来。

   摘要:当你成功解决了一个问题后,你会发现之前许多难以攻克的难题,现在正被新的方法论轻松化解。

小鹏断杖突围,AI王冠争夺战升级

   2019年,何小鹏曾发表过一句引发广泛讨论的言论——“如果只有电动化,电动车没有未来”。这句话表面上看起来与常识相悖,但实际上并不违背逻辑。如果电动化仅仅是将传统汽车换上了一层新的外壳,那么在电动化基础上实现的智能化,才是电动车与传统汽车真正分道扬镳的关键所在。

小鹏断杖突围,AI王冠争夺战升级

   六年前,敢于大手笔投入智能驾驶研发的竞争对手少之又少,即便在行业低谷时期也不减少智能驾驶投入的何小鹏,曾多次反复向外界解释这一战略。但如今,这种观点已逐渐成为行业的普遍认知。这位始终将智能驾驶视作“汽车下半场关键战场”的创业者,在十年间坚持“Allin智驾”的坚定信念,带领团队从XPILOT 1.0不断进化到VLA大模型时代,使智能化成为小鹏汽车最突出的标志。

小鹏断杖突围,AI王冠争夺战升级

   但小鹏的王冠正面临前所未有的挑战。10月9日,一份人事调整公告引发行业关注:小鹏原智驾部门负责人李力耘已卸任,由负责世界基座模型的刘先明接任。这一变动恰逢小鹏智驾系统近期市场反馈不佳——不少用户反映,小鹏最新推送的智驾5.7.8版本表现不理想。

小鹏断杖突围,AI王冠争夺战升级

   更激烈的竞争正从身后逼近。理想汽车刚刚在ICCV顶会上展示了“世界模型训练闭环”的最新智能驾驶方案,其开源数据集3DRealCar也获得学术界认可并被收录进AI顶会;与此同时,华为公开挑战小鹏、理想等车企所采用的VLA路线,宣布ADS4.0系统已经推出,乾崑智驾系统的搭载量突破100万辆,已覆盖11家车企、28款车型。 当前智能驾驶技术的竞争愈发白热化,车企与科技企业之间的较量不仅体现在技术层面,更在生态布局和规模化应用上展开。理想汽车通过学术合作提升技术影响力,而华为则以庞大的市场覆盖率和系统成熟度形成强大竞争力。这种多线并进的态势,预示着智能驾驶赛道正在加速洗牌,谁能持续输出高质量的技术成果,并实现大规模落地,将成为未来胜出的关键。

小鹏断杖突围,AI王冠争夺战升级

   当智驾化的王冠遭到冲击,小鹏如何守擂?

   重压之下,小鹏在科技日给出了回应。何小鹏宣布,

   何小鹏表示,小鹏此前在智能驾驶研发中同时推进两条技术路径,其中一条是基于视觉、语言与动作融合的VLA(Vision-Language-Action,视觉-语言-动作)模型。当第二代VLA在训练过程中展现出“涌现”特性,表现出更强的学习与决策能力后,小鹏决定暂停另一条传统技术路线的研发,全面转向以大模型为核心的VLA体系。最终实现了令人惊喜的“涌现”——自动驾驶系统竟然自主具备了此前未有的能力。

   为了打造第二代VLA,小鹏所做的远不止于此。他们不仅打破了以往的成功经验,还投入了20亿元,在没有明确方向的情况下独自探索,经历了无数次的自我怀疑与失败,最终才打磨出这套全新的自动驾驶系统。 从行业角度看,这种敢于推翻过去的勇气和持续投入的决心,体现了小鹏在技术上的深度思考与长远布局。20亿元的投入不仅是资金的消耗,更是对技术路线的坚定选择。在自动驾驶领域,每一次突破都伴随着巨大的试错成本,而小鹏的选择显示了其在竞争中寻求差异化的战略思维。

   这一全新的VLA范式,未来将同步应用于小鹏的Robotaxi、人形机器人IRON以及飞行汽车上——这标志着小鹏正在构建其“物理AI”生态系统。斯坦福大学人工智能教授李飞飞同样高度关注“物理AI”(她将其称为“空间智能”),她表示:“复杂语言是人类独有的,其进化历程不到50万年;而生物对三维世界的理解、互动与沟通,则经历了长达5.4亿年的演化。对我来说,这才是人工智能的核心挑战。如果无法解决空间智能问题,通用人工智能就无法真正完整。”

   而这也是“孤勇者”小鹏的下一站:“AI的未来不仅存在于代码和屏幕中,更在于成为人类在物理世界中的延伸与伙伴。这条路充满挑战,意味着我们要让AI学会处理现实世界中无穷的“不确定”,这比任何实验室的测试都难上百倍、千倍。”这是何小鹏在AI科技日上的宣言。

   在科技日之前,小鹏采取的是“VLM+VLA+强化学习”的方案,该框架由今年6月,时任小鹏世界基座模型负责人的刘先明博士在顶会CVPR(IEEE国际计算机视觉与模式识别会议,计算机视觉领域三大顶级会议之一)中提出。他发表的《通过大规模基础模型实现自动驾驶的规模化》(Scaling up Autonomous Driving via Large Foudation Models)的演讲,奠定了小鹏整个智驾框架。

    在演示中,他将小鹏物理世界基座模型分了三个阶段(Foundation Model Stages):

   第一阶段的输入包括图像和文本对(Input:image/textpair),输出则是视觉语言模型(VisualLanguageModel)。这一过程体现了多模态信息融合的重要性,通过结合视觉与语言信息,模型能够更全面地理解内容。这种技术的发展为后续的跨模态任务奠定了基础,也反映出当前人工智能在处理复杂信息时的不断进步。

   通过视觉-语言模型的预训练(VLMPretraining),即利用大量数据对模型进行训练,使其具备识别交通标志、理解导航指令等能力; 在当前技术快速发展的背景下,视觉-语言模型的预训练已成为提升人工智能理解能力的重要手段。这种训练方式不仅让模型能够更好地识别图像中的内容,还能帮助其理解与之相关的文本信息,从而在实际应用中发挥更大作用。例如,在智能交通系统中,这样的模型可以辅助驾驶员或自动驾驶系统更准确地解读道路标识和导航提示,提高行车安全性和效率。随着技术的不断成熟,这类模型的应用范围也将进一步扩大,为人们的日常生活带来更多便利。

   继续进行预训练(Continued Pretraining),随后开展模型对齐工作,并引入相关知识(Alignment-Knowledge Injection),使视觉语言模型掌握“红灯必须停、环岛要让行、雨天要减速”等交通规则和常识,从而提升模型对图像与文本的理解能力。

   · 第二个阶段,主题是输入视频和动作(Input: video + action),输出VLA模型。

   首先通过超过1400万条数据对VLA模型进行训练[14MdatatrainVLA(action)],开展动作预训练(ActionPretraining),简单来说,就是向模型输入超过1400万条“环境操作”相关的视频,让模型通过观察画面学习驾驶行为,例如转弯前打转向灯、超车前查看后视镜等。

   在进行监督微调(SFT:Supervised Fine-Tuning)时,相关团队采用了针对性的数据来解决实际生产中遇到的问题(Targeted data to solve production problems),对VLA模型进行了“地狱特训”,特别挑选了一系列长尾场景进行强化训练,例如广州电鸡避让、北京潮汐车道、重庆地形等复杂情况。 这种做法体现出技术团队在面对现实交通环境多样性时的务实态度。城市道路状况千差万别,尤其是一些少见但关键的场景,往往容易被忽视,却可能成为系统运行中的“致命弱点”。通过专门针对这些场景的数据训练,不仅有助于提升模型的泛化能力,也反映出企业在推动技术落地过程中更加注重细节与实用性。这种方式值得肯定,也为其他类似技术的应用提供了参考。

   · 最后一个阶段,主题是输入视频,并进行奖励(Input: video + reward)。

   主要运用了强化学习(RL,Reinforcement Learning,通过奖励优化模型行为),构建奖励函数以强化良好驾驶行为(Reward function to enforce good driving behavior),比如安全行驶就+1分,不良行驶就-2分,让模型在大量做题后驾驶得越来越熟练和安全。

   此前《21汽车·一见Auto》曾报道,4月14日小鹏 AI 技术进展分享会上时,小鹏分享过他们构建强化学习系统的三个维度:奖励函数+奖励模型+世界模型。

   刘先明虽然于今年10月接替李力耘,成为小鹏自动驾驶的一号位,但整个物理世界基座大模型的建立,离不开此前两任一号位李力耘与吴新宙的前期铺垫。

   李力耘在去年接受《21汽车·一见Auto》采访时表示,规则时代类似于“冷兵器时代”,每个参与者都有自己的专长和技艺;而端到端时代则更像“热兵器时代”,强调大规模算力部署、海量数据的灌入以及大模型的训练,就如同开采矿物、冶炼钢铁一样。当时他便指出,小鹏更关键的投入在于云端基座大模型的建设。

   吴新宙于2019年成为小鹏自动驾驶负责人,当时自动驾驶还处于“规则时代”,但在2022年4月,他就带领小鹏对自动驾驶中感知、规划、控制等模块做AI化尝试。而且,彼时规则时代留下的经验,成为了如今小鹏奖励函数的组成部分。

   新帅接棒并非另起炉灶,而是延续与传承。吴新宙在早期的探索与拓展,以及李力耘在量产落地方面的努力,为如今刘先明推动小鹏自动驾驶迈向物理AI时代奠定了坚实基础。 从行业发展的角度来看,这种接力式的推进方式体现了技术团队在不同阶段的分工与协作。前期的开拓者为后续发展打下根基,而后期的执行者则将理念转化为现实。这种持续性的创新链条,是企业能够在激烈竞争中保持领先的关键因素之一。

   只不过,理想、小鹏、元戎等企业所采用的VLA大模型,在今年下半年遭遇了来自华为、蔚来以及宇树等机器人公司的强烈竞争,双方在技术层面的较量主要集中在两个方面。 从当前市场格局来看,VLA大模型作为智能驾驶与机器人领域的重要技术支撑,正成为各大厂商争夺的焦点。随着华为等企业在底层算法和硬件整合上的持续突破,传统玩家面临的压力明显加大。这种竞争不仅推动了技术的快速迭代,也加速了行业生态的重塑。可以预见,未来一段时间内,围绕VLA模型的技术博弈将持续升级,最终将影响整个智能出行与服务机器人产业的发展方向。

   第一,VLA对多模态数据量、算力、内存、带宽的需求都极为庞大。VLA依赖海量多模态数据训练,对跨模态数据对齐有严格要求,尤其在长尾场景中数据采集和标注难度巨大;对齐之后也要对数据进行高度压缩,提升吞吐量,降低数据传输延迟。

   第二,多了一道语言转化,确实可能导致信息丢失和延迟。顾名思义,“VLA”需要先将多模态信息(V)转化为语言(L)token,再通过大语言模型生成动作指令(A)。自然语言的模糊性和简洁性,从本质上限制了其对空间感知的准确描述,也制约了系统的规划能力。而每增加一次转换步骤,都会带来额外的延迟,影响整体效率。 在我看来,这种设计虽然在一定程度上利用了现有语言模型的强大能力,但也暴露出其在处理复杂环境信息时的局限性。随着人工智能技术的发展,如何更高效地融合视觉、语音等多模态信息,减少对语言的依赖,可能是未来提升系统性能的关键方向之一。

   华为智能汽车解决方案BU CEO靳玉志指出,将驾驶决策交给VLA系统,就像让一位语言学家去学习开车——他虽然能够理解交通规则,但在紧急情况下却难以准确判断刹车距离或障碍物的位置。宇树科技创始人王兴兴也表示:“VLA模型的架构相对较为简单。”

   而与此同时,刘先明指出,小鹏在自动驾驶技术研发上正面临关键瓶颈:“我们每天都在解决那些罕见的极端情况,今天解决掉99.9%,明天再解决99.99%,但要达到L4级别,到底要抠到小数点后多少位?这种收敛速度显然跟不上现实世界的复杂变化。”他进一步分析,为何不同车企之间的技术差距难以拉开,“当技术没有突破到新的高度时,就只能在现有基础上不断调整,就像在跷跷板上反复摇摆。只有当整体技术水平提升,水桶里的水满了,才能有更多空间去探索和创新。” 从当前行业发展趋势来看,自动驾驶技术的演进确实面临诸多挑战。L4级别的实现不仅需要算法的持续优化,更依赖于数据积累、场景覆盖以及系统稳定性的全面提升。而“压跷跷板”的比喻也反映出,在技术尚未形成明显优势时,企业往往陷入同质化竞争,难以建立真正的差异化壁垒。只有在底层能力真正突破后,才能在应用层面上获得更大的自由度和扩展空间。

   于是,小鹏内部兵分两路:何小鹏在科技日上表示,小鹏一直在探索两套方案,一种是“V→L→A”的标准VLA,另一种是“V+L→A”的创新VLA。

   既然小鹏现在的自动驾驶能力无法突破当前系统上限,那就是时候创新智驾系统架构了。

   自从6月份证了模型参数与数据规模扩大到百亿级别,规模法则在物理世界中仍然可行之后,小鹏的“大数据+大算力+大模型”这一基本智驾理念就没变过。但如果要从这三者中选一个对小鹏最重要的,那绝对是“大数据”。

   2025年度小鹏科技日的主题为“涌现”。在机器学习领域,“涌现”指的是当模型的规模(包括参数数量、训练数据量以及计算资源)达到某一关键阈值后,由于量的积累引发质的飞跃,从而展现出在小型模型中无法实现的复杂能力。

   小鹏的涌现,“师承”大语言模型ChatGPT。ChatGPT-1于2018年推出,当时并未引起广泛关注,直到2022年ChatGPT-3.5的发布,模型展现出“涌现”特性,在用户实际测试中表现出多步骤推理能力(如解答数学谜题)和创造性的文本生成能力,显著超越同期其他模型。此时,其参数量达到1750亿,训练数据超过45TB。

   而小鹏之所以能“涌现”,背后究竟动用了多少量级的数据?这一问题引发了广泛关注。作为行业观察者,我认为,小鹏在技术上的突破并非偶然,而是建立在大量数据支撑的基础之上。尽管具体的数据规模尚未公开,但可以肯定的是,其训练模型所依赖的数据量已达到相当庞大的级别,这为其在智能驾驶领域的快速进步提供了坚实基础。在当前人工智能竞争日益激烈的背景下,数据的积累与应用已成为企业能否脱颖而出的关键因素之一。

   • 《21汽车•一见Auto》参加小鹏4月份AI技术分享会时,小鹏宣布自己使用了2000万Clips的视频数据;

   • 6月份刘先明博CVPR发表演讲时,宣布小鹏已经使用了5000万Clips的视频数据,相当于看了3万部《流浪地球》;

   到11月的科技日活动上,何小鹏表示,小鹏已累计使用近1亿条Clips数据,这一数量相当于驾驶35000年才能遇到的极端场景总和。

   为什么小鹏汽车销量不是最高,但收集和训练的数据却位居全国第一?

   在面对《21汽车·一见Auto》的提问时,何小鹏表示,“这就要求Infra(即人工智能基础设施,连接算力和应用的AI中间层基础设施)做得好”。他还特别指出,小鹏在训练过程中所使用的数据,主要来源于各类Cornercase和长尾数据。 从行业发展的角度来看,何小鹏的这一表态反映出当前智能汽车领域对底层技术能力的高度重视。AI基础设施作为连接算力与应用场景的核心环节,其性能直接影响到自动驾驶等关键技术的落地效果。而小鹏选择聚焦于Cornercase和长尾数据,也体现出其在提升系统鲁棒性和泛化能力上的战略考量。这种数据策略不仅有助于优化模型在极端场景下的表现,也为整个行业的技术演进提供了参考方向。

   在训练了如此庞大的数据后,小鹏“涌现”出的驾驶行为,除了已经在社交媒体上大量传播的“路人招手,车会自动停下”“红绿灯路口,人行横道的灯从绿变红时,车会有准备起步的动作”“车会自行观察前车轮胎角度判断对方是否要变道”这三个自动驾驶行为以外,还有另一个功能:“小路NGP”。

   “涌现”盖因训练了庞大的数据,那小鹏又是因为做了什么才能训练如此巨大的数据量?这就要提到第二个“大”——“大模型”,也即小鹏科技日的第二个主角:第二代VLA。

   在剩下的两个“大模型”和“大算力”中,“大模型”——也即第二代VLA——主要负责解决的是训练的数据规模问题。何小鹏在发布会直言:

   标准VLA需要两次转换,语言作为中间转译环节成为瓶颈,导致信息损耗较高,难以在“很大规模参数量”上实现“很大规模的数据训练量”。这一问题限制了模型在实际应用中的表现,尤其是在处理多模态任务时,语言作为桥梁的局限性愈发明显。当前技术发展虽快,但在跨模态理解和生成方面仍面临挑战,如何优化中间转译机制,提升信息传递效率,是未来研究的重要方向。

   因此,拆掉语言(L)这根拐杖,就是涌现的关键。

    第二代VLA,同样分三个阶段:

   ·阶段一:多模态输入层,相当于车怎么“看、听和感知自己” 。

   包括视频(由车载摄像头采集的路况信息,如红绿灯状态、周围车辆距离等)、文本或语言(如用户语音指令、导航文字提示、交通规则文本等);指令(例如“进入匝道需将车速降低20%”等);以及自车状态(如车辆定位、传感器运行状况、当前电量等)。

   · 阶段二:核心编码层(VLA 2.0),即拆掉语言后,车怎么“想”。

   刘先明在Wrokshop中详细解析了去除“L”后如何对VLA进行训练的流程,他们借鉴了大语言模型的训练方法。这一过程展示了在模型优化中的技术探索与实践路径。从内容上看,这种调整可能旨在提升模型的效率或适应特定任务需求,体现了当前AI研究中对模型结构和训练策略的持续优化。

   大模型的运作方式是将输入的语言转化为离散的token,随后通过Transformer结构进行处理,最终输出相应的token。在训练过程中,通常采用自监督学习的方法,即通过预测下一个文本token的方式来完成训练。

   通俗地理解就是“猜词游戏”——给模型喂海量文字,将“妈妈叫我回家吃饭”,拆成“妈妈”“叫”“我”“回家”“吃饭”多个token,大量训练之后,让模型预测下一个token。直到模型找到规律,发现“妈妈叫我回家”之后接的token大概率是“吃饭”,训练成功;

   而此前VLA的核心痛点,就是要给每段路测视频人工监督/标注,人工教汽车 “红圆的叫红灯,看到要停”,用中间的 L(语言),给 “视觉” 和 “动作” 做配对。但麻烦的是这种方式又慢又贵,且无穷无尽,所以刘先明说:

   “想要更大规模的去使用数据的话该怎么办?一定要拆掉所有的supervision,让它变成一种自监督的模式。只要有中间的“L”存在,就一定涉及到人工的筛选或者标注,于是我把它拆掉,把它变成一种非常极致的数据应用。”

   小鹏第二代VLA的思路正是如此——不再依赖“语言(L)”这一人工设定的中间层,而是让模型直接从“路景(V)→驾驶动作(A)”的海量数据中,自主学习物理世界的规律,例如“红灯对应刹车”“行人对应减速”。 这种技术路径的转变,意味着自动驾驶系统正在向更接近人类直觉的方向发展。通过减少对人工规则的依赖,模型能够更灵活地应对复杂多变的道路环境。不过,这也对数据的质量和多样性提出了更高要求,毕竟模型的学习效果很大程度上取决于训练数据的全面性与代表性。在实际应用中,如何确保系统的安全性和可靠性,仍是需要持续关注的问题。

   ·阶段三:闭环执行层:车怎么“做”(A)。包括两个并行的步骤:

   步骤一:Latent Tokens(潜在表征 tokens)→ World Simulation (世界模拟)→ Reinforcement Learning(强化学习)→ Action(驾驶动作);

   通俗理解,整个过程好比:汽车在自动驾驶时,先提炼视频全景中的关键信息(Latent Tokens):“危险目标:距离近的小孩”、“旁边停着电动车”、“路面2米宽”等;

   然后脑补接下来可能会出现的各种场景(World Simulation):“急刹车”“先轻踩刹车降速”等;

   接着翻出之前训练过的经验(Reinforcement Learning):“上次类似场景 ‘急刹车’ 被追尾,扣分”、“上次 ‘减速 + 轻打方向’ 安全通过,加分”等;

   最后执行动作(Action):慢慢踩刹车,同时方向盘轻轻向左打,顺利避开小孩,也没碰旁边的电动车。

   步骤二:Trajectory Tokens(轨迹表征 tokens)→ Action(驾驶动作);

   通俗理解,整个过程好比当 VLA 2.0选好 “减速+轻打方向” 的驾驶方案后,会把这个方案拆成各种轨迹(Trajectory Tokens),如速度轨迹(3 秒内把车速从30km/h平稳降到10km/h)、方向轨迹(方向盘向左转 15 度),最后汽车照着各种轨迹表征精准操作。

   最后的“大算力”,存在的目的就是让数据的运算更“快”。诚然,拆掉“L”本身也已经减少了转译的过程,从而减少了延迟,但因此涌入模型中训练的数据也更加庞大,所以小鹏才要自建万卡集群、自研图灵芯片、优化芯片-算子-模型。

   小鹏现在已经建立起了多大规模的云算力?

   • 《21汽车•一见Auto》参加小鹏4月份AI技术分享会时,小鹏宣布从2024年就已开始搭建AI基础设施,已建立起万卡规模的智能算力集群;

   6月份刘先明博士在CVPR上发表演讲时提到,小鹏智能算力集群正在向两万卡的规模稳步推进。这一进展显示出企业在人工智能基础设施建设上的持续投入与战略布局,也反映出自动驾驶和智能驾驶技术对计算能力的高需求。随着算力的不断提升,未来在算法优化、数据处理和模型训练等方面将具备更强的支撑能力,有助于推动整个行业技术的快速演进。

   • 而到11月的科技日,何小鹏宣布:我们使用了阿里云上3万张卡的云端的超大算力集群;

   • 他还展示了小鹏的野望:我相信明年的小鹏可能从3万张卡要到5万张卡,甚至到10万张卡;我相信超大的云端的算力集群是实现物理AI的重要基础。

    针对图灵AI芯片,小鹏第二代VLA重新开发了专用的编译器和软件架构,并对算子进行了专门优化,最终实现了推理效率提升12倍的效果。

   物理AI的“孤勇者”:拆掉一切,从头再来

   “总的来说,我们这个项目并没有什么‘不能说的秘密’,其实就是大模型、大算力和大数据的结合,把这些资源整合在一起,就形成了我们推出的模型。”在Workshop上详细解析了小鹏物理AI的各个组成部分后,刘先明略带轻松地说道。

   但真的那么轻松吗?

   回想起来,似乎一切看起来都很简单:去掉“L”、注入更多数据、提升更高的算力,但对当时的小鹏来说,这些都意味着真金白银的投入。而小鹏当时尚未实现盈利,最终也很可能像以往多次尝试一样,第二代VLA的开发再次以失败告终。何小鹏透露,为了这一代VLA,小鹏已经投入了20多亿元,很长一段时间内都没有看到任何进展,甚至在内部会议中,有少数自动驾驶部门的高管选择缺席,因为他们尚未找到可行的解决方案。

   直到二季度的某一天,或许是去除“L”的某个技术细节生效,又或许是灌输的数据达到了某个量级,第二代VLA跑通了。何小鹏在发布会讲述这段经历时最为激动:“当你解决了一个问题之后,你发现之前很多解决不了的难题正在被新的方法论轻松地解决”。

   为此,他们不惜暂停了标准VLA的开发,只为在第二代VLA版本中集中资源、全力突破,最终促成了如今物理世界模型在量产应用中的全新范式。 在我看来,这种战略调整反映出技术发展过程中对核心方向的深刻思考。在资源有限的情况下,选择聚焦而非分散,往往能带来更深远的影响。第二代VLA的推出不仅体现了技术上的进步,也展示了在研发路径上做出关键决策的重要性。这种以结果为导向的投入方式,或许将成为未来技术演进的重要参考。

   诚然,目前小鹏第二代VLA还有很多疑点和承诺需要兑现。比如,明年推送的第二代VLA是否真的能实现“小路NGP”,带来如今宣传的“涌现”效果?去掉“L”后,第二代VLA是否还能称作VLA,以及以往“L”所拥有的常识推理与可解释性优势,是否也荡然无存?小鹏已经作了多次技术路线切换,是否能妥善照顾老车主?最后,“涌现”除了惊喜,会不会带来不想要的意外?

   但这一切暂时并不重要,因为小鹏的勇气仍然值得肯定,它依然可以被称为中国智能驾驶领域的先锋和开拓者。它让人联想到同时获得图灵奖和诺贝尔物理学奖的人工智能学家杰弗里·辛顿(Geoffrey Hinton)。

   70年代,当辛顿进入爱丁堡大学攻读博士学位时,符号主义正处于鼎盛时期,但辛顿却对神经网络充满信心。在20世纪80年代,他提出了反向传播算法,虽然成功解决了神经网络训练的难题,但却受限于当时计算能力和数据量的瓶颈。到了90年代,随着支持向量机等统计学习方法的兴起,神经网络逐渐被边缘化。直到2012年,他与学生合作开发的八层神经网络在ImageNet竞赛中以15.3%的错误率获得冠军,从而一夜之间声名鹊起,并彻底点燃了深度学习的革命浪潮。

   人类的创新,大部分企业在进行VLA(视觉语言模型)探索时,往往在黑暗中摸索前行,为了躲避不确定性带来的寒冷,人们倾向于跟随主流和大众的选择。刘先明在分享其早期探索经验时提到,许多企业都在采用π0结构(Pi-Zero,由Physical Intelligence公司推出的VLA大模型),因为有大量开源模型可供直接使用,这无疑降低了技术门槛。然而,只有他们意识到这种结构在数据使用规模上存在明显限制。 在我看来,这种现象反映了当前技术发展中的普遍心态:依赖已有的成熟方案,而非主动寻求突破。创新者往往需要面对更多的不确定性和风险,他们不仅需要勇气,更需要对技术趋势的深刻洞察。当多数人选择“安全路径”时,真正的变革者却在寻找新的可能性,而这正是推动行业向前的重要力量。

   “一家企业,一个团队要成为伟大的团队,关键在于打破过去成功的经验。刘先明表示,必须认清自己的边界,勇于探索未知领域,即使当前并不清楚还存在哪些问题,也要持续去探索、去突破。只有不断拆掉那些曾经带来成功的方法和思维模式,团队才能实现更深层次的进化和突破。 在我看来,这种观点非常值得深思。很多团队在取得一定成绩后,容易陷入惯性思维,依赖过往的经验,反而限制了进一步发展的可能性。真正的成长往往发生在走出舒适区、敢于质疑和重构自身的时候。这不仅是对团队能力的挑战,更是对领导力和战略眼光的考验。

   唯有壮士断腕,才能拥抱新生,即便这可能充满了不确定性。正因如此,小鹏为了这次“涌现”,拆掉的拐杖不止语言。它摒弃的不止是“L”,更是对昔日成功路径的依赖。唯有壮士断腕,才能拥抱新生,即便这可能充满了不确定性。

留言评论

(已有 0 条评论)
请输入您的姓名
请输入有效的邮箱地址
请输入评论内容

暂无评论,成为第一个评论者吧!

特别推荐
人形战甲登场:未来战场的机器人军团来袭
2025-11-30 13:44
人工智能+引爆新风口!22只高增长黑马股被机构抢筹
2025-11-29 13:43
阿里震撼发布首款自研AI眼镜:夸克S1首发双光机显示,支持3K视频与秒换电池
2025-11-27 16:22
AI新王来袭!摩根士丹利预测:2027年谷歌TPU销量或破百万
2025-11-27 16:18
AI对话数据揭示:Claude助效率提升80%,工作时间大幅缩短
2025-11-26 12:20
惠普大裁员6000人,AI成成本新引擎
2025-11-26 12:17
独家:Meta拟联手谷歌,TPU芯片入局自建数据中心?
2025-11-25 11:28
创世纪来袭:美国AI计划对标曼哈顿计划引发全球关注
2025-11-25 09:28
英伟达强势反击:直指华尔街分析师,否认会计丑闻指控
2025-11-25 09:22
智元机器人携手智慧倍增,共拓机器人新未来
2025-11-25 09:19
奥尔特曼新动作:Shallotpeat来袭,直面谷歌挑战
2025-11-24 16:52
软科技谁主沉浮?AI浪潮下的估值新逻辑
2025-11-24 16:44
谷歌被曝用Gmail训练AI,官方紧急辟谣引热议
2025-11-23 11:48
AI不是人:Karpathy警告别赋予它人性特质
2025-11-23 10:10
AI泡沫风暴来袭?达利欧与大空头罕见同台激辩未来生死局
2025-11-23 10:02
京东郑小丹:具身智能引领产业变革与民生升级
2025-11-22 15:12
中国AI应用4天狂揽百万下载,速度领跑全球
2025-11-22 15:12
蚂蚁灵光 AI 助手上线四天狂揽百万下载,超越 ChatGPT?
2025-11-22 13:33
AI 拍立得上线!网友玩转谷歌 Gemini 3,零门槛造出复古游戏
2025-11-20 14:39
马斯克预言:AI将终结工作与金钱时代
2025-11-20 14:37
战略联盟

友情链接 - 合作伙伴网络

携手顶尖科技平台 共建数字生态

网暻网络

www.wjwl666.top

访问网站

科技快讯

news9999.cn

访问网站

文化潮流网

www.kouc.cn

访问网站

量子财讯

www.360shoulu.com

访问网站

友情链接持续增加中,期待与更多优秀平台建立友情链接