北京时间10月16日,就在Sora 2发布半个月后 ,谷歌火速推出了最新视频模型Veo 3.1和Veo 3.1 Fast,正面迎战OpenAI 。
在官方推文中,谷歌称“Veo正在进行重大升级” ,不过,从国内外各方实测来看,从Veo 3到Veo 3.1 ,确实如名字一样,只是进行了一次小的迭代,在画质、物理上的提升并不算大 ,在AI音频 、自动分镜等方面都不如Sora 2,但Veo 3.1的光影效果更突出,生成速度更快。
视频生成赛道的竞争越发白热化。就在今年5月,谷歌才发布Veo 3 ,一度刷屏并占据文生视频模型榜首 。不过,本月初发布的Sora 2迅速抢走了风头。
距离上一代模型更新仅5个月后,谷歌拿出了Veo 3.1。有趣的是 ,北京时间10月16日中午,OpenAI也放出了Sora 2的更新,称普通用户可以生成15秒的视频 ,专业用户则可以生成长达 25 秒的视频 。两大巨头的火药味颇浓。
就模型本身来看,谷歌这次Veo 3.1更新的核心亮点是更丰富的原生音频生成、更强的电影风格理解与叙事控制,以及更逼真的质感还原。
Veo 3.1在多个功能中集成了音频 ,支持自然对话、音效和环境噪音,在视频画面生成的同时,模型会自动根据画面内容生成环境音 、动作声及氛围配乐 。此次迭代后 ,音频质量更逼真,尤其在对话上,过去生成一个科幻短片的音频可能听起来像机器人朗读,而现在 ,Veo 3.1 能模拟出紧张的背景配乐与人物语言。
Veo 3.1生成的对话视频
今年5月,谷歌正式推出了Flow,一款由Veo驱动的AI电影制作工具。谷歌称 ,截至目前用户已在Flow中生成了超过2.75亿个视频。而此次迭代也包括Flow里的多个核心功能升级 。
业界讨论较多的是首尾帧(Frames to Video)功能,用户提供一段视频起始和结束的两张图像,模型即可生成平滑过渡的画面镜头。即使是看起来毫不相关的两张图 ,AI也能通过想象力将其合理化。
此外,视频延展(Extend)功能支持用户从前一剪辑的最后一秒扩展视频,可以生成比原始生成8秒视频更长的片段 ,持续一分钟或更长时间 。能生成更长的视频对专业创作者来说是有必要的。
在素材生视频(Ingredients to Video)功能里,用户可以上传多张参考图像,系统自动生成包含指定角色与场景风格的完整视频 ,还可以通过Remove功能移除画面中的物体或者人物。
不过,这些功能虽然是谷歌首次推出,但在业界来说并不稀奇,国内的众多视频模型早已经有类似首尾帧、素材生视频功能 ,因此惊喜有限 。
在模型性能方面,用户测试显示,Veo 3.1在提示词遵循、视听质量与音频支持方面比Veo 3提升约两到三成 ,基础物理模拟也有进步,但在复杂画面中仍会出现问题,例如生成的体操视频画面中人会多出部分肢体。整体来看 ,性能较Veo 3提升不大。
Veo 3.1 能否战胜 Sora 2?这也是业界评测关注的重点 。根据网友测试,两个模型各有优缺点,但 Sora 2整体来看得票数更多。Sora 2 在微观写实 、光影与物理细节上更常被认可 ,配音方面也有许多测试显示Sora 2的音频更加自然,另外Sora 2特别之处在于自动分镜,对视频叙事帮助显著 ,这方面Veo 3.1的镜头变化较为保守,此外对物理世界的理解不如Sora 2。
在视频长度上,Veo 3.1 支持输出最长 8 秒的视频,在这一点上 ,Sora 2更有优势,最新更新后,普通用户可以生成长达 15 秒的视频 。
不过 ,Veo 3.1的优点是生成速度,要比Sora 2快很多,目前Sora 2要等数分钟才能得到结果。此外 ,谷歌在多模态生态上更为成熟,此前发布的图像模型“Nano Banana ”引发了广泛关注,谷歌在图像与视频模型的联动可以形成完整的创作闭环。
Veo 3.1目前处于预览阶段 ,目前用户可以在Gemini API 、Vertex AI、Gemini 应用以及 Flow上面付费使用。在接口价格方面,Veo 3.1 标准版是0.4美元/秒,快速版是 0.15 美元/秒 ,对比Sora2则是0.1美元/秒,Sora2-pro是0.3美元/秒,在价格上的吸引力不如Sora2 。
总结来看,行业认为 ,Veo3.1未到超越Sora2的地步,但这仅是Veo 3到Veo 3.1的一次微调,行业更期待谷歌在下一次大版本更新中扳回一局。
回望视频生成赛道 ,谷歌与OpenAI的拉锯战从未停止。2024年初,Sora横空出世,引发行业震动 ,却迟迟未正式发布 。同年5月,谷歌推出Veo 1,正式迎战。至12月 ,Veo 2在物理模拟与风格一致性上取得突破,同期Sora正式亮相,当时业界普遍认为Veo 2更优。
2025年5月 ,Veo 3发布,登顶多榜,稳坐第一梯队 。然而10月初,OpenAI抛出“王炸”Sora 2 ,再度改写竞争格局。
两大科技巨头都还在AI视频领域持续加码,国内玩家如可灵 、海螺AI、即梦等玩家也都有不小的竞争力。视频生成大战中尚无一家具备绝对统治力,AI视频的“GPT-3.5时刻”仍未到来 ,未来行业变数仍然很大 。
(文章来源:第一财经)
股票融资的优缺点:股票怎样开户头-恢复征收债券利息收入增值税 有何深意?
公司退市股票钱怎么办:炒股怎么加杠杆资金-A股两融余额已达十年来高点 “融资客”更偏好哪些行业和个股?
公司股票的内在价值怎么算:大资金买入股票技巧-美联储降息25个基点 影响几何?券商解读来了
公司买自己股票:股票融资怎么买-特朗普再批鲍威尔:人为抬高利率 利率应控制在1%或2%
个人炒股如何加杠杆融资:什么样的公司可以发行股票-习近平将出席2025年上海合作组织峰会并举行有关活动
股票公司分红是利好还是利空:长白山股票是哪家公司-国金证券下调融资比例 业内称未普遍收紧、当前杠杆水平中等
东启网-配资公司_炒股在线配资提示:文章来自网络,不代表本站观点。
当地时间8月25日,美国总统特朗普在社交平台上表示,已签署文件,解除美联储理事库克职位,立即生效。 据新华社此前报...
宏观要闻七部门发文优化知识产权领域营商环境国家知识产权局、教育部等七部门周五发布《关于进一步优化知识产权...
界面新闻记者|杜萌今日,多家公募发布公告,称自3月21日起,存量指数基金的指数使用费将由基金管理人承担,不再...
记者辛圆给补贴、建平台,为了吸引更多高层次人才,各地纷纷放出“大招”。据央广网周一发布消息,湖...
近日,开源证券大连分公司遭大连证监局处罚,暂停其办理需要合格投资者认定相关业务六个月。该惩处力度在近年来券商分支机构中并...
记者辛圆3月25日,博鳌亚洲论坛旗舰报告《亚洲经济前景及一体化进程2025年度报告》(以下简称《报告》...
记者辛圆中国人民银行授权全国银行间同业拆借中心公布,4月21日贷款市场报价利率(LPR)为:1年期LP...
2025年3月25日,倍轻松(688793.SH)公告称,公司股东宁波倍松投资有限公司(简称“宁波倍松”)拟通过大宗交易...
国海富兰克林基金国富深化价值基金经理刘晓日前发表了对 2025 年市场的展望。刘晓指出,国内经济正处于复苏通道,市场大幅...
记者|赵阳戈年初,证监会就修改《证券发行与承销管理办法》部分条款向社会公开征求意见,市场也将注意力投向了...
记者王珍中国国际经济交流中心副理事长、国务院发展研究中心原副主任王一鸣周一在“中国发展高层论坛2025...
3月24日,AI眼镜概念股开盘拉升,瀛通通讯直线涨停,明月镜片涨超10%,比依股份、博士眼镜、恒玄科技、国光电器等跟涨。...
3月24日,易方达国证自由现金流ETF公开发售。该产品跟踪国证自由现金流指数,这个指数是什么?有哪些优势?投资价值如何?...
3月24日,业内权威专家表示,MLF(中期借贷便利)不再有统一的中标利率,标志着MLF利率的政策属性完全退出。3月24日...
沪深两市成交额连续第44个交易日突破1万亿,较昨日此时缩量超900亿。...