14

主题

12

回帖

105

贡献

高级合伙人

积分
1166
PAseer 2025-10-7 10:23:55 | 显示全部楼层 | 阅读模式

【PAseer个人观点,仅供参考交流】Sora2的公布将会带来的可预期变革-PAseer(1)


背景
StableDiffusion模型步入公众视野始于2022年底到2023年初的一段时间,由于GPT3.5实用性产生质变,进而逐渐传播和被广泛使用。2023年中到2024年,各种在线生成平台陆续成立,许多GitHub项目也正在逐渐被使用,调用,落地成项目,直到当前。SunoAI为代表的音乐科技,DeepSeek和GPT为代表的语言模型,AlphaFold为代表的生物科技也在逐渐适配更先进的架构,但并非是本观点的衍生放下不表。
视频模型的起始是基于图片生成的,在SD1.5开源【商业上的纠纷官司问题不做表述】后,大量的图片被制作和传播,人们逐渐了解或者技术人员已经很理解其生成的基本原理,是在向量场下的逆预测模型。随后,Inpainting模型的出现,其算法的基础逻辑让视频模型的出现产生了可能。这种基础逻辑(或函数)可以被描述为基于当前图片的瞬时预测逻辑(或函数)。人眼的残留效应:即因视网膜神经递质代谢的最小阈值是24分之一秒,故而若在一秒钟内产生24帧图像,则人的视觉中枢(大多数人)会认为当前的动态是连贯的。导致我们可以合理推理这样一个结论,即让SD1.5连续生成基于Inpainting的合理预测逻辑的24帧图像在一秒内连续播放,即可在人类视觉中表现出完整性,也就产生了动画或者说视频。

于是,Deforms的出现便是理所当然的了,它允许人们基于上述方式生成视频,但操作对计算机新手来说太过复杂。将这个过程简化后,Animatediff“披着”《猜拳王子》的战斗披风,携手《瞬息全宇宙》热度登上了2023年底网络AI视频的王座。虽然现在人们更多的愿意称呼它为“渲染器”而非真正意义上的视频模型,但无疑Animatediff的流行给了AI视频模型一针强力的定心剂。
真正的视频模型,SORA,将【AI真的可以生成视频】变成了现实,让人们不再虚无缥缈的猜想和揣测,而是能够真正使用到。SORA的技术报告公布后,更多的人关注的一点大量的算力堆砌是解决之道【放下AI竞赛的舆论战和国家博弈不表】,但我们不妨更进一步去观瞧。视频模型的逻辑在SORA时代与StableDiffusion并无本质差别,只是训练元数据变成了更耗费算力的视频。对于帧与帧的预测,动态运动中的骨骼和物理逻辑,其实并未有良好的解决方案。虽然当前的Transformer架构和MMOE架构能够在一定程度上通过监管模型或自检测方式协助修正和改进。但这一难点,在2025年的今天,依旧并且将长期成为科技工作者重要的攻克方向和亟待解决的难题。

SORA2的解决方案
2025年是AI的春天,很多方案,巧思与创业者们纷纷入场。伴随而来的是各个巧思落与实践后得到的强力模型成果。更高清,更全面,更流畅的模型如雨后春笋,人们也是应接不暇。但总体来说,使用AI图像方案的使用者们,绝大多数聚集于文化产业发展和商业设计两个方向。模型更迭的方向也是着重这两种方向,并在可能的范围内提供公开和开源的项目【这一点也按下不表】。但巧思的代价,如同独立游戏,便是无法全面,在某一个点上突出有特色就能够“得到成仙”
的时间越来越少了。更全面的服务,更便捷的全能,将会是未来的付费使用者们追求的结果。
之所以说“越来越少”而不是“已经结束”,是因为SORA2在这方面的尝试仅表现出了“可行性”而非“完美”。将AI放置在短视频时代,并尽可能和短视频内容和运行方式进行接轨,并且有能力进行接轨,客观上来看是一种超然的思考方式。Wan Animate其实就是在这方面进行了尝试,但生成的逻辑【指官方默认逻辑】并没有很好的匹配上模型的能力,确实是一件很可惜的事情。不然近日SORA2的热度本应归属于Wan Animate或者其2.5系列。
社交,是解决方案。IOS+个人一致性,确实是一个精彩的选择。让社交和AI进行接轨,这一点在2023年的美某秀秀AI修图,以及2023到现在的某音,或者某信上常弹出来的AI换脸等小程序本质上并没有任何差别。但【不全面的半付费服务】【不便捷的不全能】成为其流通和火热的严重障碍。SORA2的发出是好事,能够让决策层(没时间看AI实际现场,只能看AI汇报PPT)下定决心发布命令,让其社交软件和所谓更高端的视频模型SORA接轨。这样,才能够刺激并推动国内巨头向前移动,来完善付费使用者们的良好生态。

让AI生成的结果在实拍的社交视频中占据一席之地,掀起的这场变革也许会产生潜移默化的重大影响。

未来,将会有更多的模型登场,但在2025年的年底,【人工智能+社交】将会成为一股潮流,一种视频习惯的变革。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则