01 短视频自动生成 ,视频手成本1/10 “国内对短视频的天万条冲需求强烈,主要来自电商平台的进抖流量扶持。”极睿科技CEO武彬分析
。音快 极睿科技从事电商营销6年,红书通过AI自动生成海量商品营销内容 。视频手武彬注意到,天万条冲短视频需求的进抖爆发,始于2022年淘宝、音快京东 、红书唯品会等电商平台的视频手全面视频化
。比如作为淘系流量新入口的天万条冲淘宝逛逛
,2021年上线,进抖2022年淘宝逛逛被列为和淘宝直播平级的音快部门。 有官方扶持意味着大流量和高投入产出比
,红书商家只需要通过制作和发布视频就可以实现流量增长
。“因为平台有流量扶持,所以品牌的每一个SKU都有了被视频化的必要。”武彬指出。 只不过在2022年,短视频的制作能力尚且跟不上各个平台爆发的短视频需求 。 传统的人工生产视频成本100-500元/条,拍一套服装展示的短视频需要先找模特、找场景,然后美工P图、裁图、做主图
、做详情页
,第三步剪辑短视频
,第四步运营,做商品上下架管理,第五步多平台种草
,在淘宝
、京东 、抖音、小红书等平台发布 ,第六步根据种草情况进行调整。 图片来源:极睿科技 与手工作坊相比,大模型带来了工业化的日本租房视频生产方式 。比如,时代涌现提供的超麦视频,可以将品牌的所有产品图全部视频化,“我们可以根据同一个详情页
,生成无数视频 。因为每一次AI调用的镜头和生成视频是不一样的 ,在这样的服务框架下
,我们可以帮品牌生成无限量的基础视频,在公域中获得流量。”茅旭超介绍。 大模型将短视频的制作成本降低至原本的1/5-1/10。“之前我一年要做1万条视频,成本100多万
,现在可能20万搞定
。而且这个需求没有边界,这个行业里的这些商家都需要 ,只是以前做不到而已。”武彬指出。 大模型这一新的生产力,也在改变着品牌的内容营销方法和广告公司
、MCN机构的生存方式 。 茅旭超注意到,过去品牌的内容营销是倒三角形: 针对1%-5%的爆品,内容高预算高质量,广告公司或者4A创意机构制作; 针对10%-15%的核心款,内容低预算高质量,影棚或制作公司生产; 针对70%-80%的长尾款
,内容低预算低质量,电商代运营或内部职能部门制作。 现在有了AIGC,日本打工品牌可以针对不同级别的产品 ,制作不同的AI内容: 针对1%-5%的爆品,AI创意脚本+高精度3D模型
,合成高质量3D创意视频。 针对10%-15%的核心款,提供AI智能混剪、AI虚拟人测评/讲解视频 、AI商品(3D)表达视频
。 针对70%-80%的长尾款,通过AI快速让品牌的所有产品图动起来——AI商品2D表达视频
、AI淘宝详情页头图视频
、AI淘宝微详情视频、AI旁白混剪视频、AI模特换装效果图等
。 国内还流行基于语义识别和视觉识别,智能抓取直播讲解片段并混剪分发的直播切片。比如极睿科技推出的iCut
,自动识别直播过程中的卖点片段,无需剪辑就可以一边直播一边实时获得海量短视频素材,帮助直播卖家通过短视频引流获客和持续成交
。 图片来源:极睿科技 时代涌现则通过自研大模型FancyGPT ,自动生成商品视频——只要输入一个商品的链接地址,FancyGPT会自动解析生成代码
,在时代涌现的视频渲染软件中自动完成视频制作
。“只要品牌把商品店铺ID给到我们
,我们可以自动解析品牌电商店铺里面所有素材的信息 、图片、视频 、文本描述 。通过全自动方式调用素材,重新做整合
,自动生成视频 。”茅旭超介绍
。 短视频引流效果十分惊人。某知名羽绒服抖音直播间超90%的流量来自直播切片和图文视频的引流。“在我们合作的一些店铺中,短视频带来的流量一度占到了全店流量的98%。品牌其他地方的流量没有下降,这就是平台对于短视频的扶持,导致短视频流量增长非常快。”武彬指出。 2023年,极睿科技有望实现四倍增长。4月极睿科技的iCut demo版上线,受到客户的欢迎,“那个时候智能化程度还没那么高,还需要一些人工来配合,但引流效果确实不错
。之后就客户就开始大量采买视频
,真正起量在七八月份。”武彬记得
。 时代涌现的营收也预计翻三到四倍,他们还将业务从线上营销扩展到线下门店,将门店海报替换为大屏幕,在线下展示优质短视频内容。 02 大模型文生视频,群雄竞起 不久前
,有人将大热的《奥本海默》和《芭比》合在一起做成一部预告片 ,用ChatGPT写脚本,Midjourney生成图像 ,Runway Gen-2生成视频,粉色的摩登女郎和铁灰色的工程机械融合得巧妙,情节新颖,画面真实 。 图片来源:Twitter 自从2023年4月Runway上线新产品GEN-2,可以用文字 、图像或视频片段生成新视频,视频创作的玩法就五花八门。 一段话可以生成一个短视频。 图片来源:Twitter 一张图也可以生成一个短视频
。 图片来源:Twitter 在本轮AI浪潮中,文生文
、文生图、文生视频/图生视频一直并行发展,ChatGPT代表了文字生成的率先突破,Midjourney将文生图推到人人可用 ,视频是多帧图像的组合 ,文生视频在文生图的基础上增加了时间维度 ,需要更多算力资源、理解能力和生成能力 。 目前文生视频底层技术仍在优化,最优模型尚未出现 ,文生视频仍在探索如何实现高分辨率视频生成
、超长文本的视频生成和无限时长的连贯视频生成
。 谷歌在视频质量和视频长度上分别发力,推出Imagen-Video和Phenaki两款产品抢占市场;Meta发布Make-a-Video视频生成模型,让细节更逼真;OpenAI发布的GPT-4更是增加了多模态能力
,打通文字、图片 、视频 、3D之间的转换能力;微软在GitHub上开源NUWA系列 ,发布NUWA- XL超长视频生成模型。 阿里达摩院上线的文生视频模型“Zeroscope”
,试图与GEN-2正面竞争,阿里云还发布了一个数字人视频生成工具Live Portait,可以通过上传一张照片和一段文本 ,生成一段开口说话的数字人视频;文心一言通过视频插件Text2Video,实现文心一言编写脚本,插件生成视频;腾讯智影也让数字人可以开口说话。 AI视频生成在影视行业中已经得到应用
。Runway参与了《瞬息全宇宙》的特效制作,仅靠五人就完成了电影后期制作 ,名场面 “热狗手”还获得好评 。 图片来源:瞬息全宇宙 《流浪地球》导演郭帆也公开表示
,“《流浪地球》第三季如果拍摄的话,现场可能至少一半以上的人会减少掉。人工智能对我们来说既是挑战
,也是机遇,可能是我们弯道超车好莱坞的机会。” 03 营销技术变革,谁先吃到红利 影视行业对时长、动作连贯性和画面逼真度要求更高,而视频营销对分辨率和连贯性的要求较低,更重视制作成本与引流效果 。 同时,大模型应用层的创新也有窗口期
,短视频营销正在直面大厂竞争 。2023年上半年,大厂相继在研发各自的通用模型
,应用层厂商率先利用AIGC取得抢跑优势
。下半年,大厂大模型整装待发,大厂相继推出适用于各自平台的AIGC营销产品,比如阿里妈妈的“万相实验室”,京东的“云鼎权益”。 时代涌现创始人 William Li(花名:空界)曾是天猫奢品Luxury Pavilion初代负责人,时代涌现从成立之初便瞄准聚焦营销领域,只做基础物料生产。 据了解,时代涌现在技术上推出自研大模型FancyGPT——基于LLaMA模型调参600亿的大模型
,可自动完成营销视频制作;在运营上实现多平台内容的管理和生产 ,可以把各平台的直播素材混剪成视频 ,一键投放至线下大屏。“我们更多解决的不只是一个平台,而是整个品牌的资产性问题 。”时代涌现CRO默羽强调
。 除了电商营销,时代涌现还注意到4A公司和线下营销的生意。“电商营销50亿规模,广告150亿规模
,线下营销150亿规模,这350亿规模的市场,足够我们深耕 。”默羽介绍 。 据武彬介绍,极睿科技成立了一家MCN机构,从团队抽调几个人做兼职
,在淘宝精选联盟选择高佣金的商品连接 ,通过自研工具生成短视频并在淘宝平台分发。上线第一天成交100多万元
,此后每天稳定在数十万至100万左右 。8月10号注册到8月底
,该MCN公司累计成交额已经达到900多万元 。 当下的视频模型还处于发展初期,技术短板仍然不少 ,比如计算成本高昂——一个短视频每秒包含大约30帧图像,单个视频片段有数百数千帧 ,为确保每一帧之间空间和时间的一致性,需要大量的计算资源。 再比如 ,复杂信息难以处理——视频带有视觉动态信息
,添加不同帧之间的时间信息后 ,对视频内容进行建模变得非常具有挑战性。 杰克韦尔奇曾提出过一个“10倍理论”:当新技术产生的效果能够10倍于原有技术 ,或者将成本降低至原有的1/10,新技术就能打穿旧有体系。 AI视频生成在内容营销领域已经将成本降低至1/10
,同时将生产效率提升10倍
。新技术的穿透力正在改变营销公司、广告公司、MCN机构的生存方式
,这种改变还在继续。