零成本短视频带货:用 CapCut 免费 AI 做 TikTok 和 Reels 产品视频

一条免费流水线,从头跑到尾

不花一分钱也能把一条完整的短视频做出来发出去,前提是每一步都卡在免费额度里,再接受几个限制。整条链路是:先定选题,再让 AI 写脚本,然后文字转语音配音,自动加字幕,补一点短 b-roll,最后导出。每一环都有一个免费工具顶着。

先说选题。一条视频只讲一个钩子加一个卖点,别贪。20 到 30 秒的片子塞不下五个功能,开头两秒必须把买家能立刻对上号的问题或者一句反问抛出来。

接着出脚本初稿。CapCut 的 AI 写脚本功能,你喂一段简短的产品说明,它就吐一版口语化的草稿。把它当初稿用就行:钩子再收紧一点,开头那句 AI 几乎每次都加的废话直接删掉,结尾的行动号召要写清楚下一步到底干嘛(点购物车、看链接、关注领券)。

然后把脚本变成配音。CapCut 的文字转语音会用你选的声音把脚本念出来。这一步对那些不爱出镜、懒得自己录音的卖家最省事。挑一个和产品调性对得上的声音,把脚本粘进去生成。一般要重跑两三遍,调一下语速,顺手改掉机器念错的词。

下一步上字幕。在配音轨上跑自动字幕。据报道准确率在 95% 上下,挺好但不是满分,所以要重点扫一遍产品名、品牌词和数字,机器最容易在这些地方翻车。字幕样式做大、居中,方便手机上看。

画面上,先铺你自己拍的真实产品素材。手机随手拍的产品使用画面,转化比任何合成画面都好。空档用 AI 生成的短 b-roll 补,但要清楚限制:免费 AI 生成的片段很短,大概一段 4 到 8 秒,所以只能拿来做转场或者垫背景,撑不起整条视频。

最后把素材全丢进一个模板,调好节奏导出。整个工程别超过免费时长上限,据报道在 15 分钟左右,反正短视频也根本用不到这么长。

哪些免费,哪些会逼你升级

CapCut 免费和付费的分界线挪得很勤,有些原来免费的 AI 功能后来被收进了付费墙。所以下面这张表只是截至发稿时的大致样子,真要照它搭流程之前,请以软件里实际的标识和官方价格页为准。另外据报道 CapCut 在 2026 年涨过价,标准版每月 9.99 美元上下、Pro 版 19.99 美元上下,但这些数字也在动,记得去看当时的价格页。

步骤免费工具什么时候逼你付费
脚本AI 写脚本超长文本或大批量生成
配音文字转语音,标准音色高级或克隆音色、大量输出
字幕自动字幕(约 95%)高级字幕动效包
出镜基础 AI 数字人 / 主播大量数字人视频、高级形象
b-roll短 AI 片段(约 4 到 8 秒)更长的 AI 生成、更高分辨率
打磨标准模板和特效高级特效、去水印

写脚本、文字转语音、字幕、套模板,这几样在免费版就够撑一条正常的产品视频。逼你升级的就三件事,时长、数量、精致度。等你要更长的 AI 生成、整天批量做数字人视频、要高级特效、或者非得去掉水印,这时候掏钱才算划算。

TikTok 小店和 Reels:尺寸和时长怎么分

同一条片子别原封不动地两边发,虽然两个平台都要竖屏 9:16。

TikTok 和 TikTok 小店这边,就走原生、稍微糙一点的感觉。文字转语音那种像在说话的配音配上真实产品画面就挺好,前几秒就把产品使用场景秀出来的可购物片段更抓人。时长压紧,带货片 15 到 34 秒,行动号召直接指向购物车或者产品链接。

Instagram Reels 这边,同样是 9:16,但观众能接受稍微精致一点的成片。字幕照样关键,因为很大一部分人是静音刷的,你那个自动字幕是真在干活。时长还是放在短区间,最长大概能到 90 秒,但产品内容还是短的赢。

实操做法:在 CapCut 里剪一条干净的母版,然后导两版,一版剪短、标给 TikTok,行动号召盯着购物车;一版给 Reels,行动号召走主页链接或者关注。同一批素材,两个结尾。要转发的片子里别留别家平台的水印或者屏幕上的用户名,两个平台都会压看着像从别处搬来的内容的流量。

几个要提前绕开的坑

免费版大方归大方,但不是无限的,自欺欺人只会浪费时间。

AI b-roll 太短。一段也就 4 到 8 秒,免费版没法靠一句文字提示生成一整条视频,你是在拼凑。这没关系,反正真实产品画面本来就比合成画面转化好,只是你还是得自己拍点东西。

文字转语音听着就是文字转语音。免费的标准音色明显是合成的,TikTok 观众现在大多能接受,但放在高端品牌上会有点违和。如果声音质量真的在拖转化,那才是去试付费音色的正当理由,不是为了升级而升级。

自动字幕约 95% 准,不是 100%。导出前一定校对品牌名、价格和参数,字幕里数字写错可能引出合规或者退款问题,不只是个错别字。

水印和功能门槛会变。今天免费的功能明天可能限量或者上付费墙,反过来也有。流程要搭得灵活点,万一某一步 AI 被收费了,能随手换掉而不用整条重来,比如临时自己录一段真人配音顶替文字转语音,或者用现成转场顶替 AI b-roll。目标是一套能反复跑的零成本流程,不是赌某个功能永远免费。

相关文章