文 |万图幻想 国庆中秋假期,我被一个叫天空2的东西折磨着。朋友圈、微信群里流传着各种真假难辨的短视频。是视频本身,而不是“震惊世界”的情节,让我停下了手上的一切,全神贯注。许多片段几乎无法用肉眼辨认,有些泄露的版本甚至没有水印。这不再是一个有趣的问题,而是一个严重的技术问题。看似虚假又真实的内容生成工具对于我们这些构建和部署系统的人来说意味着什么?突然我的脑海里充满了可能性和风险。老实说,这部作品太棒了。这次实验起来并不算太难,所以我马上就开始玩了一段时间。但一旦新鲜感过去,更实际的问题就会出现:道德问题。这也是创造商业系统的人类的本能反应像我们这样的团队。 “我如何在‘生产’中使用它?”例如,我的一个从事跨境电商的朋友,他的商店里有数百个SKU,每个SKU都需要几秒钟的视频观看时间。是否需要操作人员手动逐一生成、下载、整理、上传网页?这是低效且容易出错的。无论单个视频有多好,如果不能批量或渲染它,它就只是一个玩具,而不是一个工具。这个结在我心里形成了。无独有偶,昨天,OpenAI 做了两件重要的事情。开发者日一早,我们正式发布了Sora 2的官方API。现在我们发布了Sora 2官方Word快速指南。现在您已经掌握了所有成分(API)和说明(官方指南)。我在另一篇文章《OpenAI 跨越了智能代理开发的门槛,从珠穆朗玛峰到人行道》中详细讨论了这一点。一切都准备好了,还不行动还等什么?我转身用手背在 n8n 上编辑。整个工作流程不到一个小时就搭建完毕,并与飞书的多维表格完全对接。效果非常直接。当你在飞书表单上发出批量命令时,n8n会自动调用Sora 2官方API生成无水印视频,最后直接保存到表单中。今天我先带大家熟悉一下官方刚刚发布的《Sora 2 快速单词指南》,然后我会对其进行分解并与大家分享如何构建这个自动化工作流程。 01|先别着急,在与Sora 2交流时一定要了解这些官方“说明”,不要把它当成ChatGPT。你应该把他看成一个技术精湛但有些无聊的“虚拟摄影师”。 l它给你的指导是摄影师的“技术要求文件”或“故事板”。写得越清楚,就越容易实现。以下都是取自官方指南的正宗方法。我会特拉为您将它们翻译成当地语言。 ✅ 设置规则:在消息外面写上“严格参数”。这与编写代码时类似:您必须首先确定函数的输入参数。调用 API 时,有些内容无法在消息中遵循,假设您需要将它们作为参数显式传递。型号:我应该使用 sora-2 还是 sora-2-pro?尺寸:视频是水平(1280×720、1792×1024)还是垂直(720×1280、1024×1792)。持续时间(秒):目前支持4秒、8秒和12秒。当出现提示时,不要说“给我更长的”之类的废话。这是一种浪费。它无法理解,因此必须将它们编码在 API 参数中。 ✅ MethodKey逻辑:从“聊天”切换到“脚本”,并使用更长的提示来稳定和控制。如果你想让人工智能给你带来惊喜,请使用简短的提示。矮也有矮的好处。有时你可以用句子制作一部电影。例如,在下面的例子中,你点击风格、人物、场景、对话就能得到很好的效果,剩下的就交给AI自由发挥吧。在 20 世纪 90 年代的纪录片式采访中,一位年长的瑞典人坐在他的书房里说:“我记得我年轻的时候。”但对于那些寻求一致结果的人来说,长提示绝对是最佳选择。这意味着你必须说得非常清楚。弱指令(AI 难以理解) 强指令(AI 能准确执行) “美丽的夜路” “湿漉漉的柏油路、人行横道、水坑里的霓虹灯倒影” “跑得快的人” “骑自行车的人踩三下、刹车、停在人行横道前” “需要电影感” “使用 2.0 倍变形宽银幕镜头,浅景深 场、体积光”坦率地说,你描述得越多,它与现有照片就越相似,你就越能恢复那张照片。 ✅ 像导演一样思考并管理平面、灯光和运动。不要只是exp不仅在于你将拍摄“什么”,还在于你将“如何”拍摄。镜头框(取景):广角定场镜头、视线水平(广角定场镜头、高视线水平)中特写镜头、微角度从后面(中特写、从后面稍微倾斜角度)相机抖动(抖动):慢镜头倾斜(慢速相机倾斜)镜头)手持EN相机(新闻采访用手持相机)节奏控制-将恒定的动作分解为几个“节拍”,让AI一步步跟随它们。不要说:“演员穿过房间。” “演员向窗户走了四步,在最后一秒停下来并拉上了窗帘。” ✅ 两大“杀手锏”:实现像素级精准控制1。请提供图片以供参考。这是一个很棒的技巧,特别是对于需要保持统一风格的商业项目。首先使用其他工具生成符合您要求的图像(人物、场景、产品),然后在调用时在 input_reference 参数中使用此图像Sora API 2.它可以作为参数传递。 Sora 2 认为该图像是视频的“第 0 帧”,并根据文本中的指示进行处理。输入 OpenAI 生成的图像 GPT 图像 Sora 2 生成的视频(转换为 GIF) 2. 编写超详细的“淫关”脚本。说实话,我第一次看到的时候很惊讶。这不再是警告。它是毫米级精度的电影电视文档预制作人工智能。在寻求最大控制的场景中,这绝对是一个天花板级别的参考。 ?示例:《火车站台》超详细场景脚本【官方示例消息】? LookDuration 格式为 4 秒。 180°快门。模拟 65 毫米光化学对比度的数字捕捉。细粒。镜面反射光的微妙光晕。不带门布。 32mm/50mm 球面定焦镜头滤镜。黑色誓言1/4;美丽的早晨阳光带着淡淡的琥珀色。中性色:平衡的中性色,阴影中带有一丝青色。黑色:光滑、中性,带有轻微提升以保持混浊。照明氛围 来自左摄像头的自然光,低角度(上午 7:30)。弹跳:来自 Trackside 的 4×4 Ultra Bounce Silver。对面墙的负填充。实用:钠平台的昏暗光线逐渐消失。气氛:柔和的雾。火车排出的废气穿过一束光。黎明时分,城市通勤站台的位置。特写:黄色安全线,长凳上的一杯咖啡。中央视图:等待的乘客在雾中现出轮廓。背景:一列到达的火车刹车并停下来。避免标牌和企业品牌。服装/配饰/特典主题:30多岁的旅行者,海军蓝色外套,肩上挎着背包,手机松松垮垮。侧面附加功能:通勤时的语气柔和。一名骑自行车的人推着自行车。配件:纸质咖啡杯、拉杆箱、LED 出口面板(常见目的地)。它听起来只是叙事性的:轻微的铁路吱吱声、火车刹车声、远处低沉的广播声(-20 LUFS),瞧w 环境嗡嗡声。脚步声和纸张的沙沙声。没有添加分数或拟音。优化镜头列表(共 2 个镜头/4 秒)0.00 至 2.40 —“到达漂移”(32 毫米,缓慢移动移动车安装在左侧肩部) 摄像机滑过平台标志的边缘。浅焦点显示画面中央有一个旅行者,可以俯瞰火车轨道。晨光透过镜头照射进来。火车的车头灯透过雾气发出柔和的光芒。目的:设定情绪和基调,暗示期待。 2.40–4.00 — “转弯并暂停”(50 毫米,慢弧) 当火车停止时,在路肩上方切出更紧的弧。旅行者稍微转向相机,捕捉她脸颊上的阳光边缘和手机屏幕的反射。眼睛上升到看不见的地方。目的:以最小的运动创造人类焦点时刻。相机注意事项(为什么这样) 保持视线较低并靠近镜头轴线以保持亲密感。允许火车玻璃发出微光作为审美精致的质感。保留细微的手持缺陷以实现真实感。不要因高光曝光过度而破坏轮廓的清晰度。保留皮肤反射的损失。细颗粒覆盖与柔和的彩色噪音,打造逼真的效果。在实践中,光环被消除了。冷/热 LUT 可以打破你早晨的语气。混合:优先考虑环境和列车细节而不是客流量瞬态。海报框架:旅客在转弯时,一辆到达的火车的柔和焦点,金色边框灯和背景中的薄雾。 ✅ 小步骤:使用“Remix”功能迭代优化该功能。这与开发中打开之前的 git 提交特别相似。修改新分支。如果您对结果基本满意,但想要更改颜色或镜头,请使用 Remix。它锁定其他元素不变,只影响特定点,从而避免了再次“抽牌”带来的巨大不确定性。 ✅ 两张可保存的“毕业记录”直接点了。 2のプロンプトを构成する方法を学习するための优れたテンプureートです。 ?示例 1: animeshon sutairunno robotto shoto fiルム[公式sanpurupuronputoワード]?sutairu:柔らかいブるタングステン照明、手描きの2D/3Dハイブリッド animeーshon。它的美感让人想起2000年代中期的童话动画。它舒适、不完美、充满机械魅力。微妙的水彩水洗和绘画纹理。暖区和冷区的平衡在一度之内。电影运动模糊,实现动画真实感。拥挤的车间里的架子上摆满了齿轮、螺栓和发黄的物体。计划。当他紧张地摆弄着嗡嗡作响的灯泡时,他明亮的大眼睛闪烁着淡蓝色的光芒。空气中充斥着无声的机械噪​​音,雨滴敲打着窗户,背景中的时钟滴答作响。摄影:相机:中特写,慢推。带悬挂工具的软视差镜头:35mm虚拟镜头。浅景深照明可减少背景混乱:上方的暖键非常方便。robottoが电球をたたきます。从我的胸口逃走:宽慰和自豪。 ——机器人低声说道。风格:20世纪70年代浪漫剧。使用 35 毫米胶片拍摄,具有自然光斑、柔焦和光晕。温暖的。轻质门面料和便携式微摇晃唤起了复古的亲密感。受柯达启发的温暖品质。灯泡光晕。影片的颗粒感和柔和的小插曲传达了那个时期的真实性。到了黄金时间,唐楼的砖瓦屋顶就会变成一个小舞台。风吹过裹着白色床单的衣服,捕捉着最后的阳光。一排不匹配的灯泡在头顶上微弱地嗡嗡作响。一位身穿流红色埃达连衣裙的年轻女子赤脚跳舞,她的卷发在傍晚的灯光下闪闪发光。他的同伴卷起袖子,松开背带,拍着手,露出迷人的笑容。下面你可以听到城市的声音:汽车喇叭声、地铁震动声、远处的笑声。从眼睛水平推入的镜片:40 毫米球面。浅焦点照明将这对夫妇与地平线分开:带有钨弹跳的天然金钥匙e.灯泡边缘 情绪: 流畅、怀旧、电影般的动作: – 她旋转。她的裙子变宽并捕捉阳光。 – 女人(笑):“你明白吗?今晚这座城市将与我们一起跳舞。” – 他向前走去,握住她的手,让她沉浸在阴影中。 – 男人(微笑):“因为你领先。” – 一片叶子穿过画面,短暂覆盖地平线,然后再次分离。背景声音:仅限自然环境:微风、飘动的织物、街道噪音、安静的音乐。暂无补充 s02|“材料”和“场地”都搞定了,准备工作就完成了。理论清晰了,下一步就是努力了。在开始之前,您必须首先配置您的“成分”(API密钥)和“地点”(飞书,n8n)。 ✅ 步骤一:设置飞书并获取“Key”。我们需要在飞书中创建一个“机器人”应用程序,使其能够充当n8n和飞书之间的沟通桥梁。这一步有点乏味,但是如果你按照它去做,你就会完成它一口气。创建自建企业应用 打开飞书开放平台开发者后台,点击创建自建企业应用。输入易于理解的应用程序名称和描述,例如“Sora2”,然后单击“创建”。开放权限是最重要的一步。创建应用程序后,在左侧菜单中找到“权限管理”。 Faish的权限非常详细。我不沮丧。只需一次性授予您稍后想要使用的所有权限,这样您就不必因缺少权限而再次访问它们。在搜索框中,找到并启用以下所有权限: 多维表:bitable:app:readonly、bitable:field:readonly、bitable:record:readonly、bitable:record:write、bitable:app:read、bitable:app:write 等。选择所有包含“多维表”的权限。还启用与云文档和文件相关的云空间:drive:drive:read-only、drive:file:read-only、drive:file:upload、drive:file:下载。所以我们的原则是,每当我们看到与“多维表”和“云空间”相关的用户和应用程序权限时,我们都会检查它们。最后点击“确认激活权限”。打开应用程序的发布权限后,在左侧菜单中查找版本和lanversion,然后单击创建版本。写入版本号(如 1.0.0)和随机更新说明并保存。然后单击“请求在线版本”并等待公司管理员的批准。发布后,返回证书和基本信息页面,复制并保存App ID和App Secret。这是 n8n 稍后用来连接 Faish 的“密钥”。 ✅ 第二步:创建多维表作为“指挥中心” 1. 在飞书云文档中创建一个新的多维表。 2. 表必须包含以下字段,并且字段名称和类型必须匹配。信号词(文本):用于存储视频生成步骤。状态(单选):用于跟踪任务的状态,至少需要两个选项:待处理和已完成。 raw resultsSuccess (Text):用于记录成功或失败信息。视频文件(附件):用于保存最终生成的视频文件。 3、编译完成后,先手动输入几行关键字,选择状态为pending,方便后期调试。 ✅ 第三步:获取Sora 2的官方API key。在昨天一早的OpenAI开发者日上,官方终于发布了Sora 2的API。这意味着你不再需要通过第三方渠道,可以直接连接官方的,更加稳定和便捷。只需访问 OpenAI 官方平台(platform.openai.com),登录您的帐户,在 API 密钥页面上创建新密钥,复制并保存即可。 ✅ 步骤 4:准备您的 n8n 环境。我的这个工作流程是在本地部署的 n8n 环境中运行的。我之前写过一篇非常详细的文章,介绍如何从 Scrat 构建 n8n 数组ch 在您自己的服务器上。有需要的朋友可以先阅读《N8N私有部署实用教程:0对1企业AI工作流引擎搭建指南》一文。在n8n环境中,您需要打开设置。找到社区节点,打开并点击安装社区节点。安装n8n-nodes-feishu-lite软件包。这是连接飞书的一个重要插件。 03|开工!您已准备好创建和配置自动化工作流程。现在让我们在装配线上组装这些零件。 ✅ 第 1 步:构建工作流程的“骨架”。在n8n中新建一个工作流程,将下面的节点一一拖动,像搭积木一样按顺序连接起来。 1.手动触发:手动触发,方便调试。 2、飞书节点:读取飞书表中处理后的指示。 3、minesSplit:将同时读取的几条指令分成单独的tasksda。 4. HTTP:调用Sora 2官方API的中心节点。 5.代码:提取t返回结果中的视频下载链接。 6. HTTP:下载视频文件。 7.飞书节点:上传视频文件到飞书云空间。 8.飞书节点:将云空间视频写入多维表。 ✅ 步骤2:一一杀死每个节点。配置每个节点的这一步需要绝对的耐心和细心。如果参数输入错误,整个过程将停止。飞书节点1:提取待办事项凭证(Credentials):首次使用,需要创建新的凭证。输入应用ID和飞书应用秘钥。资源:选择bitable(多维表)。操作:选择record.list(批量获取记录)。表 ID/令牌 – 输入多维表的 ID 和令牌(在表单 URL 中找到)。应用程序bodytud(主体):写入。使用过滤器告诉它只读取状态字段已就绪的行。粘贴以下代码并确保 field_name 与中文字段名称匹配。 ·{“filter”: {“conjunction”: “and”,”conditions”: [{“field_name”: “status”,”operator”: “is”,”value”: [“pending”]}]}}拆分节点:拆分任务很简单,只需在要拆分的字段中输入 {{ $json.data.items }}即可。 HTTP Node:调用 Sora 2 官方 API,这是你最容易摔倒的地方,抓紧。 URL:输入 OpenAI 官方补全 地址:https://api.openai.com/v1/chat/completions。身份验证:选择标头身份验证。选择“通用凭证类型”作为“授权”,选择“标头身份验证”作为“通用身份验证类型”。标头身份验证需要 OpenAI API 密钥。请求体(Body):嵌入从前一个节点传递过来的请求字变量。 {“型号”:“sora-2”,“消息”: [{“role”: “user”,”content”: [{“type”: “text”,”text”: “{{ $json.fields.prompt word[0].text }}”}]}]}代码节点:官方API提取视频URL返回的数据结构可能与第三方略有不同,但提取逻辑是一样的。使用 reg 从返回的文本中提取链接语言表达。下面的代码非常通用: const returned item = [];for (const item for item) { const markdownText = item.json.choices?.[0]?.message?.content;let extractUrl = null;if (markdownText) { const cleanText = markdownText.trim();const regex = /\((.*?)\)/;const match = cleanText.match(regex);if (match match.length 1) {extractedUrl = match[1].trim();}}item.json.videoUrl = extractedUrl;processedItems.push(item);}return requestItems;HTTP 节点 1:链接到文件 URL:输入 {{ $json.videoUrl }}。可选:搜索答案并选择文件作为答案格式。飞书节点2:上传到云盘 操作:选择通过URL上传素材。加载点令牌:输入多维表单令牌。文件链接:{{ $jEnter son.videoUrl }}。文件名:输入 Sora2_video_{{ $now.toMillis() }}.mp4。 Fashu节点3:重写表操作(Operation):选择Update Record。表 ID/令牌 – 输入多维表的 ID 和令牌(您可以在表 URL 中找到它)。记录ID:输入 {{ $node[“Split Out”].json.record_id }}。请求体:将状态更新为已完成,并将上一步返回的file_token写入视频文件字段。 {“fields”: {“Status”: “Completed”,”Generation Result”: “Successful”,”Video File”: [{“file_token”: “{{ $json.data.file_token }}”}]}} 所有配置已完成,并从头到尾运行。转到 Faceform 并检查状态是否已更改为“已完成”以及附件是否具有无水印的高分辨率可播放视频。如果是这样,恭喜你!自动化视频工厂已开始运营。最后提到的除了工具之外就是工作流程。这个工作流程给我留下了深刻的印象,它只用了不到一个小时就完成并自动更新了面部形状。您还记得我的电商朋友第一次遇到的问题吗?手动生成单个视频只是功能的一个“点”。对于商业来说,这还不够。 Sora 2 的真正商业价值最重要的是它可以插入现有的生产线,成为一个可以持续按需批量生产的“表面”。连接点和平面是我们创建的自动化工作流程。这其实是整个AI时代的一个缩影。未来我们缺少的可能不是更强大的模型。我们缺少的是一个“协作系统”和一个“工作流程”,专注于这些能够解决实际问题和流通价值的强大工具。这就是你如何构建一个最低限度。Sora 2 API,只是必需品。一个连接到你的电子商务需求和面部形态,可以运行 7×2 自动化的 n8n 工作流程 4 小时,它们是可以持续创造商业价值的线。将点连接到线,将线形成网络。这就是 开发者如何解决问题,这也是我们今天可以利用的真正优势。 【钛媒体作者简介】万图欢翔是一位专注于AI业务代理开发及企业系统的专业人士临时实施。长期专注于定制企业系统开发、多维表格定制、快速定制、智能车身设计、工作流程构建自动化、ComfyUI工作流程、AI视频制作,致力于打造各层面的AI解决方案,驱动增长、驱动优势。在这里我们将继续分享一线实践和结构化实施方法。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。