如果你是Sora的产品经理,你会如何设计这款产品?

0 评论 2446 浏览 26 收藏 10 分钟

OpenAI发布了文生视频模型Sora,这是一帮纯技术的成需要发布的大模型。但如果是从产品经理的角度设计的大模型,会不会不一样。这篇文章,我们考虑技术特性、应用场景、操作流畅度和个性化定制程度这几点,分别展开来聊聊。

Sora的出现,引发一众讨论热潮,但这款未正式发布的跨时代AI产品,还无法让我们直观感受到它的操作界面和使用效果。

那身为一名产品经理,我不禁好奇,这款产品会给人什么样的交互体验?如果我是它的产品经理,我会如何设计?

是像DALL-E 3那样直接融入ChatGPT里?还是像Pika那样单独的输入框和调试界面?又或者干脆做成剪映那种一站式视频生成和编辑器?

AI产品设计,要同时考虑技术特性、应用场景、操作流畅度和个性化定制程度这几点,下面我分别展开来聊聊。

一、技术特性

采用Diffusion Transformer架构的Sora,特点在于能够处理和生成具有复杂动态和空间关系的高质量视频。因此产品设计要重点考虑如何有效调整模型性能,控制它的泛化能力。利用Transformer的特性来提高视频的质量和多样性。

因此从产品设计上,提供高清分辨率、多场景模版、多镜头选择肯定是Sora和其他视频有差异化的配置参数。

与此同时,考虑到过度复杂的参数配置导致的过拟合问题,这类配置的选择也要控制边界,限制约束条件,不能让用户通过自然语言来随意控制。

二、应用场景

Sora的应用范围非常广泛,因此,在产品设计时,应考虑如何将Sora应用到如影视制作、游戏开发、教育教学、产品演示、内容营销等更多领域,从而扩大其市场影响力,覆盖到更多元的职业类型。

举个例子,影视制作就是官方指定的Sora应用场景之一。OpenAI曾公开表示,通过使用Sora,视觉艺术家、设计师和电影制作人可以获得关于如何推进模型对创意专业人士最有帮助的反馈。

但对产品经理而言,这样的定位更要求产品设计风格面向专业人士而不是普世大众。也许我们的界面,不应该只提供一个对话框,而是要以更贴近镜头语言、电影脚本那样的风格来给用户输入提示。就像DALL·E3的提示词生成器那样,明确规定用户要按:场景、人物角色、形象描述、背景介绍、表现说明那样的格式来撰写提示词。以剧本撰写为例,一个剧本通常由5个主要元素组成:时间、地点、人物、行为、对话。那我们的界面设计,就应该要求用户完善这些设定,才能享受到一部精彩的剧作。

当然,不同行业Sora提供的能力范围也要有区别,比如在游戏领域,游戏开发者就可以利用Sora制作游戏中的角色动画和场景效果,提供更逼真丰富的游戏体验。从这个角度看,就无需复杂的脚本设定,只考虑如何把技术融入到游戏设定中就可以了。

三、操作流畅度

设计一个用户友好、操作简便的Sora视频生成界面,首先要确保界面的设计遵循人机界面的友好性和操作便利性原则

具体来说,可以考虑以下几个方面:

第一,简化操作流程:刚刚我有提到,Sora使用过程中,用户必须对想要显示的内容进行详细描述,包括场景、人物、动作和整体基调等。这意味着在设计界面时,应尽量减少用户的输入工作量,提供清晰、直观的选项和反馈,以帮助用户快速完成描述和设置,这时候就可以融入AI Copilot角色来辅助用户撰写内容。

第二,增强视觉体验:通过合理的排版和配色,使用户能够直观地了解页面内容,并享受到视觉上的美感。这不仅能提升用户体验,还能增加工具吸引力。我个人推荐类似GPTs那样的布局。既可以自然语言交互,又支持输入框配置参数,还可以直接预览,方便直观。

第三,灵活的编辑功能:Sora需要允许用户灵活地编辑和更改生成的场景。因此,在设计界面时,应考虑到用户可能会有不同的需求和偏好,提供多种编辑选项,如调整视频的长度、添加或删除场景元素等,以满足用户的个性化需求。

第四,实时预览和反馈机制:在生成视频之前,用户可以预览生成的视频。这样的设计可以让用户更好地理解生成效果,并根据预览结果做出相应调整。同时,也应该提供一个反馈机制,让用户知道他们的描述被Sora理解了多少,以及哪些部分没有得到很好的表现。还能避免无效的patch资源浪费。

第五,易于学习和使用:Sora的使用,对普通大众而言上手门槛可能会较高。因此,在设计界面时,应确保所有的指示和说明都是清晰易懂的,避免复杂的术语或难以理解的概念。增加示意图和解释说明手册就是个很好的设计。

四、个性化定制程度

就像上面提到的,面向专业人士的设计,相比普通C端,区别就在于可个性化定制的范围。对Sora而言这可能是关键环节,也需要认真设计。具体可以分下面几个维度来考虑:

第一,提供可调节的视频长度和分辨率,以及各种模板和主题:Sora需要允许用户根据特定需求和偏好定制他们的视频,包括视频长度和分辨率的调节,以及提供各种模板和主题,从而满足不同场景和需求

第二,利用用户数据生成个性化视频:作为企业级用户,可以基于用户数据,让Sora生成针对不同用户群体的定制视频,从而提高营销活动的针对性和最终售卖的转化率

第三,支持生成支持多设备多尺寸内容的能力:由于Sora训练的视频是全尺寸,它也就支持为多样化设备定制内容的能力,从产品设计上也要支持多设备屏幕预览功能。

第四,视频风格定制:视频风格也是AIGC产品的标配,卡通、写实、科幻、幽默,用户都可以根据自己的需求和喜好,输入特定的文本信息,让Sora生成符合预期的视频内容,也给用户提供了充分发挥想象力的空间,这也是平台型产品的标准设计思路。

五、总结一下

总的来讲,我觉得sora的设计,不应该只局限在某个功能、某个界面上,更应该综合考虑技术实现、使用人群、实现目的和用户反馈。

这个过程肯定不是一蹴而就,尤其目前作为一款视频生成工具,sora还有大量不完善的地方,比如物体动作表现迟缓不自然、视频无声音、仍旧存在幻觉问题等等。就连已经很成熟的GPT4,OpenAI仍旧在使用过程中用各种方法收集用户反馈。

这也是身为产品经理要特别关注的。

希望这篇文章能对你有所启发。

专栏作家

申悦,微信公众号:互联网悦读笔记(ID:pmboxs),人人都是产品经理专栏作家,前360产品总监,起点学院优秀导师。

本文原创发布于人人都是产品经理。未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!