您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:妙鸭产品负责人–20230804 - 发现报告

妙鸭产品负责人–20230804

2023-08-07 未知机构 能力就是实力
报告封面

01 问:团队怎么从0到1做起来的? 答:这个项目最初是在一二月份开始,比较简单,没有像现在这样有一个清晰的商业计划,类似于一个兴趣小组,我和五六个同学一起研究AI和图像技术方面的前沿知识和产品。在2月9号拉了名为AIGC破壁行动小组的群。从那时候开始,我们陆续关注到图像AI技术领域中的一些新技术和生态中的新工具和插件。 「妙鸭」产品负责人2023-08-04 01 几个人的兴趣小组,三个月打磨出「妙鸭」 问:团队怎么从0到1做起来的? 答:这个项目最初是在一二月份开始,比较简单,没有像现在这样有一个清晰的商业计划,类似于一个兴趣小组,我和五六个同学一起研究AI和图像技术方面的前沿知识和产品。在2月9号拉了名为AIGC破壁行动小组的群。从那时候开始,我们陆续关注到图像AI技术领域中的一些新技术和生态中的新工具和插件。到三月份左右,我认为一些关键的技术要素已经相对成熟了,决定朝着写实人像的方向开发。 妙鸭团队合影|妙鸭相机公众号 我们花了三个多月的时间来打磨这个方向,包括技术和美学项目上的模板。在产品开发到6月底和7月初时,我们终于觉得可以向用户展示它的状态,开始为期两周的内测,邀请了一些身边的朋友和同事,我们得到了大家的反馈,发现用户对产品的效果和满意度都比较正向。在7月中旬,我们正式对外发布了产品。产品上线后,引起了比较大的反响,用户也确实比较喜欢它,发展速度超过了团队最初的预期。 资源支持方面,资源占用最初不大,随着逐渐发展,妙鸭有了更多支持。最重要的是,公司对创新的包容和支持,让我们做了比较多的尝试。 问:为什么选择写实人像领域做AIGC落地? 答:我对产品方向有一些基本的分析。首先我以前做过相册类产品,其中会给用户提供基于算法的这种自动分类,在所有用户的相册,70%以上是真人的照片。如果把所有照片和图片类信息放在一起,未经筛选的话,写实的人像将是最有价值、占比最高的,也受到最高度关注。 另一个考虑因素是,海外像Midjourney这样的产品比较成功,国内也有一些类似的产品试图复刻这种模式。然而,这些产品本身是一个什么都能画的画家,对技术和算法等方面的要求相对较高。更垂直的方向更容易实现,这就是为什么选择写实的大方向。 问:很多人体验妙鸭后都说「只需9.9元就能打败天真蓝和海马体」,你们怎么看? 答:我们并没有想要干掉天真蓝、海马体的想法,这只是用户的口号。我们最初的产品形态可能与现在的摄影服务形态相似,但从我们的角度来看,我们希望与摄影和摄像行业达成共识,成为行业的赋能者。海马体作为实体拍摄服务,它永远不可能被替代。因为拍摄的过程本身对于客户来说非常重要。例如,拍摄全家福时,一家人聚在一起完成这个过程本身就是一个非常有意义的事情。即使AI技术再发达,也无法替代这样的过程。 妙鸭相机首页 我们希望覆盖一些比较下沉的城市和欠发达地区的用户,因为他们可能很难接触到这种服务。但是,无论在哪里,对于美和摄影的需求是存在的,因为人们总是希望为自己留下值得纪念的照片。在我们最初的感谢信中,我们提到:邀请了摄影师和设计师参与模板的创建,他们对AI技术的帮助也很神奇。我们认为我们与这个生态系统是相辅,而不是对立的关系;想要给这个行业提供一些工具, 而不是干掉竞争对手。 问:你们自己复盘下来,妙鸭为什么会走红? 答:其中最重要的因素是团队成员的坚定和努力。团队氛围简单、直接,目标清晰,追求极致的风格。我们花了三个月以上的时间打磨一个效果,以获得更好的用户体验和效果。第二是公司对创新的鼓励、支持、包容,以及看到一些阶段性成果之后,进一步的支援。 在这个产品上本身去找原因的话,我觉得有几个点。 首先,我认为我们运气不错。其次,用户体验非常重要。如果用户无法流畅地使用产品,那么即使产品本身价值再高,也会被用户抛弃。产品的商业价值并不是一个线性的关系,而是在达到一个基点之后,才能真正地体现出来。因此,在设计产品时,我们一定要追求高质量的效果,至少要达到90分以上。当效果达到一个团队的所有人觉得这个效果真好,有哇哦时刻,那它裂变的概率就很高。此外,产品的可控性也非常重要。我们在设计产品时,坚持「真、像、美」三件事情,「真」是没有AI感,「像」是和用户像,「美」是要比用户美3分。这些要求都同时达到90分以上的质量,我们才会将产品推向市场。 问:为什么用户上传的照片数定在了20张? 答:为了达到理想的效果,20张是目前这个阶段的最优解。具体就不方便说了。 妙鸭相机需要用户提供20张及以上照片|妙鸭截图 问:有分析称,像这种火爆的工具类产品都会面临被复制的危机。有人猜测我们的背后模型是基于开源模型微调而来,认为这样的产品技术壁垒不够明显。请问团队,从内部看,我们的技术壁垒或产品壁垒体现在哪些方面? 答:确实不方便具体透露我们技术的实现方式,但我们确实有一些壁垒。最重要的是对其后续持续的迭代和拓展,以及效果的持续打磨。我们的技术团队会不断优化产品的效果。 问:有人猜妙鸭用了Stable Diffusion的模型,然后加Lora精调的方法,这个猜测符合现实吗?答:这可能确实也不方便发表评价。凡是有关这个技术实现的问题,可能都属于我们的商业机密,不太方便泄露。 问:妙鸭背后图像生成的基座模型是自己训练的吗?会用阿里云的图像生成模型吗? 答:妙鸭是阿里大文娱团队内部的一个项目,并没有使用阿里云与这个相关的一些技术,至于怎么实现的,其实我也不太能去讲。 我们有一个模型叫「提香」(Tiziano),大家应该在(7月17日官方发布的)感谢信中看到了这个名字——肖像画之父(的名字)。通过这个名字,也可以看出我们从一开始就想要为用户提供写实人像服务。 问:当前妙鸭的模版风格是怎么形成的? 答:本身团队内有很多年轻的同学,大家会高效讨论。更多还是看用户,比如说在社交媒体、朋友圈上公开去传播的情况下,用户比较偏好的一些方向。 我们也会收集很多用户意见,比如用户喜欢什么样的模板,继续去推出模板,核心是满足用户诉求。未来即将上线的一批模板,基本上都是根据用户的呼声产生的。 问:妙鸭相机怎么平衡出片的真实和美? 答:七八分像,两三分美。我们在定写实人像的业务方向时,提到真、像、美,这三个方向,一个是无AI感,然后能够尽可能像我,但要比我美。不管是美颜相机,还是每一代的拍摄产品,这算是常识。 同时,我们把这个选择权给了用户。人像刚出来的时候很美,但可能没有那么像,然后我们有一个特殊的功能可以让照片更像我,多点几次,就会更像。 问:妙鸭会一直只针对年轻女性群吗? 答:所有自拍或者图像类的产品的主力用户都是女性用户,看我们模板数量就很容易看出来。 02 隐私和数据安全争议 问:背靠阿里很多影视资源,有联动做动态换脸的产品计划吗?比如用通过的脸直接换成影视剧中的人物。 答:我们并不会以阿里大文娱联动为目标,不过如果有确实合适的机会,可以去考虑联动影视、古风和清宫做产品,去洞察用户兴趣方向。 换脸本身,是我们坚决不去做的事情,因为从我最初对产品的定义,就不同于之前的换脸这类产品,甚至是我刻意不想去做的。 问:您如何看待市面上换脸类产品的发展? 答:换脸是一个蛮成熟的产品,它的产品场景不做更多评价。另一方面,它也有一定的安全问题。我们本身用AI为大家生成的这个照片,它比起真正直接换脸反而是没有那么真实,最起码我们去做人脸关键点检测安全级别的东西,一定是过不去的,只是看上去像而已。我们这种方式用户数据是安全的,生成也是相对安全的,这样有更长远的发展空间。 问:如何看待隐私条款的争议问题? 答:妙鸭在上线后因为用户协议的原因引起了一些争议,我们第一时间进行了修改,我们承认这是我们自己的问题。从某些角度来看,没有充分说明这个协议,或者说没有用一个最简单的方式告诉用户。 即使是旧的那个协议,如果大家仔细看的话,就会发现它其实是和新协议类似的,即产品所有的生成物权益都归用户所有,我们不能进行二次使用。但为了能够为用户正常提供服务,我们需要在产品里展示用户的作品并对其进行操作,提供分享、下载的一些服务,肯定要获取用户授权。原协议也是这个意思,但表述可能有一些问题,所以我们进行了修改。 我们的本意是,所做的所有东西都属于用户,我们没有所有权。你所有数据我都没有留,也不会用,要展示的东西,给你展示一下,这个就是我们的初衷。 问:使用妙鸭的产品,需要上传20张照片,但你提到,生成照片后平台会删除用户的数字分身数据,那为什么之前的版本里提到用作训练数据的条文? 答:首先我们没有把这个数据用来作为训练数据,从来没有用过,也不会用。之前的协议,把大家都吓坏了。 妙鸭相机原争议用户服务协议|图片来源:网络再解释一遍,这条协议的上一条是所有的生成物所有权是属于用户的。正是因为我们把所有权完全让渡给用户了,所以又返回来需要取得用户的同意授权,才能够展示这些信息。 其实大家如果关注很多产品的用户协议的话,它是不说在我平台上制作的物品的所有权属于用户,而是模糊的,甚至是属于平台的。如果属于平台,那当然不需要要求用户的授权使用,平台本来就拥有这个所有权。 这个操作当然是我们的问题,相当于把我们本来的好意表达成了一个大家非常非常害怕的表现形式。 这里必须要再澄清一下我们团队的本心,从来都没有考虑过用户隐私数据和滥用用户隐私数据的事情,所以当我们发现这个表述不太接地气,用户理解不了之后,我们也第一时间马上就修改掉,也没有任何心理压力,因为我们压根就没干这个事情。 问:用户的面部特征会不会被提取和泄露? 答:我们没有提取用户的脸部关键点,根本没有这个操作。用户上传照片时,会有一个识别的流程,这个识别流程是进行一些安全相关的检测,避免用户上传的照片不符合国家法律规定,但是我们并没有去获取用户的脸部数据点。 第二,用户去制作数字分身的过程,也不是把脸部特征进行提取的过程。反过来说,我们没有办法再反向把你当时那20张照片推出来,不可能做得到。虽然不方便透露具体的技术原理,但是不涉及到用户脸部数据信息的提取。 这也是为什么刚才我提到,可能大家发个社交媒体,或者甚至朋友圈,发你本人的脸,这个危险性,如果要担心这方面安全性的话,那他的危险性可能比我们这种生成类产品要高。 问:如果没有提取用户的脸部关键数据的话,怎么做到现在的效果? 答:它是用一些现在AI的技术,但是肯定不是提取脸部特征点的这种方式来实现。我相信行业很多人会有各种各样(技术路线)的猜测,这里我不方便直接证实他,但是肯定不会涉及到安全问题。AI的所有东西都是一个概率性的东西,它没有办法把你的照片再复刻出来,再推理出来,所以是非常安全的。 问:在用户隐私保护上,妙鸭做了哪些举措? 答:我们在协议里承诺,没有留存用户的照片数据。用户上传的所有照片,不管是20张还是多少张,都会在数字分身的制作完毕后删除掉。所以既没有保留用户的数据,也没有办法通过用户的数字分身反向再把这些数据反推算出来。 第二,我们也不会把你的数字分身或其他任何的数据展示给第三方看。我们的产品形式里每个用户只能看到自己生成的图片,可以选择是否与他人分享展示。 第三,我们本身也做了大量的网络安全防护。因为即使我们保护用户的隐私、不滥用用户隐私,也要防止第三方黑客的获取,但这得益于阿里在隐私保护、安全方面的整体技术支持。 希望大家不要过度恐惧,这个工具本质上是一个制图工具,制作出来的内容只有你自己可以看到,并且没有公开传播的属性,恰恰更加安全。有人会问,AI已经可以生成我的脸,那么它是否可以用于恶意用途呢?但实际上可能再怎么生成,也只是像你而已。但你在,比如说一些公开的社交媒体,直接发你的照片,那就是你,(如果有人)直接把你的脸抠下来,就可以做坏事了。反而我们做出的类似你的图片,是一个没有这么大风险的产品。 综合来看,这是一个对用户影响极低的产品,几乎没有。数据没保留,无法反向推算你的数据,没有获取原本的数据和特征点,所有的东西只有你自己看得到,是否传播自己的生成物数据也是你