本文来自微信公众号 “策略产品Arthur”,作者:策略产品Arthur,纷传经授权发布。
本文以小红书智能创意生成策略为例,拆解相关案例,对其创意生成策略进行拆解分析。
分享一下小红书智能创意生成和优选策略,希望对你有所帮助。
今天接着给大家讲解大厂案例下的策略产品能力——小红书智能创意生成策略。
Arthur前面花费4篇文章给大家从头到尾讲解广告创意策略的全景,以及用阿里京东的大厂实际策略案例给大家分享关于创意生成、创意展示策略的原理和效果。
今天我们换个大厂案例目标来讲解分享一下小红书智能创意生成和优选策略,原文来自小红书公众号。
目录:
1、小红书平台做智能创意策略的背景
2、小红书智能创意生成策略实现详解
3、总结
01
小红书平台做智能创意策略的背景
小红书搜推APP客户端展示页面
小红书平台作为目前实现活跃用户Top的富媒体笔记分享平台,商业广告和自然推荐的笔记都是生态内容交互的组织成本分。
在小红书这样的上亿级别活跃用户UGC社区,笔记或者商业信息的有效呈现如何受到用户青睐和点击(CTR)是一个非常重要的问题。
之前文章也重复提到,广告创意是广告信息的核心载体。
承载广告主需要传达和推广的营销内容,更是用户被商业信息触达的门面,创意直接影响广告的点击投放效果和用户体验。
图片信息是否简洁直接地突出产品特点,标题是否展现了产品的适用场景等等,都是影响用户关注的因素,也是广告创意的一部分。
其次,优质创意的制作成本较高,小红书若能帮助客户降低广告创意制作门槛。
并且帮助客户进行创意优选和流量适配,对于提升广告的投放效率和满足用户体验意义重大。
02
小红书智能创意策略实现详解
为了保证整个小红书的用户体验,小红书的广告呈现形式都是原生广告。
以笔记作为主要呈现形式,生成的元素类型主要就是封面图和标题。
一般图文笔记中通常用户都会上传多张图片,并且都是博主精心挑选的结果,可以直接优选出来作为封面图素材。
对于视频类型的笔记,小红书算法可以根据笔记内容和视频的相关性、内容丰富性等定义抽取关键帧作为封面图片。
所以目前关键的点就在于无论是视频笔记还是图文笔记,博主都只提供了一个标题,如何在不增加博主生成成本前提下去提供更多的标题素材。
2.1 技术难点
其实文本生成类型工业界已经早有应用,技术难点就在于可控性和多样性。
为了保证可控性,早期生成的方案都是采用基于模板或者基于规则进行文本生成,这样的标题千篇一律,标题整体缺少多样性。
为了拓展多样性,工业界开始大量尝试NLP模型,开放自然语言模型进行文本生成,但是模型智能生成了通顺的标题文本,但是应用层有出现张冠李戴的问题。
核心目标:让NLP模型文本可控不受限,”自由但不散漫”是非常有技术挑战的一件事情。
因此,小红书创意团队基于可控是文本生成技术,结合小红书海量高质量的文本大数据,构建一套内容理解的小红书特色标题生成体系。
2.2 可控式生成策略
在生成范式上,小红书主要使用了基于语言模型(GPT2)和Seq2Seq(T5)两种生成范式。
小红书标题生成策略
基于语言模型GPT2:
使用内容丰富的笔记正文作为输入,充分学习笔记上下文信息,同时结合特征控制信息(关键词、标题长度、是否包含表情符合等)进行标题生成。
极大的保证的生成标题与原文的相关性。
关键词/特征控制信号 + 笔记正文 -> 生成标题
Seq2Seq 模型:
主要针对原标题进行改写,通过挖掘高频 query, bidword,并以品牌、功能点、利益点等信息作为 prompt,同时融合不同的风格元素,对原有标题进行改写,既保持原标题的核心内容,又增加了标题的多样性。
两类生成模型在线上结合使用,保证对不同的广告笔记均有较好的生成结果。
原标题核心内容 + 原笔记正文特征 | 风格模型 -> 风格标题(包含标题核心内容)
2.3 预训练技术底座
小红书Red系列预训练底座
强大的文本生成能力离不开一个熟知小红书营销风格且强大的预训练语言模型。
基于业界最前沿的大规模语言模型理论和实践经验,小红书平台建设了 RED 系列-预训练模型技术底座:
提供了基于小红书内部数据构建的 RED-BERT (理解式)、RED-GPT2 (生成式)、RED-T5 (seq2seq)等预训练模型。
充分利用大规模语言模型对小红书海量的文本知识进行无监督学习。
同时,创意文本还涉及大量相关性、以及广告法遵循等要求。
其中 RED-BERT 支持了生成依赖的卖点抽取、相关性评估、机审质控、离线预估等内容理解相关的需求。
而核心的可控式生成能力则由 RED-GPT2、RED-T5 支持。
市面上的开源生成模型都是基于公开语料进行训练的。
如中文维基百科、百度百科等,与小红书笔记的语言风格存在很大的差异。
“RED-” 系列预训练模型是基于小红书平台内部10亿规模的笔记文本内容训练的,可以更好地学习小红书笔记的语言特点。
同时,小红书平台改善了公开模型中的词表适配性的问题,如 vocab 太大,缺少对于特定中文语料的侧重,缺少 emoji 和小红书表情等。
最终两种生成模型的离线评估下过如下,相比较开源模型,基于小红书场景下训练的生成模型相关指标有了明显的提升。
策略实验结果
03
总结
小红书平台创意从21年起步,至今2年,发展速度非常快。
快速搭建起了创意标题生成、创意优选的能力。
并且也取得了非常明显点击率的效果,通过好的投放效果激起广告主追加预算投放的信息。
创意生成是一个基于item主体属性、特征信息去生成丰富文本、图片样式的一个过程。
核心是提供物料多样与丰富度给到创意优选的环节。
能让创意能够千人千面的展示到每一个小红书用户的面前,达到素材信息利用价值的最大化效果。
下一篇文章会接着给大家介绍小红书智能创意优选策略的实现方案。