产品简介 #
品牌分析通过量化的指标,帮助业务部门直观地查阅各大汽车品牌/车系在社媒上的营销表现;并支持对品牌/车系进行维度剖析,归因营销表现,助力企业优化营销策略,达到降本增效的目的。
系统数据介绍 #
一、数据范围 #
(一)数据源 #
(二)可选时间 #
系统可选择查阅的数据时间范围:2023年1月1日至今。
二、数据更新频率 #
● 系统每天会陆续呈现前一天数据;为了实现数据覆盖的全面性,我们每天会安排多轮主贴采集;同时互动量和评论贴会安排T+3天后采集。
● 主贴:发帖日+2天,系统数据趋于稳定可用作分析。互动量和评论:发帖日+6天,系统数据趋于稳定可用作分析。如下图:
三、品牌/车系识别方式 #
主贴和评论分别依据下图规则进行识别(以“雷克萨斯”为例)
四、核心指标定义 #
(一)声量 #
1.声量定义: #
与分析对象相关的帖子量总和,若在同一条帖子被提及多次,声量记1。 主贴、转发或者评论都分别计为1个声量。
2.不同层级对象(集团、品牌、车型)的声量集合关系如下: #
(二)互动量 #
1.互动量定义: #
针对分析对象被提及文本的所有互动指标之和,包括转发数/评论数/点赞数/收藏数等,如下图:
1.互动量更新机制: #
(三)正面声量及负面声量 #
- 系统中,有两类正面声量,和两类负面声量。一类是针对分析对象得出的正面声量,一类是针对分析对象中某个维度得出的正面声量;负面声量亦如此。
- 针对分析对象得出的正面声量,是通过实体情感算法识别得出的结果。以雷克萨斯ES为例:在一篇帖子中,先定位到雷克萨斯ES的位置,然后再找到雷克萨斯ES附近针对它的情绪表达。
- 针对分析对象,某个维度,得出的正面声量,是通过智能三元组算法识别得出的结果。以雷克萨斯ES-外观为例:在一篇帖子中,先明确这篇帖子讲到的车系是雷克萨斯ES,然后定位到外观的位置,最后再找到针对外观的情绪表达。
(四)NSR #
1.定义: #
NSR(Net Sentiment Rate), 净情感度。通过计算品牌/车系在网上正面与负面评价比例来分析网络情绪倾向。
2.统计逻辑: #
NSR=(正面声量-负面声量)/(正面声量+负面声量)*100%。注意:这里的正面声量与负面声量使用的是实体情感算法得出的样本。
五、核心指标定义 #
(一)声量类型 #
1.不同声量类型的定义: #
1.1 BGC: #
即品牌生产并发布的内容,是品牌为了向用户传递品牌形象、服务理念、产品特色等而生产并发布的内容。BGC通常由品牌自己的内容团队制作,包括品牌故事、公司简介、企业文化等。
1.2 PGC: #
Professionally-generated Content,即专业生产内容,是由具有一定影响力的达人或KOL为了向用户传递自己的专业知识和见解而生产并发布的内容。生产创作内容质量可控性更强,对生产者知识背景和专业资质的要求较高。部分专业内容生产者既是平台的用户,也以专业身份(专家)贡献具有一定水平和质量的内容(如资深用户的点评)。在内容创作方面,体现为更加专业化、优质化、垂直化的内容。PGC通常具有更高的质量和价值,能够吸引更多用户的关注和认可。
1.2.1 PGC-经销商: #
由经销商发表的帖子,如下图:
1.2.2 PGC-二手车: #
由二手车商发表的帖子,如下图:
1.2.3 PGC-汽车服务: #
由汽车服务商发表的帖子,如下图:
1.2.4 PGC-其他: #
由汽车领域的达人发表的帖子。如下图。这类用户以汽车领域KOL为主。KOL(Key Opinion Leader),是指关键意见领袖,拥有更多的产品信息,对某群体的购买行为有较大影响力的人。
1.3 KOC: #
Key Opinion Consumer,即关键意见消费者,对应KOL(Key Opinion Leader,关键意见领袖)。一般指能影响自己的朋友、粉丝,产生消费行为的消费者。相比于KOL,KOC的粉丝更少,影响力更小,优势是更垂直、更便宜。如下图:
1.4 UGC: #
User-Generated Content,即素人用户生产并发布的内容,是由普通用户为了向其他用户传递自己的体验和感受而生产并发布的内容。UGC通常具有更强的真实性和可信度,能够吸引更多用户的关注和共鸣。如下图:
1.5 明星: #
明星账号发出来的帖子,如下图:
2. 不同声量类型识别方式: #
3. PGC中,不同的类型识别方式如下: #
4. PGC下不同标签识别关键词: #
(二)声量质量 #
1. 定义: #
声量质量判断主要基于广告杂音判断算法得出的质量类型,方便用户快速挑选符合分析场景的数据样本。
2. 不同类型的定义: #
● 低质量广告
○ 低质量的广告,一般可能带有商品标题,¥,口令,价格数字,链接,优惠券,打折,加微信等信息,但其他商品描述很少
○ 二手转卖、海外代购、推销、打折促销信息折扣、优惠券,只有少量商品描述,几乎只有规格、购买链接、价格、商品标题
○ 充满火星文和表情防删除的广告
○ 微博上各种非官方抽奖
● 高质量广告
○ 有丰富产品描述、高质量广告
○ 官方发的广告、活动、新品信息
○ 软文、软广(一眼看不出是广告,看到最后才知道是广告)
● 杂音
○ 旅游推广、培训、活动报名、招聘广告
○ 任何房地产、租房、求租广告
○ 红包、转发助力
○ 分享文章、博客等没有任何实用信息的文本
○ 只有“转发微博”或只有表情
○ 微博提问,围观问题
○ 去除表情、微博名之后没有有意义文本
○ 其他明显由机器发出的文本
○ 小说
● 自发内容
○ 前面没有提到的情形都算非广告非杂音
○ 种草测评类内容、不能明显看出是广告的推荐商品信息标注为非广告非杂音
○ 自发追星微博都是非广告非杂音
(三)实体情感算法 #
1. 定义: #
分析一篇文章中,作者对这些分析对象的情感倾向。
2. 识别方式: #
如下面这个例子,通过实体情感算法,识别到作者提及探陆时情绪是正面的,因此这里针对探路记1个正面声量。负面声量的识别同理。
3. 统计方式: #
● 负面率=负面声量/声量100%
● 正面率=正面声量/声量100%
(四)三元组算法 #
1. 定义: #
分析一篇文章中,作者是通过哪些维度评价分析对象的,评价过程中有哪些情绪。各指标定义如下表:
2. 识别方式: #
过智能三元组算法,找到帖子中“维度-特征词-情感表达”,并将其打上对应的标签。如下图: