一.产品简介 #
活动监测从活动效果评估、发声主体分析、活动内容分析、人群画像分析四个维度对整个活动的不同阶段如活动预热、活动中等进行监测,可以帮助企业对整个活动的营销效果进行深度剖析、归因,进而为之后的活动营销策划提供方向,使得投放更加的精准。
模块 | 子模块 | 功能 |
---|---|---|
创建活动 | – |
|
任务详情 | – |
|
活动效果分析 | – |
|
发声主体分析 | – |
|
活动内容分析 | 平台话题分析 |
|
主动传播议题分析 | 提供 自定义传播议题 的核心指标排行。 支持联动话题和事件,查看对应的趋势、飙升热词、热门关键词、情感分布、原帖。 | |
活动内容观点分析 | 提供观点分类的二级汇总统计,支持联动原帖。 | |
人群画像分析 | 微博人群画像 |
|
活动列表 | – |
|
二.重要概念说明 #
1.监测对象 #
监测对象是指在整个活动中想要重点关注的品牌、品类、产品。
例如某品牌发布会发布的内容众多,包括手机、平板、电脑、操作系统等,品牌方想重点关注一下手机和操作系统的传播效果,则可以在监测对象中配置手机Find X5、ColorOS 12。
系统将会根据配置,给匹配的数据打上对应的监测对象标签,并在应用页提供查看特定监测对象数据的功能。
2.发声主体 #
活动中的发声主体,是指在活动期间,发表了相关帖子的用户。这些用户可能是品牌官方账号、明星、媒体、KOL、普通用户等。
在活动监测中,发声主体可按声量类型分为 BGC、PGC、UGC,也可按投放类型分为 官号内容、付费推广内容、自来水内容。
3.内容识别范围 #
内容识别范围默认包括整个活动中相关的互联网信息的标题及内容文本,同时支持设置语音内容转文字功能,把语音、视频内容也作为内容识别范围。
4.平台话题 #
微博和抖音平台上,以#为标识的话题。
5.主动传播议题 #
品牌方在活动中主动发出的讨论主题,包括但不限于产品的slogan、产品卖点。
如小米civi发布会发出的“中国青年天生好看”的论点,品牌方想要了解该议题在社媒中的传播效果,就可以在活动编辑页配置传播议题。
6.投放主题 #
品牌方在投放时的主题,包括但不限于产品的slogan、产品卖点。
与传播议题的区别时,传播议题是以内容来划分的,投放主题是以投放帖(URL)来划分的。
7.声量类型 #
将所有的社媒声量分类PGC/BGC/UGC三个类型,详细定义参见指标维度说明。
8.投放类型 #
针对投放内容、官号内容进行分类分析,其余的为自来水内容,投放内容根据用户上传的URL/UID进行识别,官号内容根据UID进行识别。
9.码表 #
由于文本是非结构化的数据,要想从大量的非结构化数据中找到有用的信息,就必须首先按照需求,选取一系列相关联的词组,然后以这些特征词组,从海量文本数据中进行匹配提取。
比如当我们想要对比在 OPPO Find 5X 新品宣传活动中,摄像 和 充电 这两个宣传卖点在社媒舆论上带来的效果差异。
我们可以在创建此活动时,按如下码表配置传播议题,系统将根据码表中的关键词,从活动数据中进行匹配,并统计每个议题的数据指标。
议题码表:
|
统计结果:
|
|||||||||
---|---|---|---|---|---|---|---|---|---|---|
*竖线分隔关键词表示或关系 |
|
如上表格所示,这种 以关键词过滤词形式 定义了 如何从文本数据中匹配出议题 的规则,就是议题码表。除了议题以外,其他分析内容也是类似的,比如定义如何匹配监测对象的规则,就是监测对象码表。
如需了解具体如何制作码表,可查看 附:码表设计规则。
三.数据说明 #
1.数据来源 #
阵地 | 细分站点说明 |
---|---|
微博 | 新浪微博 |
微信 | 微信公众号文章 |
新闻 | 覆盖今日头条、一点资讯、ZAKER新闻、百度新闻、新浪新闻、百度搜索、搜狗搜索、中国新闻网、中国财经信息网、凤凰网_财经、东方网等主流站点的新闻频道 |
论坛 | 覆盖中国网管论坛、电子发烧友论坛、百度贴吧、豆瓣、虎扑、大众点评、中关村_在线论坛、天涯论坛等各行业的主流论坛站点 |
小红书 | 小红书 |
短视频 | 抖音app、快手APP、微信视频号 |
视频 | 哔哩哔哩 |
问答 | 知乎、百度知道、搜狗、穷游等问答社区 |
2.更新频率 #
通过配置信息管理可查看本企业的更新频率
3.指标说明 #
指标 |
含义 |
---|---|
总声量 | 通过配置信息管理可查看本企业的声量规则 |
总互动量 | 通过配置信息管理可查看本企业的互动量规则 |
平均互动量 | 平均互动量=互动量/声量,表示平均每条帖子可以获得多少互动,进而评估特定维度下活动对受众的吸引力高低。 |
飙升率 |
飙升率=(本期声量-上期声量)/上期声量,用来表示活动本期的内容聚焦点。 |
NSR(Net Sentiment Rate,净情感度) | NSR=(正面主贴数-负面主贴数)/(正面主贴数+负面主贴数)*100%,可通过NSR低的维度定位到受众的负面评价,以便及时作出干预和调整。 |
正面率 |
正面率=监测对象正面主贴数/监测对象总主贴数*100% |
负面率 |
负面率=监测对象负面主贴数/监测对象总主贴数*100% |
TGI(Target Group Index,目标群体指数) | TGI=[目标群体中具有某一特征的群体所占比例/微博总用户中具有相同特征的群体所占比例]*标准数100。
反映目标群体在特定研究范围内的强势或弱势,其中TGI指数等于100表示平均水平,高于101 代表具有该特征的用户对活动的关注程度高于整体水平。 |
监测对象相关指标 | 使用活动中提及该监测对象的数据进行统计,具体指标计算方法见上述指标含义说明。例如:监测对象声量=提及监测对象的声量/活动总声量 |
4.维度说明 #
维度
|
定义
|
---|---|
维度
|
定义
|
阵地 | 同一类数据源的总称,例如:新浪新闻、搜狐新闻、腾讯新闻等均属于“新闻阵地”。 |
声量类型 | 通过作者的粉丝数和认证类型,将声量分成了BGC、PGC、UGC三类。不同阵地有不同的条件,具体见下方介绍。
|
投放类型 | 在创建活动时,可以配置官号和付费推广的帖子。
|
话题 | 微博、抖音、快手带#的内容,系统进行自动提取。 |
议题 | 用户在活动编辑页,设置的议题标签内容,根据议题对应的关键词和过滤词进行匹配,命中关键词且不命中过滤词的打上对应的议题标签,一条内容可以命中多个标签。 |
微博-性别 | 根据微博用户填写的性别信息进行统计 |
微博-年龄 | 根据用户填写的出生年份信息进行分段统计,<1960:50后及以上,1960=<60后<1970,1970=<70后<1980,1980=<80后<1990,1990=<90后<2000,2010=< 10后及以下 |
微博-认证分布 | 根据用户所属的认证类型进行统计,统计普通用户,黄V,金V,普通达人,蓝V |
微博-地区分布 | 根据用户填写的所在省份/城市信息进行统计 |
微博-城市级别 | 一线城市:丰台区,密云县,青浦区,海淀区,通州区,大兴区,平谷区,普陀区,广州,嘉定区,浦东新区,宣武区,门头沟区,东城区,昌平区,卢湾区,延庆,闸北区,闵行区,奉贤区,宝山区,石景山区,怀柔区,顺义区,长宁区,深圳,崇文区,松江区,上海,朝阳区,金山区,房山区,北京,静安区,南汇区,黄浦区,西城区,虹口区,崇明县,徐汇区,杨浦区
二线城市:保定,金华,兰州,廊坊,绍兴,台州,中山,南川,大足,河东区,珠海,沙坪坝区,泉州,哈尔滨,武隆,宁河,巫溪县,渝中区,潼南县,贵阳,烟台,永川,太原,昆明,铜梁,南通,武清区,九龙坡区,秀山土家族苗族自治县,江北区,济南,永川区,宁河县,蓟县,常州,徐州,荣昌县,城口,塘沽区,奉节,合川区,江津区,大渡口区,静海县,石柱,津南区,南宁,奉节县,西青区,丰都,汉沽区,长寿,石柱土家族自治县,黔江区,梁平县,巫山县,荣昌,铜梁县,渝北区,云阳县,南开区,綦江,东丽区,北碚区,长寿区,开县,南昌,酉阳,江津,和平区,垫江,长春,嘉兴,无锡,宝坻区,石家庄,云阳,涪陵区,大足县,秀山,巫山,巴南区,温州,彭水,滨海新区,垫江县,万盛区,万州区,大港区,惠州,宁波,静海,北辰区,福州,梁平,河北区,合川,红桥区,厦门,忠县,巫溪,南岸区,双桥区,璧山,大连,河西区 三线城市:洛阳,潍坊,扬州,安庆,蚌埠,滁州,阜阳,黄冈,荆州,九江,六安,马鞍山,南充,宁德,莆田,清远,商丘,上饶,新乡,信阳,宿迁,肇庆,驻马店,遵义,潮州,菏泽,宿州,宜春,周口,绵阳,鞍山,赣州,江门,襄樊,连云港,呼和浩特,临沂,邢台,衡阳,江阴,张家港,湛江,济宁,镇江,邯郸,沧州,芜湖,株洲,银川,乌鲁木齐,漳州,威海,盐城,揭阳,海口,宜昌,柳州,汕头,大庆,南阳,唐山,淮安,桂林,秦皇岛,淄博,咸阳,舟山,岳阳,义乌,三亚,泰州,襄阳,泰安,湖州,昆山 四线城市:包头,宝鸡,滨州,常德,郴州,德阳,东营,鄂尔多斯,吉林,聊城,龙岩,梅州,齐齐哈尔,西宁,榆林,运城,渭南,延安,安阳,锦州,四平,大同,邵阳,牡丹江,葫芦岛,晋中,曲靖,玉溪,通辽,盘锦,十堰,攀枝花,内江,日照,益阳,平顶山,本溪,绥化,开封,辽阳,朝阳,资阳,孝感,通化,三明,韶关,德州,延边,吉安,娄底,淮南,枣庄,吕梁,赤峰,南平,黄山,许昌,永州,衢州,抚顺,阳江,茂名,丹东,丽水,焦作,湘潭,承德,铁岭,拉萨,泸州,荆门,延边朝鲜族自治州,张家口,巢湖,临汾,宜宾,营口,黄石,乐山,衡水,达州 五线城市:大兴安岭,海安,天门,潜江,广元,吴忠,陇南,仙桃,文山,博尔,白银,黑河,铜川,诸暨,巴音郭楞,巴中,莱西,博尔塔拉蒙古自治州,临沧,克孜勒苏,乌海,果洛,福清,佳木斯,随州,吐鲁番,兴安盟,兴化,邳州,章丘,崇明,三河,安顺,毕节,寿光,长兴县,果洛藏族自治州,白山,巴彦淖尔盟,长安镇,鳌江-龙港镇,德宏傣族景颇族自治州,奉化,固原,诸城,如皋,文山壮族苗族自治州,宣城,那曲,湘西土家族苗族自治州,和田,大洼县,海东,辽源,浏阳,甘南,余姚,保山,恩施,闽侯县,孝义,阿勒泰,鹤壁,石嘴山,楚雄,广安,高密,德清县,晋江,库尔勒,河池,阜新,胶南,克孜勒苏柯尔克孜自治州,梧州,新沂,招远,黔西南,贵港,西双版纳,玉树,桓台县,荣成,邹平县,临夏回族自治州,甘孜,抚州,恩施土家族苗族自治州,阿坝,黔东南,虎门镇,汕尾,兖州,河源,玉林,阿克苏,嘉善县,林芝,新郑,黄南,建湖县,黔东南苗族侗族自治州,神木县,白城,黔南布衣族苗族自治州,阳泉,儋州,迪庆藏族自治州,海西蒙古族藏族自治州,酒泉,玉环,萍乡,鄂州,甘孜藏族自治州,海北藏族自治州,玉树藏族自治州,海门,新泰,如东县,准格尔旗,凉山,昌吉回族自治州,肥西县,西昌,红河,怀化,红河哈尼族彝族自治州,咸宁,张家界,天水,崇左,商洛,迁安,锡林郭勒盟,武威,肥城,哈密,黄南藏族自治州,阿坝藏族羌族自治州,新密,伊金霍洛旗,昭通,铜陵,池州,海南藏族自治州,防城港,钦州,莱州,六盘水,湘西,鹰潭,嘉峪关,调兵山,靖江,庆阳,汉中,三沙,三门峡,开原,石河子,赣榆县,丰县,蓬莱,博罗县,莱芜,朔州,海宁,新余,伊犁,呼伦贝尔,云浮,东台,伊宁,临海,仪征,德宏,沭阳县,即墨,金坛,遂宁,金昌,惠安县,山南,永康,长治,青州,阿里,西双版纳傣族自治州,龙海,平度,平湖,大理,松原,伊犁哈萨克自治州,宁海县,东阳,海城,黔南,普洱,楚雄彝族自治州,邹城,乌兰察布盟,永安,自贡,龙口,贺州,甘南藏族自治州,泰兴,伊春,平凉,鸡西,丽江,铜仁,克拉玛依,濮阳,临夏,亳州,百色,雅安,晋城,忻州,济源,塔城,文登,来宾,庄河,常熟,巩义,思茅,中卫,武安,迪庆,双鸭山,辽中县,漯河,昌都,眉山,新民,昌吉,海南,宁乡县,东港,鹤岗,淮北,黔西南布衣族苗族自治州,大丰,安康,海西,启东,增城,阿拉善盟,沛县,怒江,七台河,日喀则,定西,景德镇,丹阳,张掖,北海,胶州,海北,凉山彝族自治州,府谷县,怒江傈僳族自治州,喀什,郫县 新一线:成都,东莞,佛山,杭州,合肥,南京,青岛,沈阳,苏州,天津,武汉,西安,长沙,郑州,重庆 |
微博-活跃时间 | 按发帖的小时数进行聚合统计,如12点05分发贴即计入12那个时刻的数据 |
微博-爱好标签 | 根据用户及其关注的用户的近期发文,判断出每个用户最突出的50个爱好标签,并基于此信息进行统计。 |
声量类型
阵地 |
BGC
|
PGC
|
UGC |
---|---|---|---|
阵地 |
BGC
|
PGC
|
UGC |
微博 | 创建活动时配置的BGC账号 | 符合 ① or ②,且非品牌官方用户的声量 : ① 认证类型=黄V/金V/蓝V ② 认证类型=普通用户/微博达人 且 粉丝数>10w |
符合 ① and ②,且非品牌官方用户的声量 : ① 认证类型=普通用户/微博达人 ② 粉丝数 ≤ 10w |
微信 | 创建活动时配置的BGC账号 | 非品牌官方用户的声量 | 无 |
小红书 | 创建活动时配置的BGC账号 | 粉丝数 ≥ 1万 且非品牌官方用户的声量 | 粉丝数<1万 |
视频 | 创建活动时配置的BGC账号 | 非品牌官方用户的声量 | 无 |
抖音 | 创建活动时配置的BGC账号 | 符合 ① or ② ,且非品牌官方用户的声量: ① 粉丝数≤10万,且有认证 ② 粉丝数≥10万 |
符合 ① and ②,且非品牌官方用户的声量 : ① 非认证用户 ② 粉丝数 < 10w |
快手 | 创建活动时配置的BGC账号 | 粉丝数 ≥ 10万 且非品牌官方用户的声量 | 粉丝数<10万 且非品牌官方用户的声量 |
美拍 | 创建活动时配置的BGC账号 | 粉丝数 ≥ 1万 且非品牌官方用户的声量 | 粉丝数<1万 且非品牌官方用户的声量 |
新闻 | 无 | 均为PGC | 无 |
论坛 | 无 | 无 | 均为UGC |
问答 | 无 | 无 | 均为UGC |
四.操作说明 #
1.总流程及权限说明 #
流程:创建活动 → 数据监测 → 数据复盘
版本功能模块:
模块 | 子模块 | 基础版 | 至尊版 |
---|---|---|---|
活动效果评估 | – | √ | √ | 发声主体分析 | – | √ | √ |
活动内容分析 | 平台话题分析 | √ | √ |
主动传播议题分析 | × | √ | |
活动内容观点分析 | × | √(仅部分行业) | |
人群画像分析 | 微博人群分析 | √ | √ |
2.活动列表页 #
用户可在此页面下看到自己创建的活动、同部门账号创建的共享活动,且支持 按活动名称搜索 和 按活动标签筛选 活动。
其中,为了保证活动标签的可用性,需要有企业管理员账号进行标签的增加和修改。
活动卡片会展示本活动的名称、创建人、数据源、活动简介、活动时间范围、运行状态。
其中运行状态包括等待运行、运行中、监测中、运行成功四种。
- 等待运行:数据正在采集、处理中
- 运行中:数据已经处理完成,可以点击查看活动数据
- 监测中:整个活动还在设定的监测时间内,将会按更新频率更新数据。如果是对历史活动进行回溯则不会出现该状态。
- 运行成功:整个活动监测已经完成
如果还没有活动,可以点击『新建活动』转到活动创建页,创建一个新的活动。
3.创建活动 #
创建一个活动需要四个部分的配置,分别为基础配置、采集配置、高级配置、个性化配置。
若活动信息尚未完全确定,可先点击保存,后面再补充完整。
填写确认无误后,可点击提交监测,系统将在15分钟内启动活动跑数。(未来时间的活动,会在开始日期到达以后启动跑数。)
- 活动名称:活动名称不可重复,长度须在2-60个字符之间
- 活动日期:时间范围需要在3个月内
- 关键词:会将命中关键词的数据作为活动数据。
- 关键词用“+”连接,表示且的关系,用“|”连接,表示或的关系,~N限词距,N<=20,支持英文()组合,不区分大小写。
- 关键词示例:小米+发布会~10
- 上例会将 命中“小米”和“发布会”,且这两个词之间的其他字符少于10个的数据,作为此活动的数据。
- 过滤词:过滤词是为了过滤通过关键词采集回来的数据中的噪声声量数据。设置过滤词后,会将命中过滤词的数据剔除出活动数据范围。语法规则同关键词。
- 数据源:必选项,选择需要监控的站点。
- 单贴采集:上传投放链接或作者ID,投放效果一目了然。上限10000条。
- 支持 微信、微博、抖音app、豆瓣、知乎、今日头条、小红书、哔哩哔哩 站点。其中微信需要填写URL和BIZ,其他站点填写URL/UID即可。
- 支持为每条帖子设置投放类型和投放主题。多个投放主题可用竖线分隔。
- 互动量发酵时间:以内容的发表时间作为起始点,在第N天之后在发酵一次互动量,默认值为3天,即12月1日发布内容,12月4日零点再次采集互动量数据;
- 话题曝光量采集:勾选后系统会对微博、抖音、小红书、快手的话题曝光量指标进行采集。
- 监测对象配置:该活动关联的监测对象,一般为活动关联的品牌或产品。
- 最多支持配置15个监测对象。一个监测对象若对应多个关键词,可使用竖线分隔,组合关键词距离默认为单句内,区分大小写。
- 比如,在小米2021秋季新品发布会的活动中,可以将 小米MIX4、小米平板、小米电视6 添加为监测对象。
- 关键词示例:小米MIX4|小米mix4
- 传播议题配置:品牌方在活动中主动发出的讨论主题,包括但不限于产品的slogan。
- 最多支持配置150个传播议题。关键词必填,过滤词可为空。
- 比如,在小米2021秋季新品发布会的活动中,可以将 CUP全面屏、UWB一指连 等卖点词添加为传播议题。
- 议题的关键词可用“+”连接,表示且的关系,用“|”连接,表示或的关系,多组关键词需要用括号包裹起来,区分大小写。
- 关键词示例:120W|(小米+无线快充)
- 对标活动选择:可从已创建的历史活动中选择本活动的benchmark。最多同时对标20个活动【任意状态可修改】
- BGC账号配置:品牌旗下的相关新媒体矩阵,比如,微博-小米手机、微博-小米公司、抖音-小米手机。
- 内容识别范围:活动默认仅分析帖子的内容文本,此项开启后会将高互动量的短视频语音转换为文本,合并到内容中,一并进行情感/监测对象/传播议题等标签的分析识别。至尊版支持另外配置ETL流程,开通后需和产品对接交流。
- 是否共享活动:默认共享,活动共享后,与创建者同部门的人都可看到此活动。如不共享,则仅创建活动的账号可以查看该活动。【任意状态可修改】
- 活动标签:可为活动添加标签,方便后续在列表页进行分类筛选。标签需由管理员统一添加。【任意状态可修改】
- 活动描述:可对活动做简单的介绍,方便快速定位活动内容。【任意状态可修改】
- 上传图片:作为活动头像,只支持JPG、PNG、GIF,大小不超过1M。【任意状态可修改】
4.查看活动数据 #
活动监测过程中,和活动结束以后,均可在活动列表页,点击活动以查看活动详情。
详情分为 活动效果评估、发声主体分析、活动内容分析、人群画像分析、对标活动分析 五个部分,接下来会分别做详细介绍。
4.1活动效果分析 #
筛选器
- 监测对象筛选器:可查看本活动的总体效果,也可筛选本活动下具体品类的活动效果。比如选本活动+Redmi Note 11表明,查看活动中Redmi Note 11传播效果。
- 组合筛选器:可对数据阵地、声量类型、投放类型进行筛选,用户也可通过内容筛选,筛选出想分析的特定内容。
- 日期筛选器:可选择特定时间范围来查看数据。
总览模块
- 从活动声量、活动互动量、活动NSR、活动正面率、负面率、监测对象等指标对本活动效果进行分析。
效果分布
- 活动效果趋势:展示活动的核心指标趋势,支持按 声量 和 互动量查看。
- 阵地分布:可通过右上角筛选器选择总声量、总互动量、平均互动量、分监测对象声量、分监测对象互动量的分布情况。
- 声量类型分布:不同发声主体的总声量、总互动量的分布情况,BGC通过活动配置时选择对应的BGC.
- 投放类型分布:分析付费推广内容、官号内容的总声量、总互动量的分布情况,付费推广内容可通过任务详情页面配置UID\URL上传来实现。
情感分布
- 情感占比趋势:分析活动中的情感趋势变化,采用百分百堆积效果,可以看到每天的情感占比情况;
- 各类型情感分布:分别查看活动整体情感、PGC情感、UGC情感分布,这三部分的情感分布不受组合筛选器中的声量类型筛选器影响。
内容分析
原帖展示:展示具体的评论内容,可通过右上角按钮切换排序方式;
词云:活动整体内容的分词结果,基于每条帖子的高频词进行聚类;
话题、议题总览:抽取话题分析和议题分析页面的信息在总览页进行预览;
4.2发声主体分析 #
从账号视角,分析活动的声量互动量指标的构成情况
顶部筛选器
- 监测对象筛选器:可查看本活动的总体效果,也可筛选本活动下具体品类的活动效果。比如选本活动+Redmi Note 11表明,查看活动中Redmi Note 11传播效果。
- 组合筛选器:可对数据阵地、声量类型、投放类型进行筛选,用户可通过内容搜索和昵称搜索,筛选出想分析的特定内容和特定的账号。
- 日期筛选器 :**可选择特定时间范围来查看数据。
总览模块
- 声量类型分布:展示自来水PGC\付费PGC\BGC\UGC的分布情况,付费PGC通过URL上传识别,PGC默认为自来水PGC;
- 分阵地分布:不同阵地不同声量类型的声量和互动分布情况;
- 分趋势分布:按帖子的发表时间,分析不同声量类型在不同阵地的分布趋势。
PGC分析
- 账号类型:根据该作者过往发文的主要领域进行判断,仅针对 微博、微信、小红书、哔哩哔哩、抖音app 的作者有效;
- 粉丝量级:
- 是否KOL:
- PGC指标卡:互动量、总声量、NSR均为声量类型为PGC的数据;
- 内容词云:选取声量类型为PGC的发帖的关键词的前50进行展示,按关键词对应的帖子数进行排序,可以与原帖进行联动;
- 贡献排行:按互动量倒序TOP30的作者的排行列表,指标包括互动量、互粉比*100、总声量,均为该作者在本活动的表现情况,可以与原帖进行联动
BGC分析
- 官号贡献:本活动官号矩阵的表现分布,按互动量和互粉比*100两个指标进行分析;
- 官号贡献排行:官号贡献的明细数据分析,可以与原帖进行联动;
UGC分析
- UGC指标卡:互动量、总声量、NSR均为声量类型为UGC的数据;
- 内容词云:选取声量类型为UGC的发帖的关键词的前50进行展示,按关键词对应的帖子数进行排序,可以与原帖进行联动;
- 性别分布:包含了微博、抖音、小红书等主流站点的人群信息数据;
- 年龄分布:包含了微博、抖音站点的年龄分布数据;
4.3活动内容分析 #
从 平台话题、传播议题、内容观点 三个方面来深度解构活动传播内容。
通过话题可了解到哪些话题在该次活动中起到了更好的效果表现,用户在该次活动中关心的内容是什么。
传播议题则对活动进行多维度的效果监测,如本次活动涉及的产品功能、明星代言、服务等多维度的效果表现。
活动内容观点分析则可以帮助我们快速了解内容传播的细节和全貌。
【其中,传播议题、内容观点 为至尊版内容,且内容观点仅支持美妆、3C行业】
- 监测对象筛选器、组合筛选器、日期筛选器,功能与效果评估页面相同。
- 微博/抖音/快手话题:自动提取微博/抖音/快手平台带#的话题名称,并统计相应内容的指标数据。
- 聚类事件:利用文本指纹算法将相似文本合并为一个事件,以便了解活动主要的传播热点。
- 传播议题:根据配置的传播议题进行统计。若未配置传播议题,在进入页面时将会提示“本活动未设置业务关注议题”。【至尊版功能】
- 投放主题:根据单贴采集中配置的投放主题进行统计。若未配置投放主题,在进入页面时将会提示“本活动未设置投放主题”。
- 以上列表均支持联动,点击具体 话题/事件/议题 可联动下方的 趋势图、飙升热词、情感分布图、词云图、原帖,方便进一步了解该传播热点。
- 此列表展示较为全面的指标,如有明确的核心指标,可点击列表右上角的按钮,选择核心指标并勾选『记住』,固定展示核心指标即可。
- 点击右上角的按钮,可将列表下载保存。
- 展示活动的核心指标趋势,并以图例区分不同阵地,以便了解整体趋势变化和分阵地趋势变化。
- 如需查看特定阵地的趋势,可使用顶部的组合筛选器,或点击图例。其中,组合筛选器会影响所有图表,点击图例仅影响趋势图。
- 此图表接受上方列表的联动,点击后可单独查看该传播热点的趋势变化。
- 同时,此图表还支持联动其他图表。点击某一天的数据点,可以查看这一天的 话题/议题/事件 列表,以及词云、原帖等数据。
- 如需查看趋势图的具体数据,可点击右上角的按钮切换到表格视图,在表格视图中亦支持下载数据表。
- 飙升热词:将声量top1000的关键词,按飙升率倒序展示,表示与活动上一个时间周期相比,本期的内容聚焦点。点击热词可与原帖联动。
- 情感分布:利用情感算法判断数据内容的情感倾向,点击图形可联动查看对应情感倾向的词云和原帖,效果与组合筛选器的情感类型筛选相同。
- 当左上角『监测对象筛选器』选择“本活动”时,使用的是通用情感。当左上角『监测对象筛选器』选择“本活动+监测对象”时,使用的是实体情感,代表了内容针对该监测对象的情感倾向。
- 查看情感分布时,建议切换『监测对象筛选器』为某一个特定的监测对象,以便获得更精准的情感展示。
- 词云图:为凸显核心的差异性信息,基于每条帖子最具代表性的TOP5关键词生成。
- TOP5关键词基于TF-IDF算法提取。TF-IDF算法是一种文本分析与信息检索的经典统计算法,用以评估某个词对于这条文本的重要程度。计算方式是TF与IDF相乘。具体说明如下:
- TF(Term Frequency)=某个词在该文本出现的次数,如果出现次数越多代表该词越重要
- IDF(Inverse Document Frequency)=某个词在所有统计文本出现次数的倒数再取log,如果在大多数文章出现代表该词重要性较低,比如“的确”等词
- TOP5关键词基于TF-IDF算法提取。TF-IDF算法是一种文本分析与信息检索的经典统计算法,用以评估某个词对于这条文本的重要程度。计算方式是TF与IDF相乘。具体说明如下:
- 评论维度分布:利用三元组算法,识别评论内容中 针对特定维度的、体现了正面或负面情感倾向的 关键短语,并进行归类,得出受众对活动的关注点。
- 评论情感分布:评论内容提及产品及产品或品牌的相关特征的情感。如产品好看、运行流畅等语句识别为正面。
- 评论词云:基于算法识别出的关键短语汇总为词云图。
- 评论展示:展示具体的评论内容,可通过右上角按钮切换排序方式。
- 【评论分析和展示 为至尊版功能】
- 一级观点分类:利用三元组算法,识别数据中 针对特定维度的、体现了正面或负面情感倾向的 关键短语,并进行归类,得出活动声量中的热门观点。
- 二级观点分类:三元组算法针对不同行业会有不同的分析框架,框架均为二级结构。比如在“使用体验”下,会有“清爽感”、“水润度”、“服帖度”等多个二级分类。
- 观点情感分布:算法识别到的情感倾向分布。
- 观点词云:基于算法识别出的关键短语汇总为词云图。
- 原文展示:展示具体的评论内容,可通过右上角按钮切换排序方式。
- 以上列表均支持联动,点击具体 维度/情感/词云 可联动其他图表,方便进一步了解该观点。
- 【内容观点分析 为至尊版内容,且仅支持美妆行业】
4.4人群画像分析 #
目前提供微博平台的人群画像,支持快速查看数据辐射人群画像信息,提高对受众的精准认知,辅助品牌方及时调整商业活动策略。
此页面提供较全的画像维度,包括性别分布、年龄分布、认证分布、城市级别分布、地区分布、常用客户端、爱好标签、用户粉丝数量分布、活跃时间、关注用户排名、关注微博话题、话题原贴。
图表标题均有注释说明,可将鼠标移入查看。
4.5活动效果对标 #
可选定同类活动进行对比分析,以评估本活动的表现优劣。
具体包括声量互动量对比、情感对比、监测对象对比、内容对比。
五.附:核心算法说明 #
1.关键词提取算法 #
从文本中提取出与这篇文档意义最相关的一些词,通过这些关键词就可以了解文本的主题思想。文本通过关键词提取后可以方便后续地摘要提取,文本分类/聚类等问题的处理分析工作。
2.情感判断算法 #
用户通过发表内容表达自身情感时,主要包括正面、负面、中性三种倾向。数说基于自然语言处理及机器学习技术,深入挖掘用户不同情感的隐含特征,包括极致赞扬、粗鲁表达、特殊表情及符号折射的情感表达,并经过大量的情感标注数据,迭代优化情感判别模型。目前,数说情感判别模型准确率可达85%以上。
3.广告杂音判断算法 #
通过人工数据标注不同类型的广告,如微商软文、海外代购、抽奖活动、优惠券信息、旅游推广、培训活动报名、⽂章主动推出含购买链接的产品等广告,基于机器学习模型,实现广告判断。将微博、微信、新闻等数据分为四类:低质量广告、高质量广告、杂音、自发内容,以帮助用户清洗数据和分析广告数据中的有用信息。
4.文本指纹识别算法 #
文本指纹算法指的是对文本生成“数字指纹”,这个数字指纹是一个由字母和数字组成的32位的字符串,用这个字符串指纹来作为该文本的标识。文本指纹算法可以用来衡量不同文本之间的相似程度,指纹相同,文本也就越相似,此算法在文本去重,信息检索等文本处理任务有重要应用。
每个事件都会生成一个事件指纹和多个事件名称,事件名称的系统上结果取互动量最高的那个帖子的标题或前200个字。
5.智能三元组算法 #
智能三元组分析指的是细粒度情感分析,可分析具体某个维度的情感,例如“价格”、“物流”。通过三元组分析,可以精确了解消费者对品牌的的反馈(如下图)。智能三元组算法很大程度上弥补了传统NLP分词算法分词缺乏关联性不足的问题。
传统分词词云图 |
智能三元组分词词云图 |
六.附:码表设计规则 #
码表制作的基本思路:
活动监测涉及到的码表,包括活动关键词过滤词、单帖采集、监测对象、传播议题,具体规则如下。
输入项
|
规则
|
||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
活动关键词/过滤词 | 关键词和过滤词为同时满足的关系,分别最多支持1000组词。词用+连接,表示且关系;用|连接,表示或关系;支持~N限词距,N<=20;支持英文括号()组合。
|
||||||||||||||||||||
单帖采集-按URL采集 | 最多支持上传1万条URL,需要按照格式提供,示例如下:
|
||||||||||||||||||||
监测对象 | 最多支持配置15个监测对象。
每个监测对象最多支持500组关键词。 多组词请用竖线分隔,不支持加号、括号、词距规则。
|
||||||||||||||||||||
传播议题 | 最多支持配置150个传播议题。
每个传播议题最多支持1000组关键词。 词用+连接,表示且关系;用|连接,表示或关系;支持英文括号()组合。不支持词距规则。
|
七.常见问题 #
Q1:筛选框中的内容包含和内容过滤区分大小写吗? #
A1:区分大小写
Q2:若系统显示活动情感分布与预估的情感分布不一致,用户如何自行通过系统验证情感分布数据质量? #
A2:活动监测中情感分布饼图均可与该页面里的原文展示进行联动,用户可以点击某一情感类型查看该类型下的原文,查看情感标签是否合理。
Q3:文章提及多个分析对象时,算法是如何做到针对不同的分析对象输出情感结果的? #
A3:当文章出现多个分析对象时,模型根据分析对象所在语境来判断情感极性分别标注它们的情感倾向,输出多个情感判断结果,如同时提及小米和OPPO,那么这条文本会被打上小米的情感类型和OPPO的情感类型两种标签。
Q4:一个文本多次提及某个分析对象,并且评价有正面有负面时,如何对这条文本做情感判断? #
A4:当某个分析对象被多次提及时,模型会统计其“正面”、“负面”、“中性”出现的次数,在进行判断,具体规则如下:
(1)中性情感:满足如下任一条件
- 出现正面或负面的占比低于提及占比的20%
- 各个提及情感均为中性
(2)正面情感:出现正面或负面的占比高于提及占比的20%且“正面”出现的次数较多。
(3)负面情感:满足如下任一条件
- 出现正面或负面的占比高于提及占比的20%且“负面”出现的次数较多
- 出现正面或负面的占比高于提及占比的20%且“正面”和“负面”、出现的次数一样多
Q5:想要关注的品牌账号不在品牌官方账号库,怎么办? #
A5:品牌官方账号库可以根据需求更新。
Q6:为什么我能看到其他账号创建的没有共享的活动? #
A6:超管账号可以看到企业下所有活动,如果不需看到所有活动,可在用户中心登录企业管理员账号,修改对应权限。