一.产品简介 #
活动监测从活动智库、深度监测、速览监测三个维度对整个活动的不同阶段如活动策划、活动投放等进行监测。帮助企业对行业活动趋势,本品活动的营销效果进行深度剖析、归因,进而为之后的活动营销策划提供方向,使活动获得更好的营销效果,同时为品牌积累活动的数据资产。
模块 | 子模块 | 功能 |
---|---|---|
活动智库 | 热门榜单、活动月历、榜单活动详情页 |
|
活动管理 | 活动列表、配置信息管理、新增监测 |
|
深度监测 | 活动效果分析 |
|
平台话题分析 |
|
主动传播议题分析 |
|
评论观点分析 |
|
|
速览监测 | – |
|
二.重要概念说明 #
1.监测对象 #
监测对象是指在整个活动中想要重点关注的品牌、品类、产品。
例如某品牌发布会发布的内容众多,包括手机、平板、电脑、操作系统等,品牌方想重点关注一下手机和操作系统的传播效果,则可以在监测对象中配置手机Find X5、ColorOS 12。
系统将会根据配置,给匹配的数据打上对应的监测对象标签,并在应用页提供查看特定监测对象数据的功能。
2.发声主体 #
活动中的发声主体,是指在活动期间,发表了相关帖子的用户。这些用户可能是品牌官方账号、明星、媒体、KOL、普通用户等。
在活动监测中,发声主体可按声量类型分为 BGC、PGC、UGC,也可按投放类型分为 官号内容、付费推广内容、自来水内容。
3.内容识别范围 #
内容识别范围默认包括整个活动中相关的互联网信息的标题及内容文本,同时支持设置语音内容转文字功能,把语音、视频内容也作为内容识别范围。
4.平台话题 #
微博和抖音平台上,以#为标识的话题。
5.主动传播议题(内容提及标签) #
品牌方在活动中主动发出的讨论主题,包括但不限于产品的slogan、产品卖点。
如小米civi发布会发出的“中国青年天生好看”的论点,品牌方想要了解该议题在社媒中的传播效果,就可以在活动编辑页配置传播议题。
6.投放主题 #
品牌方在投放时的主题,包括但不限于产品的slogan、产品卖点。
与传播议题的区别时,传播议题是以内容来划分的,投放主题是以投放帖(URL)来划分的。
7.声量类型 #
将所有的社媒声量分类PGC/BGC/UGC三个类型,详细定义参见指标维度说明。
8.投放类型 #
针对投放内容、官号内容进行分类分析,其余的为自来水内容,投放内容根据用户上传的URL/UID进行识别,官号内容根据UID进行识别。
9.码表 #
由于文本是非结构化的数据,要想从大量的非结构化数据中找到有用的信息,就必须首先按照需求,选取一系列相关联的词组,然后以这些特征词组,从海量文本数据中进行匹配提取。
比如当我们想要对比在 OPPO Find 5X 新品宣传活动中,摄像 和 充电 这两个宣传卖点在社媒舆论上带来的效果差异。
我们可以在创建此活动时,按如下码表配置传播议题,系统将根据码表中的关键词,从活动数据中进行匹配,并统计每个议题的数据指标。
内容提及标签码表:
|
统计结果:
|
|||||||||
---|---|---|---|---|---|---|---|---|---|---|
*竖线分隔关键词表示或关系 |
|
如上表格所示,这种 以关键词过滤词形式 定义了 如何从文本数据中匹配出议题 的规则,就是议题码表。除了议题以外,其他分析内容也是类似的,比如定义如何匹配监测对象的规则,就是监测对象码表。
如需了解具体如何制作码表,可查看 附:码表设计规则。
三.数据说明 #
1.数据来源 #
阵地 | 细分站点说明 |
---|---|
微博 | 新浪微博 |
微信 | 微信公众号文章 |
新闻 | 覆盖今日头条、懂球帝、一点资讯、ZAKER新闻、百度新闻、新浪新闻、百度搜索、搜狗搜索、中国新闻网、中国财经信息网、凤凰网_财经、东方网等主流站点的新闻频道 |
论坛 | 覆盖中国网管论坛、电子发烧友论坛、百度贴吧、豆瓣、虎扑、大众点评、中关村_在线论坛、天涯论坛等各行业的主流论坛站点 |
小红书 | 小红书 |
短视频 | 抖音app、快手APP、微信视频号、西瓜视频、火山小视频等 |
长视频 | 哔哩哔哩、爱优腾等 |
问答 | 知乎、百度知道、搜狗、穷游等问答社区 |
其他 | 得物等 |
2.更新频率 #
通过配置信息管理可查看本企业的更新频率
3.指标说明 #
指标 |
含义 |
---|---|
总声量 | 通过配置信息管理可查看本企业的声量规则 |
总互动量 | 通过配置信息管理可查看本企业的互动量规则 |
平均互动量 | 平均互动量=互动量/声量,表示平均每条帖子可以获得多少互动,进而评估特定维度下活动对受众的吸引力高低。 |
飙升率 |
飙升率=(本期声量-上期声量)/上期声量,用来表示活动本期的内容聚焦点。 |
NSR(Net Sentiment Rate,净情感度) | NSR=(正面主贴数-负面主贴数)/(正面主贴数+负面主贴数)*100%,可通过NSR低的维度定位到受众的负面评价,以便及时作出干预和调整。 |
正面率 |
正面率=监测对象正面主贴数/监测对象总主贴数*100% |
负面率 |
负面率=监测对象负面主贴数/监测对象总主贴数*100% |
TGI(Target Group Index,目标群体指数) | TGI=[目标群体中具有某一特征的群体所占比例/微博总用户中具有相同特征的群体所占比例]*标准数100。
反映目标群体在特定研究范围内的强势或弱势,其中TGI指数等于100表示平均水平,高于101 代表具有该特征的用户对活动的关注程度高于整体水平。 |
监测对象相关指标 | 使用活动中提及该监测对象的数据进行统计,具体指标计算方法见上述指标含义说明。例如:监测对象声量=提及监测对象的声量/活动总声量 |
4.维度说明 #
维度
|
定义
|
---|---|
维度
|
定义
|
阵地 | 同一类数据源的总称,例如:新浪新闻、搜狐新闻、腾讯新闻等均属于“新闻阵地”。 |
声量类型 | 通过作者的粉丝数和认证类型,将声量分成了BGC、PGC、UGC三类。不同阵地有不同的条件,具体见下方介绍。
|
投放类型 | 在创建活动时,可以配置官号和付费推广的帖子。
|
话题 | 微博、抖音、快手带#的内容,系统进行自动提取。 |
议题 | 用户在活动编辑页,设置的内容标签,根据提及标签对应的关键词和过滤词进行匹配,命中关键词且不命中过滤词的打上对应的议题标签,一条内容可以命中多个标签。 |
微博-性别 | 根据微博用户填写的性别信息进行统计 |
微博-年龄 | 根据用户填写的出生年份信息进行分段统计,<1960:50后及以上,1960=<60后<1970,1970=<70后<1980,1980=<80后<1990,1990=<90后<2000,2010=< 10后及以下 |
微博-认证分布 | 根据用户所属的认证类型进行统计,统计普通用户,黄V,金V,普通达人,蓝V |
微博-地区分布 | 根据用户填写的所在省份/城市信息进行统计 |
微博-城市级别 | 一线城市:丰台区,密云县,青浦区,海淀区,通州区,大兴区,平谷区,普陀区,广州,嘉定区,浦东新区,宣武区,门头沟区,东城区,昌平区,卢湾区,延庆,闸北区,闵行区,奉贤区,宝山区,石景山区,怀柔区,顺义区,长宁区,深圳,崇文区,松江区,上海,朝阳区,金山区,房山区,北京,静安区,南汇区,黄浦区,西城区,虹口区,崇明县,徐汇区,杨浦区
二线城市:保定,金华,兰州,廊坊,绍兴,台州,中山,南川,大足,河东区,珠海,沙坪坝区,泉州,哈尔滨,武隆,宁河,巫溪县,渝中区,潼南县,贵阳,烟台,永川,太原,昆明,铜梁,南通,武清区,九龙坡区,秀山土家族苗族自治县,江北区,济南,永川区,宁河县,蓟县,常州,徐州,荣昌县,城口,塘沽区,奉节,合川区,江津区,大渡口区,静海县,石柱,津南区,南宁,奉节县,西青区,丰都,汉沽区,长寿,石柱土家族自治县,黔江区,梁平县,巫山县,荣昌,铜梁县,渝北区,云阳县,南开区,綦江,东丽区,北碚区,长寿区,开县,南昌,酉阳,江津,和平区,垫江,长春,嘉兴,无锡,宝坻区,石家庄,云阳,涪陵区,大足县,秀山,巫山,巴南区,温州,彭水,滨海新区,垫江县,万盛区,万州区,大港区,惠州,宁波,静海,北辰区,福州,梁平,河北区,合川,红桥区,厦门,忠县,巫溪,南岸区,双桥区,璧山,大连,河西区 三线城市:洛阳,潍坊,扬州,安庆,蚌埠,滁州,阜阳,黄冈,荆州,九江,六安,马鞍山,南充,宁德,莆田,清远,商丘,上饶,新乡,信阳,宿迁,肇庆,驻马店,遵义,潮州,菏泽,宿州,宜春,周口,绵阳,鞍山,赣州,江门,襄樊,连云港,呼和浩特,临沂,邢台,衡阳,江阴,张家港,湛江,济宁,镇江,邯郸,沧州,芜湖,株洲,银川,乌鲁木齐,漳州,威海,盐城,揭阳,海口,宜昌,柳州,汕头,大庆,南阳,唐山,淮安,桂林,秦皇岛,淄博,咸阳,舟山,岳阳,义乌,三亚,泰州,襄阳,泰安,湖州,昆山 四线城市:包头,宝鸡,滨州,常德,郴州,德阳,东营,鄂尔多斯,吉林,聊城,龙岩,梅州,齐齐哈尔,西宁,榆林,运城,渭南,延安,安阳,锦州,四平,大同,邵阳,牡丹江,葫芦岛,晋中,曲靖,玉溪,通辽,盘锦,十堰,攀枝花,内江,日照,益阳,平顶山,本溪,绥化,开封,辽阳,朝阳,资阳,孝感,通化,三明,韶关,德州,延边,吉安,娄底,淮南,枣庄,吕梁,赤峰,南平,黄山,许昌,永州,衢州,抚顺,阳江,茂名,丹东,丽水,焦作,湘潭,承德,铁岭,拉萨,泸州,荆门,延边朝鲜族自治州,张家口,巢湖,临汾,宜宾,营口,黄石,乐山,衡水,达州 五线城市:大兴安岭,海安,天门,潜江,广元,吴忠,陇南,仙桃,文山,博尔,白银,黑河,铜川,诸暨,巴音郭楞,巴中,莱西,博尔塔拉蒙古自治州,临沧,克孜勒苏,乌海,果洛,福清,佳木斯,随州,吐鲁番,兴安盟,兴化,邳州,章丘,崇明,三河,安顺,毕节,寿光,长兴县,果洛藏族自治州,白山,巴彦淖尔盟,长安镇,鳌江-龙港镇,德宏傣族景颇族自治州,奉化,固原,诸城,如皋,文山壮族苗族自治州,宣城,那曲,湘西土家族苗族自治州,和田,大洼县,海东,辽源,浏阳,甘南,余姚,保山,恩施,闽侯县,孝义,阿勒泰,鹤壁,石嘴山,楚雄,广安,高密,德清县,晋江,库尔勒,河池,阜新,胶南,克孜勒苏柯尔克孜自治州,梧州,新沂,招远,黔西南,贵港,西双版纳,玉树,桓台县,荣成,邹平县,临夏回族自治州,甘孜,抚州,恩施土家族苗族自治州,阿坝,黔东南,虎门镇,汕尾,兖州,河源,玉林,阿克苏,嘉善县,林芝,新郑,黄南,建湖县,黔东南苗族侗族自治州,神木县,白城,黔南布衣族苗族自治州,阳泉,儋州,迪庆藏族自治州,海西蒙古族藏族自治州,酒泉,玉环,萍乡,鄂州,甘孜藏族自治州,海北藏族自治州,玉树藏族自治州,海门,新泰,如东县,准格尔旗,凉山,昌吉回族自治州,肥西县,西昌,红河,怀化,红河哈尼族彝族自治州,咸宁,张家界,天水,崇左,商洛,迁安,锡林郭勒盟,武威,肥城,哈密,黄南藏族自治州,阿坝藏族羌族自治州,新密,伊金霍洛旗,昭通,铜陵,池州,海南藏族自治州,防城港,钦州,莱州,六盘水,湘西,鹰潭,嘉峪关,调兵山,靖江,庆阳,汉中,三沙,三门峡,开原,石河子,赣榆县,丰县,蓬莱,博罗县,莱芜,朔州,海宁,新余,伊犁,呼伦贝尔,云浮,东台,伊宁,临海,仪征,德宏,沭阳县,即墨,金坛,遂宁,金昌,惠安县,山南,永康,长治,青州,阿里,西双版纳傣族自治州,龙海,平度,平湖,大理,松原,伊犁哈萨克自治州,宁海县,东阳,海城,黔南,普洱,楚雄彝族自治州,邹城,乌兰察布盟,永安,自贡,龙口,贺州,甘南藏族自治州,泰兴,伊春,平凉,鸡西,丽江,铜仁,克拉玛依,濮阳,临夏,亳州,百色,雅安,晋城,忻州,济源,塔城,文登,来宾,庄河,常熟,巩义,思茅,中卫,武安,迪庆,双鸭山,辽中县,漯河,昌都,眉山,新民,昌吉,海南,宁乡县,东港,鹤岗,淮北,黔西南布衣族苗族自治州,大丰,安康,海西,启东,增城,阿拉善盟,沛县,怒江,七台河,日喀则,定西,景德镇,丹阳,张掖,北海,胶州,海北,凉山彝族自治州,府谷县,怒江傈僳族自治州,喀什,郫县 新一线:成都,东莞,佛山,杭州,合肥,南京,青岛,沈阳,苏州,天津,武汉,西安,长沙,郑州,重庆 |
微博-活跃时间 | 按发帖的小时数进行聚合统计,如12点05分发贴即计入12那个时刻的数据 |
微博-爱好标签 | 根据用户及其关注的用户的近期发文,判断出每个用户最突出的50个爱好标签,并基于此信息进行统计。 |
声量类型
阵地 |
BGC
|
PGC
|
UGC |
---|---|---|---|
阵地 |
BGC
|
PGC
|
UGC |
微博 | 创建活动时配置的BGC账号 | 符合 ① or ②,且非品牌官方用户的声量 : ① 认证类型=黄V/金V/蓝V ② 认证类型=普通用户/微博达人 且 粉丝数>10w |
符合 ① and ②,且非品牌官方用户的声量 : ① 认证类型=普通用户/微博达人 ② 粉丝数 ≤ 10w |
微信 | 创建活动时配置的BGC账号 | 非品牌官方用户的声量 | 无 |
小红书 | 创建活动时配置的BGC账号 | 粉丝数 ≥ 1万 且非品牌官方用户的声量 | 粉丝数<1万 |
视频 | 创建活动时配置的BGC账号 | 非品牌官方用户的声量 | 无 |
抖音 | 创建活动时配置的BGC账号 | 符合 ① or ② ,且非品牌官方用户的声量: ① 粉丝数≤10万,且有认证 ② 粉丝数≥10万 |
符合 ① and ②,且非品牌官方用户的声量 : ① 非认证用户 ② 粉丝数 < 10w |
快手 | 创建活动时配置的BGC账号 | 粉丝数 ≥ 10万 且非品牌官方用户的声量 | 粉丝数<10万 且非品牌官方用户的声量 |
美拍 | 创建活动时配置的BGC账号 | 粉丝数 ≥ 1万 且非品牌官方用户的声量 | 粉丝数<1万 且非品牌官方用户的声量 |
新闻 | 无 | 均为PGC | 无 |
论坛 | 无 | 无 | 均为UGC |
问答 | 无 | 无 | 均为UGC |
四.操作说明 #
1.总流程及权限说明 #
流程:创建活动 → 数据监测 → 数据复盘
版本功能模块:
模块 | 子模块 | 速览版 | 至尊版 |
---|---|---|---|
深度监测 | 活动效果评估 | × | √ | 平台话题分析 | × | √ |
主动传播议题分析 | × | √ | |
评论观点分析 | × | √(仅部分行业) | |
速览监测 | 速览监测 | √ | √ |
活动管理 | 活动列表、配置信息管理、新增监测 | √ | √ |
2.活动列表页 #
用户可在此页面下看到自己创建的活动、同部门账号创建的共享活动,且支持 按活动名称搜索 和 按活动标签筛选 活动。
其中,为了保证活动标签的可用性,需要有企业管理员账号进行标签的增加和修改。
活动卡片会展示本活动的名称、创建人、数据源、活动简介、活动时间范围、运行状态。
其中运行状态包括等待运行、运行中、监测中、运行成功四种。
- 等待运行:数据正在采集、处理中
- 运行中:数据已经处理完成,可以点击查看活动数据
- 监测中:整个活动还在设定的监测时间内,将会按更新频率更新数据。如果是对历史活动进行回溯则不会出现该状态。
- 运行成功:整个活动监测已经完成
如果还没有活动,可以点击『新建活动』转到活动创建页,创建一个新的活动。
3.创建活动 #
创建一个活动需要四个部分的配置,分别为基础配置、采集配置、高级配置、个性化配置。
若活动信息尚未完全确定,可先点击保存,后面再补充完整。
填写确认无误后,可点击提交监测,系统将在15分钟内启动活动跑数。(未来时间的活动,会在开始日期到达以后启动跑数。)
- 活动名称:活动名称不可重复,长度须在2-60个字符之间
- 活动日期:时间范围需要在3个月内
- 关键词:会将命中关键词的数据作为活动数据。
- 关键词用“+”连接,表示且的关系,用“|”连接,表示或的关系,~N限词距,N<=20,支持英文()组合,不区分大小写。
- 关键词示例:小米+发布会~10
- 上例会将 命中“小米”和“发布会”,且这两个词之间的其他字符少于10个的数据,作为此活动的数据。
- 过滤词:过滤词是为了过滤通过关键词采集回来的数据中的噪声声量数据。设置过滤词后,会将命中过滤词的数据剔除出活动数据范围。语法规则同关键词。
- 数据源:必选项,选择需要监控的站点。
- URL/UID采集:上传投放链接URL或作者账号UID,投放效果一目了然。上限10000条。
- 支持 微信、微博、抖音app、豆瓣、知乎、今日头条、小红书、哔哩哔哩 站点。
- 支持为每条帖子设置投放类型和投放主题。多个投放主题可用竖线分隔。
- 互动量发酵时间:以内容的发表时间作为起始点,在第N天之后在发酵一次互动量,默认值为3天,即12月1日发布内容,12月4日零点再次采集互动量数据;
- 话题曝光量采集:勾选后系统会对微博、抖音、小红书、快手的话题曝光量指标进行采集。
- 监测对象配置:该活动关联的监测对象,一般为活动关联的品牌或产品。
- 最多支持配置15个监测对象。一个监测对象若对应多个关键词,可使用竖线分隔,组合关键词距离默认为单句内,区分大小写。
- 比如,在小米2021秋季新品发布会的活动中,可以将 小米MIX4、小米平板、小米电视6 添加为监测对象。
- 关键词示例:小米MIX4|小米mix4
- 内容提及标签配置:品牌方在活动中主动发出的讨论主题,包括但不限于产品的slogan。
- 最多支持配置150个传播议题(内容标签)。关键词必填,过滤词可为空。
- 比如,在小米2021秋季新品发布会的活动中,可以将 CUP全面屏、UWB一指连 等卖点词添加为传播议题。
- 议题的关键词可用“+”连接,表示且的关系,用“|”连接,表示或的关系,多组关键词需要用括号包裹起来,区分大小写。
- 关键词示例:120W|(小米+无线快充)
- 对标活动选择:可从已创建的历史活动中选择本活动的benchmark。最多同时对标20个活动【任意状态可修改】
- BGC账号配置:品牌旗下的相关新媒体矩阵,需提前在配置信息管理录入关注的品牌官方账号信息。比如,微博-小米手机、微博-小米公司、抖音-小米手机。
- 内容识别范围:活动默认仅分析帖子的内容文本,此项开启后会将高互动量的短视频语音转换为文本,合并到内容中,一并进行情感/监测对象/传播议题等标签的分析识别。至尊版支持另外配置ETL流程,开通后需和产品对接交流。
- 是否共享活动:默认共享,活动共享后,与创建者同部门的人都可看到此活动。如不共享,则仅创建活动的账号可以查看该活动。【任意状态可修改】
- 活动标签:可为活动添加标签,方便后续在列表页进行分类筛选。标签需由管理员统一添加。【任意状态可修改】
- 活动描述:可对活动做简单的介绍,方便快速定位活动内容。【任意状态可修改】
- 上传图片:作为活动头像,只支持JPG、PNG、GIF,大小不超过1M。【任意状态可修改】
4.任务详情 #
活动监测任务详情的查看及配置项修改,从活动列表-任务详情进入。有四个可编辑模块分别:活动信息管理、采集配置管理、数据更新状态、高级配置项
修改后对活动影响:
- 活动信息管理:活动时间的延长。
- 采集配置管理:采集更多的活动数据。
- 数据更新状态:通过设置对互动量进行相应的更新。
- 高级配置项:设置不同的配置项会影响活动总览页面的对应模块。(下面具体说明)
4.1活动信息管理 #
- 活动时间的延长:通过修改活动结束时间来延长活动(点击确认提交后即生效)
- 修改限制条件:当前时间距离活动结束时间不超过一天(例:当前时间-2023年3月2日>1,不能不能延长)
- 修改后通过条件:活动总时长不超过一个自然年
4.2采集配置管理 #
采集配置分为批量采集和单贴采集(URL、UID),当单帖采集中的URL采集和UID采集被识别为同一条数据源时,数据会被覆盖。
批量采集管理
- 关键词:会将命中关键词的数据作为活动数据,新增关键词为高亮显示。当前版本不能删除或编辑已有的关键词。(增加的关键词只能作用于未来采集的数据,对已经采集的数据无效)
- 过滤词:过滤词是为了过滤通过关键词采集回来的数据中的噪声声量数据。设置过滤词后,会将命中过滤词的数据剔除出活动数据范围,新增过滤词为高亮显示。当前版本不能删除或编辑已有的过滤词。(增加的过滤词只能作用于未来采集的数据,对已经采集的数据无效)
单帖采集(URL)
通过URL进行数据的采集(最多10000个URL同时采集)
- 采集站点:微信/其他站点(微博、小红书、抖音、快手等)
- 原贴URL:对应站点的正确原贴URL(否则无法获取数据)
- 投放类型:付费推广内容、官号内容、自来水内容
批量上传请下载文件模板参考
单帖采集(UID)
通过UID+关键词进行数据的采集(最多200组UID+关键词同时采集)
- 采集站点:微信、抖音、小红书等主流社交平台
- UID:对应站点的正确UID(否则无法获取数据)
- 关键词:会将命中关键词的数据作为活动数据。(多个关键词可用竖线分隔)
- 投放类型:付费推广内容、官号内容、自来水内容
4.4数据更新状态 #
修改互动量数据更新及状态和查看数据采集状态
- 互动量发酵时间:以内容的发表时间作为起始点,在第N天之后在发酵一次互动量,默认值为3天。【即3月1日发布内容,3月4日零点再次采集互动量数据】
手动更新互动量
- 发表时间:可选范围为活动监测时间,即活动监测范围为2023-03-01~2022-03-03,发表时间可选范围为2023-03-01~2022-03-03
- 筛选方式(可多选):互动量top“n”(n为1~10000)
- 通知邮箱:可修改
点击确定后第二天对设置的发表时间内的数据进行互动量的更新。
4.5高级配置项 #
该模块包括话题信息维护、内容提及标签管理、监测对象管理、词云关键词管理、噪音标识管理、定制化码表
话题信息维护 #
话题信息维护,用户可以自主配置各个站点(抖音、微博、快手)的官方与非官方的话题标签,以及二级自主话题标签。
- 站点:抖音app/微博/快手app,站点信息允许多选
- 话题:不允许输入 #,但词的开头和结尾空格默认删除
- 话题类型:固定值-官方话题、合作话题、其他
- 话题标签:自定义输入字符不超过5个字,不允许特殊符号输入(非必填)
批量上传请下载文件模板参考
内容提及标签管理 #
内容提及标签管理,通过判断输入的关键词,对包含关键词的数据对其打上自定义标签
- 必填字段:内容标签、关键词
- 选填字段:过滤词、二级内容标签、三级内容标签、四级内容标签、父级投放主题标签、父级投放主题
- 内容标签、父级投放主题标签:禁止输入以下字符外的特殊字符,”\\”, “&”, “$”, “(“, “)”, “*”, “+”, “.”, “[“, “]”, “?”, “^”, “{“, “}”, “|”, “#”, “~”, “\””, “<“, “>”,开头和结尾不能有空格
- 关键词、过滤词:支持 +!()|等逻辑符号
批量上传请下载文件模板参考
监测对象管理 #
监测对象管理,通过设置相关字段,添加/删除监测对象(影响全局筛选器)
- 监测对象类型:品牌/产品(允许为空)
- 监测对象:用于定义一个监测对象的名称
- 最大15个字符,支持中文、英文、数字、空格,默认删除前后空格
- 关键词:用于匹配的关键词
- 过滤词:用于排除的关键词
批量上传请下载文件模板参考
词云关键词管理
词云关键词管理,根据用户提供的“被调整的关键词“,替换原有词云中的关键词(影响活动总览的全局词云关键词)
- 调整后关键词:根据用户提供的“被调整的关键词“,替换原有词云中的关键词,输入为空值则删除“被调整关键词”
- 被调整关键词:需要作为条件去命中的关键词(精准匹配)
- 声量类型:作为条件命中原帖条件(允许为空)
- 活动/监测对象情感:作为条件命中原帖条件(允许为空)
- 内容标签情感:作为条件命中原帖条件(允许为空)
- 内容标签(一级):作为条件命中原帖条件(允许为空)
- 平台话题:作为条件命中原帖条件(允许为空)
批量上传请下载文件模板参考
噪音识别管理 #
噪音识别管理,通过上传表格对表格内的数据进行处理,从而降低噪点。(影响活动总览的全局数据)
表格内具体字段:
- 阵地:站点的分类集合,参照数说标准有:微博、短视频、电商笔记、视频、微信、问答、论坛、新闻、微博评论、电商评论、汽车垂媒、短视频评论,可在系统筛选器中查阅该值;
- 站点:不同网站/app的名称,可在原帖-数据站点中查找该值;
- 微博水军类型:针对微博panel库识别账号是否为水军,条件值有:“水军”、“真实”
- 广告杂音类型:数说广告算法结果,条件值为“杂音”
- 内容关键词:内容、源内容、标题字段的匹配条件,支持|()+!等逻辑条件,命中逻辑为 包含
- 主贴URL:系统中存储的帖子链接,请在原帖组件中复制该URL,系统方可识别;
- mid:微博评论的主贴id,根据该主贴id找到评论帖子,该id需要通过系统数据库查找;
- parent_id:除了微博站点外的评论的主贴id;
- 作者名:发帖人的昵称,可在原贴组件中查找;
- src_mid:微博转发贴的源微博id,根据该源微博id找到转发帖子,该id需要通过系统数据库查找
定制化码表管理(定制化产品) #
当全部配置更改并保存后需要点击“更新”按钮,等待数据处理,数据处理完成才能在活动数据页面生效。
5.查看活动数据 #
活动监测过程中,和活动结束以后,均可在活动列表页,点击活动列表的活动名称,进入对应版本的活动详情页。
活动的详情页分为三个板块:速览监测;深度监测;监测总览
速览监测:单个速览监测页面
深度监测:活动效果评估、发声主体分析、平台话题分析、评论观点分析、对标活动分析(从活动列表点击活动名称进入后可见)
监测总览:活动概览、爆款单帖
5.1活动效果评估 #
筛选器
- 活动效果趋势:展示活动的核心指标趋势,支持按 声量 和 互动量查看,也支持按阵地查看。
- 趋势诊断:对活动的声量/互动量峰值日期发生的事件进行总结,总结语句支持编辑;点击趋势探查按钮,可以修改条件进行重新总结
- 阵地分布:可通过右上角筛选器选择总声量、总互动量、平均互动量、分监测对象声量、分监测对象互动量的分布情况。
- 发声主体分布:不同发声主体的总声量、总互动量的分布情况。BGC通过活动配置时选择对应的BGC;付费PGC通过活动管理采集配置的URL/UID上传识别,无上传则默认为自来水PGC
- 情感占比趋势:分析活动中的情感趋势变化,采用百分百堆积效果,可以看到每天的情感占比情况;
- 各类型情感分布:分别查看活动整体情感、PGC情感、UGC情感分布,这三部分的情感分布不受组合筛选器中的声量类型筛选器影响。
- 监测对象筛选器:可查看本活动的总体效果,也可筛选本活动下具体品类的活动效果。比如选本活动+Redmi Note 11表明,查看活动中Redmi Note 11传播效果。
- 组合筛选器:可对数据阵地、声量类型、投放类型进行筛选,用户可通过内容搜索和昵称搜索,筛选出想分析的特定内容和特定的账号。
- 日期筛选器 :**可选择特定时间范围来查看数据。
- 声量类型分布:展示自来水PGC\付费PGC\BGC\UGC的分布情况,付费PGC通过URL上传识别,PGC默认为自来水PGC;
- 分阵地分布:不同阵地不同声量类型的声量和互动分布情况;
- 分趋势分布:按帖子的发表时间,分析不同声量类型在不同阵地的分布趋势。
- 账号类型:根据该作者过往发文的主要领域进行判断,仅针对 微博、微信、小红书、哔哩哔哩、抖音app 的作者有效;
- 粉丝量级:
- 是否KOL:
- PGC指标卡:互动量、总声量、NSR均为声量类型为PGC的数据;
- 内容词云:选取声量类型为PGC的发帖的关键词的前50进行展示,按关键词对应的帖子数进行排序,可以与原帖进行联动;
- 贡献排行:按互动量倒序TOP30的作者的排行列表,指标包括互动量、互粉比*100、总声量,均为该作者在本活动的表现情况,可以与原帖进行联动
- 官号贡献:本活动官号矩阵的表现分布,按互动量和互粉比*100两个指标进行分析;
- 官号贡献排行:官号贡献的明细数据分析,可以与原帖进行联动;
- UGC指标卡:互动量、总声量、NSR均为声量类型为UGC的数据;
- 内容词云:选取声量类型为UGC的发帖的关键词的前50进行展示,按关键词对应的帖子数进行排序,可以与原帖进行联动;
- 性别分布:包含了微博、抖音、小红书等主流站点的人群信息数据;
- 年龄分布:包含了微博、抖音站点的年龄分布数据;
- 监测对象筛选器、组合筛选器、日期筛选器,功能与效果评估页面相同。
- 微博/抖音/快手/小红书话题列表:自动提取微博/抖音/快手/小红书平台带#的话题名称,并统计相应内容的指标数据。
- 效果趋势:通过话题的声量/互动量/情感日趋势图表,查看话题传播效果
- 情感分布:话题整体情感倾向
- 主动传播议题分析:根据配置的传播议题进行效果指标,情感分布,高频词云等进行数据展示,支持联动议题相关原贴。若未配置传播议题,在进入页面时将会提示“本活动未设置业务关注议题”。【至尊版功能】
- 点击右上角的“导出csv”按钮,可将列表下载保存。
- 评论观点指标卡:通过监测对象提及率,NSR,互动量指标,了解评论内容对活动的关注程度,情感倾向,以及评论引发互动的情况
- 营销智囊bot-评论分析总览:通过AI算法对评论讨论的聚焦点进行总结,快速概览评论主要讨论点
- 观点维度总览:利用三元组算法,识别评论内容中 针对特定维度的、体现了正面或负面情感倾向的 关键短语,并进行归类,得出受众对活动的关注点。
- 观点词云:基于算法识别出的关键短语汇总为词云图。
- 营销智囊bot-细分观点总结:利用大语言训练模型根据每个聚类观点进行观点总结及观点情感判断
- 评论展示:展示具体的评论内容,接受与维度总览,词云,观点总结进行联动。
- 【评论分析和展示为额外采买功能】
- 关于运算符号:
- “|”连接表示或关系,如(雅诗兰黛|口红)表示出现 雅诗兰黛或口红;
- “+” 连接表示且关系,如(雅诗兰黛+口红)表示同时出现 雅诗兰黛和口红;
- “( )”用于组合运算,仅支持英文括号,(口红+(雅诗兰黛|兰蔻))相当于(口红+雅诗兰黛|口红+兰蔻);
- “ \ ” 用于保留语法规则符号本身意义,如(\+关注)保留了加号。除了语法符号,其余符号不需要加转义符;
- “ ~N”用于限制多个词之间相隔的字符数,如(雅诗兰黛+口红~5),可以匹配到“雅诗兰黛金管口红”,但不会匹配到“雅诗兰黛520情人节限定口红”;
- 运算符号需使用英文标点符号。
- 词距语法补充说明:
- 词距最多支持间隔20个字符,语法规则为(A+B~20),操作符~写在词组末尾;
- 连续英文单词(Hello+Word~10)、连续数字(123+789~10),无法做词距查询;需着重注意加号两侧不能直接出现该种情况,如(雅诗兰黛a+b口红~10);
- 词距查询不支持双层,例如(((宝洁+个护~5)+洗发水)~5)、(天猫超市+(省心|省事|扫雷|(踩+雷)|避坑|避雷)~20),均不支持;
- 无词距情况下,查询对关键词前后顺序不敏感,即A+B和B+A的查询结果一致;
- 有词距情况下,A+B~5和B+A~5会得到不同的查询结果,但词距越大时差异越小(即A+B~20和B+A~20的查询结果非常接近)(ES特性:当slop值足够大时,单词可以按照任意顺序排列。slop值即我们用到的词距数值)。
- 词距最多支持间隔20个字符,语法规则为(A+B~20),操作符~写在词组末尾;
- 其他补充:
- 英文关键词不区分大小写;
- 运算符号均需用半角英文符号。
- 关于运算符号:
- “|”连接表示或关系,如(find x5|findx5)表示出现 find x5或findx5;;
- 运算符号需使用英文标点符号。
- 其他补充:
- 英文关键词不区分大小写;
- 运算符号均需用半角英文符号。
- 关于运算符号:
- “|”连接表示或关系,如(雅诗兰黛|口红)表示出现 雅诗兰黛或口红;
- “+” 连接表示且关系,如(雅诗兰黛+口红)表示同时出现 雅诗兰黛和口红;
- “( )”用于组合运算,仅支持英文括号,(口红+(雅诗兰黛|兰蔻))相当于(口红+雅诗兰黛|口红+兰蔻);
- “ \\ ” 用于保留语法规则符号本身意义,如(\\+关注)保留了加号。除了语法符号,其余符号不需要加转义符;
- 运算符号需使用英文标点符号。
- 其他补充:
- 英文关键词不区分大小写;
- 运算符号均需用半角英文符号。
- 出现正面或负面的占比低于提及占比的20%
- 各个提及情感均为中性
- 出现正面或负面的占比高于提及占比的20%且“负面”出现的次数较多
- 出现正面或负面的占比高于提及占比的20%且“正面”和“负面”、出现的次数一样多
- 活动筛选器:可以选择已监测的活动进行数据查看
- 监测对象筛选器:可查看本活动的总体效果,也可筛选本活动下具体品类的活动效果。比如选本活动+Redmi Note 11表明,查看活动中Redmi Note 11传播效果。
- 组合筛选器:可对数据阵地、声量类型、投放类型进行筛选,用户也可通过内容筛选,筛选出想分析的特定内容。
- 日期筛选器:可选择特定时间范围来查看数据。
- 从活动声量、活动互动量、活动NSR、活动正面率、负面率、监测对象、互动成本等指标对本活动效果进行分析。
- 活动效果趋势:展示活动的核心指标趋势,支持按 声量 和 互动量查看,也支持按阵地查看。
- 趋势诊断:对活动的声量/互动量峰值日期发生的事件进行总结,总结语句支持编辑;点击趋势探查按钮,可以修改条件进行重新总结
- 阵地分布:可通过右上角筛选器选择总声量、总互动量、平均互动量、分监测对象声量、分监测对象互动量的分布情况。
- 发声主体分布:不同发声主体的总声量、总互动量的分布情况。BGC通过活动配置时选择对应的BGC;付费PGC通过活动管理采集配置的URL/UID上传识别,无上传则默认为自来水PGC
- 情感占比趋势:分析活动中的情感趋势变化,采用百分百堆积效果,可以看到每天的情感占比情况;
- 各类型情感分布:分别查看活动整体情感、PGC情感、UGC情感分布,这三部分的情感分布不受组合筛选器中的声量类型筛选器影响。
- 监测对象筛选器:可查看本活动的总体效果,也可筛选本活动下具体品类的活动效果。比如选本活动+Redmi Note 11表明,查看活动中Redmi Note 11传播效果。
- 组合筛选器:可对数据阵地、声量类型、投放类型进行筛选,用户可通过内容搜索和昵称搜索,筛选出想分析的特定内容和特定的账号。
- 日期筛选器 :**可选择特定时间范围来查看数据。
- 声量类型分布:展示自来水PGC\付费PGC\BGC\UGC的分布情况,付费PGC通过URL上传识别,PGC默认为自来水PGC;
- 分阵地分布:不同阵地不同声量类型的声量和互动分布情况;
- 分趋势分布:按帖子的发表时间,分析不同声量类型在不同阵地的分布趋势。
- 账号类型:根据该作者过往发文的主要领域进行判断,仅针对 微博、微信、小红书、哔哩哔哩、抖音app 的作者有效;
- 粉丝量级:
- 是否KOL:
- PGC指标卡:互动量、总声量、NSR均为声量类型为PGC的数据;
- 内容词云:选取声量类型为PGC的发帖的关键词的前50进行展示,按关键词对应的帖子数进行排序,可以与原帖进行联动;
- 贡献排行:按互动量倒序TOP30的作者的排行列表,指标包括互动量、互粉比*100、总声量,均为该作者在本活动的表现情况,可以与原帖进行联动
- 官号贡献:本活动官号矩阵的表现分布,按互动量和互粉比*100两个指标进行分析;
- 官号贡献排行:官号贡献的明细数据分析,可以与原帖进行联动;
- UGC指标卡:互动量、总声量、NSR均为声量类型为UGC的数据;
- 内容词云:选取声量类型为UGC的发帖的关键词的前50进行展示,按关键词对应的帖子数进行排序,可以与原帖进行联动;
- 性别分布:包含了微博、抖音、小红书等主流站点的人群信息数据;
- 年龄分布:包含了微博、抖音站点的年龄分布数据;
- 监测对象筛选器、组合筛选器、日期筛选器,功能与效果评估页面相同。
- 微博/抖音/快手/小红书话题列表:自动提取微博/抖音/快手/小红书平台带#的话题名称,并统计相应内容的指标数据。
- 效果趋势:通过话题的声量/互动量/情感日趋势图表,查看话题传播效果
- 情感分布:话题整体情感倾向
- 主动传播议题分析:根据配置的传播议题进行效果指标,情感分布,高频词云等进行数据展示,支持联动议题相关原贴。若未配置传播议题,在进入页面时将会提示“本活动未设置业务关注议题”。【至尊版功能】
- 点击右上角的“导出csv”按钮,可将列表下载保存。
- 评论观点指标卡:通过监测对象提及率,NSR,互动量指标,了解评论内容对活动的关注程度,情感倾向,以及评论引发互动的情况
- 营销智囊bot-评论分析总览:通过AI算法对评论讨论的聚焦点进行总结,快速概览评论主要讨论点
- 观点维度总览:利用三元组算法,识别评论内容中 针对特定维度的、体现了正面或负面情感倾向的 关键短语,并进行归类,得出受众对活动的关注点。
- 观点词云:基于算法识别出的关键短语汇总为词云图。
- 营销智囊bot-细分观点总结:利用大语言训练模型根据每个聚类观点进行观点总结及观点情感判断
- 评论展示:展示具体的评论内容,接受与维度总览,词云,观点总结进行联动。
- 【评论分析和展示为额外采买功能】
- 关于运算符号:
- “|”连接表示或关系,如(雅诗兰黛|口红)表示出现 雅诗兰黛或口红;
- “+” 连接表示且关系,如(雅诗兰黛+口红)表示同时出现 雅诗兰黛和口红;
- “( )”用于组合运算,仅支持英文括号,(口红+(雅诗兰黛|兰蔻))相当于(口红+雅诗兰黛|口红+兰蔻);
- “ \ ” 用于保留语法规则符号本身意义,如(\+关注)保留了加号。除了语法符号,其余符号不需要加转义符;
- “ ~N”用于限制多个词之间相隔的字符数,如(雅诗兰黛+口红~5),可以匹配到“雅诗兰黛金管口红”,但不会匹配到“雅诗兰黛520情人节限定口红”;
- 运算符号需使用英文标点符号。
- 词距语法补充说明:
- 词距最多支持间隔20个字符,语法规则为(A+B~20),操作符~写在词组末尾;
- 连续英文单词(Hello+Word~10)、连续数字(123+789~10),无法做词距查询;需着重注意加号两侧不能直接出现该种情况,如(雅诗兰黛a+b口红~10);
- 词距查询不支持双层,例如(((宝洁+个护~5)+洗发水)~5)、(天猫超市+(省心|省事|扫雷|(踩+雷)|避坑|避雷)~20),均不支持;
- 无词距情况下,查询对关键词前后顺序不敏感,即A+B和B+A的查询结果一致;
- 有词距情况下,A+B~5和B+A~5会得到不同的查询结果,但词距越大时差异越小(即A+B~20和B+A~20的查询结果非常接近)(ES特性:当slop值足够大时,单词可以按照任意顺序排列。slop值即我们用到的词距数值)。
- 词距最多支持间隔20个字符,语法规则为(A+B~20),操作符~写在词组末尾;
- 其他补充:
- 英文关键词不区分大小写;
- 运算符号均需用半角英文符号。
- 关于运算符号:
- “|”连接表示或关系,如(find x5|findx5)表示出现 find x5或findx5;;
- 运算符号需使用英文标点符号。
- 其他补充:
- 英文关键词不区分大小写;
- 运算符号均需用半角英文符号。
- 关于运算符号:
- “|”连接表示或关系,如(雅诗兰黛|口红)表示出现 雅诗兰黛或口红;
- “+” 连接表示且关系,如(雅诗兰黛+口红)表示同时出现 雅诗兰黛和口红;
- “( )”用于组合运算,仅支持英文括号,(口红+(雅诗兰黛|兰蔻))相当于(口红+雅诗兰黛|口红+兰蔻);
- “ \\ ” 用于保留语法规则符号本身意义,如(\\+关注)保留了加号。除了语法符号,其余符号不需要加转义符;
- 运算符号需使用英文标点符号。
- 其他补充:
- 英文关键词不区分大小写;
- 运算符号均需用半角英文符号。
- 出现正面或负面的占比低于提及占比的20%
- 各个提及情感均为中性
- 出现正面或负面的占比高于提及占比的20%且“负面”出现的次数较多
- 出现正面或负面的占比高于提及占比的20%且“正面”和“负面”、出现的次数一样多
情感分布
内容分析
原帖展示:展示具体的评论内容,可通过右上角按钮切换排序方式;
词云:活动整体内容的分词结果,基于每条帖子的高频词进行聚类;
话题、议题、评论总览:抽取话题分析、内容标签分析、评论观点的信息在总览页进行预览;
5.2发声主体分析 #
从账号视角,分析活动的声量互动量指标的构成情况
顶部筛选器
总览模块
PGC分析
BGC分析
UGC分析
5.3平台话题分析,主动传播议题分析,评论观点分析 #
从 平台话题、传播议题、评论观点 三个方面来深度解构活动传播内容。
通过话题可了解到哪些话题在该次活动中起到了更好的效果表现,用户在该次活动中关心的内容是什么。
传播议题则针对品牌设置的主动沟通角度进行效果监测,如本次活动涉及的产品功能、明星代言、服务等多维度的效果表现。
评论观点分析则可以帮助快速了解与活动相关的评论内容总结。
平台话题分析页
主动传播议题分析页
评论观点分析页
5.4对标活动分析 #
可选定同类N个活动进行对比分析,以评估本活动的表现优劣。
具体包括声量互动量对比、热度趋势对比、投放类型对比、阵地热度对比、活动情感分布对比,话题/主动传播内容对比
五.附:核心算法说明 #
1.关键词提取算法 #
从文本中提取出与这篇文档意义最相关的一些词,通过这些关键词就可以了解文本的主题思想。文本通过关键词提取后可以方便后续地摘要提取,文本分类/聚类等问题的处理分析工作。
2.情感判断算法 #
用户通过发表内容表达自身情感时,主要包括正面、负面、中性三种倾向。数说基于自然语言处理及机器学习技术,深入挖掘用户不同情感的隐含特征,包括极致赞扬、粗鲁表达、特殊表情及符号折射的情感表达,并经过大量的情感标注数据,迭代优化情感判别模型。目前,数说情感判别模型准确率可达85%以上。
3.广告杂音判断算法 #
通过人工数据标注不同类型的广告,如微商软文、海外代购、抽奖活动、优惠券信息、旅游推广、培训活动报名、⽂章主动推出含购买链接的产品等广告,基于机器学习模型,实现广告判断。将微博、微信、新闻等数据分为四类:低质量广告、高质量广告、杂音、自发内容,以帮助用户清洗数据和分析广告数据中的有用信息。
4.文本指纹识别算法 #
文本指纹算法指的是对文本生成“数字指纹”,这个数字指纹是一个由字母和数字组成的32位的字符串,用这个字符串指纹来作为该文本的标识。文本指纹算法可以用来衡量不同文本之间的相似程度,指纹相同,文本也就越相似,此算法在文本去重,信息检索等文本处理任务有重要应用。
每个事件都会生成一个事件指纹和多个事件名称,事件名称的系统上结果取互动量最高的那个帖子的标题或前200个字。
5.智能三元组算法 #
智能三元组分析指的是细粒度情感分析,可分析具体某个维度的情感,例如“价格”、“物流”。通过三元组分析,可以精确了解消费者对品牌的的反馈(如下图)。智能三元组算法很大程度上弥补了传统NLP分词算法分词缺乏关联性不足的问题。
传统分词词云图 |
智能三元组分词词云图 |
6.长文本相关性算法 #
通过构建分析主体的关键词码表进行硬匹配,获取到分析对象相关的文本,是最常见的取数方式,这种取数方式不可避免引入与分析对象不太相关的文本。
本算法旨在构建算法模型,判断长文本(主要是新闻、微信)与分析主体的相关性,判断为高相关/低相关。
六.附:码表设计规则 #
码表制作的基本思路:
活动监测涉及到的码表,包括活动关键词过滤词、单帖采集、监测对象、传播议题,具体规则如下。
输入项
|
规则
|
||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
活动关键词/过滤词 | 关键词和过滤词为同时满足的关系,分别最多支持1000组词。词用+连接,表示且关系;用|连接,表示或关系;支持~N限词距,N<=20;支持英文括号()组合。
|
||||||||||||||||||||
单帖采集-按URL采集 | 最多支持上传1万条URL,需要按照格式提供,示例如下:
|
||||||||||||||||||||
监测对象 | 最多支持配置15个监测对象。
每个监测对象最多支持500组关键词。 多组词请用竖线分隔,不支持加号、括号、词距规则。 |
||||||||||||||||||||
传播议题 | 最多支持配置150个传播议题。
每个传播议题最多支持1000组关键词。 词用+连接,表示且关系;用|连接,表示或关系;支持英文括号()组合。不支持词距规则。 |
七.常见问题 #
Q1:筛选框中的内容包含和内容过滤区分大小写吗? #
A1:区分大小写
Q2:若系统显示活动情感分布与预估的情感分布不一致,用户如何自行通过系统验证情感分布数据质量? #
A2:活动监测中情感分布饼图均可与该页面里的原文展示进行联动,用户可以点击某一情感类型查看该类型下的原文,查看情感标签是否合理。
Q3:文章提及多个分析对象时,算法是如何做到针对不同的分析对象输出情感结果的? #
A3:当文章出现多个分析对象时,模型根据分析对象所在语境来判断情感极性分别标注它们的情感倾向,输出多个情感判断结果,如同时提及小米和OPPO,那么这条文本会被打上小米的情感类型和OPPO的情感类型两种标签。
Q4:一个文本多次提及某个分析对象,并且评价有正面有负面时,如何对这条文本做情感判断? #
A4:当某个分析对象被多次提及时,模型会统计其“正面”、“负面”、“中性”出现的次数,在进行判断,具体规则如下:
(1)中性情感:满足如下任一条件
(2)正面情感:出现正面或负面的占比高于提及占比的20%且“正面”出现的次数较多。
(3)负面情感:满足如下任一条件
Q5:想要关注的品牌账号不在品牌官方账号库,怎么办? #
A5:品牌官方账号库可以根据需求更新。
Q6:为什么我能看到其他账号创建的没有共享的活动? #
A6:超管账号可以看到企业下所有活动,如果不需看到所有活动,可在用户中心登录企业管理员账号,修改对应权限。
总览模块
效果分布
情感分布
内容分析
原帖展示:展示具体的评论内容,可通过右上角按钮切换排序方式;
词云:活动整体内容的分词结果,基于每条帖子的高频词进行聚类;
话题、议题、评论总览:抽取话题分析、内容标签分析、评论观点的信息在总览页进行预览;
5.2发声主体分析 #
从账号视角,分析活动的声量互动量指标的构成情况
顶部筛选器
总览模块
PGC分析
BGC分析
UGC分析
5.3平台话题分析,主动传播议题分析,评论观点分析 #
从 平台话题、传播议题、评论观点 三个方面来深度解构活动传播内容。
通过话题可了解到哪些话题在该次活动中起到了更好的效果表现,用户在该次活动中关心的内容是什么。
传播议题则针对品牌设置的主动沟通角度进行效果监测,如本次活动涉及的产品功能、明星代言、服务等多维度的效果表现。
评论观点分析则可以帮助快速了解与活动相关的评论内容总结。
平台话题分析页
主动传播议题分析页
评论观点分析页
5.4对标活动分析 #
可选定同类N个活动进行对比分析,以评估本活动的表现优劣。
具体包括声量互动量对比、热度趋势对比、投放类型对比、阵地热度对比、活动情感分布对比,话题/主动传播内容对比
五.附:核心算法说明 #
1.关键词提取算法 #
从文本中提取出与这篇文档意义最相关的一些词,通过这些关键词就可以了解文本的主题思想。文本通过关键词提取后可以方便后续地摘要提取,文本分类/聚类等问题的处理分析工作。
2.情感判断算法 #
用户通过发表内容表达自身情感时,主要包括正面、负面、中性三种倾向。数说基于自然语言处理及机器学习技术,深入挖掘用户不同情感的隐含特征,包括极致赞扬、粗鲁表达、特殊表情及符号折射的情感表达,并经过大量的情感标注数据,迭代优化情感判别模型。目前,数说情感判别模型准确率可达85%以上。
3.广告杂音判断算法 #
通过人工数据标注不同类型的广告,如微商软文、海外代购、抽奖活动、优惠券信息、旅游推广、培训活动报名、⽂章主动推出含购买链接的产品等广告,基于机器学习模型,实现广告判断。将微博、微信、新闻等数据分为四类:低质量广告、高质量广告、杂音、自发内容,以帮助用户清洗数据和分析广告数据中的有用信息。
4.文本指纹识别算法 #
文本指纹算法指的是对文本生成“数字指纹”,这个数字指纹是一个由字母和数字组成的32位的字符串,用这个字符串指纹来作为该文本的标识。文本指纹算法可以用来衡量不同文本之间的相似程度,指纹相同,文本也就越相似,此算法在文本去重,信息检索等文本处理任务有重要应用。
每个事件都会生成一个事件指纹和多个事件名称,事件名称的系统上结果取互动量最高的那个帖子的标题或前200个字。
5.智能三元组算法 #
智能三元组分析指的是细粒度情感分析,可分析具体某个维度的情感,例如“价格”、“物流”。通过三元组分析,可以精确了解消费者对品牌的的反馈(如下图)。智能三元组算法很大程度上弥补了传统NLP分词算法分词缺乏关联性不足的问题。
传统分词词云图 |
智能三元组分词词云图 |
6.长文本相关性算法 #
通过构建分析主体的关键词码表进行硬匹配,获取到分析对象相关的文本,是最常见的取数方式,这种取数方式不可避免引入与分析对象不太相关的文本。
本算法旨在构建算法模型,判断长文本(主要是新闻、微信)与分析主体的相关性,判断为高相关/低相关。
六.附:码表设计规则 #
码表制作的基本思路:
活动监测涉及到的码表,包括活动关键词过滤词、单帖采集、监测对象、传播议题,具体规则如下。
输入项
|
规则
|
||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
活动关键词/过滤词 | 关键词和过滤词为同时满足的关系,分别最多支持1000组词。词用+连接,表示且关系;用|连接,表示或关系;支持~N限词距,N<=20;支持英文括号()组合。
|
||||||||||||||||||||
单帖采集-按URL采集 | 最多支持上传1万条URL,需要按照格式提供,示例如下:
|
||||||||||||||||||||
监测对象 | 最多支持配置15个监测对象。
每个监测对象最多支持500组关键词。 多组词请用竖线分隔,不支持加号、括号、词距规则。 |
||||||||||||||||||||
传播议题 | 最多支持配置150个传播议题。
每个传播议题最多支持1000组关键词。 词用+连接,表示且关系;用|连接,表示或关系;支持英文括号()组合。不支持词距规则。 |
七.常见问题 #
Q1:筛选框中的内容包含和内容过滤区分大小写吗? #
A1:区分大小写
Q2:若系统显示活动情感分布与预估的情感分布不一致,用户如何自行通过系统验证情感分布数据质量? #
A2:活动监测中情感分布饼图均可与该页面里的原文展示进行联动,用户可以点击某一情感类型查看该类型下的原文,查看情感标签是否合理。
Q3:文章提及多个分析对象时,算法是如何做到针对不同的分析对象输出情感结果的? #
A3:当文章出现多个分析对象时,模型根据分析对象所在语境来判断情感极性分别标注它们的情感倾向,输出多个情感判断结果,如同时提及小米和OPPO,那么这条文本会被打上小米的情感类型和OPPO的情感类型两种标签。
Q4:一个文本多次提及某个分析对象,并且评价有正面有负面时,如何对这条文本做情感判断? #
A4:当某个分析对象被多次提及时,模型会统计其“正面”、“负面”、“中性”出现的次数,在进行判断,具体规则如下:
(1)中性情感:满足如下任一条件
(2)正面情感:出现正面或负面的占比高于提及占比的20%且“正面”出现的次数较多。
(3)负面情感:满足如下任一条件
Q5:想要关注的品牌账号不在品牌官方账号库,怎么办? #
A5:品牌官方账号库可以根据需求更新。
Q6:为什么我能看到其他账号创建的没有共享的活动? #
A6:超管账号可以看到企业下所有活动,如果不需看到所有活动,可在用户中心登录企业管理员账号,修改对应权限。