本页内容
1、正则码表中, A(.{0,20})B 里的词距,是指A和B之间相隔20个词,还是相隔20个字符? 一个中文字占据几个字符? #
答:20个字符;一个中文字占据1个字符
2、合并多渠道数据源,“数据追加”会有原字段缺失 #
答:A←B时会优先保留A的字段,B中不被A包含的就并不进来;建议按字段数从大到小的顺序并上子数据源
3、数据源打标发现未打上 #
答:重新核对打标csv文档内的表头是否填入关联字段名与所打的标签名
4、需要新建处理后的新数据源 #
答:选择输出——工厂
5、“正则匹配”是什么意思? #
答:详见正则匹配
6、“正则匹配”如何使用? #
答:正则表达式:(词组)(.{m,n})(词组),m为两个词组之间的最小字符数,n为两个词组之间的最小字符数(先后顺序有意义);在工厂设置条件时选择“正则匹配”/“正则不匹配”
7、日化库中,字段“是否广告”的判定规则是什么? #
答:
8、“句内包含”具体以哪些字符作为分隔? #
答:.?!;。?!;…
9、要合并数据源的时候,是选择“数据追加”还是“字段追加”? #
答:合并数据源时,选【数据追加】,点击后会看到两个数据源之间字段的对应关系
10、工厂打标签,显示是否短路是什么意思? #
答:码表匹配上第一个关键词后,是否停止往后匹配;所以一般选“否”;(过滤码表可以选“是”)