业务安全(1)-天御内容安全

一、前言

此系列将写一个系列给大家介绍腾讯云上的业务安全产品,希望加深大家对于腾讯业务安全产品的了解和熟悉,使用。

随着互联网业务的发展,各行各业都涉及业务安全问题:

  • 金融中涉及的主要业务安全问题包括账号安全、资金安全、洗钱、骗贷、老赖逾期问题、金融黑中介、薅羊毛等;
  • 社交中面临的主要业务安全问题包括账号安全(盗号、恶意注册、养号)、诈骗、恶意引流、色情恐怖政治等;
  • 游戏中则是外挂、盗号、内容类(诈骗引流低俗辱骂色情恐怖)、工作室打金等。

业务安全是一个不断对抗的过程,腾讯业务安全是基于腾讯20年黑灰产的对抗经验和领先技术打造而成的标准化风控模型,目前已在金融、电商、政务等多个行业落地应用,并覆盖金融领域超过80%的标杆客户。

目前互联网上的数据呈现爆炸式增长,图片、视频、发文、聊天等互动内容已经成为人们表达感情、日常工作不可或缺的部分。这些日益增长的内容中也充斥着各种不可控的风险因素,比如不雅不良评论、垃圾广告、违法违规交易/宣传、低俗不文明等垃圾内容。目前天御内容安全主要有下面四种场景:

  • 图片内容安全
  • 文本内容安全
  • 音频内容安全
  • 视频内容安全

图片内容安全(Image Moderation System,IMS)能精准识别涉黄、涉恐、涉政等有害内容,支持配置图片黑名单,打击自定义的违规类型。识别结果分为正常、可疑与违规三部分,建议放行正常的图片,人工审查可疑的图片,屏蔽违规的图片,节省人力成本,提高审核效率。

文本内容安全(Text Moderation System,TMS)服务使用了深度学习技术,可有效识别涉黄、涉政、涉恐等有害内容,支持用户配置词库,打击自定义的违规文本。通过 API 接口,能检测内容的危险等级,对于高危部分直接过滤,可疑部分人工复审,从而节省审核人力,释放业务风险。

音频内容安全(Audio Moderation System,AMS)能自动检测音频,识别音频中的涉黄、涉恐、涉政、谩骂、低俗等违规内容,并支持自定义黑名单热词,打击自定义的违规音频内容。用户可通过 API 获取检测的标签、违规内容及置信度,直接使用信置信度高的结果和人工复审置信度低的结果,从而降低人工成本,提高审核效率。

二、内容安全产品特性

2分钟带你认识腾讯云 T-Sec 天御 内容安全

https://cloud.tencent.com/edu/learning/course-2321-33927

腾讯云官网进入内容安全页面

  • 图片内容安全特性

  • 文本内容安全特性

  • 音频内容安全特性

三、文本内容安全现状

不良不雅评论,违规违法交易严重影响主营业务的健康发展 。面对此类问题,企业主该如何解决呢?

一种方法是投入人力加大审核力度,此种方式的特点如下:

  1. 垃圾评论占比较小,人力逐条审核容易漏审
  2. UGC评论数据规模巨大,每日多达数十亿、百亿等,人力成本太高
  3. 审核人员的招聘成本,管理成本较高

另外一种方式是招聘专业的AI工程师自建识别模型,此种方式特点如下:

  1. AI工程师非常昂贵
  2. 内容安全一般不属于主营业务,投入较少
  3. 识别模型的效果受限于样本规模和样本质量,在数据标注上需要持续投入

最后一种途径是购买保险:将内容安全问题交给专业的公司来解决,从而实现“四两拨千斤”。

四、文本内容安全现有解决方案

当前识别此类垃圾内容的主流方法有:关键词过滤模式、关键词文法过滤模式、在打标数据上训练垃圾识别模型的机器学习模式,或融合关键词与机器学习的混合模式,其特点分析如下:

  1. 基于关键词过滤模式:该模式的优点是立竿见影生效快,但是由于分词歧义问题导致误杀,对未登录的case泛化能力弱,词库的维护成本高
  2. 基于关键词文法的过滤模式:由于考虑了关键词的上下文,此种方式相比关键词过滤拥有了一定的消歧义能力,但是关键词文法需要人工总结归纳,再加上上下文不易枚举,使得人力成本成倍上升,于此同时随着变种不断涌现,从变种中挖掘拦截文法,人力成本不可控
  3. 静态机器学习模型或融合了关键词文法过滤的混合模式:由于模型是静态的,上线之后,应对不了变种问题,使得模型很快失灵

新变种不断涌现,会快速绕过当前垃圾识别方法,使得当前的方法“失灵”,各公司不得不投入大量人力研究变种,归纳拦截策略或标注新样本,于此同时每个业务平台上的垃圾内容存在较大差异,同一垃圾类型,客户的尺度也存在较大差别。在节约人力成本的条件下,如何解决此类对抗性的问题,并做到客户级的个性化定制,成为困扰业界一大难题。腾讯云天御分别从:

  1. Active learning方式挖掘高质量语料,降低人工审核量
  2. 打造数据闭环降低研发运维投入
  3. KV分布式存储实现GB级模型秒级更新
  4. T+1滚动式升级模型对抗变种

等四大维度搭建内容安全完整解决方案。

五、天御文本内容方案

5.1 UGC分类

天御把UGC评论文本类型分为6大类:

  1. 不良
  2. 不雅
  3. 违法违规:UGC中含有违法违规词汇,或法律禁止网上交易的内容
  4. 广告:为第三方导流的合法广告,其尺度因平台业务类型而异
  5. 低俗不文明:骂人,爆粗口等
  6. 正常

5.2 UGC特点及天御应对策略

综上,未来内容安全一条便宜省心的趋势,选择行业成熟的解决方案,可以实现业务健康发展的同时,确保内容安全。

七、使用常见问题和案例

根据数据分析,大家接入内容安全过程中主要的常见问题是:客户接入和产品问题

7.1 客户接入

1、接口文档

音频:https://cloud.tencent.com/document/product/1219/46477
图片:https://cloud.tencent.com/document/api/669/34503
文本:https://cloud.tencent.com/document/product/1124/46976

2、怎么查看腾讯云账号信息,获取UIN与APPID

使用腾讯云账号登录账号信息控制台:
https://console.cloud.tencent.com/developer

3、怎么获取调用接口的SecretId和SecretKey?

使用腾讯云账号登录云API密钥管理控制台:
https://console.cloud.tencent.com/cam/capi
如没有,点击新建一个即可

4、内容安全服务接入指引:

( 内容仅针对文本和图片 )
用户在腾讯云官网-控制台(内容安全链接),图片内容安全/文本内容安全界面内即可免费领取试用包、购买正式包。
https://console.cloud.tencent.com/cms
字体颜色或背景 开通服务后,可先使用API在线工具调试接口(地区选择广州)

批量测试和正式接入可参考在线工具中的Demo使用SDK接入或自行实现HTTP请求调用API(推荐使用SDK)。
SDK下载地址:https://cloud.tencent.com/document/product/669/34502
Java路径:
tencentcloud-sdk-java-master\\src\\main\\java\\com\\tencentcloudapi\\cms
其他路径:内容安全命名为CMS,可在SDK内搜索对应文件名
调用数据可在内容安全控制台查看(最新数据为T-1天)

7.2 常见产品问题

1、主账号权限错误 返回参数code:10001

{
"Response":{
"RequestID":"b*****-*****-****-****-******af",
"Businesscode": 0,
"Error":{
"code":"UnauthorizedOpertion.Unauthorized",
"Message":"未开通权限"
}
}
"retcode":10001,
"retmsg":"未开通权限"
}
未开通内容安全服务,需要主账号去控制台开通测试包或者购买服务包

2、主账号已经开通了内容安全的服务,子账号需要调用服务需要授权?

如果是子账号要使用,需要主账号给权限QcloudCMSFullAccess
https://console.cloud.tencent.com/cam/policy

3、为什么控制台没有数据?

需要确认登录的账号是否和调用接口的账号一致。
主账号与子账号,以及子账号之间的控制台数据独立。
控制台数据(t+1),今天的数据次日才可以查看。

4、是否可以自行添加违规词、自行新增恶意类型?

对于漏过(人审违规机审正常)的词,目前可以通过加入到自定义词库中实现打击。
恶意类型目前不支持新增。

5、图片接口支持哪些图片格式?对图片大小、分辨率有限制吗?

3.0接口
格式:常见的图片格式如PNG、JPG、JPEG、WEBP、GIF等都支持。
大小:目前无硬性限制,建议4M以内,图片分辨率大于200200,小于10002000。
4.0接口
格式:常见的图片格式如PNG、JPG、JPEG、WEBP、GIF等都支持。
大小:目前无硬性限制,建议4M以内,图片分辨率,小于1000*2000。

6、图片识别接口返回”多媒体文件链接下载源错误”是什么原因?

图片链接可以打开,但由于图片太太或者偶发的网络不稳定等原因导致下载失败

7、天御视频接口量级是按照什么计算?

按照视频总时长计算;
默认1s/帧,如客户截帧频率较密,会提前消耗完套餐包。

8、读取视频多久会超时?

3s,读取不到视频的头,就会超时

9、如图片下载全部会显示‘多媒体下载链接错误’是什么原因?

需要调整为域名使用,下载会拒绝直接使用ip的链接

10、内容线是否支持离线SDK?

不支持。

11、4.0接口图片Biztype字段是否客户可以自己设定?

可以的;Biztype 是我们这边要配置后,才会产生的,可以是英文、数字下划线来组合;
如果客户方需要配置什么格式的在配置前通知,一旦配置后,就无法更改。

12、4.0接口图片Review字段是否可以每个标签都输出?

不可以,只有机审后有分数输出的标签才会输出;如广告,二维码则不会输出。

13、音频审核类型中‘点播音频’和直播音频的区别是什么?

点播音频是基于文件的,直播音频是基于直播流。

14、视频审核-是否支持多个视频同时审核?

支持,最多支持40个视频同时审核。

15、视频审核Callback url 是否有callback失败后recall的逻辑?

没有。如果需要高可用,可用taskid 再查一遍。

16、缓冲队列最多可以支持多少个视频排队验证?

排队没有验证。同时审核数量是 40个。

17、是否有小视频插队逻辑?

是的。默认情况下,小视频不用排队。

18、如要检测视频中的音频,是要接一个接口还是两个接口?

一个接口就可以了,但是需要区分API请求地址和数据标识(如:audio、video)

19、是否有支持批量图片检测的接口吗?目前试单张检测的接口

没有,需要客户方自己写脚本去测试。

八、服务保证指标SLA

8.1 内容安全服务承诺99.9%的业务可用性。
(1)业务可用性 = 图片内容安全服务周期内业务可用时间 / 图片内容安全服务周期内服务总时间。
(2)失败请求: 因图片内容安全系统故障导致正常的请求未到达图片内容安全服务端的请求。
(3)有效的总请求:图片内容安全服务端接收到的所有请求视为有效的总请求。
(4)错误率 =(每分钟失败请求数 / 每分钟有效总请求数)x 100%。
(5)不可用时间:图片内容安全服务在1分钟内的错误率大于0.01%的,计为该分钟内服务不可用。服务连续1分钟以上不可用的,计为一次故障事件。以下情况不纳入业务不可用时间计算:

  • 日常系统维护时间。
  • 由客户原因、第三方原因或不可抗力导致的不可用时间。

(6)服务不可用分钟数:服务周期内累计故障事件的持续时间分钟数之和

参考:https://blog.csdn.net/weixin_34235371/article/details/89158495

本站文章资源均来源自网络,除非特别声明,否则均不代表站方观点,并仅供查阅,不作为任何参考依据!
如有侵权请及时跟我们联系,本站将及时删除!
如遇版权问题,请查看 本站版权声明
THE END
分享
二维码
海报
业务安全(1)-天御内容安全
此系列将写一个系列给大家介绍腾讯云上的业务安全产品,希望加深大家对于腾讯业务安全产品的了解和熟悉,使用。
<<上一篇
下一篇>>