如何对音视频内容进行审核?

 

我们之前讲过关于视频网站的搭建、视频的云存储、视频的加速播放等,今天的主要话题是视频内容的审核,为了满足视频业务对音视频的审核需求,审核要支持对上传的音视频进行涉黄、涉恐、涉政审查,一旦发现,可以及时下线违规的音视频,避免或减少对外发布后造成的不良影响。

特别是在UGC场景,若视频平台未对用户自由上传的视频内容进行违规审核,则将会给平台带来多方面的伤害。

CMS的审核机制,一般是多版本的,也就是说线上的版本是发布的,可以访问的,后台审核的是另一个版本,只有审核的通过了,才会替换线上的发布版本,审核不通过,线上的版本是不会变化的,具体可以参考我们之前《CMS版本和审核管理的介绍》。

 

 

 

 

人工审核和AI智能审核

 

视频点播服务一般有两种审核模式:

  • 先发后审模式:音视频上传后先发布,其“媒资状态”为“已发布”,音视频可以正常播放或预览,审核发现违规内容后再屏蔽。
  • 先审后发模式:音视频上传后不发布,其“媒资状态”为“未发布”,音视频必须经过审核并通过后,才可以在控制台以外的播放器被播放。 

 

 

不管那种审核,一般在审核中,都分为人工审核、AI智能审核,因为视频审核比内容审核更耗时耗力,所以AI审核可以大量的节约人力成本,所以,可以通过AI的智能审核,配合先发后审的模式,可以通过AI审核通过先发布视频,然后再通过人工审核,发现违规的视频,理解下架即可。

所以,最终的业务流程如下图所示

 

AI智能审核一般通过第三方平台实现,主流的几个达成,菊花鹅厂阿里百度都支持,比如百度的审核平台共介绍:

https://ai.baidu.com/solution/censoring 

应用场景 描述
图像审核 百度违禁图库:基于百度海量历史数据挖掘,提供对封禁图片的识别能力
色情识别:检测图中是否包含各类色情违禁、儿童裸露、女性性感等内容
公众人物识别:检测图中是否包含明星、球星等公众人物的人脸
用户头像审核:对图片中人脸的角度、遮挡、占比、清晰度等进行审核,筛选合适作为头像的照片
图文审核:检测图片的文字是否包含色情、广告等违禁内容
广告检测:检测图片中是否包含水印、二维码、条形码
违禁识别:检测图中是否包含吸烟、饮酒、赌博、吸毒等违禁行为和纹身等违禁品
恶心图像识别:检测图片中是否包含病变组织、流血恐怖等恶心内容
图像质量检测:对图像的清晰度和美观度进行打分
自定义图像黑名单:对用户黑名单中的图片进行拦截
自定义图像白名单:对用户白名单中的图片直接放过
自定义图片审核-EasyDL:支持用户通过EasyDL自助定制图像分类、物体检测模型,满足个性化审核需求
文本审核 百度违禁词库:包含百度海量历史数据挖掘,提供对封禁词语的识别审核能力
文本色情:对文本中的色情行为描述、色情资源链接、低俗交友、污秽文爱等内容进行识别
恶意推广:对文本中带有售卖意向的软文广告,微信、QQ等个人联系方式等违规内容及变体进行识别
低俗辱骂:对文本中的侮辱谩骂、人身攻击、消极宣泄等内容进行识别
低质灌水:对网络社区常见的乱码、水帖、刷屏等无意义的灌水信息进行识别
广告法审核:对广告法中要求的不能出现的违规词进行检测
短视频审核 采用同步方案,接口返回速度快,适合对响应时延要求高的场景,审核项目与图片审核一致
长审核审核 采用异步方案,适合长视频文件批量审核场景,审核项目与图片审核一致
短音频同步审核 采用同步方案,接口返回速度快,适合对响应时延要求高的场景。音频审核能力包含娇喘声检测和语音内容审核,语音内容审核是先通过语音识别将语音转换为文字,再过文本审核,审核项目与文本审核一致
音频文件异步审核 采用异步方案,适合长音频文件批量审核的场景。音频审核能力包含娇喘声检测和语音内容审核,语音内容审核是先通过语音识别将语音转换为文字,再过文本审核,审核项目与文本审核一致
直播审核 分为视频流审核及音频流审核,支持直接提交直播流链接,即可完成自动解析,对视频流进行抽帧审核;对音频流按照VAD方式进行语音识别及审核。并支持通过轮询或回调的方式实时获取审核结果

 

要使用百度的AI审核功能,就要调用AI的审核接口,具体可以参考百度的AI审核接口说明。

 

与CMS的审核集成

 

CMS做为内容管理平台,审核要保留历史记录、以及草稿的编辑等,因此审核发布本身并不仅仅是一个状态的管理,比如发布、未发布,真正审核机制其实多版本的,就是每次都生成一个新的版本,并且要跟旧版本进行比较,看看这个版本改动了什么,这个可以参考头条的内容发布流程,来理解审核发布的工作流。

具体逻辑可以参考下图,更多的信息,可以参考我们之前《CMS审核功能的介绍

 

结论

 

当然,集成了CMS多版本管理和审核,会导致一篇内容,会有很多版本,视频也会有很多版本,会带来大量冗余的存储,我们可以通过清理不要的历史版本来清除多余的内容和视频文件,这样可以减少存储空间的使用。

整体来说,视频审核是一个不可或缺的环节,因此启用审核和AI审核也是一个必要环节。

 

欢迎转载,请注明出处!

 

关于CMS的架构和在线教育网站的搭建,也可以参考我们之前相关的文章介绍,

1. 高校信息化之统一SAAS管理的解决方案

2. 如何通过开源方案自建视频课程平台

3. 在线视频教育学习平台介绍

4. 基于Drupal的在线教育网站案例