摘要: 背景 近些年来,视频直播快速发展,大量的直播平台如雨后春笋一般出现,但是这同样给直播内容的监管带来了巨大的挑战,一方面国家对于直播内容监管的要求日益严格,另一方面相对于文字内容的审核,多媒体内容的审核复杂度更高,资源耗费也更大技术门槛相对也较高,所以这逐渐成为制约直播服务健康发展的一个瓶颈,尤其是对于一些刚刚起步的中小直播平台。
背景
近些年来,视频直播快速发展,大量的直播平台如雨后春笋一般出现,但是这同样给直播内容的监管带来了巨大的挑战,一方面国家对于直播内容监管的要求日益严格,另一方面相对于文字内容的审核,多媒体内容的审核复杂度更高,资源耗费也更大技术门槛相对也较高,所以这逐渐成为制约直播服务健康发展的一个瓶颈,尤其是对于一些刚刚起步的中小直播平台。
对于内容审核,一些平台还是采用人肉审核的方法,雇佣大量的直播审核员,来从海量的直播视频中寻找那些不合规的视频,但是受限于人的精力,往往不能达到很好的效果,而且审核人员的紧缺薪水也响应的水涨船高。
幸好,人工智能的快速发展,给这个问题的解决带来的转机,人工智能审核+人工复审成为主流。
传统解决方案
有技术积累和人力的公司往往会自己组建自己的AI团队,根据自己的业务场景和海量的资源来训练自己的检测模型,这样优势是,能够对于自己的场景有更好的把控,但是也有一些缺点,比如:
- 用户需要自己完成截帧的工作,这个简单的工作可能耗费大量的计算资源
- 海量的图片存储和传输成本
- 受限于技术和人力的原因,审核算法精度不如人意
还不具备自建AI团队的平台往往使用第三方的图片审核的API,但是这样对于算法的微调就比较困难,并且对于图片的审核并不具备上下文综合判断的能力。
直播审核解决方案
阿里云视频直播审核可以完美的解决如上的问题,没有很高的技术门槛,用户可以快速的在控制台中开启直播审核的服务,解决中小直播平台内容审核的痛点。
直播审核架构
- 主播推流到视频直播中心,触发直播审核任务
- 对于直播流进行指定频率的截帧
- 实时的对于截帧通过内容审核引擎进行综合内容审核
- 结果交由管控服务进行综合的判断,是否需要通知客户和保存证据截帧
直播审核特性
开销低
对于用户透明,用户可以在控制台上轻松的开启视频直播审核服务,无需付出单独的存储,流量费用和计算成本,用户通过自行构建或者使用我们提供的直播审核平台可以快速的进行问题和疑似视频流的复审和封禁。
强大的算法支持
依赖于阿里巴巴多年的视频和AI技术的积累,可以快速方便的接入业界领先的直播审核算法,同时采用多帧综合判定来降低误检测率。
多种场景支持
- 智能鉴黄
- 智能暴恐检测
- 广告检测
- 无意义直播检测(针对长期推流又无有意义内容的直播流)
检测模型定制化
由于用户的需求多种多样,场景也不尽相同,所以直播审核提供了更弹性的解决方案,用户可以动态的对于每一路流给一个不同的审核策略,算法模型也可以根据不同的流采用不同的模型,这非常必要,因为不同的场景千差万别,实践中我们发现有些直播流误检率很高。
比如拳击比赛,经常被误判成色情,因为这和绝大多数两三个人就演完的小电影场景非常相似。
再比如游戏场景,因为游戏本身的场景是渲染出来的,纹理和正常的通过摄像头采集的图像有些不同,加上游戏很多就是被设计成有一定暴力成分在里面,所以正确的区别游戏和现实场景也是非常必要的,例如很多的场景很容易被错误认为是暴恐。
所以必须根据场景对于不同的流进行算法细分,从而可以挺高精确度,并且让直播审核更加实用。阿里云视频直播审核提供了细致到流级别的算法控制,更好的覆盖这些场景。
灵活配置
可以动态的对不同的流采用不同的检测场景,不同的截帧频率,截帧频率最高可以达到1s一帧,从而可以对于不同的视频流采用不同的监控强度,重点监控高危流,可以进一步降低使用成本。
实用的辅助功能
实际应用中独立的几张图片可能不足以作为认定违规的强有力的证据,结合视频直播平台的实时录制功能,可以实时的对于已经发现有问题的流启动录制,搜集证据,也方便人工复审。
语音审核
有些复杂的场景,比如涉政,可能主要的风险出现在言语上,并不是视觉上;有些主播为了避免被视频鉴黄抓到,退而求其次在言语上输出一些不雅内容,这都可以用过阿里云的语音识别来进行语音鉴黄,多维度的进行直播审核。
综述
阿里云视频直播审核可以方便的为用户提供直播视频审核的能力,大大的减少人力资源的耗费,提高审核效率,欢迎