Skip to main content

Intro

ROI 感兴趣区域

ROI 的工作机制:

  1. 划分区域: 将画面分为“重要区域(ROI)”和“非重要区域(Background)”。
  2. 资源倾斜: 通过调整量化参数(QP, Quantization Parameter)来分配码率。
    • 给 ROI 区域分配更低的 QP 值(低压缩,高画质,占用更多码率)。
    • 给背景区域分配更高的 QP 值(高压缩,低画质/模糊,节省大量码率)。

核心收益: 在不增加甚至降低整体视频文件大小(带宽)的前提下,显著提升观众主观感知上的画质

## Smart ROI(智能感兴趣区域)是什么?

如果我们前面在 FFmpeg 里用坐标画框叫“传统 ROI”或“静态 ROI”,那么 Smart ROI 就是赋予了它“眼睛”和“大脑”

传统 ROI 的痛点在于:如果视频里的人走出了你设定的那个固定坐标框,ROI 就失效了。而 Smart ROI 利用计算机视觉(CV)*和*人工智能(AI)*技术,能够*动态、实时地识别并追踪画面中的关键元素。

Smart ROI 的三大核心特点:

  • 自动识别: 编码器前置了一个 AI 模型,它会自动分析每一帧画面。比如,它能瞬间识别出哪里是人脸、人体、车辆或者文字。
  • 动态追踪: 随着视频的播放,即使主角在画面中来回走动,Smart ROI 也会紧紧跟随,每一帧都重新计算并下发最新的 ROI 坐标和权重。
  • 无缝集成: 它通常作为一个预处理模块,与底层的 H.264/H.265 编码器深度绑定。AI 模块输出热力图或坐标,编码器直接按图调整 QP。