【问题标题】:How to know the number of NAL unit in H.264 stream which represent a picture如何知道 H.264 流中代表图片的 NAL 单元的数量
【发布时间】:2015-04-18 00:46:46
【问题描述】:

我正在使用带有通过 avcodec 解码的 RTSP 上的 H.264 流的摄像机。对于大多数相机,接收到的每个数据包(NAL 单元)都代表一个完整的帧(I 帧或帧),当我对其进行解码时,我每次都会获得一个帧。 但是对于另一台相机,一个帧被分成许多恒定大小的 NAL 单元,当我解码每个数据包时,我没有得到每个数据包的帧。

我看到 NAL 单元中有一个开始和结束标志。除了 PPS 或 SPS,从不设置结束标志。不过,我可以检测开始代码,并在新帧开始时告诉每一帧结束。

我想在单个帧内缓冲每个 NAL 单元,然后将其发送到解码器(这用于记录功能并最大限度地减少帧索引)。

这里是一个例子(start_flags 在 NAL[1] 字节内是 128)

NALU: 10 bytes: SPS, NAL[1]={0,64,0,2} // Start Frame 1
NALU: 5 bytes: PPS, NAL[1]={128,64,0,14}
NALU: 551 bytes: I-Frame, NAL[1]={128,0,0,8}
NALU: 531 bytes: I-Frame, NAL[1]={0,0,0,9}
NALU: 532 bytes: I-Frame, NAL[1]={0,0,0,4}
NALU: 517 bytes: I-Frame, NAL[1]={0,0,0,7}
NALU: 533 bytes: I-Frame, NAL[1]={0,0,0,3}
NALU: 621 bytes: I-Frame, NAL[1]={0,0,0,3}
NALU: 586 bytes: I-Frame, NAL[1]={0,0,0,1}
NALU: 520 bytes: I-Frame, NAL[1]={0,0,0,1}
NALU: 507 bytes: I-Frame, NAL[1]={0,0,0,1}
NALU: 508 bytes: I-Frame, NAL[1]={0,0,0,1}
NALU: 531 bytes: I-Frame, NAL[1]={0,0,0,0}
NALU: 558 bytes: I-Frame, NAL[1]={0,0,0,0}
NALU: 49 bytes: I-Frame, NAL[1]={0,0,0,0} // Start Frame 2 + END Frame 1
NALU: 253 bytes: Frame, NAL[1]={128,0,0,26} // Start Frame 3 + END Frame 2
// Frame 2 start so we can record/decode Frame 1
NALU: 510 bytes: Frame, NAL[1]={128,0,0,26}
// Frame 3 start so we can record/decode Frame 2
NALU: 506 bytes: Frame, NAL[1]={0,0,0,1}
NALU: 267 bytes: Frame, NAL[1]={0,0,0,0} // Start Frame 4 + END Frame 3
NALU: 535 bytes: Frame, NAL[1]={128,0,0,26}
// Frame 4 start so we can record/decode Frame 3
NALU: 527 bytes: Frame, NAL[1]={0,0,0,4}
NALU: 509 bytes: Frame, NAL[1]={0,0,0,3}
NALU: 508 bytes: Frame, NAL[1]={0,0,0,1}
NALU: 519 bytes: Frame, NAL[1]={0,0,0,0}
NALU: 327 bytes: Frame, NAL[1]={0,0,0,0} // END Frame 4
...

但是,我似乎在某些流中遇到了一些麻烦。对于每个 NAL 单元代表一个帧的流,如果我仅在下一次开始时解码帧,RTSP 流似乎会丢弃一些 I 帧。我认为这是一个同步问题,因为可能是由于解码时间问题,因为问题没有发生是我直接接收时解码帧。

这里是我直接解码时的细节(一切正常):

NALU: 24 bytes: SPS, NAL[1]={0,64,0,13} // Start Frame 1
NALU: 4 bytes: PPS, NAL[1]={128,64,32,14}
NALU: 176124 bytes: Frame, NAL[1]={128,0,0,8}
// Decode Frame 1 OK
NALU: 24 bytes: SPS, NAL[1]={0,64,0,13}  // Start Frame 2
NALU: 4 bytes: PPS, NAL[1]={128,64,32,14}
NALU: 175605 bytes: I-Frame, NAL[1]={128,0,0,8}
// Decode Frame 2 OK
NALU: 38777 bytes: Frame, NAL[1]={128,0,0,26} // Start Frame 3
// Decode Frame 3 OK
NALU: 32188 bytes: Frame, NAL[1]={128,0,0,26} // Start Frame 4
// Decode Frame 4 OK
NALU: 24 bytes: SPS, NAL[1]={0,64,0,13} // Start Frame 5
NALU: 4 bytes: PPS, NAL[1]={128,64,32,14}
NALU: 175975 bytes: I-Frame, NAL[1]={128,0,0,8}
// Decode Frame 5 OK
NALU: 41681 bytes: Frame, NAL[1]={128,0,0,26} // Start Frame 6
// Decode Frame 6 OK

这里是我在每一帧开始后解码时的细节(有些帧没有解码):

NALU: 24 bytes: NAL[0]={0,3,7}, NAL[1]={0,64,0,13} // Start frame 1
NALU: 4 bytes: NAL[0]={0,3,8}, NAL[1]={128,64,32,14}
NALU: 177827 bytes: NAL[0]={0,3,1}, NAL[1]={128,0,0,8}
NALU: 24 bytes: NAL[0]={0,3,7}, NAL[1]={0,64,0,13} // Start frame 2 + End frame 1
// Decode Frame 1 OK
NALU: 4 bytes: NAL[0]={0,3,8}, NAL[1]={128,64,32,14}
NALU: 43304 bytes: NAL[0]={0,3,1}, NAL[1]={128,0,0,26}
NALU: 39115 bytes: NAL[0]={0,3,1}, NAL[1]={128,0,0,26} // Start frame 3 + End frame 2
// Decode Frame 2 OK
NALU: 24 bytes: NAL[0]={0,3,7}, NAL[1]={0,64,0,13} // Start frame 4 + End frame 3
// Decode Frame 3 OK
NALU: 4 bytes: NAL[0]={0,3,8}, NAL[1]={128,64,32,14} 
NALU: 49200 bytes: NAL[0]={0,3,1}, NAL[1]={128,0,0,26}
NALU: 41002 bytes: NAL[0]={0,3,1}, NAL[1]={128,0,0,26}  // Start frame 5 + End frame 4
// Decode Frame 4 failed
 NALU: 39581 bytes: NAL[0]={0,3,1}, NAL[1]={128,0,0,26}
// Decode Frame 5 failed

就像 RTSP 流(I-Frame)丢弃了某些帧

所以我的问题是:

  • 您认为 RTPS 会丢帧吗?
  • H.264 解码器是否期望在延迟内到达的帧被正确解码,尊重某些时间码或类似的东西?
  • 如何检测 NAL 单元是图片的最后一个,而不是等待下一个的开始。

感谢您的帮助

【问题讨论】:

    标签: c++ h.264 rtsp libavcodec


    【解决方案1】:

    首先,没有“结束标志”。只有附件 B 的起始码和其他格式的 NALU 大小(我相信 RTP 使用附件 B)。在 H.264 中,您所说的帧称为访问单元。对于每个访问单元,非视频编码层(非 VCL)NALUS 可选地在 VCL nalus 之前。因此,要确定是否拥有所有 VCL Nalus,必须解析每个 NALU 以确定将哪些宏块编码到切片中。通过使用从 SPS 解析的数据,您可以确定每帧有多少宏块。然后,一旦你收到了所有的宏块,你就可以解码帧了。

    【讨论】:

    • 谢谢。这对我来说更清楚了。 ;)。我会尽力解决这个问题。如果我需要信息,我会告诉你。
    • 您好,我试图处理您的信息。我成功解析了 SPS,并获得了宏块的大小。我还能够获得切片中第一个宏块的地址。不过,我不明白我怎么知道我得到了所有的宏块。如果我理解得很好,最后一个宏块可能不会发送(如果没有修改)。我也应该解析所有宏块吗?对于我真正需要的东西,这似乎很重。提前致谢。
    猜你喜欢
    • 1970-01-01
    • 2016-03-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多