【问题标题】:Non-audible videos with libwebm (VP8/Opus) -- Syncing audio --使用 libwebm (VP8/Opus) 的非音频视频 -- 同步音频 --
【发布时间】:2016-05-18 21:43:55
【问题描述】:

我正在尝试创建一个非常简单的 webm(vp8/opus) 编码器,但是我无法让音频正常工作。

ffprobe 确实检测文件格式和持续时间

Stream #1:0(eng): Audio: opus, 48000 Hz, mono, fltp (default)

视频可以在 VLC 和 Chrome 中正常播放,但没有音频,由于某种原因音频input bitrate 始终为 0

大部分音频编码代码都复制自 https://github.com/fnordware/AdobeWebM/blob/master/src/premiere/WebM_Premiere_Export.cpp

以下是相关代码:

static const long long kTimeScale = 1000000000LL;

MkvWriter writer;
writer.Open("video.webm");

Segment mux_seg;
mux_seg.Init(&writer);

// VPX encoding...

int16_t pcm[SAMPLES];
uint64_t audio_track_id = mux_seg.AddAudioTrack(SAMPLE_RATE, 1, 0);
mkvmuxer::AudioTrack *audioTrack = (mkvmuxer::AudioTrack*)mux_seg.GetTrackByNumber(audio_track_id);
audioTrack->set_codec_id(mkvmuxer::Tracks::kOpusCodecId);
audioTrack->set_seek_pre_roll(80000000);
OpusEncoder *encoder = opus_encoder_create(SAMPLE_RATE, 1, OPUS_APPLICATION_AUDIO, NULL);
opus_encoder_ctl(encoder, OPUS_SET_BITRATE(64000));
opus_int32 skip = 0;
opus_encoder_ctl(encoder, OPUS_GET_LOOKAHEAD(&skip));
audioTrack->set_codec_delay(skip * kTimeScale / SAMPLE_RATE);
mux_seg.CuesTrack(audio_track_id);
uint64_t currentAudioSample = 0;
uint64_t opus_ts = 0;
while(has_frame) {
  int bytes = opus_encode(encoder, pcm, SAMPLES, out, SAMPLES * 8);
  opus_ts = currentAudioSample * kTimeScale / SAMPLE_RATE;
  mux_seg.AddFrame(out, bytes, audio_track_id, opus_ts, true);
  currentAudioSample += SAMPLES;
}

opus_encoder_destroy(encoder);
mux_seg.Finalize();
writer.Close();

更新#1: 似乎问题在于WebM要求音频和视频轨道交错。 但是我不知道如何同步音频。 我应该计算帧持续时间,然后对等效的音频样本进行编码吗?

【问题讨论】:

    标签: c++ audio webm opus


    【解决方案1】:

    问题是我丢失了 OGG 标头数据,并且音频帧时间戳不准确。

    在这里完成答案是编码器的伪代码。

    const int kTicksPerSecond = 1000000000; // webm timescale
    const int kTimeScale = kTicksPerSecond / FPS;
    const int kTwoNanoSeconds = 1000000000;
    
    init_opus_encoder();
    audioTrack->set_seek_pre_roll(80000000);
    audioTrack->set_codec_delay(opus_preskip);
    audioTrack->SetCodecPrivate(ogg_header_data, ogg_header_size);
    
    while(has_video_frame) {
      encode_vpx_frame();
      video_pts = frame_index * kTimeScale;
      muxer_segment.addFrame(frame_packet_data, packet_length, video_track_id, video_pts, packet_flags);
      // fill the video frames gap with OPUS audio samples
      while(audio_pts < video_pts + kTimeScale) {
        encode_opus_frame();
        muxer_segment.addFrame(opus_frame_data, opus_frame_data_length, audio_track_id, audio_pts, true /* keyframe */);
        audio_pts = curr_audio_samples * kTwoNanoSeconds / 48000;
        curr_audio_samples += 960;
      }
    }
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2012-12-16
      • 1970-01-01
      • 2012-03-16
      • 2012-07-11
      • 1970-01-01
      • 2015-05-16
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多