【问题标题】:How can I draw multiple(10000) cubes in the bevy game engine for my 3D voxel game?如何在 bevy 游戏引擎中为我的 3D 体素游戏绘制多个(10000)立方体?
【发布时间】:2021-03-13 01:40:37
【问题描述】:

当我在 bevy 中创建一个 100 x 100 的立方体块时,它只能保持 10 fps。
即使我用更简单的东西(如飞机)替换立方体,我也不会从中获得更好的性能。
我用 mangohud 对其进行了基准测试,它说我的 cpu 和 gpu 的使用率只有 20% 左右。

这是我使用 OpenSimplex 噪声生成 32 x 32 块的代码

    commands: &mut Commands,
    mut meshes: ResMut<Assets<Mesh>>,
    mut materials: ResMut<Assets<StandardMaterial>>,
    asset_server: Res<AssetServer>,
    seed: Res<Seed>,
) {
    let noise = OpenSimplex::new();

    commands
        .spawn(PbrBundle {
            mesh: meshes.add(Mesh::from(shape::Plane{ size: 1.0 })),
            material: materials.add(Color::rgb(0.5, 0.5, 1.0).into()),
            transform: Transform::from_translation(Vec3::new(0.0, 0.0, 0.0)),
            ..Default::default()
        })
        .with(Chunk)
        .with_children(|parent| {

        let texture_handle = asset_server.load("textures/dirt.png");
    
        for x in -32 .. 32 {
            for z in -32 .. 32 {
                let y = (noise.get([
                    ( x as f32 / 20. ) as f64, 
                    ( z as f32 / 20. ) as f64,
                    seed.value,
                ]) * 15. + 16.0) as u32;


                parent
                    .spawn(PbrBundle {
                        mesh: meshes.add(Mesh::from(shape::Cube{ size: 1.0 })),
                        material: materials.add(StandardMaterial { albedo: Color::rgba(1.0, 1.0, 1.0, 1.0), albedo_texture: Some(texture_handle.clone()), ..Default::default() }),
                        transform: Transform::from_translation(Vec3::new(x as f32, y as f32, z as f32)),
                        ..Default::default()
                    })
                .with(Cube);
            }
        }
    });
}

但 32 x 32 是可玩体验的绝对最大值。 我需要做什么才能同时绘制多个块?

系统规格:
cpu: Intel Core i7-6820HQ CPU @ 2.70GHz
igpu:英特尔高清显卡 530
dgpu:Nvidia Quadro M2000M

但是当卸载到更强大的 dgpu 时,我没有得到更好的性能。

【问题讨论】:

标签: rust game-engine game-development bevy


【解决方案1】:

一些立即可见的优化:

  • 将嵌套的for-loop 算法转换为单个for-loop
    • 它对缓存更友好。
    • 使用数学将现在的单个索引拆分为 x/y/z 值以确定位置。
  • 隐藏表面移除。
    • 在网格创建过程中,不是创建一个全新的立方体来添加到网格(6 个面、12 个三角形、24 个顶点),而是只将面(2 个三角形)添加到实际可见的网格中。 IE。那些在该方向上没有相邻不透明(非空气)块的那些。
  • 使用索引绘图而不是基于顶点的绘图
  • 使用 TextureAtlas。
    • 为每个立方体使用一个大纹理,而不是每个立方体使用一个纹理。

【讨论】:

  • 将嵌套循环转换为非嵌套循环不会提高性能,也不会改变算法的复杂性。
  • @Acorn 这取决于循环的尺寸,在这种情况下它们是相等的,但是平面循环比嵌套循环更适合缓存。
  • 不,它不取决于尺寸是否相等,我不确定您要说什么。循环是否嵌套,对于缓存来说都无关紧要,访问的局部性也无关紧要。
  • 纹理图集的建议也很奇怪。 OP 应该做的不是创建图集,而是重用纹理。
  • 我通过只生成平面而不是立方体来减少网格创建中的面,因此现在只渲染 200 个三角形而不是渲染 1200 个三角形。但这无济于事,因为我没有获得更多的单帧第二。这可能是引擎的某种限制吗? (贝维)
【解决方案2】:

这实际上是引擎故障,但随着 0.5.0 版本的发布会有所改善。

【讨论】:

最近更新 更多