如上一个答案所述,您每次都在更新整个缓冲区,这取决于模型大小。
解决方案确实是实现部分更新,有两种可能,你想更新单个顶点,或者你想更新
任意索引(例如,您想一次性移动 N 个顶点,在不同的位置,例如顶点 1,20,23。
第一个解决方案相当简单,首先使用以下描述创建缓冲区:
Usage = D3D11_USAGE_DEFAULT;
CPUAccessFlags = 0;
BindFlags = D3D11_BIND_VERTEX_BUFFER;
ByteWidth = sizeof(ST_Vertex) * _nVertexCount
D3D11_SUBRESOURCE_DATA d3dBufferData;
d3dBufferData.pSysMem = pVerticesInfo;
hr = pd3dDevice->CreateBuffer(&descBuffer, &d3dBufferData, &_pVertexBuffer);
这可确保您的顶点缓冲区仅在 gpu 可见。
接下来创建一个具有单个顶点大小的第二个动态缓冲区(在这种情况下您不需要任何绑定标志,因为它只会用于副本)
_pCopyVertexBuffer
Usage = D3D11_USAGE_DYNAMIC; //Staging works as well
CPUAccessFlags = D3D11_CPU_ACCESS_WRITE;
BindFlags = 0;
ByteWidth = sizeof(ST_Vertex);
D3D11_SUBRESOURCE_DATA d3dBufferData;
d3dBufferData.pSysMem = NULL;
hr = pd3dDevice->CreateBuffer(&descBuffer, &d3dBufferData, &_pCopyVertexBuffer);
when you move a vertex, copy the changed vertex in the copy buffer :
ST_Vertex changedVertex;
D3D11_MAPPED_SUBRESOURCE d3dMappedResource;
pImmediateContext->Map(_pVertexBuffer, 0, D3D11_MAP_WRITE_DISCARD, 0, &d3dMappedResource);
ST_Vertex* pBuffer = (ST_Vertex*)d3dMappedResource.pData;
pBuffer->xfPosition.x = changedVertex.xfPosition.x;
pBuffer->.xfPosition.y = changedVertex.xfPosition.y;
pBuffer->.xfPosition.z = changedVertex.xfPosition.z;
pImmediateContext->Unmap(_pVertexBuffer, 0);
由于您使用 D3D11_MAP_WRITE_DISCARD,因此请确保将所有属性写入那里(不仅仅是位置)。
现在完成后,您可以使用ID3D11DeviceContext::CopySubresourceRegion 仅复制当前位置的修改顶点:
我假设 vertexID 是修改后顶点的索引:
pd3DeviceContext->CopySubresourceRegion(_pVertexBuffer,
0, //must be 0
vertexID * sizeof(ST_Vertex), //location of the vertex in you gpu vertex buffer
0, //must be 0
0, //must be 0
_pCopyVertexBuffer,
0, //must be 0
NULL //in this case we copy the full content of _pCopyVertexBuffer, so we can set to null
);
现在,如果您想更新顶点列表,事情会变得更加复杂,您有多种选择:
-首先你在一个循环中应用这个单顶点技术,如果你的变更集很小,这将工作得很好。
-如果您的变更集非常大(接近几乎完整的顶点大小,您可以改写整个缓冲区)。
-一种中间技术是使用计算着色器来执行更新(这是我通常使用的最灵活的版本)。
发布所有 c++ 绑定代码会太长,但这是概念:
- 您的顶点缓冲区必须有 BindFlags = D3D11_BIND_VERTEX_BUFFER | D3D11_BIND_UNORDERED_ACCESS; //这允许写wioth计算
- 您需要为此缓冲区创建一个 ID3D11UnorderedAccessView(以便着色器可以写入)
- 您需要以下其他标志:D3D11_RESOURCE_MISC_BUFFER_ALLOW_RAW_VIEWS //这允许写入为 RWByteAddressBuffer
- 然后您创建两个动态结构化缓冲区(我更喜欢那些超过 byteaddress 的缓冲区,但在 dx11 中不允许使用顶点缓冲区和结构化缓冲区,因此您需要使用原始缓冲区)
- 第一个结构化缓冲区的步长为 ST_Vertex(这是您的变更集)
- 第二个结构化缓冲区的步长为 4(uint,这些是索引)
- 两个结构化缓冲区都获得任意元素计数(通常我使用 1024 或 2048),因此这将是您一次可以更新的最大顶点数量。
- 两个结构化缓冲区都需要一个 ID3D11ShaderResourceView(着色器可见,只读)
那么更新过程如下:
- 在结构化缓冲区中写入修改后的顶点和位置(使用地图丢弃,如果您必须复制较少的话就可以了)
- 附加两个结构化缓冲区以供读取
- 附加 ID3D11UnorderedAccessView 进行写入
- 设置计算着色器
- 呼叫调度
- 分离 ID3D11UnorderedAccessView 以进行写入(这非常重要)
这是一个示例计算着色器代码(为简单起见,我假设您的顶点只是位置)
cbuffer cbUpdateCount : register(b0)
{
uint updateCount;
};
RWByteAddressBuffer RWVertexPositionBuffer : register(u0);
StructuredBuffer<float3> ModifiedVertexBuffer : register(t0);
StructuredBuffer<uint> ModifiedVertexIndicesBuffer : register(t0);
//this is the stride of your vertex buffer, since here we use float3 it is 12 bytes
#define WRITE_STRIDE 12
[numthreads(64, 1, 1)]
void CS( uint3 tid : SV_DispatchThreadID )
{
//make sure you do not go part element count, as here we runs 64 threads at a time
if (tid.x >= updateCount) { return; }
uint readIndex = tid.x;
uint writeIndex = ModifiedVertexIndicesBuffer[readIndex];
float3 vertex = ModifiedVertexBuffer[readIndex];
//byte address buffers do not understand float, asuint is a binary cast.
RWVertexPositionBuffer.Store3(writeIndex * WRITE_STRIDE, asuint(vertex));
}