【发布时间】:2017-12-20 00:27:05
【问题描述】:
AES-NI 似乎已针对加密/解密大块数据进行了优化。但是我正在尝试解密密码并且我有很多非常小的位要尝试(iv + 第一个 cbc 块,总共 32 个字节)。
我目前正在使用 openssl,每个周期调用 EVP_DecryptInit_ex、EVP_DecryptUpdate(每个线程调用一次 EVP_CIPHER_CTX_init)。
我可以在单核上每秒执行大约 200 万次。
我认为这是使用 AES-NI 指令可以预期的性能,我不应该担心进一步优化它。这是正确的吗?
有谁知道这在高端 GPU 或不太昂贵的 FPGA 上会快多少?
【问题讨论】: