Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

CPP版本多核性能测试分析 #6

Open
acely opened this issue Mar 1, 2023 · 6 comments
Open

CPP版本多核性能测试分析 #6

acely opened this issue Mar 1, 2023 · 6 comments
Assignees

Comments

@acely
Copy link

acely commented Mar 1, 2023

测试环境Rocky Linux 8,仅测试cpp版本结果(未测python版本)

简述:

在3台配置不同的机器上分别编译并测试,在fftw和onnxruntime版本都相同的前提下,识别同一个30分钟的音频文件,分别测试不同onnx线程数量的表现。
image

目前可以总结出大致规律:

  • 并非onnx线程数越多越好
  • 2线程比1线程提升显著,线程再多则提升较小
  • 线程数等于CPU物理核心数时效率最好

实操建议:

  • 大部分场景用3-4线程性价比最高
  • 低配机器用2线程合适
@znsoftm
Copy link
Member

znsoftm commented Mar 1, 2023

不错,感谢

@cgisky1980
Copy link

onnxruntime 看来要快不少

@cgisky1980
Copy link

测试了一下 RK3588 加载模型的时间略长 推理速度快很多
这里线程数怎么改的?

@znsoftm
Copy link
Member

znsoftm commented Mar 8, 2023

@znsoftm
Copy link
Member

znsoftm commented Mar 8, 2023

测试了一下 RK3588 加载模型的时间略长 推理速度快很多 这里线程数怎么改的?

加载时间长这个是必然的,模型比较大,嵌入板emmc也慢。 不过推理时很快。

@cgisky1980
Copy link

参见: https://github.com/RapidAI/RapidASR/blob/main/cpp_onnx/tester/tester.cpp

看到了 thx 4线程正好是RK3588上跑最佳配置

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants