久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

Ansys Fluent GPU求解器介紹

 基算仿真 2024-09-11 發(fā)布于廣西
高性能計算 (HPC) 一直是加速 CFD 仿真的關(guān)鍵推動因素之一,,GPU技術(shù)的發(fā)展對CFD的意義是革命性的。

其實在CFD領(lǐng)域利用GPU并不是一個新概念,,使用GPU加速CFD求解已經(jīng)有一段時間了(Ansys Fluent于2014年提供),,但傳統(tǒng)的GPU加速往往無法完全擺脫CPU進(jìn)行獨立計算,CPU和GPU之間的數(shù)據(jù)交換會造成相當(dāng)程度的性能損失,。

Ansys Fluent 在2021 R1版本開始提供了原生的GPU求解器,,可完全在 GPU上運行求解器代碼,避免了CPU和GPU之間交換數(shù)據(jù)的開銷以充分發(fā)揮 GPU的潛力,,與CPU求解器相比,,GPU求解器可以提高性能、降低硬件成本及功耗,。

例如對于一個上億網(wǎng)格的車輛外部空氣動力學(xué)仿真而言,,GPU求解器可以將求解效率提升5倍,如果使用多個GPU甚至可以提升至30倍,。

GPU求解器效率

同等性能的情況下,,GPU相較于CPU,能耗可以降低4倍甚至更多,。

相同性能下能耗對比

眾所周知,,GPU相較于CPU在數(shù)值精度和算法穩(wěn)定性上還存在一定的差距,但Fluent的GPU求解器有相當(dāng)高的精度,,例如對于經(jīng)典的球體擾流問題,,其阻力系數(shù)誤差僅為-0.252%。

求解精度

特別是對于工程應(yīng)用,,如果能通過GPU求解器在每項任務(wù)上節(jié)約幾小時,,那么全年下來節(jié)約的時間會十分可觀

支持的GPU和驅(qū)動程序

Fluent GPU求解器基于NVIDIA開發(fā)的CUDA API實現(xiàn)并行計算,因此只支持NVIDIA的GPU,。

支持的NVIDIA GPU包括NVIDIA Tesla和Quadro系列,,不同的GPU對操作系統(tǒng)也有一定的要求(64位版本的Linux或Windows)。

Fluent在2024 R1版本開始測試支持AMD gpu,包括AMD MI250

GPU加速支持列表

GPU求解器支持列表

Nvidia GPU的驅(qū)動程序必須兼容CUDA 11.0或更新版本,。

在cmd或終端輸入nvidia-smi,,可以檢查GPU型號、驅(qū)動版本,、CUDA版本等信息,。

參數(shù)信息

啟用Fluent GPU求解器

啟用Fluent的GPU求解器有兩種方法:

  • 使用Fluent啟動器

  • 使用命令行

使用Fluent啟動器

如圖所示,GPU求解器僅支持企業(yè)級許可,,切換至企業(yè)級許可后勾選本地GPU求解器選項即可,。

啟動GPU求解器

如果有多個GPU可以分別進(jìn)行控制,但指定的CPU進(jìn)程數(shù)量必須大于GPU數(shù),。


GPU分配

通過命令行啟動

對于Windows,,在從命令行啟動Fluent GPU求解器之前,通過執(zhí)行位于Ansys Fluent目錄中的setenv.exe程序(例如,,c: \ program Files\ Ansys Inc\v232\ Fluent \ntbin\win64),,確保到主目錄的路徑在命令搜索路徑環(huán)境變量中。

在命令行鍵入以下命令即可開啟GPU求解器

單精度
fluent 3d -tn -gpu 
雙精度
fluent 3ddp -tn -gpu

命令啟動

GPU求解器支持的功能

以下是GPU求解器支持的主要功能

基本:

  • 僅支持3D幾何

  • 支持單精度/雙精度

  • 支持可壓縮流動

  • 支持共軛傳熱

湍流模型:

  • Laminar

  • Standard ,、Realizable k-epsilon

  • k-omega GEKO 、 k-omega SST

  • Large Eddy Simulation (LES)

求解:

  • 支持基于壓力的求解器

  • 支持絕對速度形式

  • 支持瞬態(tài)和穩(wěn)態(tài)計算

邊界條件:

  • 支持壁面,、對稱,、平移周期對稱、旋轉(zhuǎn)周期對稱等邊界條件,。

  • 支持多孔介質(zhì)

  • 支持動網(wǎng)格,,旋轉(zhuǎn)坐標(biāo)

  • 支持源項

  • 支持組分輸運

GPU求解器的局限性

下面包含了當(dāng)前Fluent GPU(截止至2024R1)求解器的限制:

  • GPU求解器在Ansys Workbench環(huán)境中不可用。

  • 不支持圓柱坐標(biāo)系中的Profiles,,包括用于旋流入口的Profiles,。

  • 必須在初始化或求解之前定義監(jiān)視器(Monitors)和報告定義(Report definitions)。此外,,如果求解器設(shè)置從穩(wěn)定更改為瞬態(tài),,則可能需要重新定義報告定義。

  • 當(dāng)檢測固定壁面的動壓(Dynamic Pressure)時,,結(jié)果會為0,。但是,使用報告計算的結(jié)果將顯示一個不正確的非零值,。

  • GPU求解器支持靜態(tài)表達(dá)式(Static expressions),,但不推薦使用。

  • 使用 GPU 求解器模擬超音速流動時,,壓力入口,、速度入口和壓力出口處的流動將無法正確離散,在這些邊界類型處的流動將被視為亞音速流動,。

  • 在對不可壓縮或不可壓縮理想氣體材料進(jìn)行能量方程建模時,,基于cpu求解器和GPU求解器計算的溫度場可能不同,。這是由于兩個求解器在計算不可壓縮流時使用了不同的能量公式(總能量和熱能)。,、

  • 當(dāng)使用二階瞬態(tài)重新啟動模擬時,,求解器在重新啟動后的第一個時間步使用一階向后歐拉格式。

GPU求解器的顯存占用

Fluent GPU求解器的顯存消耗取決于案例的大小,、網(wǎng)格類型,、啟用的模型、精度和某些求解器設(shè)置,。

相較于內(nèi)存,,顯存往往更少且難以擴展,因此在計算前需要對算例的顯存占用進(jìn)行估計,。

通過以下幾點可以幫助估算顯存的占用情況:

  • 當(dāng)用六面體網(wǎng)格,,單精度,一百萬單元模擬湍流時,,需要約1GB的GPU內(nèi)存,。

  • 啟用雙精度將會提高50%顯存占用。

  • 多面體網(wǎng)格將會提高20%到40%的顯存占用,。

  • 在AMG求解器聚合類型中使用最大獨立集可以減少GPU20%到25%的顯存占用,。

  • 在控制臺中執(zhí)行以下命令為AMG求解器啟用最大獨立集:

(rpsetvar 'gpuapp/aggregation-method "mis")

參考資料

[1]

Ansys Fluent User's Guide: https://ansyshelp./Views/Secured/corp/v241/en/flu_ug/flu_ug.html

[2]

Graphical Display Cards Tested: https://www./content/dam/it-solutions/platform-support/2024-r1/ansys-2024-r1-graphical-display-graphics-cards-tested.pdf

[3]

GPU Accelerator Capabilities: https://www./content/dam/it-solutions/platform-support/2024-r1/ansys-2024-r1-gpu-accelerator-capabilities.pdf

[4]

GPU Compute Capabilities 2024 R1: https://www./content/dam/it-solutions/platform-support/2024-r1/ansys-2024-r1-gpu-compute-capabilities.pdf

[5]

Unleashing the Full Power of GPUs for Ansys Fluent, Part 1: https://www./blog/unleashing-the-full-power-of-gpus-for-ansys-fluent

[6]

Unleashing the Full Power of GPUs for Ansys Fluent, Part 2: https://www./blog/unleashing-the-full-power-of-gpus-for-ansys-fluent-part-2

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多