金钊、陈勇-大气边界层湍流风生成方法DSRFG的计算效率研究.pdf

DSRFG,pdf,边界层,金钊,陈勇,学术文献
文档页数:7
文档大小:1.38MB
文档格式:pdf
文档分类:学术文献
上传会员:
上传日期:
最后更新:

第二十三届全国高层建筑结构学术会议论文2014年 大气边界层湍流风生成方法DSRFG的计算效率研究 金钊陈勇 (1.中国建筑东北设计研究院技术中心,沈阳110005) 提要:本文研究了大气边界层淄流风生成方法DSRFG的计算效率问题,分析了在FIuent软件上通过UDF应用 该方法时计算速度较低的原因,并提出了加速方法.

该方法把淄流风生成过程与主计算程序分离,由额外的并行 程序独立计算,并通过UDF实现风速数据的实时传递.

通过对比算例分析了加速方法的效率.

计算结果表明,应 用该方法可以有效的提高淄流风生成的速度,减少非稳态数值风润的分析时间.

关键词:结构抗风:大涡模拟:淄流边界层:计算风工程 1引言 计算风工程在过去的30年发展迅速,成为既风洞试验后研究建筑风荷载与风环境的新方法".

建筑物 处于大气边界层内部,淄流度与雷诺数较大,为了能尽量准确的模拟建筑物周围的流场以及表面的压强, 同时考虑到计算效率,计算风工程中常用各种淄流模型而不是使用直接模拟(DNS).

早期,基于雷诺平均 的RANS淄流模型被广泛的应用于稳态数值风洞的分析,主要用于建筑表面的风压系数、局部体型系数、 建筑周围风环境的分析.

但是仅有平均风荷载无法满足建筑抗风设计的需求.

除了平均风荷载外,结构 主体设计需要用到考虑结构振动响应的等效静力风荷载,幕墙等维护结构设计需要极值风压,对于较柔的 超高层建筑,有时还需要考虑流固耦合效应.

随着近年来计算机能力的飞快提升,将大涡模拟(LES)用于非稳态数值风润分析成为可能.

与RANS 方法不同,大涡模拟能够模拟钝体附近复杂的瞬态淄流流场,获得建筑表面的脉动风荷载时程,进而可以 用来研究建筑的风致动力响应.

且研究表明,在钝体绕流的分离区,LES可获得更准确的风压信息.

影响非稳态数值风润分析准确性的一个重要因素为计算域入口处来流脉动风场的生成.

生成的风场除 了要符合大气边界层的平均风剖面与淄流强度剖面外,还需要符合特定空间相关性与功率谱特征.

目前 常用的脉动风生成方法有预先生成法与人工合成法.

预先生成法的主要思路为在入口边界前设置一段独立 的辅助计算域,域内地面模仿风洞试验段设置粗糙元来制造淄流风.

该方法的优点为获得的入口风场满 足NS方程,缺点为计算时间比较长,生成各点的风速时程存储比较耗费存储资源.

人工合成法按合成方 式不同分为两种,一种是通过脉动风速的功率谱函数和空间相关性构造带有高斯随机系数项的三角级数序 列,脉动速度可以表达为一系列正弦和余弦函数.

该方法的优点是能够保证脉动风速的淄流特性,缺点为 连续性条件在生成过程中无法满足,须在时程数据生成后进一步处理”.

另一种方法是利用三维能谱 生成脉动风速时间序列,并与无散度空间向量叠加来模拟脉动入口条件.

该方法由Kraichnan首先提出, 而后Smirnov将淄流长度尺度和时间尺度加入了Kraichnan的基本公式中提出了RFG方法,该方法可生 成满足目标湍流长度尺度和时间尺度并满足连续方程的淄流风场,但该方法生成结果仅能满足Guass谱, 无法生成满足Karman谱或Daveport谱等更符合实际功率谱的风场.

黄生洪,李秋胜在Kraichnan与 基金项目:中国建筑股份有限公司科技研发基金项目(CSCEC-2010-Z-01-02) 作者简介:金划(1985.1),男,研士,助理工程师.

第二十三届全国高层建筑结构学术会议论文2014年 Smirmov工作的基础上,提出了DSRFG方法.

该方法将连续能谱离散,逐个构造风速时程,最后再将风速 合成.

DSRFG方法的主要优点为":1)严格满足连续性条件:2)基于严格的理论推导,具有通用性.

生成 的脉动风速场满足指定的谱函数:3)入口淄流的空间相关性可通过相关性尺度因子调整:4)每个坐标点 的淄流生成过程相互独立,适用于并行计算.

在风速生成速度上,预先生成法和第一种人工合成法效率较低,因而只能提前生成并存储,在正式模 拟时读取风速数据加在入口网格节点上.

遇到计算域尺寸、入口边界网格划分或者时间步长发生变化的 情况时就要重新生成或者进行插值处理.

而DSRFG方法中各空间点的生成相互独立,可进行并行处理,所 以生成速度高于前两者,在实际应用中可以与整个流场的分析同时进行.

本文对DSRFG方法的计算速度进行了深入研究,分析了文章"的算例中,淄流生成用时与流场模拟用 时相当的原因.

并提出了针对DSRFG淄流边界层风速风生成方法的加速方法.

该方法的基本思想是将淄流 风生成过程与主计算程序分离,由额外的并行程序独立计算,再痛过Fluent提供的UDF实现两程序间相 关数据的传递.

并通过实际算例分析了该方法的加速性能.

2 DSRFG 根据Kraichnan的研究,空间各向同性的淄流速度场可以通过下式来合成: u (x t)=[p²cos(kx ∞ )q sin(k²x )] (1) P”=ek”,q=e5²k (2) 式中:下标i j=1 2.3表示不同方向.

E是置换张量.

N(M.o)为均值为M以及标准差为的正 态分布.

为服从正态分布的频率样本.

k”为波数向量,其分布规律决定(1)式生成的速度场的能谱形 式,当k的取值各向同性的分布在三维圆球表面或者二维圆周上时,生成的能谱满足 E(k)=(3/2)v8(k-k)或E (k)=v8(k-k),其中v.

为脉动速度的标准差.

当k的取值满足均值 为k/2标准差为k.

/√3高斯分布时,生成的能谱满足: E(k)=16(2/π)v²k*kexp(k²/k²)(三维) (3) 或者 E(k) = 4.5k²kexp((3/ 2)k² / k²) (二维) (4) 在Kraichnan研究的基础上,黄生洪等人,提出了DSRFG方法,该方法可以生成符合任意功率谱的淄 流风速场.

从Kraichnan的研究中可以看出,脉动风速能谱E(k)或E (k)仅在k.

处不为零,因此可利用 这一特性构造满足任意能量谱的速度场.

对于任意给定的3D能谱E(k)有:
第二十三届全国高层建筑结构学术会议论文 2014年 E(k)= E(k)8(k-k)= E(k)8(k-k)= )8(k-k (5) e=1 对于每个E(k),其脉动速度场可采用Kraichnan的方法生成: m(x t)= cos(kx )q sin(kx )] (6) 其中k各向同性的分布在半径为k的圆球上,∈N(0 2πf),f=kUg 最终生成淄流风速时程表达式为(式中粗体字母表示向量): u(x 1) = u_(x 1)= [p"” cos(kx01)q sin(kx)] (7) m=1 x=] xk" 4E(k xk"" 4E(k) q” (8) xk"n N xk" N (9) Ls ∈ N(0 2π f) f=k_U (10) 式中,为向量形式的C”号”,f为频率,U为平均速度,Ls为淄流长度尺度.

DSRFG方法的 详细介绍见文缺".

100 DSRFG Kxmm音 S 10 100 频率f 图1DSRFG方法生成风速时程的功率谱与目标Karman谱比较 3DSRFG加速方法
第二十三届全国高层建筑结构学术会议论文2014年 3.1 UDF 版 DSRFG 文章对比了FIuent内置的RFG方法与DSRFG方法的计算效率,其中DSRFG通过UDF编程加入FIuent 参与计算(以下简称UDF法).入口边界面共有网格节点84x70=5880个,N=100,M=500,所以理论上DSRFG 模型采用大涡模拟.

每一时步需要的计算时间共78s,其中30s为流场的选代求解,28s为DSRFG计算, 20s为力监控.

整个4000个时步的计算共用了86小时,约有30小时用于DSRFG计算.

如果不考虑力监控 耗费的时间,DSRFG计算用时与整体流场分析时间相当,占总用时的48.28%.

而作为对比的RFG方法可以 节约30%的计算时间.

从上述算例中可以看出,用DSRFG作为入口处淄流风生成方法将会加倍模拟用时.

但在实际应用中发 现,将该方法编译为独立的应用程序时,计算速度会大幅提高.

3.2独立DSRFG程序 独立的DSRFG程序采用C语言编写,同时使用了OpenMPr进行并行化处理.

测试时仍采用上述算例的 5880个网格节点,N=100,L500,并考察了采用不同个数CPU进行并行计算的用时与并行加速比,结果如 图 2.

CRUB 图2独立DSRFG程序计算速度 (左图为不同并行CPU数计算一个时步的用时,右图为对应的并行加速比) 由图2可以看出,独立DSRFG程序的并行CPU数低于10核时,并行加速比近似成线性,并行效率大 于90%.

当CPU数大于10后,加速比不再增加而计算用时也不再减小.

分析原因为5880个节点等分为10 份以上后,每个线程负责的计算任务过少,导致OpenMP的线程操作用时占比例增加,所以并行效果不再 明显.

另外,12核并行计算的用时为1.81s,远小于文献中的28s.

可见独立的并行DSRFG程序计算速 度快于UDF法.

3.3原因分析 通过具体算例分析了UDF法与独立运行程序计算速度差别较大的原因,算例的具体布置与边界条件详 见4.1节,采用16核并行: 1)并行不充分: Fluent并行计算的方式为将整个计算域划分为并行核数个网格数尽量相等的子域,每个子域内的 计算由对应的CPU负责,不同子域交接处的数据通过MPI互相传递.

这种并行方式无法将DSRFG的计算充 分并行化,如表1所示,虽然整个计算域被划分16个子域,但是入口边界面仅划分了3个.

每一时步内, 当3个CPU在进行淄流风场生成时,其他13个CPU闲置等待.

另外,入口处划分的子域中各自包含的网 格节点数也存在差异,导致计算任务分配不平均(如表1).

2)CompliedUDF运行效率较低: 对比了在使用相同CPU数并行时,UDF与独立程序的计算用时,采用16核并行时,其中入口边界面仅 被分为3个子域.

独立程序同样采用3线程并行,每个线程负责的节点数与每一时步内用于DSRFG计算的
第二十三届全国高层建筑结构学术会议论文 2014年 用时见表1.

可见,即使在并行核数相同的情况下,独立程序的计算速度也要比UDF快很多.

表1相同并行CPU数的计算速度对比 UOF 独立程序 子域1(节点数) 2551 1960 子域2(节点数) 1543 1960 子域3(节点数) 1786 1960 计算用时 19.975s 6.046s 3.4与Fluent的结合 独立的DSRFG程序与FIuent无法直接读取各自进程中的数据,本文通过UDF实现两者间数据的传递.

考虑到用UDF实现进程等待时,各进程依然占用CPU资源,所以采用了FIuent与DSRFG同时进行计算的 方式.

既每一时间步内,Fluent进行流场分析,于此同时DSRFG程序生成下一时步入口处各网格节点的风 速,在两者都结束当前时步的计算后,应用UDF实现入口风场的更新(下文简称该方法为独立程序法), 如下图所示: DSRFG程序初始化入口边界风场 Fuent更新入口处各 节点风速并初始化 Fluent流场分析 内程 序间 DSRFG生成下时 步计 则入口边界风场 一时步 同步,两程序都完成后雅续 Fuent更新下时刻入口处各节点风速 图3独立程序法的分析流程图 4计算效率对比 首先,详细研究了应用本文提出的方法时,Fluent与DSRFG的CPU分配问题,以使资源分配最优化.

4.1计算域与网格划分 计算域大小和边界设置如图4所示,结构采用CAARC标准建筑模型,模型比尺为1:300.

B=0.1524m, D=0.1024m,H=0.6096m.

网格划分采用结构与非结构化网格混合方法,在建筑物附近的长方体区域内用四 面体网格,其他区域采用结构化网格(如图5).共布置网格168万,入口边界面上网格节点5880.

对非边界 对家边界 8D 22D 2H Outflow 80 对称地界 图4计算域布置与边界条件

资源链接请先登录(扫码可直接登录、免注册)
十二年老网站,真实资源!
高速直链,非网盘分享!浏览器直接下载、拒绝套路!
本站已在工信部及公安备案,真实可信!
手机扫码一键登录、无需填写资料及验证,支持QQ/微信/微博(建议QQ,支持手机快捷登录)
①升级会员方法:一键登录后->用户中心(右上角)->升级会员菜单
②注册登录、单独下载/升级会员、下载失败处理等任何问题,请加客服微信
不会操作?点此查看“会员注册登录方法”

投稿会员:匿名用户
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)