# int8
--reset
--mb=2
--dir=FWD_B
--cfg=s8s8s32,s8s8s8,s8s8u8,u8s8s32,u8s8s8,u8s8u8
# output scales per oc are not supported
#--attr=oscale=per_oc:2.25;post_ops='sum:0.5;relu:0.5' --batch=ip_all
--attr=oscale=common:2.25;post_ops='sum:0.5;tanh' --batch=ip_all

# f32, bf16
--reset
--cfg=f32,bf16bf16bf16
--mb=2
--dir=FWD_B,BWD_D,BWD_WB --batch=ip_all

# f32 + post_ops
--reset
--cfg=f32
--mb=2
--dir=FWD_B,FWD_D
--attr=post_ops='sum:2.0;relu:3.0' --batch=ip_1d
--attr=post_ops='sum:2.0' --batch=ip_all
--attr=post_ops='linear:3.0:2.0' --batch=ip_1d

# f16
--reset
--cfg=f16
--mb=2
--dir=FWD_B,FWD_D
--attr=post_ops='linear:1.0:2.0' --batch=ip_1d

# bf16 + f32
--mb=2
--attr=
--dir=FWD_B
--cfg=bf16bf16f32 --batch=ip_all

--dir=BWD_D
--cfg=f32bf16bf16 --batch=ip_all

--dir=BWD_WB
--cfg=bf16f32bf16 --batch=ip_all

# bf16 + post_ops
--mb=2
--dir=FWD_B
--cfg=bf16bf16bf16,bf16bf16f32
--attr=post_ops='sum:0.5;relu:0.5' --batch=ip_all
--attr=post_ops='sum:0.5;tanh'     --batch=ip_all
