--reset

--sdt=f32,s32,s8,u8
--ddt=f32,s32,s8,u8
--dtag=undef,nchw,nhwc,nChw8c,nChw16c
--stag=nchw:nchw       --axis=3 3x4x5x13:3x4x5x17
--stag=nhwc:nhwc       --axis=2 5x2x0x8:5x2x8x8
--stag=nChw8c:nChw8c   --axis=1 7x8x4x9:7x8x4x9 7x8x4x9:7x9x4x9 7x9x4x9:7x8x4x9 7x9x4x9:7x9x4x9
--stag=nChw16c:nChw16c --axis=1 4x16x2x1:4x16x2x1 4x16x2x1:4x15x2x1 4x15x2x1:4x16x2x1 4x15x2x1:4x15x2x1

--sdt=f32,s32
--ddt=f32,s32
--dtag=undef,ncdhw,ndhwc,nCdhw8c,nCdhw16c
--stag=nCdhw16c:ncdhw:ndhwc --axis=1
6x48x3x4x5:6x32x3x4x5:6x16x3x4x5
6x48x3x4x5:6x31x3x4x5:6x16x3x4x5
6x47x3x4x5:6x33x3x4x5:6x15x3x4x5

# sizes less than blocks (+zero dim)
--sdt=f32,s32,s8
--ddt=f32,s32,s8
--dtag=undef,nhwc,nChw16c
--stag=nChw16c:nchw:nChw8c:nhwc --axis=1
6x8x3x4:6x2x3x4:6x3x3x4:6x0x3x4
6x8x3x4:6x1x3x4:6x0x3x4:6x3x3x4
6x0x3x4:6x3x3x4:6x5x3x4:6x5x3x4

# bf16
--batch=test_concat_bfloat16
