Commit c2718c4803

Jacob Young <jacobly0@users.noreply.github.com>
2025-02-06 14:08:54
x86_64: rewrite float `@mod`
1 parent 288d306
Changed files (2)
src
arch
test
behavior
x86_64
src/arch/x86_64/CodeGen.zig
@@ -2414,7 +2414,7 @@ fn genBodyBlock(self: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
 }
 
 fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
-    @setEvalBranchQuota(9_200);
+    @setEvalBranchQuota(9_600);
     const pt = cg.pt;
     const zcu = pt.zcu;
     const ip = &zcu.intern_pool;
@@ -2458,7 +2458,6 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
             .shl, .shl_exact => try cg.airShlShrBinOp(inst),
 
             .mul_wrap,
-            .mod,
             => |air_tag| try cg.airMulDivBinOp(inst, air_tag),
 
             .add_sat         => try cg.airAddSat(inst),
@@ -2522,7 +2521,6 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
             .intcast_safe,
             => return cg.fail("TODO implement safety_checked_instructions", .{}),
 
-            .mod_optimized => try cg.airMulDivBinOp(inst, .mod),
             .reduce_optimized => try cg.airReduce(inst),
             .int_from_float_optimized => try cg.airIntFromFloat(inst),
 
@@ -8983,6 +8981,2096 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                 };
                 try res[0].finish(inst, &.{ bin_op.lhs, bin_op.rhs }, &ops, cg);
             },
+            .mod, .mod_optimized => |air_tag| if (use_old) try cg.airMulDivBinOp(inst, .mod) else fallback: {
+                const bin_op = air_datas[@intFromEnum(inst)].bin_op;
+                if (cg.floatBits(cg.typeOf(bin_op.lhs).scalarType(zcu)) == null) break :fallback try cg.airMulDivBinOp(inst, .mod);
+                var ops = try cg.tempsFromOperands(inst, .{ bin_op.lhs, bin_op.rhs });
+                var res: [1]Temp = undefined;
+                cg.select(&res, &.{cg.typeOf(bin_op.lhs)}, &ops, comptime &.{ .{
+                    .required_features = .{ .f16c, .fast_imm16, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, .v_d, .mov, .tmp0d, .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp2d, .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3d, .tmp0d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp3d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .src1x, .tmp0d, ._, ._ },
+                        .{ ._, .v_ps, .cvtph2, .src0x, .src0q, ._, ._ },
+                        .{ ._, .v_ps, .cvtph2, .src1x, .src1q, ._, ._ },
+                        .{ ._, .v_ss, .add, .dst0x, .src0x, .src1d, ._ },
+                        .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .f16c, null, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, .v_d, .mov, .tmp0d, .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp2d, .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3d, .tmp0d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp3d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp3d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .src1x, .tmp0d, ._, ._ },
+                        .{ ._, .v_ps, .cvtph2, .src0x, .src0q, ._, ._ },
+                        .{ ._, .v_ps, .cvtph2, .src1x, .src1q, ._, ._ },
+                        .{ ._, .v_ss, .add, .dst0x, .src0x, .src1d, ._ },
+                        .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .avx, .fast_imm16, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, .v_d, .mov, .tmp0d, .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp2d, .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3d, .tmp0d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp3d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .src1x, .tmp0d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .avx, null, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, .v_d, .mov, .tmp0d, .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp2d, .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3d, .tmp0d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp3d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp3d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .src1x, .tmp0d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse2, .fast_imm16, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._d, .mov, .tmp0d, .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp2d, .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3d, .tmp0d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp3d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, ._d, .mov, .src1x, .tmp0d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse2, null, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._d, .mov, .tmp0d, .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp2d, .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3d, .tmp0d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp3d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp3d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, ._d, .mov, .src1x, .tmp0d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse, .fast_imm16, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f32, .kind = .mem },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f32, .kind = .mem },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._ss, .mov, .mem(.tmp0d), .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .mem(.tmp2d), .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3d, .mem(.tmp0d), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp3d, .mem(.tmp2d), ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .src1x, .mem(.tmp0d), ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse, null, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f32, .kind = .mem },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f32, .kind = .mem },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._ss, .mov, .mem(.tmp0d), .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .mem(.tmp2d), .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp3d, .mem(.tmp0d), ._, ._ },
+                        .{ ._, ._, .xor, .tmp3d, .mem(.tmp2d), ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .src1x, .mem(.tmp0d), ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .f16c, .fast_imm16, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0x, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .vp_, .xor, .tmp1x, .tmp1x, .tmp1x, ._ },
+                        .{ ._, .vp_w, .insr, .tmp1x, .tmp1x, .memia(.src0w, .tmp0, .add_unaligned_size), .ui(0) },
+                        .{ ._, ._, .movzx, .tmp2d, .memia(.src1w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6d, .tmp5d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, .v_ps, .cvtph2, .tmp1x, .tmp1x, ._, ._ },
+                        .{ ._, .v_ps, .cvtph2, .tmp3x, .tmp3x, ._, ._ },
+                        .{ ._, .v_ss, .add, .tmp1x, .tmp1x, .tmp3d, ._ },
+                        .{ ._, .v_, .cvtps2ph, .tmp1q, .tmp1x, .rm(.{}), ._ },
+                        .{ .@"1:", .vp_w, .extr, .memia(.dst0w, .tmp0, .add_unaligned_size), .tmp1x, .ui(0), ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(2), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .f16c, null, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0x, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .vp_, .xor, .tmp1x, .tmp1x, .tmp1x, ._ },
+                        .{ ._, .vp_w, .insr, .tmp1x, .tmp1x, .memia(.src0w, .tmp0, .add_unaligned_size), .ui(0) },
+                        .{ ._, ._, .movzx, .tmp2d, .memia(.src1w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6d, .tmp5d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, .v_ps, .cvtph2, .tmp1x, .tmp1x, ._, ._ },
+                        .{ ._, .v_ps, .cvtph2, .tmp3x, .tmp3x, ._, ._ },
+                        .{ ._, .v_ss, .add, .tmp1x, .tmp1x, .tmp3d, ._ },
+                        .{ ._, .v_, .cvtps2ph, .tmp1q, .tmp1x, .rm(.{}), ._ },
+                        .{ .@"1:", .vp_w, .extr, .memia(.dst0w, .tmp0, .add_unaligned_size), .tmp1x, .ui(0), ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(2), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .avx, .fast_imm16, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0x, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .vp_, .xor, .tmp1x, .tmp1x, .tmp1x, ._ },
+                        .{ ._, .vp_w, .insr, .tmp1x, .tmp1x, .memia(.src0w, .tmp0, .add_unaligned_size), .ui(0) },
+                        .{ ._, ._, .movzx, .tmp2d, .memia(.src1w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6d, .tmp5d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ .@"1:", .vp_w, .extr, .memia(.dst0w, .tmp0, .add_unaligned_size), .tmp1x, .ui(0), ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(2), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .avx, null, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0x, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .vp_, .xor, .tmp1x, .tmp1x, .tmp1x, ._ },
+                        .{ ._, .vp_w, .insr, .tmp1x, .tmp1x, .memia(.src0w, .tmp0, .add_unaligned_size), .ui(0) },
+                        .{ ._, ._, .movzx, .tmp2d, .memia(.src1w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6d, .tmp5d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ .@"1:", .vp_w, .extr, .memia(.dst0w, .tmp0, .add_unaligned_size), .tmp1x, .ui(0), ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(2), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse4_1, .fast_imm16, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0x, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .p_, .xor, .tmp1x, .tmp1x, ._, ._ },
+                        .{ ._, .p_w, .insr, .tmp1x, .memia(.src0w, .tmp0, .add_unaligned_size), .ui(0), ._ },
+                        .{ ._, ._, .movzx, .tmp2d, .memia(.src1w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6d, .tmp5d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ .@"1:", .p_w, .extr, .memia(.dst0w, .tmp0, .add_unaligned_size), .tmp1x, .ui(0), ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(2), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse4_1, null, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0x, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .p_, .xor, .tmp1x, .tmp1x, ._, ._ },
+                        .{ ._, .p_w, .insr, .tmp1x, .memia(.src0w, .tmp0, .add_unaligned_size), .ui(0), ._ },
+                        .{ ._, ._, .movzx, .tmp2d, .memia(.src1w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6d, .tmp5d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ .@"1:", .p_w, .extr, .memia(.dst0w, .tmp0, .add_unaligned_size), .tmp1x, .ui(0), ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(2), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse2, .fast_imm16, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0x, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .p_, .xor, .tmp1x, .tmp1x, ._, ._ },
+                        .{ ._, .p_w, .insr, .tmp1x, .memia(.src0w, .tmp0, .add_unaligned_size), .ui(0), ._ },
+                        .{ ._, ._, .movzx, .tmp2d, .memia(.src1w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6d, .tmp5d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ .@"1:", ._, .mov, .memia(.dst0w, .tmp0, .add_unaligned_size), .tmp5w, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(2), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse2, null, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f16, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f16, .kind = .{ .reg = .dx } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0x, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .p_, .xor, .tmp1x, .tmp1x, ._, ._ },
+                        .{ ._, .p_w, .insr, .tmp1x, .memia(.src0w, .tmp0, .add_unaligned_size), .ui(0), ._ },
+                        .{ ._, ._, .movzx, .tmp2d, .memia(.src1w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6d, .tmp5d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp6w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp3x, .tmp2d, ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ .@"1:", ._, .mov, .memia(.dst0w, .tmp0, .add_unaligned_size), .tmp5w, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(2), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse, .fast_imm16, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .f32, .kind = .mem },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f32, .kind = .mem },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0x, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._, .movzx, .tmp1d, .memia(.src0w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .mov, .mem(.tmp2d), .tmp1d, ._, ._ },
+                        .{ ._, ._ss, .mov, .tmp3x, .mem(.tmp2d), ._, ._ },
+                        .{ ._, ._, .movzx, .tmp1d, .memia(.src1w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .mov, .mem(.tmp2d), .tmp1d, ._, ._ },
+                        .{ ._, ._ss, .mov, .tmp4x, .mem(.tmp2d), ._, ._ },
+                        .{ ._, ._, .call, .tmp5d, ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .mem(.tmp6d), .tmp3x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp1d, .mem(.tmp2d), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp1w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp1d, .mem(.tmp6d), ._, ._ },
+                        .{ ._, ._, .cmp, .tmp1w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .tmp4x, .mem(.tmp2d), ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .mem(.tmp6d), .tmp3x, ._, ._ },
+                        .{ .@"1:", ._, .mov, .tmp1d, .mem(.tmp6d), ._, ._ },
+                        .{ ._, ._, .mov, .memia(.dst0w, .tmp0, .add_unaligned_size), .tmp1w, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(2), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse, null, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .{ .multiple_scalar_float = .{ .of = .word, .is = .word } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f16, .kind = .{ .reg = .ax } },
+                        .{ .type = .f32, .kind = .mem },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodh" } } },
+                        .{ .type = .f32, .kind = .mem },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addhf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0x, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._, .movzx, .tmp1d, .memia(.src0w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .mov, .mem(.tmp2d), .tmp1d, ._, ._ },
+                        .{ ._, ._ss, .mov, .tmp3x, .mem(.tmp2d), ._, ._ },
+                        .{ ._, ._, .movzx, .tmp1d, .memia(.src1w, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .mov, .mem(.tmp2d), .tmp1d, ._, ._ },
+                        .{ ._, ._ss, .mov, .tmp4x, .mem(.tmp2d), ._, ._ },
+                        .{ ._, ._, .call, .tmp5d, ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .mem(.tmp6d), .tmp3x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp1d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp1d, .mem(.tmp2d), ._, ._ },
+                        .{ ._, ._, .xor, .tmp1d, .mem(.tmp6d), ._, ._ },
+                        .{ ._, ._, .cmp, .tmp1w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .tmp4x, .mem(.tmp2d), ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .mem(.tmp6d), .tmp3x, ._, ._ },
+                        .{ .@"1:", ._, .mov, .tmp1d, .mem(.tmp6d), ._, ._ },
+                        .{ ._, ._, .mov, .memia(.dst0w, .tmp0, .add_unaligned_size), .tmp1w, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(2), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .avx, null, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .dword, .is = .dword } },
+                        .{ .scalar_float = .{ .of = .dword, .is = .dword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f32, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodf" } } },
+                        .{ .type = .f32, .kind = .{ .reg = .edx } },
+                        .{ .type = .f32, .kind = .{ .reg = .eax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, .v_d, .mov, .tmp0d, .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp2d, .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3d, .tmp0d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp3d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp3d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .src1x, .tmp0d, ._, ._ },
+                        .{ ._, .v_ss, .add, .dst0x, .src0x, .src1d, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse2, null, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .dword, .is = .dword } },
+                        .{ .scalar_float = .{ .of = .dword, .is = .dword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f32, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodf" } } },
+                        .{ .type = .f32, .kind = .{ .reg = .edx } },
+                        .{ .type = .f32, .kind = .{ .reg = .eax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._d, .mov, .tmp0d, .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp2d, .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3d, .tmp0d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp3d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp3d, .tmp2d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, ._d, .mov, .src1x, .tmp0d, ._, ._ },
+                        .{ ._, ._ss, .add, .dst0x, .src1d, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse, null, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .dword, .is = .dword } },
+                        .{ .scalar_float = .{ .of = .dword, .is = .dword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f32, .kind = .mem },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodf" } } },
+                        .{ .type = .f32, .kind = .mem },
+                        .{ .type = .f32, .kind = .{ .reg = .eax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._ss, .mov, .mem(.tmp0d), .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .mem(.tmp2d), .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3d, .tmp0d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp3d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp3d, .mem(.tmp2d), ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, ._ss, .add, .dst0x, .mem(.tmp0d), ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .avx, null, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .dword, .is = .dword } },
+                        .{ .multiple_scalar_float = .{ .of = .dword, .is = .dword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f32, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f32, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .f32, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodf" } } },
+                        .{ .type = .f32, .kind = .{ .reg = .edx } },
+                        .{ .type = .f32, .kind = .{ .reg = .eax } },
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .v_ss, .mov, .tmp1x, .memia(.src0d, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_ss, .mov, .tmp2x, .memia(.src1d, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp3d, .tmp2x, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6d, .tmp3d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6d, .tmp5d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp6d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .v_d, .mov, .tmp2x, .tmp3d, ._, ._ },
+                        .{ ._, .v_ss, .add, .tmp1x, .tmp1x, .tmp2d, ._ },
+                        .{ .@"1:", .v_ss, .mov, .memia(.dst0d, .tmp0, .add_unaligned_size), .tmp1x, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(4), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse2, null, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .dword, .is = .dword } },
+                        .{ .multiple_scalar_float = .{ .of = .dword, .is = .dword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f32, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f32, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .f32, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodf" } } },
+                        .{ .type = .f32, .kind = .{ .reg = .edx } },
+                        .{ .type = .f32, .kind = .{ .reg = .eax } },
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._ss, .mov, .tmp1x, .memia(.src0d, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._ss, .mov, .tmp2x, .memia(.src1d, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._d, .mov, .tmp3d, .tmp2x, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp5d, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6d, .tmp3d, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6d, .tmp5d, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp6d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._d, .mov, .tmp2x, .tmp3d, ._, ._ },
+                        .{ ._, ._ss, .add, .tmp1x, .tmp2d, ._, ._ },
+                        .{ .@"1:", ._ss, .mov, .memia(.dst0d, .tmp0, .add_unaligned_size), .tmp1x, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(4), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .sse, null, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .dword, .is = .dword } },
+                        .{ .multiple_scalar_float = .{ .of = .dword, .is = .dword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f32, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f32, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodf" } } },
+                        .{ .type = .f32, .kind = .mem },
+                        .{ .type = .f32, .kind = .{ .reg = .eax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._ss, .mov, .tmp1x, .memia(.src0d, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._ss, .mov, .tmp2x, .memia(.src1d, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ ._, ._ss, .mov, .mem(.tmp4d), .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp5d, .memia(.src1d, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp5d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp5d, .mem(.tmp4d), ._, ._ },
+                        .{ ._, ._, .cmp, .tmp5d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._ss, .add, .tmp1x, .memia(.src1d, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ .@"1:", ._ss, .mov, .memia(.dst0d, .tmp0, .add_unaligned_size), .tmp1x, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(4), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .avx, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .qword, .is = .qword } },
+                        .{ .scalar_float = .{ .of = .qword, .is = .qword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f64, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmod" } } },
+                        .{ .type = .f64, .kind = .{ .reg = .rcx } },
+                        .{ .type = .f64, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f64, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, .v_q, .mov, .tmp0q, .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp2q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, .v_q, .mov, .tmp3q, .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4q, .tmp0q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._, .xor, .tmp4q, .tmp3q, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .v_q, .mov, .src1q, .tmp0q, ._, ._ },
+                        .{ ._, .v_sd, .add, .dst0x, .src0x, .src1q, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse2, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .qword, .is = .qword } },
+                        .{ .scalar_float = .{ .of = .qword, .is = .qword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f64, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmod" } } },
+                        .{ .type = .f64, .kind = .{ .reg = .rcx } },
+                        .{ .type = .f64, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f64, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._q, .mov, .tmp0q, .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp2q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._q, .mov, .tmp3q, .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4q, .tmp0q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._, .xor, .tmp4q, .tmp3q, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, ._q, .mov, .src1x, .tmp0q, ._, ._ },
+                        .{ ._, ._sd, .add, .dst0x, .src1q, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .qword, .is = .qword } },
+                        .{ .scalar_float = .{ .of = .qword, .is = .qword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f64, .kind = .mem },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmod" } } },
+                        .{ .type = .f64, .kind = .mem },
+                        .{ .type = .f64, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f64, .kind = .{ .reg = .rax } },
+                        .{ .type = .f64, .kind = .{ .reg = .st6 } },
+                        .{ .type = .f64, .kind = .{ .reg = .st7 } },
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._ps, .movl, .mem(.tmp0q), .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp3q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._ps, .movl, .mem(.tmp2q), .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4q, .tmp0q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4q, .tmp3q, ._, ._ },
+                        .{ ._, ._, .xor, .tmp4q, .mem(.tmp2q), ._, ._ },
+                        .{ ._, ._, .cmp, .tmp4q, .tmp3q, ._, ._ },
+                        .{ ._, ._na, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .mem(.tmp2q), ._, ._, ._ },
+                        .{ ._, .f_, .ld, .mem(.tmp0q), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp2q), ._, ._, ._ },
+                        .{ ._, ._ps, .xor, .dst0x, .dst0x, ._, ._ },
+                        .{ ._, ._ps, .movl, .dst0x, .mem(.tmp2q), ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .avx, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .qword, .is = .qword } },
+                        .{ .multiple_scalar_float = .{ .of = .qword, .is = .qword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f64, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f64, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .f64, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmod" } } },
+                        .{ .type = .f64, .kind = .{ .reg = .rcx } },
+                        .{ .type = .f64, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f64, .kind = .{ .reg = .rax } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .v_sd, .mov, .tmp1x, .memia(.src0q, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_sd, .mov, .tmp2x, .memia(.src1q, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_q, .mov, .tmp3q, .tmp2x, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp5q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, .v_q, .mov, .tmp6q, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp7q, .tmp3q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp7q, .tmp5q, ._, ._ },
+                        .{ ._, ._, .xor, .tmp7q, .tmp6q, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp7q, .tmp5q, ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .v_q, .mov, .tmp2x, .tmp3q, ._, ._ },
+                        .{ ._, .v_sd, .add, .tmp1x, .tmp1x, .tmp2q, ._ },
+                        .{ .@"1:", .v_sd, .mov, .memia(.dst0q, .tmp0, .add_unaligned_size), .tmp1x, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(8), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse2, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .qword, .is = .qword } },
+                        .{ .multiple_scalar_float = .{ .of = .qword, .is = .qword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f64, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f64, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .f64, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmod" } } },
+                        .{ .type = .f64, .kind = .{ .reg = .rcx } },
+                        .{ .type = .f64, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f64, .kind = .{ .reg = .rax } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._sd, .mov, .tmp1x, .memia(.src0q, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._sd, .mov, .tmp2x, .memia(.src1q, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._q, .mov, .tmp3q, .tmp2x, ._, ._ },
+                        .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp5q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._q, .mov, .tmp6q, .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp7q, .tmp3q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp7q, .tmp5q, ._, ._ },
+                        .{ ._, ._, .xor, .tmp7q, .tmp6q, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp7q, .tmp5q, ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._q, .mov, .tmp2x, .tmp3q, ._, ._ },
+                        .{ ._, ._sd, .add, .tmp1x, .tmp2q, ._, ._ },
+                        .{ .@"1:", ._sd, .mov, .memia(.dst0q, .tmp0, .add_unaligned_size), .tmp1x, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(8), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .qword, .is = .qword } },
+                        .{ .multiple_scalar_float = .{ .of = .qword, .is = .qword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f64, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f64, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmod" } } },
+                        .{ .type = .f64, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f64, .kind = .mem },
+                        .{ .type = .f64, .kind = .{ .reg = .rax } },
+                        .{ .type = .f64, .kind = .{ .reg = .st6 } },
+                        .{ .type = .f64, .kind = .{ .reg = .st7 } },
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._ps, .xor, .tmp1x, .tmp1x, ._, ._ },
+                        .{ ._, ._ps, .xor, .tmp2x, .tmp2x, ._, ._ },
+                        .{ ._, ._ps, .movl, .tmp1x, .memia(.src0q, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._ps, .movl, .tmp2x, .memia(.src1q, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._ps, .movl, .mem(.tmp5q), .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6q, .memia(.src1q, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6q, .tmp4q, ._, ._ },
+                        .{ ._, ._, .xor, .tmp6q, .mem(.tmp5q), ._, ._ },
+                        .{ ._, ._, .cmp, .tmp6q, .tmp4q, ._, ._ },
+                        .{ ._, ._na, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .mem(.tmp5q), ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memia(.src1q, .tmp0, .add_unaligned_size), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp5q), ._, ._, ._ },
+                        .{ ._, ._ps, .xor, .tmp1x, .tmp1x, ._, ._ },
+                        .{ ._, ._ps, .movl, .tmp1x, .mem(.tmp5q), ._, ._ },
+                        .{ .@"1:", ._ps, .movl, .memia(.dst0q, .tmp0, .add_unaligned_size), .tmp1x, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(8), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .avx, .x87, .fast_imm16 },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .reg = .st0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, .v_dqa, .mov, .tmp0x, .mem(.src0x), ._, ._ },
+                        .{ ._, .v_dqa, .mov, .mem(.tmp1x), .tmp0x, ._, ._ },
+                        .{ ._, .v_dqa, .mov, .tmp0x, .mem(.src1x), ._, ._ },
+                        .{ ._, .v_dqa, .mov, .memd(.tmp1x, 16), .tmp0x, ._, ._ },
+                        .{ ._, ._, .call, .tmp2d, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .dst0t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp1t), ._, ._, ._ },
+                        .{ ._, ._, .movzx, .tmp4d, .memd(.tmp1w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp4w, .memd(.tmp1w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp1q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp4w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp1t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .avx, .x87, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .reg = .st0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, .v_dqa, .mov, .tmp0x, .mem(.src0x), ._, ._ },
+                        .{ ._, .v_dqa, .mov, .mem(.tmp1x), .tmp0x, ._, ._ },
+                        .{ ._, .v_dqa, .mov, .tmp0x, .mem(.src1x), ._, ._ },
+                        .{ ._, .v_dqa, .mov, .memd(.tmp1x, 16), .tmp0x, ._, ._ },
+                        .{ ._, ._, .call, .tmp2d, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .dst0t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp1t), ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4w, .memd(.tmp1w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp4w, .memd(.tmp1w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp1q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp4w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp1t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse2, .x87, .fast_imm16 },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .reg = .st0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._dqa, .mov, .tmp0x, .mem(.src0x), ._, ._ },
+                        .{ ._, ._dqa, .mov, .mem(.tmp1x), .tmp0x, ._, ._ },
+                        .{ ._, ._dqa, .mov, .tmp0x, .mem(.src1x), ._, ._ },
+                        .{ ._, ._dqa, .mov, .memd(.tmp1x, 16), .tmp0x, ._, ._ },
+                        .{ ._, ._, .call, .tmp2d, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .dst0t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp1t), ._, ._, ._ },
+                        .{ ._, ._, .movzx, .tmp4d, .memd(.tmp1w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp4w, .memd(.tmp1w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp1q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp4w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp1t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse2, .x87, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .reg = .st0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._dqa, .mov, .tmp0x, .mem(.src0x), ._, ._ },
+                        .{ ._, ._dqa, .mov, .mem(.tmp1x), .tmp0x, ._, ._ },
+                        .{ ._, ._dqa, .mov, .tmp0x, .mem(.src1x), ._, ._ },
+                        .{ ._, ._dqa, .mov, .memd(.tmp1x, 16), .tmp0x, ._, ._ },
+                        .{ ._, ._, .call, .tmp2d, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .dst0t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp1t), ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4w, .memd(.tmp1w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp4w, .memd(.tmp1w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp1q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp4w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp1t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse, .x87, .fast_imm16 },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .reg = .st0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._ps, .mova, .tmp0x, .mem(.src0x), ._, ._ },
+                        .{ ._, ._ps, .mova, .mem(.tmp1x), .tmp0x, ._, ._ },
+                        .{ ._, ._ps, .mova, .tmp0x, .mem(.src1x), ._, ._ },
+                        .{ ._, ._ps, .mova, .memd(.tmp1x, 16), .tmp0x, ._, ._ },
+                        .{ ._, ._, .call, .tmp2d, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .dst0t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp1t), ._, ._, ._ },
+                        .{ ._, ._, .movzx, .tmp4d, .memd(.tmp1w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp4w, .memd(.tmp1w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp1q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp4w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp1t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse, .x87, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .reg = .st0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._ps, .mova, .tmp0x, .mem(.src0x), ._, ._ },
+                        .{ ._, ._ps, .mova, .mem(.tmp1x), .tmp0x, ._, ._ },
+                        .{ ._, ._ps, .mova, .tmp0x, .mem(.src1x), ._, ._ },
+                        .{ ._, ._ps, .mova, .memd(.tmp1x, 16), .tmp0x, ._, ._ },
+                        .{ ._, ._, .call, .tmp2d, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .dst0t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp1t), ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4w, .memd(.tmp1w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp4w, .memd(.tmp1w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp1q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp4w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp1t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .avx, .x87, .fast_imm16 },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .v_dqa, .mov, .tmp1x, .memia(.src0x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_dqa, .mov, .mem(.tmp2x), .tmp1x, ._, ._ },
+                        .{ ._, .v_dqa, .mov, .tmp1x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_dqa, .mov, .memd(.tmp2x, 16), .tmp1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ .pseudo, .f_cstp, .de, ._, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .tmp4t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp2t), ._, ._, ._ },
+                        .{ ._, ._, .movzx, .tmp5d, .memd(.tmp2w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp5w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp5w, .memd(.tmp2w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp2q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp5w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp2t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                        .{ .@"1:", .f_p, .st, .memia(.dst0t, .tmp0, .add_unaligned_size), ._, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(16), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .avx, .x87, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .v_dqa, .mov, .tmp1x, .memia(.src0x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_dqa, .mov, .mem(.tmp2x), .tmp1x, ._, ._ },
+                        .{ ._, .v_dqa, .mov, .tmp1x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_dqa, .mov, .memd(.tmp2x, 16), .tmp1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ .pseudo, .f_cstp, .de, ._, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .tmp4t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp2t), ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp5d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp5w, .memd(.tmp2w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp5w, .memd(.tmp2w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp2q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp5w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp2t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                        .{ .@"1:", .f_p, .st, .memia(.dst0t, .tmp0, .add_unaligned_size), ._, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(16), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse2, .x87, .fast_imm16 },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._dqa, .mov, .tmp1x, .memia(.src0x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._dqa, .mov, .mem(.tmp2x), .tmp1x, ._, ._ },
+                        .{ ._, ._dqa, .mov, .tmp1x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._dqa, .mov, .memd(.tmp2x, 16), .tmp1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ .pseudo, .f_cstp, .de, ._, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .tmp4t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp2t), ._, ._, ._ },
+                        .{ ._, ._, .movzx, .tmp5d, .memd(.tmp2w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp5w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp5w, .memd(.tmp2w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp2q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp5w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp2t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                        .{ .@"1:", .f_p, .st, .memia(.dst0t, .tmp0, .add_unaligned_size), ._, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(16), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse2, .x87, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._dqa, .mov, .tmp1x, .memia(.src0x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._dqa, .mov, .mem(.tmp2x), .tmp1x, ._, ._ },
+                        .{ ._, ._dqa, .mov, .tmp1x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._dqa, .mov, .memd(.tmp2x, 16), .tmp1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ .pseudo, .f_cstp, .de, ._, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .tmp4t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp2t), ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp5d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp5w, .memd(.tmp2w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp5w, .memd(.tmp2w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp2q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp5w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp2t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                        .{ .@"1:", .f_p, .st, .memia(.dst0t, .tmp0, .add_unaligned_size), ._, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(16), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse, .x87, .fast_imm16 },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._ps, .mova, .tmp1x, .memia(.src0x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._ps, .mova, .mem(.tmp2x), .tmp1x, ._, ._ },
+                        .{ ._, ._ps, .mova, .tmp1x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._ps, .mova, .memd(.tmp2x, 16), .tmp1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ .pseudo, .f_cstp, .de, ._, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .tmp4t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp2t), ._, ._, ._ },
+                        .{ ._, ._, .movzx, .tmp5d, .memd(.tmp2w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp5w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .xor, .tmp5w, .memd(.tmp2w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp2q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp5w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp2t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                        .{ .@"1:", .f_p, .st, .memia(.dst0t, .tmp0, .add_unaligned_size), ._, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(16), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse, .x87, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .size = 16 * 2, .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f80, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f80, .kind = .{ .frame = .call_frame } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fmodx" } } },
+                        .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                        .{ .type = .f80, .kind = .{ .reg = .rax } },
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._ps, .mova, .tmp1x, .memia(.src0x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._ps, .mova, .mem(.tmp2x), .tmp1x, ._, ._ },
+                        .{ ._, ._ps, .mova, .tmp1x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._ps, .mova, .memd(.tmp2x, 16), .tmp1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ .pseudo, .f_cstp, .de, ._, ._, ._, ._ },
+                        .{ ._, .f_, .ld, .tmp4t, ._, ._, ._ },
+                        .{ ._, .f_p, .st, .mem(.tmp2t), ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp5d, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._, .@"and", .tmp5w, .memd(.tmp2w, 16 + 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp5w, .memd(.tmp2w, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp2q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp5w, .sa(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._nae, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .f_, .ld, .memd(.tmp2t, 16), ._, ._, ._ },
+                        .{ ._, .f_p, .add, ._, ._, ._, ._ },
+                        .{ .@"1:", .f_p, .st, .memia(.dst0t, .tmp0, .add_unaligned_size), ._, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(16), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .avx, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .xword, .is = .xword } },
+                        .{ .scalar_float = .{ .of = .xword, .is = .xword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f128, .kind = .mem },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodq" } } },
+                        .{ .type = .f128, .kind = .{ .reg = .rcx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addtf3" } } },
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, .v_dqa, .mov, .mem(.tmp0x), .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp2q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, .vp_q, .extr, .tmp3q, .dst0x, .ui(1), ._ },
+                        .{ ._, ._, .mov, .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4q, .memd(.tmp0q, 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp4q, .tmp3q, ._, ._ },
+                        .{ ._, .v_q, .mov, .tmp3q, .dst0x, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3q, .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._nae, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, .v_dqa, .mov, .src1x, .mem(.tmp0x), ._, ._ },
+                        .{ ._, ._, .call, .tmp5d, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse4_1, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .xword, .is = .xword } },
+                        .{ .scalar_float = .{ .of = .xword, .is = .xword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f128, .kind = .mem },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodq" } } },
+                        .{ .type = .f128, .kind = .{ .reg = .rcx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addtf3" } } },
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._dqa, .mov, .mem(.tmp0x), .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp2q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, .p_q, .extr, .tmp3q, .dst0x, .ui(1), ._ },
+                        .{ ._, ._, .mov, .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4q, .memd(.tmp0q, 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp4q, .tmp3q, ._, ._ },
+                        .{ ._, ._q, .mov, .tmp3q, .dst0x, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3q, .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._nae, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, ._dqa, .mov, .src1x, .mem(.tmp0x), ._, ._ },
+                        .{ ._, ._, .call, .tmp5d, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse2, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .xword, .is = .xword } },
+                        .{ .scalar_float = .{ .of = .xword, .is = .xword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f128, .kind = .mem },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodq" } } },
+                        .{ .type = .f128, .kind = .{ .reg = .rcx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addtf3" } } },
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._dqa, .mov, .mem(.tmp0x), .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp2q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, .p_d, .shuf, .src1x, .dst0x, .ui(0b11_10_11_10), ._ },
+                        .{ ._, ._q, .mov, .tmp3q, .src1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4q, .memd(.tmp0q, 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp4q, .tmp3q, ._, ._ },
+                        .{ ._, ._q, .mov, .tmp3q, .dst0x, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp3q, .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._nae, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, ._dqa, .mov, .src1x, .mem(.tmp0x), ._, ._ },
+                        .{ ._, ._, .call, .tmp5d, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse, null, null },
+                    .src_constraints = .{
+                        .{ .scalar_float = .{ .of = .xword, .is = .xword } },
+                        .{ .scalar_float = .{ .of = .xword, .is = .xword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .{ .to_reg = .xmm0 }, .{ .to_reg = .xmm1 }, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .f128, .kind = .mem },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodq" } } },
+                        .{ .type = .f128, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f128, .kind = .mem },
+                        .{ .type = .f128, .kind = .{ .reg = .rax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addtf3" } } },
+                        .unused,
+                        .unused,
+                        .unused,
+                    },
+                    .dst_temps = .{.{ .ref = .src0 }},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._ps, .mova, .mem(.tmp0x), .src1x, ._, ._ },
+                        .{ ._, ._, .call, .tmp1d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp2q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._ps, .mova, .mem(.tmp3x), .dst0x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp4q, .memd(.tmp0q, 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp4q, .memd(.tmp3q, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp3q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp4q, .tmp2q, ._, ._ },
+                        .{ ._, ._nae, .j, .@"0f", ._, ._, ._ },
+                        .{ ._, ._ps, .mova, .src1x, .mem(.tmp0x), ._, ._ },
+                        .{ ._, ._, .call, .tmp5d, ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .avx, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .xword } },
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .xword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f128, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f128, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodq" } } },
+                        .{ .type = .f128, .kind = .{ .reg = .rcx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addtf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", .v_dqa, .mov, .tmp1x, .memia(.src0x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, .v_dqa, .mov, .tmp2x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, .vp_q, .extr, .tmp5q, .tmp1x, .ui(1), ._ },
+                        .{ ._, ._, .mov, .tmp6q, .tmp4q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6q, .memiad(.src1q, .tmp0, .add_unaligned_size, 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6q, .tmp5q, ._, ._ },
+                        .{ ._, .v_q, .mov, .tmp5q, .tmp1x, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp5q, .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp6q, .tmp4q, ._, ._ },
+                        .{ ._, ._nae, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, .v_dqa, .mov, .tmp2x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ .@"1:", .v_dqa, .mov, .memia(.dst0x, .tmp0, .add_unaligned_size), .tmp1x, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(16), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse4_1, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .xword } },
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .xword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f128, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f128, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodq" } } },
+                        .{ .type = .f128, .kind = .{ .reg = .rcx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addtf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._dqa, .mov, .tmp1x, .memia(.src0x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._dqa, .mov, .tmp2x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, .p_q, .extr, .tmp5q, .tmp1x, .ui(1), ._ },
+                        .{ ._, ._, .mov, .tmp6q, .tmp4q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6q, .memiad(.src1q, .tmp0, .add_unaligned_size, 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6q, .tmp5q, ._, ._ },
+                        .{ ._, ._q, .mov, .tmp5q, .tmp1x, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp5q, .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp6q, .tmp4q, ._, ._ },
+                        .{ ._, ._nae, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._dqa, .mov, .tmp2x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ .@"1:", ._dqa, .mov, .memia(.dst0x, .tmp0, .add_unaligned_size), .tmp1x, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(16), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse2, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .xword } },
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .xword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f128, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f128, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodq" } } },
+                        .{ .type = .f128, .kind = .{ .reg = .rcx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f128, .kind = .{ .reg = .rax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addtf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._dqa, .mov, .tmp1x, .memia(.src0x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._dqa, .mov, .tmp2x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, .p_d, .shuf, .tmp2x, .tmp1x, .ui(0b11_10_11_10), ._ },
+                        .{ ._, ._q, .mov, .tmp5q, .tmp2x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6q, .tmp4q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6q, .memiad(.src1q, .tmp0, .add_unaligned_size, 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6q, .tmp5q, ._, ._ },
+                        .{ ._, ._q, .mov, .tmp5q, .tmp1x, ._, ._ },
+                        .{ ._, ._, .cmp, .tmp5q, .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp6q, .tmp4q, ._, ._ },
+                        .{ ._, ._nae, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._dqa, .mov, .tmp2x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ .@"1:", ._dqa, .mov, .memia(.dst0x, .tmp0, .add_unaligned_size), .tmp1x, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(16), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                }, .{
+                    .required_features = .{ .@"64bit", .sse, null, null },
+                    .src_constraints = .{
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .xword } },
+                        .{ .multiple_scalar_float = .{ .of = .xword, .is = .xword } },
+                        .any,
+                    },
+                    .patterns = &.{
+                        .{ .src = .{ .to_mem, .to_mem, .none } },
+                    },
+                    .call_frame = .{ .alignment = .@"16" },
+                    .extra_temps = .{
+                        .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
+                        .{ .type = .f128, .kind = .{ .reg = .xmm0 } },
+                        .{ .type = .f128, .kind = .{ .reg = .xmm1 } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fmodq" } } },
+                        .{ .type = .f128, .kind = .{ .reg = .rdx } },
+                        .{ .type = .f128, .kind = .mem },
+                        .{ .type = .f128, .kind = .{ .reg = .rax } },
+                        .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__addtf3" } } },
+                        .unused,
+                    },
+                    .dst_temps = .{.mem},
+                    .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                    .each = .{ .once = &.{
+                        .{ ._, ._, .mov, .tmp0p, .sa(.src0, .sub_unaligned_size), ._, ._ },
+                        .{ .@"0:", ._ps, .mova, .tmp1x, .memia(.src0x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._ps, .mova, .tmp2x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .call, .tmp3d, ._, ._, ._ },
+                        .{ ._, ._, .mov, .tmp4q, .ua(.src0, .add_smin), ._, ._ },
+                        .{ ._, ._ps, .mova, .mem(.tmp5x), .tmp1x, ._, ._ },
+                        .{ ._, ._, .mov, .tmp6q, .tmp4q, ._, ._ },
+                        .{ ._, ._, .@"and", .tmp6q, .memiad(.src1q, .tmp0, .add_unaligned_size, 8), ._, ._ },
+                        .{ ._, ._, .xor, .tmp6q, .memd(.tmp5q, 8), ._, ._ },
+                        .{ ._, ._, .cmp, .mem(.tmp5q), .si(1), ._, ._ },
+                        .{ ._, ._, .sbb, .tmp6q, .tmp4q, ._, ._ },
+                        .{ ._, ._nae, .j, .@"1f", ._, ._, ._ },
+                        .{ ._, ._ps, .mova, .tmp2x, .memia(.src1x, .tmp0, .add_unaligned_size), ._, ._ },
+                        .{ ._, ._, .call, .tmp7d, ._, ._, ._ },
+                        .{ .@"1:", ._ps, .mova, .memia(.dst0x, .tmp0, .add_unaligned_size), .tmp1x, ._, ._ },
+                        .{ ._, ._, .add, .tmp0p, .si(16), ._, ._ },
+                        .{ ._, ._nc, .j, .@"0b", ._, ._, ._ },
+                    } },
+                } }) catch |err| switch (err) {
+                    error.SelectFailed => return cg.fail("failed to select {s} {} {} {}", .{
+                        @tagName(air_tag),
+                        cg.typeOf(bin_op.lhs).fmt(pt),
+                        ops[0].tracking(cg),
+                        ops[1].tracking(cg),
+                    }),
+                    else => |e| return e,
+                };
+                try res[0].finish(inst, &.{ bin_op.lhs, bin_op.rhs }, &ops, cg);
+            },
             .ptr_add => |air_tag| if (use_old) try cg.airPtrArithmetic(inst, air_tag) else {
                 const ty_pl = air_datas[@intFromEnum(inst)].ty_pl;
                 const bin_op = cg.air.extraData(Air.Bin, ty_pl.payload).data;
@@ -68831,6 +70919,7 @@ const Select = struct {
             const sub_src0_elem_size_times_src1: Adjust = .{ .sign = .neg, .lhs = .src0_elem_size_times_src1, .op = .mul, .rhs = .@"1" };
             const add_log2_src0_elem_size: Adjust = .{ .sign = .pos, .lhs = .log2_src0_elem_size, .op = .mul, .rhs = .@"1" };
             const add_elem_limbs: Adjust = .{ .sign = .pos, .lhs = .elem_limbs, .op = .mul, .rhs = .@"1" };
+            const add_smin: Adjust = .{ .sign = .pos, .lhs = .smin, .op = .mul, .rhs = .@"1" };
             const add_umax: Adjust = .{ .sign = .pos, .lhs = .umax, .op = .mul, .rhs = .@"1" };
         };
         const Ref = enum(u4) {
test/behavior/x86_64/math.zig
@@ -11479,6 +11479,45 @@ test rem {
     try test_rem.testFloatVectors();
 }
 
+inline fn mod(comptime Type: type, lhs: Type, rhs: Type) Type {
+    if (@inComptime()) {
+        const scalarMod = struct {
+            fn scalarMod(scalar_lhs: Scalar(Type), scalar_rhs: Scalar(Type)) Scalar(Type) {
+                // workaround https://github.com/ziglang/zig/issues/22748
+                if (scalar_rhs == 0) return nan(Scalar(Type));
+                const scalar_rem = @rem(scalar_lhs, scalar_rhs);
+                return if (scalar_rem == 0 or math.signbit(scalar_rem) == math.signbit(scalar_rhs)) scalar_rem else scalar_rem + scalar_rhs;
+            }
+        }.scalarMod;
+        // workaround https://github.com/ziglang/zig/issues/22748
+        switch (@typeInfo(Type)) {
+            // workaround llvm backend bugs
+            // TODO: else => return if (rhs != 0) @mod(lhs, rhs) else nan(Type),
+            // TODO: .vector => |info| {
+            // TODO:     var res: Type = undefined;
+            // TODO:     inline for (0..info.len) |i| res[i] = if (rhs[i] != 0) @mod(lhs[i], rhs[i]) else nan(Scalar(Type));
+            // TODO:     return res;
+            // TODO: },
+            else => return scalarMod(lhs, rhs),
+            .vector => |info| {
+                var res: Type = undefined;
+                inline for (0..info.len) |i| res[i] = scalarMod(lhs[i], rhs[i]);
+                return res;
+            },
+        }
+    }
+    // workaround https://github.com/ziglang/zig/issues/22748
+    // TODO: return @mod(lhs, rhs);
+    var rt_rhs = rhs;
+    _ = &rt_rhs;
+    return @mod(lhs, rt_rhs);
+}
+test mod {
+    const test_mod = binary(mod, .{});
+    try test_mod.testFloats();
+    try test_mod.testFloatVectors();
+}
+
 inline fn bitNot(comptime Type: type, rhs: Type) @TypeOf(~rhs) {
     return ~rhs;
 }