Commit 114a4eaf5c

Jacob Young <jacobly0@users.noreply.github.com>
2025-05-28 04:23:51
x86_64: implement optimized float `@reduce(.Min)`
1 parent 8bacf3e
Changed files (3)
src
test
behavior
x86_64
src/arch/x86_64/CodeGen.zig
@@ -2389,7 +2389,7 @@ fn genBodyBlock(self: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
 }
 
 fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
-    @setEvalBranchQuota(26_500);
+    @setEvalBranchQuota(26_800);
     const pt = cg.pt;
     const zcu = pt.zcu;
     const ip = &zcu.intern_pool;
@@ -142846,14 +142846,14 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                     }, .{
                         .required_features = .{ .x87, null, null, null },
                         .dst_constraints = .{ .{ .float = .tbyte }, .any },
-                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .qword, .is = .tbyte } }, .any, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } }, .any, .any },
                         .patterns = &.{
                             .{ .src = .{ .to_mem, .none, .none } },
                         },
                         .extra_temps = .{
                             .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
-                            .{ .type = .f80, .kind = .{ .reg = .st6 } },
                             .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                            .{ .type = .f80, .kind = .{ .reg = .st6 } },
                             .unused,
                             .unused,
                             .unused,
@@ -142863,7 +142863,7 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                             .unused,
                             .unused,
                         },
-                        .dst_temps = .{ .mem, .unused },
+                        .dst_temps = .{ .{ .rc = .x87 }, .unused },
                         .clobbers = .{ .eflags = true },
                         .each = .{ .once = &.{
                             .{ ._, ._, .mov, .tmp0p, .sia(16, .src0, .sub_unaligned_size), ._, ._ },
@@ -146385,14 +146385,14 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                     }, .{
                         .required_features = .{ .x87, null, null, null },
                         .dst_constraints = .{ .{ .float = .tbyte }, .any },
-                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .qword, .is = .tbyte } }, .any, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } }, .any, .any },
                         .patterns = &.{
                             .{ .src = .{ .to_mem, .none, .none } },
                         },
                         .extra_temps = .{
                             .{ .type = .isize, .kind = .{ .rc = .general_purpose } },
-                            .{ .type = .f80, .kind = .{ .reg = .st6 } },
                             .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                            .{ .type = .f80, .kind = .{ .reg = .st6 } },
                             .unused,
                             .unused,
                             .unused,
@@ -146402,7 +146402,7 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                             .unused,
                             .unused,
                         },
-                        .dst_temps = .{ .mem, .unused },
+                        .dst_temps = .{ .{ .rc = .x87 }, .unused },
                         .clobbers = .{ .eflags = true },
                         .each = .{ .once = &.{
                             .{ ._, ._, .mov, .tmp0p, .sia(16, .src0, .sub_unaligned_size), ._, ._ },
@@ -146531,32 +146531,19 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                 try res[0].finish(inst, &.{reduce.operand}, &ops, cg);
             },
             .reduce_optimized => |air_tag| if (use_old) try cg.airReduce(inst) else fallback: {
+                const inf = std.math.inf(f16);
                 const reduce = air_datas[@intFromEnum(inst)].reduce;
                 switch (reduce.operation) {
                     .And, .Or, .Xor => unreachable,
-                    .Min, .Max => break :fallback try cg.airReduce(inst),
+                    .Min => {},
+                    .Max => break :fallback try cg.airReduce(inst),
                     .Add, .Mul => {},
                 }
                 var ops = try cg.tempsFromOperands(inst, .{reduce.operand});
                 var res: [1]Temp = undefined;
                 cg.select(&res, &.{cg.typeOfIndex(inst)}, &ops, switch (reduce.operation) {
                     .And, .Or, .Xor => unreachable,
-                    .Min, .Max => unreachable,
-                    .Add => comptime &.{ .{
-                        .required_features = .{ .f16c, .fast_hops, null, null },
-                        .dst_constraints = .{ .{ .float = .word }, .any },
-                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .dword, .is = .word } }, .any, .any },
-                        .patterns = &.{
-                            .{ .src = .{ .mem, .none, .none } },
-                            .{ .src = .{ .to_sse, .none, .none } },
-                        },
-                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
-                        .each = .{ .once = &.{
-                            .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
-                            .{ ._, .vh_ps, .add, .dst0x, .dst0x, .dst0x, ._ },
-                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
-                        } },
-                    }, .{
+                    .Min => comptime &.{ .{
                         .required_features = .{ .f16c, null, null, null },
                         .dst_constraints = .{ .{ .float = .word }, .any },
                         .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .dword, .is = .word } }, .any, .any },
@@ -146581,36 +146568,7 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                         .each = .{ .once = &.{
                             .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
                             .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b01) },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
-                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
-                        } },
-                    }, .{
-                        .required_features = .{ .f16c, .fast_hops, null, null },
-                        .dst_constraints = .{ .{ .float = .word }, .any },
-                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .qword, .is = .word } }, .any, .any },
-                        .patterns = &.{
-                            .{ .src = .{ .mem, .none, .none } },
-                            .{ .src = .{ .to_sse, .none, .none } },
-                        },
-                        .extra_temps = .{
-                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                        },
-                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
-                        .each = .{ .once = &.{
-                            .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
-                            .{ ._, .vh_ps, .add, .tmp0x, .dst0x, .dst0x, ._ },
-                            .{ ._, .v_ps, .shuf, .dst0x, .dst0x, .dst0x, .ui(0b11_10) },
-                            .{ ._, .v_ss, .add, .dst0x, .tmp0x, .dst0x, ._ },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp0x, ._ },
                             .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
                         } },
                     }, .{
@@ -146638,24 +146596,9 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                         .each = .{ .once = &.{
                             .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
                             .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b11_10) },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp0x, ._ },
                             .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b01) },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
-                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
-                        } },
-                    }, .{
-                        .required_features = .{ .f16c, .fast_hops, null, null },
-                        .dst_constraints = .{ .{ .float = .word }, .any },
-                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .qword, .is = .word } }, .any, .any },
-                        .patterns = &.{
-                            .{ .src = .{ .mem, .none, .none } },
-                            .{ .src = .{ .to_sse, .none, .none } },
-                        },
-                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
-                        .each = .{ .once = &.{
-                            .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
-                            .{ ._, .vh_ps, .add, .dst0x, .dst0x, .dst0x, ._ },
-                            .{ ._, .vh_ps, .add, .dst0x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp0x, ._ },
                             .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
                         } },
                     }, .{
@@ -146683,40 +146626,9 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                         .each = .{ .once = &.{
                             .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
                             .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b11_10) },
-                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp0x, ._ },
                             .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b01) },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
-                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
-                        } },
-                    }, .{
-                        .required_features = .{ .f16c, .fast_hops, null, null },
-                        .dst_constraints = .{ .{ .float = .word }, .any },
-                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .xword, .is = .word } }, .any, .any },
-                        .patterns = &.{
-                            .{ .src = .{ .to_sse, .none, .none } },
-                        },
-                        .extra_temps = .{
-                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
-                            .{ .type = .vector_16_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
-                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                        },
-                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
-                        .each = .{ .once = &.{
-                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
-                            .{ ._, .v_ps, .@"and", .dst0x, .src0x, .lea(.tmp0x), ._ },
-                            .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
-                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
-                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
-                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp0x, ._ },
                             .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
                         } },
                     }, .{
@@ -146729,6 +146641,7 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                         .extra_temps = .{
                             .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
                             .{ .type = .vector_16_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_8_f16, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
                             .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
                             .unused,
                             .unused,
@@ -146737,49 +146650,20 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                             .unused,
                             .unused,
                             .unused,
-                            .unused,
                         },
                         .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
                         .each = .{ .once = &.{
                             .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
                             .{ ._, .v_ps, .@"and", .dst0x, .src0x, .lea(.tmp0x), ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_ps, .@"or", .dst0x, .src0x, .lea(.tmp0x), ._ },
                             .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
-                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
-                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
-                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b11_10) },
-                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
-                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b01) },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp2x, ._ },
-                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
-                        } },
-                    }, .{
-                        .required_features = .{ .f16c, .fast_hops, null, null },
-                        .dst_constraints = .{ .{ .float = .word }, .any },
-                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .xword, .is = .word } }, .any, .any },
-                        .patterns = &.{
-                            .{ .src = .{ .mem, .none, .none } },
-                            .{ .src = .{ .to_sse, .none, .none } },
-                        },
-                        .extra_temps = .{
-                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                        },
-                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
-                        .each = .{ .once = &.{
-                            .{ ._, .v_ps, .cvtph2, .dst0y, .src0x, ._, ._ },
-                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
-                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
-                            .{ ._, .v_f128, .extract, .tmp0x, .dst0y, .ui(1), ._ },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp3x, ._ },
                             .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
                         } },
                     }, .{
@@ -146807,45 +146691,11 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                         .each = .{ .once = &.{
                             .{ ._, .v_ps, .cvtph2, .dst0y, .src0x, ._, ._ },
                             .{ ._, .v_f128, .extract, .tmp0x, .dst0y, .ui(1), ._ },
-                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp0x, ._ },
                             .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b11_10) },
-                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp0x, ._ },
                             .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b01) },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
-                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
-                        } },
-                    }, .{
-                        .required_features = .{ .f16c, .fast_hops, null, null },
-                        .dst_constraints = .{ .{ .float = .word }, .any },
-                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .yword, .is = .word } }, .any, .any },
-                        .patterns = &.{
-                            .{ .src = .{ .to_sse, .none, .none } },
-                        },
-                        .extra_temps = .{
-                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
-                            .{ .type = .vector_32_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
-                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                        },
-                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
-                        .each = .{ .once = &.{
-                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
-                            .{ ._, .v_ps, .@"and", .dst0y, .src0y, .lea(.tmp0y), ._ },
-                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
-                            .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
-                            .{ ._, .v_ps, .cvtph2, .tmp2y, .tmp2x, ._, ._ },
-                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp2y, ._ },
-                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
-                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
-                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp0x, ._ },
                             .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
                         } },
                     }, .{
@@ -146858,6 +146708,7 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                         .extra_temps = .{
                             .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
                             .{ .type = .vector_32_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_16_f16, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
                             .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
                             .unused,
                             .unused,
@@ -146866,54 +146717,23 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                             .unused,
                             .unused,
                             .unused,
-                            .unused,
                         },
                         .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
                         .each = .{ .once = &.{
                             .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
                             .{ ._, .v_ps, .@"and", .dst0y, .src0y, .lea(.tmp0y), ._ },
-                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_ps, .@"or", .dst0y, .dst0y, .lea(.tmp0y), ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
                             .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
-                            .{ ._, .v_ps, .cvtph2, .tmp2y, .tmp2x, ._, ._ },
-                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp2y, ._ },
-                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
-                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
-                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b11_10) },
-                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
-                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b01) },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp2x, ._ },
-                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
-                        } },
-                    }, .{
-                        .required_features = .{ .f16c, .fast_hops, null, null },
-                        .dst_constraints = .{ .{ .float = .word }, .any },
-                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .yword, .is = .word } }, .any, .any },
-                        .patterns = &.{
-                            .{ .src = .{ .to_sse, .none, .none } },
-                        },
-                        .extra_temps = .{
-                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                            .unused,
-                        },
-                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
-                        .each = .{ .once = &.{
-                            .{ ._, .v_f128, .extract, .tmp0x, .src0y, .ui(1), ._ },
-                            .{ ._, .v_ps, .cvtph2, .dst0y, .src0x, ._, ._ },
-                            .{ ._, .v_ps, .cvtph2, .tmp0y, .tmp0x, ._, ._ },
-                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp0y, ._ },
-                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
-                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
-                            .{ ._, .v_f128, .extract, .tmp0x, .dst0y, .ui(1), ._ },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp3y, .tmp3x, ._, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp3y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp3x, ._ },
                             .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
                         } },
                     }, .{
@@ -146941,13 +146761,13 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                             .{ ._, .v_f128, .extract, .tmp0x, .src0y, .ui(1), ._ },
                             .{ ._, .v_ps, .cvtph2, .dst0y, .src0x, ._, ._ },
                             .{ ._, .v_ps, .cvtph2, .tmp0y, .tmp0x, ._, ._ },
-                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp0y, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp0y, ._ },
                             .{ ._, .v_f128, .extract, .tmp0x, .dst0y, .ui(1), ._ },
-                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp0x, ._ },
                             .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b11_10) },
-                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp0x, ._ },
                             .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b01) },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp0x, ._ },
                             .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
                         } },
                     }, .{
@@ -146960,6 +146780,7 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                         .extra_temps = .{
                             .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
                             .{ .type = .vector_64_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_32_f16, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
                             .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
                             .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
                             .unused,
@@ -146968,30 +146789,1903 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                             .unused,
                             .unused,
                             .unused,
-                            .unused,
                         },
                         .dst_temps = .{ .{ .rc = .sse }, .unused },
                         .each = .{ .once = &.{
                             .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
                             .{ ._, .v_ps, .mova, .dst0y, .lea(.tmp0y), ._, ._ },
-                            .{ ._, .v_ps, .mova, .tmp2y, .lead(.tmp0y, 32), ._, ._ },
-                            .{ ._, .v_ps, .@"and", .tmp2y, .tmp2y, .memd(.src0y, 32), ._ },
+                            .{ ._, .v_ps, .mova, .tmp3y, .lead(.tmp0y, 32), ._, ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .tmp3y, .tmp3y, .memd(.src0y, 32), ._ },
                             .{ ._, .v_ps, .@"and", .dst0y, .dst0y, .mem(.src0y), ._ },
-                            .{ ._, .v_f128, .extract, .tmp3x, .tmp2y, .ui(1), ._ },
-                            .{ ._, .v_ps, .cvtph2, .tmp2y, .tmp2x, ._, ._ },
+                            .{ ._, .v_ps, .@"or", .dst0y, .dst0y, .lea(.tmp0y), ._ },
+                            .{ ._, .v_ps, .@"or", .tmp3y, .tmp3y, .lead(.tmp0y, 32), ._ },
+                            .{ ._, .v_f128, .extract, .tmp4x, .tmp3y, .ui(1), ._ },
                             .{ ._, .v_ps, .cvtph2, .tmp3y, .tmp3x, ._, ._ },
-                            .{ ._, .v_ps, .add, .tmp2y, .tmp2y, .tmp3y, ._ },
-                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp4y, .tmp4x, ._, ._ },
+                            .{ ._, .v_ps, .min, .tmp3y, .tmp3y, .tmp4y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp4x, .dst0y, .ui(1), ._ },
                             .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
-                            .{ ._, .v_ps, .cvtph2, .tmp3y, .tmp3x, ._, ._ },
-                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp3y, ._ },
-                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp2y, ._ },
-                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
-                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
-                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b11_10) },
-                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
-                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b01) },
-                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp4y, .tmp4x, ._, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp4y, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp3y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx512f, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .zword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .mova, .tmp1y, .memd(.src0y, 32), ._, ._ },
+                            .{ ._, .v_ps, .mova, .dst0y, .mem(.src0y), ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp2x, .tmp1y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp1y, .tmp1x, ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp2y, .tmp2x, ._, ._ },
+                            .{ ._, .v_ps, .min, .tmp1y, .tmp1y, .tmp2y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp2y, .tmp2x, ._, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp2y, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp1y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp1x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp1x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp1x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .unaligned_multiple_scalar_float = .{ .of = .xword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .memad(.src0x, .add_unaligned_size, -16), ._, ._ },
+                            .{ .@"0:", .v_ps, .cvtph2, .tmp1y, .memi(.src0x, .tmp0), ._, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp1y, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp1x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp1x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp1x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx512f, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .zword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_64_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_32_f16, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_ps, .mova, .dst0y, .lea(.tmp0y), ._, ._ },
+                            .{ ._, .v_ps, .mova, .tmp3y, .lead(.tmp0y, 32), ._, ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .tmp3y, .tmp3y, .memad(.src0y, .add_size, -32), ._ },
+                            .{ ._, .v_ps, .@"and", .dst0y, .dst0y, .memad(.src0y, .add_size, -64), ._ },
+                            .{ ._, .v_ps, .@"or", .dst0y, .dst0y, .lea(.tmp0y), ._ },
+                            .{ ._, .v_ps, .@"or", .tmp3y, .tmp3y, .lead(.tmp0y, 32), ._ },
+                            .{ ._, ._, .mov, .tmp0d, .sia(-80, .src0, .add_size), ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp4x, .tmp3y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp3y, .tmp3x, ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp4y, .tmp4x, ._, ._ },
+                            .{ ._, .v_ps, .min, .tmp3y, .tmp3y, .tmp4y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp4x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp4y, .tmp4x, ._, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp4y, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp3y, ._ },
+                            .{ .@"0:", .v_ps, .cvtph2, .tmp3y, .memi(.src0x, .tmp0), ._, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp3y, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .yword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_32_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_16_f16, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_ps, .mova, .dst0y, .lea(.tmp0y), ._, ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .dst0y, .dst0y, .memad(.src0y, .add_size, -32), ._ },
+                            .{ ._, .v_ps, .@"or", .dst0y, .dst0y, .lea(.tmp0y), ._ },
+                            .{ ._, ._, .mov, .tmp0d, .sia(-48, .src0, .add_size), ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp3y, .tmp3x, ._, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp3y, ._ },
+                            .{ .@"0:", .v_ps, .cvtph2, .tmp3y, .memi(.src0x, .tmp0), ._, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp3y, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .word, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .call_frame = .{ .alignment = .@"16" },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                            .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fminh" } } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .reg = .xmm0 }, .unused },
+                        .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                        .each = .{ .once = &.{
+                            .{ ._, .vp_, .xor, .dst0x, .dst0x, .dst0x, ._ },
+                            .{ ._, ._, .mov, .tmp0d, .sia(-4, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .vp_w, .insr, .dst0x, .dst0x, .memad(.src0w, .add_unaligned_size, -2), .ui(0) },
+                            .{ .@"0:", .vp_, .xor, .tmp1x, .tmp1x, .tmp1x, ._ },
+                            .{ ._, .vp_w, .insr, .tmp1x, .tmp1x, .memi(.src0w, .tmp0), .ui(0) },
+                            .{ ._, ._, .call, .tmp2d, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(2), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse2, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .word, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .call_frame = .{ .alignment = .@"16" },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                            .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fminh" } } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .reg = .xmm0 }, .unused },
+                        .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                        .each = .{ .once = &.{
+                            .{ ._, .p_, .xor, .dst0x, .dst0x, ._, ._ },
+                            .{ ._, ._, .mov, .tmp0d, .sia(-4, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .p_w, .insr, .dst0x, .memad(.src0w, .add_unaligned_size, -2), .ui(0), ._ },
+                            .{ .@"0:", .p_, .xor, .tmp1x, .tmp1x, ._, ._ },
+                            .{ ._, .p_w, .insr, .tmp1x, .memi(.src0w, .tmp0), .ui(0), ._ },
+                            .{ ._, ._, .call, .tmp2d, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(2), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .word, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .call_frame = .{ .alignment = .@"16" },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f16, .kind = .{ .reg = .ax } },
+                            .{ .type = .f32, .kind = .mem },
+                            .{ .type = .f16, .kind = .{ .reg = .xmm1 } },
+                            .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "__fminh" } } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .reg = .xmm0 }, .unused },
+                        .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                        .each = .{ .once = &.{
+                            .{ ._, ._ps, .xor, .dst0x, .dst0x, ._, ._ },
+                            .{ ._, ._, .mov, .tmp0d, .sia(-4, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, ._, .movzx, .tmp1d, .memad(.src0w, .add_unaligned_size, -2), ._, ._ },
+                            .{ ._, ._, .mov, .mem(.tmp2d), .tmp1d, ._, ._ },
+                            .{ ._, ._ss, .mov, .dst0x, .mem(.tmp2d), ._, ._ },
+                            .{ .@"0:", ._ps, .xor, .tmp3x, .tmp3x, ._, ._ },
+                            .{ ._, ._ss, .mov, .tmp3x, .memi(.src0d, .tmp0), ._, ._ },
+                            .{ ._, ._, .call, .tmp4d, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(2), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .qword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .shuf, .tmp0x, .src0x, .src0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .src0x, .tmp0x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .qword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mut_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .ref = .src0 }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._ps, .mova, .tmp0x, .src0x, ._, ._ },
+                            .{ ._, ._ps, .shuf, .tmp0x, .tmp0x, .ui(0b01), ._ },
+                            .{ ._, ._ss, .min, .dst0x, .tmp0x, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .xword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .movhl, .tmp0x, .src0x, .src0x, ._ },
+                            .{ ._, .v_ss, .min, .tmp0x, .src0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .shuf, .dst0x, .src0x, .src0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .tmp0x, .dst0x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .xword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mut_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .ref = .src0 }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._ps, .xor, .tmp0x, .tmp0x, ._, ._ },
+                            .{ ._, ._ps, .movhl, .tmp0x, .src0x, ._, ._ },
+                            .{ ._, ._ss, .min, .tmp0x, .src0x, ._, ._ },
+                            .{ ._, ._ps, .shuf, .dst0x, .src0x, .ui(0b01), ._ },
+                            .{ ._, ._ss, .min, .dst0x, .tmp0x, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .xword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .movhl, .tmp0x, .src0x, .src0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .src0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp0x, .src0x, .src0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .src0x, .tmp0x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .xword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mut_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .ref = .src0 }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._ps, .xor, .tmp0x, .tmp0x, ._, ._ },
+                            .{ ._, ._ps, .movhl, .tmp0x, .src0x, ._, ._ },
+                            .{ ._, ._ps, .min, .dst0x, .tmp0x, ._, ._ },
+                            .{ ._, ._ps, .mova, .tmp0x, .dst0x, ._, ._ },
+                            .{ ._, ._ps, .shuf, .tmp0x, .tmp0x, .ui(0b01), ._ },
+                            .{ ._, ._ss, .min, .dst0x, .tmp0x, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .yword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_32_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .dst0y, .src0y, .lea(.tmp0y), ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_ps, .@"or", .dst0y, .src0y, .lea(.tmp0y), ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp3x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .yword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_f128, .extract, .tmp1x, .src0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .src0x, .tmp1x, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp1x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp1x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx512f, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .zword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_64_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_16_f32, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_ps, .mova, .dst0y, .lea(.tmp0y), ._, ._ },
+                            .{ ._, .v_ps, .mova, .tmp3y, .lead(.tmp0y, 32), ._, ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .dst0y, .dst0y, .mem(.src0y), ._ },
+                            .{ ._, .v_ps, .@"and", .tmp3y, .tmp3y, .memd(.src0y, 32), ._ },
+                            .{ ._, .v_ps, .@"or", .dst0y, .dst0y, .lea(.tmp0y), ._ },
+                            .{ ._, .v_ps, .@"or", .tmp3y, .tmp3y, .lead(.tmp0y, 32), ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp3y, ._ },
+                            .{ ._, .v_i128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp3x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx512f, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .zword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .mova, .dst0y, .mem(.src0y), ._, ._ },
+                            .{ ._, .v_ps, .mova, .tmp0y, .memd(.src0y, 32), ._, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp0y, ._ },
+                            .{ ._, .v_i128, .extract, .tmp0x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp0x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp0x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .unaligned_multiple_scalar_float = .{ .of = .yword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-64, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .v_ps, .mova, .dst0y, .memad(.src0y, .add_unaligned_size, -32), ._, ._ },
+                            .{ .@"0:", .v_ps, .min, .dst0y, .dst0y, .memi(.src0y, .tmp0), ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(32), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp1x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp1x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp1x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .unaligned_multiple_scalar_float = .{ .of = .xword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, ._ps, .mova, .dst0x, .memad(.src0x, .add_unaligned_size, -16), ._, ._ },
+                            .{ .@"0:", ._ps, .min, .dst0x, .memi(.src0x, .tmp0), ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, ._ps, .xor, .tmp1x, .tmp1x, ._, ._ },
+                            .{ ._, ._ps, .movhl, .tmp1x, .dst0x, ._, ._ },
+                            .{ ._, ._ps, .min, .dst0x, .tmp1x, ._, ._ },
+                            .{ ._, ._ps, .mova, .tmp1x, .dst0x, ._, ._ },
+                            .{ ._, ._ps, .shuf, .tmp1x, .tmp1x, .ui(0b01), ._ },
+                            .{ ._, ._ss, .min, .dst0x, .tmp1x, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx512f, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .zword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_64_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_16_f32, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_ps, .mova, .dst0y, .lea(.tmp0y), ._, ._ },
+                            .{ ._, .v_ps, .mova, .tmp3y, .lead(.tmp0y, 32), ._, ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .tmp3y, .tmp3y, .memad(.src0y, .add_size, -32), ._ },
+                            .{ ._, .v_ps, .@"and", .dst0y, .dst0y, .memad(.src0y, .add_size, -64), ._ },
+                            .{ ._, .v_ps, .@"or", .dst0y, .dst0y, .lea(.tmp0y), ._ },
+                            .{ ._, .v_ps, .@"or", .tmp3y, .tmp3y, .lead(.tmp0y, 32), ._ },
+                            .{ ._, ._, .mov, .tmp0d, .sia(-128, .src0, .add_size), ._, ._ },
+                            .{ .@"0:", .v_ps, .min, .tmp3y, .tmp3y, .memid(.src0y, .tmp0, 32), ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .memi(.src0y, .tmp0), ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(64), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .v_ps, .min, .dst0y, .dst0y, .tmp3y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp3x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .yword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_32_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_ps, .mova, .dst0y, .lea(.tmp0y), ._, ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .dst0y, .dst0y, .memad(.src0y, .add_size, -32), ._ },
+                            .{ ._, .v_ps, .@"or", .dst0y, .dst0y, .lea(.tmp0y), ._ },
+                            .{ ._, ._, .mov, .tmp0d, .sia(-48, .src0, .add_size), ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ .@"0:", .v_ps, .min, .dst0x, .dst0x, .memi(.src0x, .tmp0), ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp3x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_ps, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp3x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse, null, null, null },
+                        .dst_constraints = .{ .{ .float = .dword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .dword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_16_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_4_f32, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, ._ps, .mova, .dst0x, .lea(.tmp0x), ._, ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, ._ps, .@"and", .dst0x, .memad(.src0x, .add_size, -16), ._, ._ },
+                            .{ ._, ._ps, .@"or", .dst0x, .lea(.tmp0x), ._, ._ },
+                            .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_size), ._, ._ },
+                            .{ .@"0:", ._ps, .min, .dst0x, .memi(.src0x, .tmp0), ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, ._ps, .xor, .tmp3x, .tmp3x, ._, ._ },
+                            .{ ._, ._ps, .movhl, .tmp3x, .dst0x, ._, ._ },
+                            .{ ._, ._ps, .min, .dst0x, .tmp3x, ._, ._ },
+                            .{ ._, ._ps, .mova, .tmp3x, .dst0x, ._, ._ },
+                            .{ ._, ._ps, .shuf, .tmp3x, .tmp3x, .ui(0b01), ._ },
+                            .{ ._, ._ss, .min, .dst0x, .tmp3x, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .xword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_2_f64, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .movhl, .tmp0x, .src0x, .src0x, ._ },
+                            .{ ._, .v_sd, .min, .dst0x, .src0x, .tmp0x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse2, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .xword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mut_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_2_f64, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .ref = .src0 }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._ps, .xor, .tmp0x, .tmp0x, ._, ._ },
+                            .{ ._, ._ps, .movhl, .tmp0x, .src0x, ._, ._ },
+                            .{ ._, ._sd, .min, .dst0x, .tmp0x, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .yword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_2_f64, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_f128, .extract, .tmp0x, .src0y, .ui(1), ._ },
+                            .{ ._, .v_sd, .min, .tmp0x, .src0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .movhl, .dst0x, .src0x, .src0x, ._ },
+                            .{ ._, .v_sd, .min, .dst0x, .tmp0x, .dst0x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .yword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_2_f64, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_f128, .extract, .tmp0x, .src0y, .ui(1), ._ },
+                            .{ ._, .v_pd, .min, .dst0x, .src0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp0x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_sd, .min, .dst0x, .dst0x, .tmp0x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx512f, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .zword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_64_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_8_f64, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_pd, .mova, .dst0y, .lea(.tmp0y), ._, ._ },
+                            .{ ._, .v_pd, .mova, .tmp3y, .lead(.tmp0y, 32), ._, ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_pd, .@"and", .dst0y, .dst0y, .mem(.src0y), ._ },
+                            .{ ._, .v_pd, .@"and", .tmp3y, .tmp3y, .memd(.src0y, 32), ._ },
+                            .{ ._, .v_pd, .@"or", .dst0y, .dst0y, .lea(.tmp0y), ._ },
+                            .{ ._, .v_pd, .@"or", .tmp3y, .tmp3y, .lead(.tmp0y, 32), ._ },
+                            .{ ._, .v_pd, .min, .dst0y, .dst0y, .tmp3y, ._ },
+                            .{ ._, .v_i128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_pd, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp3x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_sd, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx512f, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .zword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_pd, .mova, .dst0y, .mem(.src0y), ._, ._ },
+                            .{ ._, .v_pd, .mova, .tmp0y, .memd(.src0y, 32), ._, ._ },
+                            .{ ._, .v_pd, .min, .dst0y, .dst0y, .tmp0y, ._ },
+                            .{ ._, .v_i128, .extract, .tmp0x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_pd, .min, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp0x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_sd, .min, .dst0x, .dst0x, .tmp0x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .unaligned_multiple_scalar_float = .{ .of = .yword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-64, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .v_pd, .mova, .dst0y, .memad(.src0y, .add_unaligned_size, -32), ._, ._ },
+                            .{ .@"0:", .v_pd, .min, .dst0y, .dst0y, .memi(.src0y, .tmp0), ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(32), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp1x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_pd, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp1x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_pd, .min, .dst0x, .dst0x, .tmp1x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse2, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .unaligned_multiple_scalar_float = .{ .of = .xword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_2_f64, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, ._pd, .mova, .dst0x, .memad(.src0x, .add_unaligned_size, -16), ._, ._ },
+                            .{ .@"0:", ._pd, .min, .dst0x, .memi(.src0x, .tmp0), ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, ._ps, .xor, .tmp1x, .tmp1x, ._, ._ },
+                            .{ ._, ._ps, .movhl, .tmp1x, .dst0x, ._, ._ },
+                            .{ ._, ._sd, .min, .dst0x, .tmp1x, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx512f, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .zword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_64_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_8_f64, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
+                            .{ .type = .vector_4_f64, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_pd, .mova, .dst0y, .lea(.tmp0y), ._, ._ },
+                            .{ ._, .v_pd, .mova, .tmp3y, .lead(.tmp0y, 32), ._, ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_pd, .@"and", .tmp3y, .tmp3y, .memad(.src0y, .add_size, -32), ._ },
+                            .{ ._, .v_pd, .@"and", .dst0y, .dst0y, .memad(.src0y, .add_size, -64), ._ },
+                            .{ ._, .v_pd, .@"or", .dst0y, .dst0y, .lea(.tmp0y), ._ },
+                            .{ ._, .v_pd, .@"or", .tmp3y, .tmp3y, .lead(.tmp0y, 32), ._ },
+                            .{ ._, ._, .mov, .tmp0d, .sia(-128, .src0, .add_size), ._, ._ },
+                            .{ .@"0:", .v_pd, .min, .tmp3y, .tmp3y, .memid(.src0y, .tmp0, 32), ._ },
+                            .{ ._, .v_pd, .min, .dst0y, .dst0y, .memi(.src0y, .tmp0), ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(64), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .v_pd, .min, .dst0y, .dst0y, .tmp3y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_pd, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp3x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_sd, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .yword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_32_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_4_f64, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
+                            .{ .type = .vector_2_f64, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_pd, .mova, .dst0y, .lea(.tmp0y), ._, ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, .v_pd, .@"and", .dst0y, .dst0y, .memad(.src0y, .add_size, -32), ._ },
+                            .{ ._, .v_pd, .@"or", .dst0y, .dst0y, .lea(.tmp0y), ._ },
+                            .{ ._, ._, .mov, .tmp0d, .sia(-48, .src0, .add_size), ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_pd, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                            .{ .@"0:", .v_pd, .min, .dst0x, .dst0x, .memi(.src0x, .tmp0), ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .v_ps, .movhl, .tmp3x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_pd, .min, .dst0x, .dst0x, .tmp3x, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse2, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_16_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_2_f64, .kind = .{ .splat_float_mem = .{ .ref = .src0, .outside = inf } } },
+                            .{ .type = .vector_2_f64, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, ._pd, .mova, .dst0x, .lea(.tmp0x), ._, ._ },
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp2), ._, ._ },
+                            .{ ._, ._pd, .@"and", .dst0x, .memad(.src0x, .add_size, -16), ._, ._ },
+                            .{ ._, ._pd, .@"or", .dst0x, .lea(.tmp0x), ._, ._ },
+                            .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_size), ._, ._ },
+                            .{ .@"0:", ._pd, .min, .dst0x, .memi(.src0x, .tmp0), ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, ._ps, .xor, .tmp3x, .tmp3x, ._, ._ },
+                            .{ ._, ._ps, .movhl, .tmp3x, .dst0x, ._, ._ },
+                            .{ ._, ._pd, .min, .dst0x, .tmp3x, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .x87, .cmov, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .qword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f64, .kind = .{ .reg = .st7 } },
+                            .{ .type = .f64, .kind = .{ .reg = .st6 } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .mem, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-16, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .f_, .ld, .memad(.src0q, .add_unaligned_size, -8), ._, ._, ._ },
+                            .{ .@"0:", .f_, .ld, .memi(.src0q, .tmp0), ._, ._, ._ },
+                            .{ ._, .f_, .ucomi, .tmp2t, .tmp1t, ._, ._ },
+                            .{ ._, .f_nb, .cmov, .tmp2t, .tmp1t, ._, ._ },
+                            .{ ._, .f_p, .st, .tmp1t, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(8), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .f_p, .st, .dst0q, ._, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sahf, .x87, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .qword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f64, .kind = .{ .reg = .st7 } },
+                            .{ .type = .f64, .kind = .{ .reg = .st6 } },
+                            .{ .type = .u16, .kind = .{ .reg = .ax } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .mem, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-16, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .f_, .ld, .memad(.src0q, .add_unaligned_size, -8), ._, ._, ._ },
+                            .{ .@"0:", .f_, .ld, .memi(.src0q, .tmp0), ._, ._, ._ },
+                            .{ ._, .f_, .ucom, .tmp1t, ._, ._, ._ },
+                            .{ ._, .fn_sw, .st, .tmp3w, ._, ._, ._ },
+                            .{ ._, ._, .sahf, ._, ._, ._, ._ },
+                            .{ ._, ._nb, .j, .@"1f", ._, ._, ._ },
+                            .{ ._, .f_, .st, .tmp1t, ._, ._, ._ },
+                            .{ .@"1:", .f_p, .st, .tmp2t, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(8), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .f_p, .st, .dst0q, ._, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .x87, null, null, null },
+                        .dst_constraints = .{ .{ .float = .qword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .qword, .is = .qword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f64, .kind = .{ .reg = .st7 } },
+                            .{ .type = .f64, .kind = .{ .reg = .st6 } },
+                            .{ .type = .u16, .kind = .{ .reg = .ax } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .mem, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-16, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .f_, .ld, .memad(.src0q, .add_unaligned_size, -8), ._, ._, ._ },
+                            .{ .@"0:", .f_, .ld, .memi(.src0q, .tmp0), ._, ._, ._ },
+                            .{ ._, .f_, .ucom, .tmp1t, ._, ._, ._ },
+                            .{ ._, .fn_sw, .st, .tmp3w, ._, ._, ._ },
+                            .{ ._, ._, .@"test", .tmp3h, .si(0b0_000_001), ._, ._ },
+                            .{ ._, ._z, .j, .@"1f", ._, ._, ._ },
+                            .{ ._, .f_, .st, .tmp1t, ._, ._, ._ },
+                            .{ .@"1:", .f_p, .st, .tmp2t, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(8), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .f_p, .st, .dst0q, ._, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .x87, .cmov, null, null },
+                        .dst_constraints = .{ .{ .float = .tbyte }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                            .{ .type = .f80, .kind = .{ .reg = .st6 } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .x87 }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .f_, .ld, .memad(.src0t, .add_unaligned_size, -16), ._, ._, ._ },
+                            .{ .@"0:", .f_, .ld, .memi(.src0t, .tmp0), ._, ._, ._ },
+                            .{ ._, .f_, .ucomi, .tmp2t, .tmp1t, ._, ._ },
+                            .{ ._, .f_nb, .cmov, .tmp2t, .tmp1t, ._, ._ },
+                            .{ ._, .f_p, .st, .tmp1t, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .f_p, .st, .dst0t, ._, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sahf, .x87, null, null },
+                        .dst_constraints = .{ .{ .float = .tbyte }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                            .{ .type = .f80, .kind = .{ .reg = .st6 } },
+                            .{ .type = .u16, .kind = .{ .reg = .ax } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .x87 }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .f_, .ld, .memad(.src0t, .add_unaligned_size, -16), ._, ._, ._ },
+                            .{ .@"0:", .f_, .ld, .memi(.src0t, .tmp0), ._, ._, ._ },
+                            .{ ._, .f_, .ucom, .tmp1t, ._, ._, ._ },
+                            .{ ._, .fn_sw, .st, .tmp3w, ._, ._, ._ },
+                            .{ ._, ._, .sahf, ._, ._, ._, ._ },
+                            .{ ._, ._nb, .j, .@"1f", ._, ._, ._ },
+                            .{ ._, .f_, .st, .tmp1t, ._, ._, ._ },
+                            .{ .@"1:", .f_p, .st, .tmp2t, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .f_p, .st, .dst0t, ._, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .x87, null, null, null },
+                        .dst_constraints = .{ .{ .float = .tbyte }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                            .{ .type = .f80, .kind = .{ .reg = .st6 } },
+                            .{ .type = .u16, .kind = .{ .reg = .ax } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .x87 }, .unused },
+                        .clobbers = .{ .eflags = true },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .f_, .ld, .memad(.src0t, .add_unaligned_size, -16), ._, ._, ._ },
+                            .{ .@"0:", .f_, .ld, .memi(.src0t, .tmp0), ._, ._, ._ },
+                            .{ ._, .f_, .ucom, .tmp1t, ._, ._, ._ },
+                            .{ ._, .fn_sw, .st, .tmp3w, ._, ._, ._ },
+                            .{ ._, ._, .@"test", .tmp3h, .si(0b0_000_001), ._, ._ },
+                            .{ ._, ._z, .j, .@"1f", ._, ._, ._ },
+                            .{ ._, .f_, .st, .tmp1t, ._, ._, ._ },
+                            .{ .@"1:", .f_p, .st, .tmp2t, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                            .{ ._, .f_p, .st, .dst0t, ._, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx, null, null, null },
+                        .dst_constraints = .{ .{ .float = .xword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .xword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .call_frame = .{ .alignment = .@"16" },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f128, .kind = .{ .reg = .xmm1 } },
+                            .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fminq" } } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .reg = .xmm0 }, .unused },
+                        .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, .v_dqa, .mov, .dst0x, .memad(.src0x, .add_unaligned_size, -16), ._, ._ },
+                            .{ .@"0:", .v_dqa, .mov, .tmp1x, .memi(.src0x, .tmp0), ._, ._ },
+                            .{ ._, ._, .call, .tmp2d, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse2, null, null, null },
+                        .dst_constraints = .{ .{ .float = .xword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .xword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .call_frame = .{ .alignment = .@"16" },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f128, .kind = .{ .reg = .xmm1 } },
+                            .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fminq" } } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .reg = .xmm0 }, .unused },
+                        .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, ._dqa, .mov, .dst0x, .memad(.src0x, .add_unaligned_size, -16), ._, ._ },
+                            .{ .@"0:", ._dqa, .mov, .tmp1x, .memi(.src0x, .tmp0), ._, ._ },
+                            .{ ._, ._, .call, .tmp2d, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .sse, null, null, null },
+                        .dst_constraints = .{ .{ .float = .xword }, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .xword } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .call_frame = .{ .alignment = .@"16" },
+                        .extra_temps = .{
+                            .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .f128, .kind = .{ .reg = .xmm1 } },
+                            .{ .type = .usize, .kind = .{ .symbol = &.{ .name = "fminq" } } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .reg = .xmm0 }, .unused },
+                        .clobbers = .{ .eflags = true, .caller_preserved = .ccc },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_unaligned_size), ._, ._ },
+                            .{ ._, ._ps, .mova, .dst0x, .memad(.src0x, .add_unaligned_size, -16), ._, ._ },
+                            .{ .@"0:", ._ps, .mova, .tmp1x, .memi(.src0x, .tmp0), ._, ._ },
+                            .{ ._, ._, .call, .tmp2d, ._, ._, ._ },
+                            .{ ._, ._, .sub, .tmp0d, .si(16), ._, ._ },
+                            .{ ._, ._nb, .j, .@"0b", ._, ._, ._ },
+                        } },
+                    } },
+                    .Max => unreachable,
+                    .Add => comptime &.{ .{
+                        .required_features = .{ .f16c, .fast_hops, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .dword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .mem, .none, .none } },
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
+                            .{ ._, .vh_ps, .add, .dst0x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .dword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .mem, .none, .none } },
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, .fast_hops, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .qword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .mem, .none, .none } },
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
+                            .{ ._, .vh_ps, .add, .tmp0x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_ps, .shuf, .dst0x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ss, .add, .dst0x, .tmp0x, .dst0x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .qword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .mem, .none, .none } },
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, .fast_hops, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .qword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .mem, .none, .none } },
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
+                            .{ ._, .vh_ps, .add, .dst0x, .dst0x, .dst0x, ._ },
+                            .{ ._, .vh_ps, .add, .dst0x, .dst0x, .dst0x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .qword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .mem, .none, .none } },
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_4_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .cvtph2, .dst0x, .src0q, ._, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, .fast_hops, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .xword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_16_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .dst0x, .src0x, .lea(.tmp0x), ._ },
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
+                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
+                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .xword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_16_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .dst0x, .src0x, .lea(.tmp0x), ._ },
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, .fast_hops, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .xword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .mem, .none, .none } },
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .src0x, ._, ._ },
+                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
+                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp0x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .xword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .mem, .none, .none } },
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .src0x, ._, ._ },
+                            .{ ._, .v_f128, .extract, .tmp0x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, .fast_hops, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .yword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_32_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .dst0y, .src0y, .lea(.tmp0y), ._ },
+                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp2y, .tmp2x, ._, ._ },
+                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp2y, ._ },
+                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
+                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .yword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_32_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .dst0y, .src0y, .lea(.tmp0y), ._ },
+                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp2y, .tmp2x, ._, ._ },
+                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp2y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, .fast_hops, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .yword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_f128, .extract, .tmp0x, .src0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .src0x, ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp0y, .tmp0x, ._, ._ },
+                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp0y, ._ },
+                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
+                            .{ ._, .vh_ps, .add, .dst0y, .dst0y, .dst0y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp0x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .f16c, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exact_scalar_float = .{ .of = .yword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_sse, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .mut_rc = .{ .ref = .src0, .rc = .sse } }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, .v_f128, .extract, .tmp0x, .src0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .src0x, ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp0y, .tmp0x, ._, ._ },
+                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp0y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp0x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp0x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp0x, ._ },
+                            .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
+                        } },
+                    }, .{
+                        .required_features = .{ .avx512f, null, null, null },
+                        .dst_constraints = .{ .{ .float = .word }, .any },
+                        .src_constraints = .{ .{ .exclusive_scalar_float = .{ .of = .zword, .is = .word } }, .any, .any },
+                        .patterns = &.{
+                            .{ .src = .{ .to_mem, .none, .none } },
+                        },
+                        .extra_temps = .{
+                            .{ .type = .usize, .kind = .{ .rc = .general_purpose } },
+                            .{ .type = .vector_64_u8, .kind = .{ .pand_mask_mem = .{ .ref = .src0 } } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .{ .type = .vector_8_f32, .kind = .{ .rc = .sse } },
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                            .unused,
+                        },
+                        .dst_temps = .{ .{ .rc = .sse }, .unused },
+                        .each = .{ .once = &.{
+                            .{ ._, ._, .lea, .tmp0p, .mem(.tmp1), ._, ._ },
+                            .{ ._, .v_ps, .mova, .dst0y, .lea(.tmp0y), ._, ._ },
+                            .{ ._, .v_ps, .mova, .tmp2y, .lead(.tmp0y, 32), ._, ._ },
+                            .{ ._, .v_ps, .@"and", .tmp2y, .tmp2y, .memd(.src0y, 32), ._ },
+                            .{ ._, .v_ps, .@"and", .dst0y, .dst0y, .mem(.src0y), ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .tmp2y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp2y, .tmp2x, ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp3y, .tmp3x, ._, ._ },
+                            .{ ._, .v_ps, .add, .tmp2y, .tmp2y, .tmp3y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp3x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .cvtph2, .dst0y, .dst0x, ._, ._ },
+                            .{ ._, .v_ps, .cvtph2, .tmp3y, .tmp3x, ._, ._ },
+                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp3y, ._ },
+                            .{ ._, .v_ps, .add, .dst0y, .dst0y, .tmp2y, ._ },
+                            .{ ._, .v_f128, .extract, .tmp2x, .dst0y, .ui(1), ._ },
+                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b11_10) },
+                            .{ ._, .v_ps, .add, .dst0x, .dst0x, .tmp2x, ._ },
+                            .{ ._, .v_ps, .shuf, .tmp2x, .dst0x, .dst0x, .ui(0b01) },
+                            .{ ._, .v_ss, .add, .dst0x, .dst0x, .tmp2x, ._ },
                             .{ ._, .v_, .cvtps2ph, .dst0q, .dst0x, .rm(.{}), ._ },
                         } },
                     }, .{
@@ -148679,14 +150373,14 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                     }, .{
                         .required_features = .{ .x87, null, null, null },
                         .dst_constraints = .{ .{ .float = .tbyte }, .any },
-                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .qword, .is = .tbyte } }, .any, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } }, .any, .any },
                         .patterns = &.{
                             .{ .src = .{ .to_mem, .none, .none } },
                         },
                         .extra_temps = .{
                             .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
-                            .{ .type = .f80, .kind = .{ .reg = .st6 } },
                             .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                            .{ .type = .f80, .kind = .{ .reg = .st6 } },
                             .unused,
                             .unused,
                             .unused,
@@ -148696,7 +150390,7 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                             .unused,
                             .unused,
                         },
-                        .dst_temps = .{ .mem, .unused },
+                        .dst_temps = .{ .{ .rc = .x87 }, .unused },
                         .clobbers = .{ .eflags = true },
                         .each = .{ .once = &.{
                             .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_unaligned_size), ._, ._ },
@@ -150222,14 +151916,14 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                     }, .{
                         .required_features = .{ .x87, null, null, null },
                         .dst_constraints = .{ .{ .float = .tbyte }, .any },
-                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .qword, .is = .tbyte } }, .any, .any },
+                        .src_constraints = .{ .{ .multiple_scalar_float = .{ .of = .xword, .is = .tbyte } }, .any, .any },
                         .patterns = &.{
                             .{ .src = .{ .to_mem, .none, .none } },
                         },
                         .extra_temps = .{
                             .{ .type = .u32, .kind = .{ .rc = .general_purpose } },
-                            .{ .type = .f80, .kind = .{ .reg = .st6 } },
                             .{ .type = .f80, .kind = .{ .reg = .st7 } },
+                            .{ .type = .f80, .kind = .{ .reg = .st6 } },
                             .unused,
                             .unused,
                             .unused,
@@ -150239,7 +151933,7 @@ fn genBody(cg: *CodeGen, body: []const Air.Inst.Index) InnerError!void {
                             .unused,
                             .unused,
                         },
-                        .dst_temps = .{ .mem, .unused },
+                        .dst_temps = .{ .{ .rc = .x87 }, .unused },
                         .clobbers = .{ .eflags = true },
                         .each = .{ .once = &.{
                             .{ ._, ._, .mov, .tmp0d, .sia(-32, .src0, .add_unaligned_size), ._, ._ },
src/arch/x86_64/encodings.zon
@@ -1111,10 +1111,10 @@
     .{ .fcomp,  .z, .{      }, .{ 0xd8, 0xd9 }, 0, .none, .x87 },
     .{ .fcompp, .z, .{      }, .{ 0xde, 0xd9 }, 0, .none, .x87 },
 
-    .{ .fcomi,   .zo, .{ .st0, .st }, .{ 0xdb, 0xf0 }, 0, .none, .x87 },
-    .{ .fcomip,  .zo, .{ .st0, .st }, .{ 0xdf, 0xf0 }, 0, .none, .x87 },
-    .{ .fucomi,  .zo, .{ .st0, .st }, .{ 0xdb, 0xe8 }, 0, .none, .x87 },
-    .{ .fucomip, .zo, .{ .st0, .st }, .{ 0xdf, 0xe8 }, 0, .none, .x87 },
+    .{ .fcomi,   .zo, .{ .st0, .st }, .{ 0xdb, 0xf0 }, 0, .none, .@"cmov x87" },
+    .{ .fcomip,  .zo, .{ .st0, .st }, .{ 0xdf, 0xf0 }, 0, .none, .@"cmov x87" },
+    .{ .fucomi,  .zo, .{ .st0, .st }, .{ 0xdb, 0xe8 }, 0, .none, .@"cmov x87" },
+    .{ .fucomip, .zo, .{ .st0, .st }, .{ 0xdf, 0xe8 }, 0, .none, .@"cmov x87" },
 
     .{ .fcos, .z, .{}, .{ 0xd9, 0xff }, 0, .none, .x87 },
 
test/behavior/x86_64/unary.zig
@@ -5128,6 +5128,15 @@ test reduceMul {
     try test_reduce_mul.testFloatVectors();
 }
 
+inline fn reduceMinOptimized(comptime Type: type, rhs: Type) @typeInfo(Type).vector.child {
+    @setFloatMode(.optimized);
+    return @reduce(.Min, rhs);
+}
+test reduceMinOptimized {
+    const test_reduce_min_optimized = unary(reduceMinOptimized, .{});
+    try test_reduce_min_optimized.testFloatVectors();
+}
+
 inline fn reduceAddOptimized(comptime Type: type, rhs: Type) @typeInfo(Type).vector.child {
     @setFloatMode(.optimized);
     return @reduce(.Add, rhs);