Optimized Float<M,E> multiplication

Before: ucomiss xmm1, xmm1 jp .L9 pxor xmm2, xmm2 mov edx, 1 ucomiss xmm0, xmm2 setp al cmovne eax, edx test al, al jne .L9 .L3: movaps xmm0, xmm2 ret .L9: ucomiss xmm0, xmm0 jp .L10 pxor xmm2, xmm2 mov edx, 1 ucomiss xmm1, xmm2 setp al cmovne eax, edx test al, al je .L3 After: movaps xmm2, xmm1 mulss xmm2, xmm0 ucomiss xmm2, xmm2 jnp .L3 ucomiss xmm1, xmm0 jnp .L11 .L3: movaps xmm0, xmm2 ret .L11: pxor xmm2, xmm2 jmp .L3
author: Huw Pascoe 2017-09-22 15:37:42 +0100
committer: Huw Pascoe 2017-09-25 00:54:02 +0100
commit: 903906da3b9b274836510adcabf8adf8e2c15954 (patch)
tree: db271240137bfa4d2d3912a00469fbba32932af6
parent: Merge pull request #2921 from jroweboy/batch-fix-2 (diff)
download: yuzu-903906da3b9b274836510adcabf8adf8e2c15954.tar.gz
yuzu-903906da3b9b274836510adcabf8adf8e2c15954.tar.xz
yuzu-903906da3b9b274836510adcabf8adf8e2c15954.zip
1 files changed, 7 insertions, 11 deletions
diff --git a/src/video_core/pica_types.h b/src/video_core/pica_types.h
index 5d7e10066..2eafa7e9e 100644
--- a/src/video_core/pica_types.h
+++ b/src/video_core/pica_types.h
@@ -58,11 +58,12 @@ public:
    }
    Float<M, E> operator*(const Float<M, E>& flt) const {
-        if ((this->value == 0.f && !std::isnan(flt.value)) ||
+        float result = value * flt.ToFloat32();
-            (flt.value == 0.f && !std::isnan(this->value)))
+        // PICA gives 0 instead of NaN when multiplying by inf
-            // PICA gives 0 instead of NaN when multiplying by inf
+        if (!std::isnan(value) && !std::isnan(flt.ToFloat32()))
-            return Zero();
+            if (std::isnan(result))
-        return Float<M, E>::FromFloat32(ToFloat32() * flt.ToFloat32());
+                result = 0.f;
+        return Float<M, E>::FromFloat32(result);
    }
    Float<M, E> operator/(const Float<M, E>& flt) const {
@@ -78,12 +79,7 @@ public:
    }
    Float<M, E>& operator*=(const Float<M, E>& flt) {
-        if ((this->value == 0.f && !std::isnan(flt.value)) ||
+        value = operator*(flt).value;
-            (flt.value == 0.f && !std::isnan(this->value)))
-            // PICA gives 0 instead of NaN when multiplying by inf
-            *this = Zero();
-        else
-            value *= flt.ToFloat32();
        return *this;
    }
author	Huw Pascoe	2017-09-22 15:37:42 +0100
committer	Huw Pascoe	2017-09-25 00:54:02 +0100
commit	903906da3b9b274836510adcabf8adf8e2c15954 (patch)
tree	db271240137bfa4d2d3912a00469fbba32932af6
parent	Merge pull request #2921 from jroweboy/batch-fix-2 (diff)
download	yuzu-903906da3b9b274836510adcabf8adf8e2c15954.tar.gz yuzu-903906da3b9b274836510adcabf8adf8e2c15954.tar.xz yuzu-903906da3b9b274836510adcabf8adf8e2c15954.zip