Fix some warnings in ARM specific code

author: Jack Lloyd <[email protected]> 2018-10-01 06:17:35 -0400
committer: Jack Lloyd <[email protected]> 2018-10-01 06:17:35 -0400
commit: da123fb7d7142126b194b8f27293d1b114a4baf5 (patch)
tree: cbcaf163f341088575c4fbc009d309a6e7cb1a67
parent: b96189789154222a8de57e31deb457be4208b4b3 (diff)
2 files changed, 34 insertions, 28 deletions
diff --git a/src/lib/hash/sha1/sha1_armv8/sha1_armv8.cpp b/src/lib/hash/sha1/sha1_armv8/sha1_armv8.cpp
index 9da48c9fe..3dc9f43d8 100644
--- a/src/lib/hash/sha1/sha1_armv8/sha1_armv8.cpp
+++ b/src/lib/hash/sha1/sha1_armv8/sha1_armv8.cpp
@@ -20,15 +20,14 @@ namespace Botan {
 BOTAN_FUNC_ISA("+crypto")
 void SHA_160::sha1_armv8_compress_n(secure_vector<uint32_t>& digest, const uint8_t input8[], size_t blocks)
    {
-   uint32x4_t C0, C1, C2, C3;
-   uint32x4_t ABCD, ABCD_SAVED;
-   uint32_t   E0, E0_SAVED, E1;
+   uint32x4_t ABCD;
+   uint32_t E0;
 
-   // Load initial values
-   C0 = vdupq_n_u32(0x5A827999);
-   C1 = vdupq_n_u32(0x6ED9EBA1);
-   C2 = vdupq_n_u32(0x8F1BBCDC);
-   C3 = vdupq_n_u32(0xCA62C1D6);
+   // Load magic constants
+   const uint32x4_t C0 = vdupq_n_u32(0x5A827999);
+   const uint32x4_t C1 = vdupq_n_u32(0x6ED9EBA1);
+   const uint32x4_t C2 = vdupq_n_u32(0x8F1BBCDC);
+   const uint32x4_t C3 = vdupq_n_u32(0xCA62C1D6);
 
    ABCD = vld1q_u32(&digest[0]);
    E0 = digest[4];
@@ -38,12 +37,13 @@ void SHA_160::sha1_armv8_compress_n(secure_vector<uint32_t>& digest, const uint8
 
    while (blocks)
       {
+      // Save current hash
+      const uint32x4_t ABCD_SAVED = ABCD;
+      const uint32_t E0_SAVED = E0;
+
       uint32x4_t MSG0, MSG1, MSG2, MSG3;
       uint32x4_t TMP0, TMP1;
-
-      // Save current hash
-      ABCD_SAVED = ABCD;
-      E0_SAVED = E0;
+      uint32_t E1;
 
       MSG0 = vld1q_u32(input32 + 0);
       MSG1 = vld1q_u32(input32 + 4);
diff --git a/src/lib/modes/aead/gcm/pmull/pmull.cpp b/src/lib/modes/aead/gcm/pmull/pmull.cpp
index 13fa565c4..9d6ceb105 100644
--- a/src/lib/modes/aead/gcm/pmull/pmull.cpp
+++ b/src/lib/modes/aead/gcm/pmull/pmull.cpp
@@ -62,6 +62,12 @@ inline uint64x2_t gcm_reduce(uint32x4_t B0, uint32x4_t B1)
    }
 
 BOTAN_FUNC_ISA("+crypto")
+inline uint32x4_t vmull(uint64_t x, uint64_t y)
+   {
+   return reinterpret_cast<uint32x4_t>(vmull_p64(x, y));
+   }
+
+BOTAN_FUNC_ISA("+crypto")
 inline uint64x2_t gcm_multiply(uint64x2_t H, uint64x2_t x)
    {
    const uint32x4_t zero = vdupq_n_u32(0);
@@ -71,10 +77,10 @@ inline uint64x2_t gcm_multiply(uint64x2_t H, uint64x2_t x)
    const uint64_t H_hi = vgetq_lane_u64(H, 0);
    const uint64_t H_lo = vgetq_lane_u64(H, 1);
 
-   uint32x4_t T0 = (uint32x4_t)vmull_p64(x_hi, H_hi);
-   uint32x4_t T1 = (uint32x4_t)vmull_p64(x_lo, H_hi);
-   uint32x4_t T2 = (uint32x4_t)vmull_p64(x_hi, H_lo);
-   uint32x4_t T3 = (uint32x4_t)vmull_p64(x_lo, H_lo);
+   uint32x4_t T0 = vmull(x_hi, H_hi);
+   uint32x4_t T1 = vmull(x_lo, H_hi);
+   uint32x4_t T2 = vmull(x_hi, H_lo);
+   uint32x4_t T3 = vmull(x_lo, H_lo);
 
    T1 = veorq_u32(T1, T2);
    T0 = veorq_u32(T0, vextq_u32(zero, T1, 2));
@@ -105,19 +111,19 @@ inline uint64x2_t gcm_multiply_x4(uint64x2_t H1, uint64x2_t H2, uint64x2_t H3, u
    const uint64_t X4_hi = vgetq_lane_u64(X4, 0);
    const uint64_t X4_lo = vgetq_lane_u64(X4, 1);
 
-   const uint32x4_t H1_X1_lo = (uint32x4_t)vmull_p64(X1_lo, H1_lo);
-   const uint32x4_t H2_X2_lo = (uint32x4_t)vmull_p64(X2_lo, H2_lo);
-   const uint32x4_t H3_X3_lo = (uint32x4_t)vmull_p64(X3_lo, H3_lo);
-   const uint32x4_t H4_X4_lo = (uint32x4_t)vmull_p64(X4_lo, H4_lo);
+   const uint32x4_t H1_X1_lo = vmull(X1_lo, H1_lo);
+   const uint32x4_t H2_X2_lo = vmull(X2_lo, H2_lo);
+   const uint32x4_t H3_X3_lo = vmull(X3_lo, H3_lo);
+   const uint32x4_t H4_X4_lo = vmull(X4_lo, H4_lo);
 
    const uint32x4_t lo = veorq_u32(
       veorq_u32(H1_X1_lo, H2_X2_lo),
       veorq_u32(H3_X3_lo, H4_X4_lo));
 
-   const uint32x4_t H1_X1_hi = (uint32x4_t)vmull_p64(X1_hi, H1_hi);
-   const uint32x4_t H2_X2_hi = (uint32x4_t)vmull_p64(X2_hi, H2_hi);
-   const uint32x4_t H3_X3_hi = (uint32x4_t)vmull_p64(X3_hi, H3_hi);
-   const uint32x4_t H4_X4_hi = (uint32x4_t)vmull_p64(X4_hi, H4_hi);
+   const uint32x4_t H1_X1_hi = vmull(X1_hi, H1_hi);
+   const uint32x4_t H2_X2_hi = vmull(X2_hi, H2_hi);
+   const uint32x4_t H3_X3_hi = vmull(X3_hi, H3_hi);
+   const uint32x4_t H4_X4_hi = vmull(X4_hi, H4_hi);
 
    const uint32x4_t hi = veorq_u32(
       veorq_u32(H1_X1_hi, H2_X2_hi),
@@ -125,10 +131,10 @@ inline uint64x2_t gcm_multiply_x4(uint64x2_t H1, uint64x2_t H2, uint64x2_t H3, u
 
    uint32x4_t T0 = veorq_u32(lo, hi);
 
-   T0 = veorq_u32(T0, (uint32x4_t)vmull_p64(X1_hi ^ X1_lo, H1_hi ^ H1_lo));
-   T0 = veorq_u32(T0, (uint32x4_t)vmull_p64(X2_hi ^ X2_lo, H2_hi ^ H2_lo));
-   T0 = veorq_u32(T0, (uint32x4_t)vmull_p64(X3_hi ^ X3_lo, H3_hi ^ H3_lo));
-   T0 = veorq_u32(T0, (uint32x4_t)vmull_p64(X4_hi ^ X4_lo, H4_hi ^ H4_lo));
+   T0 = veorq_u32(T0, vmull(X1_hi ^ X1_lo, H1_hi ^ H1_lo));
+   T0 = veorq_u32(T0, vmull(X2_hi ^ X2_lo, H2_hi ^ H2_lo));
+   T0 = veorq_u32(T0, vmull(X3_hi ^ X3_lo, H3_hi ^ H3_lo));
+   T0 = veorq_u32(T0, vmull(X4_hi ^ X4_lo, H4_hi ^ H4_lo));
 
    const uint32x4_t zero = vdupq_n_u32(0);
    uint32x4_t B0 = veorq_u32(vextq_u32(zero, T0, 2), hi);
author	Jack Lloyd <[email protected]>	2018-10-01 06:17:35 -0400
committer	Jack Lloyd <[email protected]>	2018-10-01 06:17:35 -0400
commit	da123fb7d7142126b194b8f27293d1b114a4baf5 (patch)
tree	cbcaf163f341088575c4fbc009d309a6e7cb1a67
parent	b96189789154222a8de57e31deb457be4208b4b3 (diff)