math/aarch64/sincospif_3u2.c

*f3087befSAndrew Turner/*
*f3087befSAndrew Turner * Single-precision scalar sincospi function.
*f3087befSAndrew Turner *
*f3087befSAndrew Turner * Copyright (c) 2024, Arm Limited.
*f3087befSAndrew Turner * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*f3087befSAndrew Turner */
*f3087befSAndrew Turner
*f3087befSAndrew Turner#include "math_config.h"
*f3087befSAndrew Turner#include "test_sig.h"
*f3087befSAndrew Turner#include "test_defs.h"
*f3087befSAndrew Turner#include "poly_scalar_f32.h"
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Taylor series coefficents for sin(pi * x).  */
*f3087befSAndrew Turnerconst static struct sincospif_data
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  float poly[6];
*f3087befSAndrew Turner} sincospif_data = {
*f3087befSAndrew Turner  /* Taylor series coefficents for sin(pi * x).  */
*f3087befSAndrew Turner  .poly = { 0x1.921fb6p1f, -0x1.4abbcep2f, 0x1.466bc6p1f, -0x1.32d2ccp-1f,
*f3087befSAndrew Turner	    0x1.50783p-4f, -0x1.e30750p-8f },
*f3087befSAndrew Turner};
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Top 12 bits of the float representation with the sign bit cleared.  */
*f3087befSAndrew Turnerstatic inline uint32_t
*f3087befSAndrew Turnerabstop12 (float x)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  return (asuint (x) >> 20) & 0x7ff;
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Triages special cases into 4 categories:
*f3087befSAndrew Turner     -1 or +1 if iy represents half an integer
*f3087befSAndrew Turner       -1 if round(y) is odd.
*f3087befSAndrew Turner       +1 if round(y) is even.
*f3087befSAndrew Turner     -2 or +2 if iy represents and integer.
*f3087befSAndrew Turner       -2 if iy is odd.
*f3087befSAndrew Turner       +2 if iy is even.
*f3087befSAndrew Turner   The argument is the bit representation of a positive non-zero
*f3087befSAndrew Turner   finite floating-point value which is either a half or an integer.  */
*f3087befSAndrew Turnerstatic inline int
*f3087befSAndrew Turnercheckint (uint32_t iy)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  int e = iy >> 23;
*f3087befSAndrew Turner  if (e > 0x7f + 23)
*f3087befSAndrew Turner    return 2;
*f3087befSAndrew Turner  if (iy & ((1 << (0x7f + 23 - e)) - 1))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      if ((iy - 1) & 2)
*f3087befSAndrew Turner	return -1;
*f3087befSAndrew Turner      else
*f3087befSAndrew Turner	return 1;
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner  if (iy & (1 << (0x7f + 23 - e)))
*f3087befSAndrew Turner    return -2;
*f3087befSAndrew Turner  return 2;
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Approximation for scalar single-precision sincospif(x).
*f3087befSAndrew Turner   Maximum error for sin: 3.04 ULP:
*f3087befSAndrew Turner      sincospif_sin(0x1.c597ccp-2) got 0x1.f7cd56p-1 want 0x1.f7cd5p-1.
*f3087befSAndrew Turner   Maximum error for cos: 3.18 ULP:
*f3087befSAndrew Turner      sincospif_cos(0x1.d341a8p-5) got 0x1.f7cd56p-1 want 0x1.f7cd5p-1.  */
*f3087befSAndrew Turnervoid
*f3087befSAndrew Turnerarm_math_sincospif (float x, float *out_sin, float *out_cos)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner
*f3087befSAndrew Turner  const struct sincospif_data *d = ptr_barrier (&sincospif_data);
*f3087befSAndrew Turner  uint32_t sign = asuint (x) & 0x80000000;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* abs(x) in [0, 0x1p22].  */
*f3087befSAndrew Turner  if (likely (abstop12 (x) < abstop12 (0x1p22)))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      /* ar_s = x - n (range reduction into -1/2 .. 1/2).  */
*f3087befSAndrew Turner      float ar_s = x - rintf (x);
*f3087befSAndrew Turner      /* We know that cospi(x) = sinpi(0.5 - x)
*f3087befSAndrew Turner      range reduction and offset into sinpi range -1/2 .. 1/2
*f3087befSAndrew Turner      ar_c = 0.5 - |x - n|.  */
*f3087befSAndrew Turner      float ar_c = 0.5f - fabsf (ar_s);
*f3087befSAndrew Turner
*f3087befSAndrew Turner      float ar2_s = ar_s * ar_s;
*f3087befSAndrew Turner      float ar2_c = ar_c * ar_c;
*f3087befSAndrew Turner      float ar4_s = ar2_s * ar2_s;
*f3087befSAndrew Turner      float ar4_c = ar2_c * ar2_c;
*f3087befSAndrew Turner
*f3087befSAndrew Turner      uint32_t cc_sign = lrintf (x) << 31;
*f3087befSAndrew Turner      uint32_t ss_sign = cc_sign;
*f3087befSAndrew Turner      if (ar_s == 0)
*f3087befSAndrew Turner	ss_sign = sign;
*f3087befSAndrew Turner
*f3087befSAndrew Turner      /* As all values are reduced to -1/2 .. 1/2, the result of cos(x)
*f3087befSAndrew Turner      always be positive, therefore, the sign must be introduced
*f3087befSAndrew Turner      based upon if x rounds to odd or even. For sin(x) the sign is
*f3087befSAndrew Turner      copied from x.  */
*f3087befSAndrew Turner      *out_sin = pw_horner_5_f32 (ar2_s, ar4_s, d->poly)
*f3087befSAndrew Turner		 * asfloat (asuint (ar_s) ^ ss_sign);
*f3087befSAndrew Turner      *out_cos = pw_horner_5_f32 (ar2_c, ar4_c, d->poly)
*f3087befSAndrew Turner		 * asfloat (asuint (ar_c) ^ cc_sign);
*f3087befSAndrew Turner      return;
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner  else
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      /* When abs(x) > 0x1p22, the x will be either
*f3087befSAndrew Turner	    - Half integer (relevant if abs(x) in [0x1p22, 0x1p23])
*f3087befSAndrew Turner	    - Odd integer  (relevant if abs(x) in [0x1p22, 0x1p24])
*f3087befSAndrew Turner	    - Even integer (relevant if abs(x) in [0x1p22, inf])
*f3087befSAndrew Turner	    - Inf or NaN.  */
*f3087befSAndrew Turner      if (abstop12 (x) >= 0x7f8)
*f3087befSAndrew Turner	{
*f3087befSAndrew Turner	  float inv_result = __math_invalidf (x);
*f3087befSAndrew Turner	  *out_sin = inv_result;
*f3087befSAndrew Turner	  *out_cos = inv_result;
*f3087befSAndrew Turner	  return;
*f3087befSAndrew Turner	}
*f3087befSAndrew Turner      else
*f3087befSAndrew Turner	{
*f3087befSAndrew Turner	  uint32_t ax = asuint (x) & 0x7fffffff;
*f3087befSAndrew Turner	  int m = checkint (ax);
*f3087befSAndrew Turner	  if (m & 1)
*f3087befSAndrew Turner	    {
*f3087befSAndrew Turner	      *out_sin = sign ? -m : m;
*f3087befSAndrew Turner	      *out_cos = 0;
*f3087befSAndrew Turner	      return;
*f3087befSAndrew Turner	    }
*f3087befSAndrew Turner	  else
*f3087befSAndrew Turner	    {
*f3087befSAndrew Turner	      *out_sin = asfloat (sign);
*f3087befSAndrew Turner	      *out_cos = m >> 1;
*f3087befSAndrew Turner	      return;
*f3087befSAndrew Turner	    }
*f3087befSAndrew Turner	}
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner#if WANT_TRIGPI_TESTS
*f3087befSAndrew TurnerTEST_DISABLE_FENV (arm_math_sincospif_sin)
*f3087befSAndrew TurnerTEST_DISABLE_FENV (arm_math_sincospif_cos)
*f3087befSAndrew TurnerTEST_ULP (arm_math_sincospif_sin, 2.54)
*f3087befSAndrew TurnerTEST_ULP (arm_math_sincospif_cos, 2.68)
*f3087befSAndrew Turner#  define SINCOSPIF_INTERVAL(lo, hi, n)                                       \
*f3087befSAndrew Turner    TEST_SYM_INTERVAL (arm_math_sincospif_sin, lo, hi, n)                     \
*f3087befSAndrew Turner    TEST_SYM_INTERVAL (arm_math_sincospif_cos, lo, hi, n)
*f3087befSAndrew TurnerSINCOSPIF_INTERVAL (0, 0x1p-31, 10000)
*f3087befSAndrew TurnerSINCOSPIF_INTERVAL (0x1p-31, 1, 50000)
*f3087befSAndrew TurnerSINCOSPIF_INTERVAL (1, 0x1p22f, 50000)
*f3087befSAndrew TurnerSINCOSPIF_INTERVAL (0x1p22f, inf, 10000)
*f3087befSAndrew Turner#endif