math/aarch64/tanpif_3u1.c

*f3087befSAndrew Turner/*
*f3087befSAndrew Turner * Single-precision scalar tanpi(x) function.
*f3087befSAndrew Turner *
*f3087befSAndrew Turner * Copyright (c) 2024, Arm Limited.
*f3087befSAndrew Turner * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*f3087befSAndrew Turner */
*f3087befSAndrew Turner#include "mathlib.h"
*f3087befSAndrew Turner#include "math_config.h"
*f3087befSAndrew Turner#include "test_sig.h"
*f3087befSAndrew Turner#include "test_defs.h"
*f3087befSAndrew Turner#include "poly_scalar_f32.h"
*f3087befSAndrew Turner
*f3087befSAndrew Turnerconst static struct tanpif_data
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  float tan_poly[6], cot_poly[4], pi, invpi;
*f3087befSAndrew Turner} tanpif_data = {
*f3087befSAndrew Turner  /* Coefficents for tan(pi * x).  */
*f3087befSAndrew Turner  .tan_poly = {
*f3087befSAndrew Turner    0x1.4abbc8p3,
*f3087befSAndrew Turner    0x1.467284p5,
*f3087befSAndrew Turner    0x1.44cf12p7,
*f3087befSAndrew Turner    0x1.596b5p9,
*f3087befSAndrew Turner    0x1.753858p10,
*f3087befSAndrew Turner    0x1.76ff52p14,
*f3087befSAndrew Turner  },
*f3087befSAndrew Turner  /* Coefficents for cot(pi * x).  */
*f3087befSAndrew Turner  .cot_poly = {
*f3087befSAndrew Turner    -0x1.0c1522p0,
*f3087befSAndrew Turner    -0x1.60ce32p-1,
*f3087befSAndrew Turner    -0x1.49cd42p-1,
*f3087befSAndrew Turner    -0x1.73f786p-1,
*f3087befSAndrew Turner  },
*f3087befSAndrew Turner  .pi = 0x1.921fb6p1f,
*f3087befSAndrew Turner  .invpi = 0x1.45f308p-2f,
*f3087befSAndrew Turner};
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Single-precision scalar tanpi(x) implementation.
*f3087befSAndrew Turner   Maximum error 2.56 ULP:
*f3087befSAndrew Turner   tanpif(0x1.4bf948p-1) got -0x1.fcc9ep+0
*f3087befSAndrew Turner			want -0x1.fcc9e6p+0.  */
*f3087befSAndrew Turnerfloat
*f3087befSAndrew Turnerarm_math_tanpif (float x)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  uint32_t xabs_12 = asuint (x) >> 20 & 0x7f8;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* x >= 0x1p24f.  */
*f3087befSAndrew Turner  if (unlikely (xabs_12 >= 0x4b1))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      /* tanpif(+/-inf) and tanpif(+/-nan) = nan.  */
*f3087befSAndrew Turner      if (unlikely (xabs_12 == 0x7f8))
*f3087befSAndrew Turner	{
*f3087befSAndrew Turner	  return __math_invalidf (x);
*f3087befSAndrew Turner	}
*f3087befSAndrew Turner
*f3087befSAndrew Turner      uint32_t x_sign = asuint (x) & 0x80000000;
*f3087befSAndrew Turner      return asfloat (x_sign);
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner
*f3087befSAndrew Turner  const struct tanpif_data *d = ptr_barrier (&tanpif_data);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Prevent underflow exceptions. x <= 0x1p-31.  */
*f3087befSAndrew Turner  if (unlikely (xabs_12 < 0x300))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      return d->pi * x;
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner
*f3087befSAndrew Turner  float rounded = roundf (x);
*f3087befSAndrew Turner  if (unlikely (rounded == x))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      /* If x == 0, return with sign.  */
*f3087befSAndrew Turner      if (x == 0)
*f3087befSAndrew Turner	{
*f3087befSAndrew Turner	  return x;
*f3087befSAndrew Turner	}
*f3087befSAndrew Turner      /* Otherwise, return zero with alternating sign.  */
*f3087befSAndrew Turner      int32_t m = (int32_t) rounded;
*f3087befSAndrew Turner      if (x < 0)
*f3087befSAndrew Turner	{
*f3087befSAndrew Turner	  return m & 1 ? 0.0f : -0.0f;
*f3087befSAndrew Turner	}
*f3087befSAndrew Turner      else
*f3087befSAndrew Turner	{
*f3087befSAndrew Turner	  return m & 1 ? -0.0f : 0.0f;
*f3087befSAndrew Turner	}
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner
*f3087befSAndrew Turner  float x_reduced = x - rounded;
*f3087befSAndrew Turner  float abs_x_reduced = 0.5f - asfloat (asuint (x_reduced) & 0x7fffffff);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  float result, offset, scale;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Test  0.25 < abs_x < 0.5 independent from abs_x_reduced.  */
*f3087befSAndrew Turner  float x2 = x + x;
*f3087befSAndrew Turner  int32_t rounded_x2 = (int32_t) roundf (x2);
*f3087befSAndrew Turner  if (rounded_x2 & 1)
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      float r_x = abs_x_reduced;
*f3087befSAndrew Turner
*f3087befSAndrew Turner      float r_x2 = r_x * r_x;
*f3087befSAndrew Turner      float r_x4 = r_x2 * r_x2;
*f3087befSAndrew Turner
*f3087befSAndrew Turner      uint32_t sign = asuint (x_reduced) & 0x80000000;
*f3087befSAndrew Turner      r_x = asfloat (asuint (r_x) ^ sign);
*f3087befSAndrew Turner
*f3087befSAndrew Turner      // calculate sign for half-fractional inf values
*f3087befSAndrew Turner      uint32_t is_finite = asuint (abs_x_reduced);
*f3087befSAndrew Turner      uint32_t is_odd = (rounded_x2 & 2) << 30;
*f3087befSAndrew Turner      uint32_t is_neg = rounded_x2 & 0x80000000;
*f3087befSAndrew Turner      uint32_t keep_sign = is_finite | (is_odd ^ is_neg);
*f3087befSAndrew Turner      offset = d->invpi / (keep_sign ? r_x : -r_x);
*f3087befSAndrew Turner      scale = r_x;
*f3087befSAndrew Turner
*f3087befSAndrew Turner      result = pairwise_poly_3_f32 (r_x2, r_x4, d->cot_poly);
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner  else
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      float r_x = x_reduced;
*f3087befSAndrew Turner
*f3087befSAndrew Turner      float r_x2 = r_x * r_x;
*f3087befSAndrew Turner      float r_x4 = r_x2 * r_x2;
*f3087befSAndrew Turner
*f3087befSAndrew Turner      offset = d->pi * r_x;
*f3087befSAndrew Turner      scale = r_x * r_x2;
*f3087befSAndrew Turner
*f3087befSAndrew Turner      result = pw_horner_5_f32 (r_x2, r_x4, d->tan_poly);
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner
*f3087befSAndrew Turner  return fmaf (scale, result, offset);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner#if WANT_EXPERIMENTAL_MATH
*f3087befSAndrew Turnerfloat
*f3087befSAndrew Turnertanpif (float x)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  return arm_math_tanpif (x);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner#endif
*f3087befSAndrew Turner
*f3087befSAndrew Turner#if WANT_TRIGPI_TESTS
*f3087befSAndrew TurnerTEST_ULP (arm_math_tanpif, 2.57)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (arm_math_tanpif, 0, 0x1p-31f, 50000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (arm_math_tanpif, 0x1p-31f, 0.5, 100000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (arm_math_tanpif, 0.5, 0x1p23f, 100000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (arm_math_tanpif, 0x1p23f, inf, 100000)
*f3087befSAndrew Turner#endif