math/aarch64/cospif_2u6.c

*f3087befSAndrew Turner/*
*f3087befSAndrew Turner * Single-precision scalar cospi function.
*f3087befSAndrew Turner *
*f3087befSAndrew Turner * Copyright (c) 2023-2024, Arm Limited.
*f3087befSAndrew Turner * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*f3087befSAndrew Turner */
*f3087befSAndrew Turner
*f3087befSAndrew Turner#include "mathlib.h"
*f3087befSAndrew Turner#include "math_config.h"
*f3087befSAndrew Turner#include "test_sig.h"
*f3087befSAndrew Turner#include "test_defs.h"
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Taylor series coefficents for sin(pi * x).  */
*f3087befSAndrew Turner#define C0 0x1.921fb6p1f
*f3087befSAndrew Turner#define C1 -0x1.4abbcep2f
*f3087befSAndrew Turner#define C2 0x1.466bc6p1f
*f3087befSAndrew Turner#define C3 -0x1.32d2ccp-1f
*f3087befSAndrew Turner#define C4 0x1.50783p-4f
*f3087befSAndrew Turner#define C5 -0x1.e30750p-8f
*f3087befSAndrew Turner
*f3087befSAndrew Turner#define Shift 0x1.0p+23f
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Approximation for scalar single-precision cospi(x) - cospif.
*f3087befSAndrew Turner   Maximum error: 2.64 ULP:
*f3087befSAndrew Turner   cospif(0x1.37e844p-4) got 0x1.f16b3p-1
*f3087befSAndrew Turner			want 0x1.f16b2ap-1.  */
*f3087befSAndrew Turnerfloat
*f3087befSAndrew Turnerarm_math_cospif (float x)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  if (isinf (x) || isnan (x))
*f3087befSAndrew Turner    return __math_invalidf (x);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  float ax = asfloat (asuint (x) & ~0x80000000);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Edge cases for when cospif should be exactly +/- 1. (Integers)
*f3087befSAndrew Turner     0x1p23 is the limit for single precision to store any decimal places.  */
*f3087befSAndrew Turner  if (ax >= 0x1p24f)
*f3087befSAndrew Turner    return 1;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  uint32_t m = roundf (ax);
*f3087befSAndrew Turner  if (m == ax)
*f3087befSAndrew Turner    return (m & 1) ? -1 : 1;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Any non-integer values >= 0x1p22f will be int +0.5.
*f3087befSAndrew Turner     These values should return exactly 0.  */
*f3087befSAndrew Turner  if (ax >= 0x1p22f)
*f3087befSAndrew Turner    return 0;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* For very small inputs, squaring r causes underflow.
*f3087befSAndrew Turner     Values below this threshold can be approximated via cospi(x) ~= 1 -
*f3087befSAndrew Turner     (pi*x).  */
*f3087befSAndrew Turner  if (ax < 0x1p-31f)
*f3087befSAndrew Turner    return 1 - (C0 * x);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* n = rint(|x|).  */
*f3087befSAndrew Turner  float n = ax + Shift;
*f3087befSAndrew Turner  uint32_t sign = asuint (n) << 31;
*f3087befSAndrew Turner  n = n - Shift;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* We know that cospi(x) = sinpi(0.5 - x)
*f3087befSAndrew Turner     range reduction and offset into sinpi range -1/2 .. 1/2
*f3087befSAndrew Turner     r = 0.5 - |x - rint(x)|.  */
*f3087befSAndrew Turner  float r = 0.5f - fabs (ax - n);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* y = sin(pi * r).  */
*f3087befSAndrew Turner  float r2 = r * r;
*f3087befSAndrew Turner  float y = fmaf (C5, r2, C4);
*f3087befSAndrew Turner  y = fmaf (y, r2, C3);
*f3087befSAndrew Turner  y = fmaf (y, r2, C2);
*f3087befSAndrew Turner  y = fmaf (y, r2, C1);
*f3087befSAndrew Turner  y = fmaf (y, r2, C0);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* As all values are reduced to -1/2 .. 1/2, the result of cos(x) always be
*f3087befSAndrew Turner     positive, therefore, the sign must be introduced based upon if x rounds to
*f3087befSAndrew Turner     odd or even.  */
*f3087befSAndrew Turner  return asfloat (asuint (y * r) ^ sign);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner#if WANT_EXPERIMENTAL_MATH
*f3087befSAndrew Turnerfloat
*f3087befSAndrew Turnercospif (float x)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  return arm_math_cospif (x);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner#endif
*f3087befSAndrew Turner
*f3087befSAndrew Turner#if WANT_TRIGPI_TESTS
*f3087befSAndrew TurnerTEST_ULP (arm_math_cospif, 2.15)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (arm_math_cospif, 0, 0x1p-31, 5000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (arm_math_cospif, 0x1p-31, 0.5, 10000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (arm_math_cospif, 0.5, 0x1p22f, 10000)
*f3087befSAndrew TurnerTEST_SYM_INTERVAL (arm_math_cospif, 0x1p22f, inf, 10000)
*f3087befSAndrew Turner#endif