arm-optimized-routines/math/sincosf.c

*31914882SAlex Richardson/*
*31914882SAlex Richardson * Single-precision sin/cos function.
*31914882SAlex Richardson *
*31914882SAlex Richardson * Copyright (c) 2018-2019, Arm Limited.
*31914882SAlex Richardson * SPDX-License-Identifier: MIT
*31914882SAlex Richardson */
*31914882SAlex Richardson
*31914882SAlex Richardson#include <stdint.h>
*31914882SAlex Richardson#include <math.h>
*31914882SAlex Richardson#include "math_config.h"
*31914882SAlex Richardson#include "sincosf.h"
*31914882SAlex Richardson
*31914882SAlex Richardson/* Fast sincosf implementation.  Worst-case ULP is 0.5607, maximum relative
*31914882SAlex Richardson   error is 0.5303 * 2^-23.  A single-step range reduction is used for
*31914882SAlex Richardson   small values.  Large inputs have their range reduced using fast integer
*31914882SAlex Richardson   arithmetic.  */
*31914882SAlex Richardsonvoid
*31914882SAlex Richardsonsincosf (float y, float *sinp, float *cosp)
*31914882SAlex Richardson{
*31914882SAlex Richardson  double x = y;
*31914882SAlex Richardson  double s;
*31914882SAlex Richardson  int n;
*31914882SAlex Richardson  const sincos_t *p = &__sincosf_table[0];
*31914882SAlex Richardson
*31914882SAlex Richardson  if (abstop12 (y) < abstop12 (pio4))
*31914882SAlex Richardson    {
*31914882SAlex Richardson      double x2 = x * x;
*31914882SAlex Richardson
*31914882SAlex Richardson      if (unlikely (abstop12 (y) < abstop12 (0x1p-12f)))
*31914882SAlex Richardson	{
*31914882SAlex Richardson	  if (unlikely (abstop12 (y) < abstop12 (0x1p-126f)))
*31914882SAlex Richardson	    /* Force underflow for tiny y.  */
*31914882SAlex Richardson	    force_eval_float (x2);
*31914882SAlex Richardson	  *sinp = y;
*31914882SAlex Richardson	  *cosp = 1.0f;
*31914882SAlex Richardson	  return;
*31914882SAlex Richardson	}
*31914882SAlex Richardson
*31914882SAlex Richardson      sincosf_poly (x, x2, p, 0, sinp, cosp);
*31914882SAlex Richardson    }
*31914882SAlex Richardson  else if (abstop12 (y) < abstop12 (120.0f))
*31914882SAlex Richardson    {
*31914882SAlex Richardson      x = reduce_fast (x, p, &n);
*31914882SAlex Richardson
*31914882SAlex Richardson      /* Setup the signs for sin and cos.  */
*31914882SAlex Richardson      s = p->sign[n & 3];
*31914882SAlex Richardson
*31914882SAlex Richardson      if (n & 2)
*31914882SAlex Richardson	p = &__sincosf_table[1];
*31914882SAlex Richardson
*31914882SAlex Richardson      sincosf_poly (x * s, x * x, p, n, sinp, cosp);
*31914882SAlex Richardson    }
*31914882SAlex Richardson  else if (likely (abstop12 (y) < abstop12 (INFINITY)))
*31914882SAlex Richardson    {
*31914882SAlex Richardson      uint32_t xi = asuint (y);
*31914882SAlex Richardson      int sign = xi >> 31;
*31914882SAlex Richardson
*31914882SAlex Richardson      x = reduce_large (xi, &n);
*31914882SAlex Richardson
*31914882SAlex Richardson      /* Setup signs for sin and cos - include original sign.  */
*31914882SAlex Richardson      s = p->sign[(n + sign) & 3];
*31914882SAlex Richardson
*31914882SAlex Richardson      if ((n + sign) & 2)
*31914882SAlex Richardson	p = &__sincosf_table[1];
*31914882SAlex Richardson
*31914882SAlex Richardson      sincosf_poly (x * s, x * x, p, n, sinp, cosp);
*31914882SAlex Richardson    }
*31914882SAlex Richardson  else
*31914882SAlex Richardson    {
*31914882SAlex Richardson      /* Return NaN if Inf or NaN for both sin and cos.  */
*31914882SAlex Richardson      *sinp = *cosp = y - y;
*31914882SAlex Richardson#if WANT_ERRNO
*31914882SAlex Richardson      /* Needed to set errno for +-Inf, the add is a hack to work
*31914882SAlex Richardson	 around a gcc register allocation issue: just passing y
*31914882SAlex Richardson	 affects code generation in the fast path.  */
*31914882SAlex Richardson      __math_invalidf (y + y);
*31914882SAlex Richardson#endif
*31914882SAlex Richardson    }
*31914882SAlex Richardson}