aarch64/experimental/asinh_2u5.c

*f3087befSAndrew Turner/*
*f3087befSAndrew Turner * Double-precision asinh(x) function
*f3087befSAndrew Turner *
*f3087befSAndrew Turner * Copyright (c) 2022-2024, Arm Limited.
*f3087befSAndrew Turner * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*f3087befSAndrew Turner */
*f3087befSAndrew Turner#include "mathlib.h"
*f3087befSAndrew Turner#include "poly_scalar_f64.h"
*f3087befSAndrew Turner#include "math_config.h"
*f3087befSAndrew Turner#include "test_sig.h"
*f3087befSAndrew Turner#include "test_defs.h"
*f3087befSAndrew Turner
*f3087befSAndrew Turner#define AbsMask 0x7fffffffffffffff
*f3087befSAndrew Turner#define ExpM26 0x3e50000000000000 /* asuint64(0x1.0p-26).  */
*f3087befSAndrew Turner#define One 0x3ff0000000000000	  /* asuint64(1.0).  */
*f3087befSAndrew Turner#define Exp511 0x5fe0000000000000 /* asuint64(0x1.0p511).  */
*f3087befSAndrew Turner#define Ln2 0x1.62e42fefa39efp-1
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Scalar double-precision asinh implementation. This routine uses different
*f3087befSAndrew Turner   approaches on different intervals:
*f3087befSAndrew Turner
*f3087befSAndrew Turner   |x| < 2^-26: Return x. Function is exact in this region.
*f3087befSAndrew Turner
*f3087befSAndrew Turner   |x| < 1: Use custom order-17 polynomial. This is least accurate close to 1.
*f3087befSAndrew Turner     The largest observed error in this region is 1.47 ULPs:
*f3087befSAndrew Turner     asinh(0x1.fdfcd00cc1e6ap-1) got 0x1.c1d6bf874019bp-1
*f3087befSAndrew Turner				want 0x1.c1d6bf874019cp-1.
*f3087befSAndrew Turner
*f3087befSAndrew Turner   |x| < 2^511: Upper bound of this region is close to sqrt(DBL_MAX). Calculate
*f3087befSAndrew Turner     the result directly using the definition asinh(x) = ln(x + sqrt(x*x + 1)).
*f3087befSAndrew Turner     The largest observed error in this region is 2.03 ULPs:
*f3087befSAndrew Turner     asinh(-0x1.00094e0f39574p+0) got -0x1.c3508eb6a681ep-1
*f3087befSAndrew Turner				 want -0x1.c3508eb6a682p-1.
*f3087befSAndrew Turner
*f3087befSAndrew Turner   |x| >= 2^511: We cannot square x without overflow at a low
*f3087befSAndrew Turner     cost. At very large x, asinh(x) ~= ln(2x). At huge x we cannot
*f3087befSAndrew Turner     even double x without overflow, so calculate this as ln(x) +
*f3087befSAndrew Turner     ln(2). The largest observed error in this region is 0.98 ULPs at many
*f3087befSAndrew Turner     values, for instance:
*f3087befSAndrew Turner     asinh(0x1.5255a4cf10319p+975) got 0x1.52652f4cb26cbp+9
*f3087befSAndrew Turner				  want 0x1.52652f4cb26ccp+9.  */
*f3087befSAndrew Turnerdouble
*f3087befSAndrew Turnerasinh (double x)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  uint64_t ix = asuint64 (x);
*f3087befSAndrew Turner  uint64_t ia = ix & AbsMask;
*f3087befSAndrew Turner  double ax = asdouble (ia);
*f3087befSAndrew Turner  uint64_t sign = ix & ~AbsMask;
*f3087befSAndrew Turner
*f3087befSAndrew Turner  if (ia < ExpM26)
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      return x;
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner
*f3087befSAndrew Turner  if (ia < One)
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      double x2 = x * x;
*f3087befSAndrew Turner      double z2 = x2 * x2;
*f3087befSAndrew Turner      double z4 = z2 * z2;
*f3087befSAndrew Turner      double z8 = z4 * z4;
*f3087befSAndrew Turner      double p = estrin_17_f64 (x2, z2, z4, z8, z8 * z8, __asinh_data.poly);
*f3087befSAndrew Turner      double y = fma (p, x2 * ax, ax);
*f3087befSAndrew Turner      return asdouble (asuint64 (y) | sign);
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner
*f3087befSAndrew Turner  if (unlikely (ia >= Exp511))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      return asdouble (asuint64 (log (ax) + Ln2) | sign);
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner
*f3087befSAndrew Turner  return asdouble (asuint64 (log (ax + sqrt (ax * ax + 1))) | sign);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew TurnerTEST_SIG (S, D, 1, asinh, -10.0, 10.0)
*f3087befSAndrew TurnerTEST_ULP (asinh, 1.54)
*f3087befSAndrew TurnerTEST_INTERVAL (asinh, -0x1p-26, 0x1p-26, 50000)
*f3087befSAndrew TurnerTEST_INTERVAL (asinh, 0x1p-26, 1.0, 40000)
*f3087befSAndrew TurnerTEST_INTERVAL (asinh, -0x1p-26, -1.0, 10000)
*f3087befSAndrew TurnerTEST_INTERVAL (asinh, 1.0, 100.0, 40000)
*f3087befSAndrew TurnerTEST_INTERVAL (asinh, -1.0, -100.0, 10000)
*f3087befSAndrew TurnerTEST_INTERVAL (asinh, 100.0, inf, 50000)
*f3087befSAndrew TurnerTEST_INTERVAL (asinh, -100.0, -inf, 10000)