pl/math/acoshf_2u8.c

*072a4ba8SAndrew Turner/*
*072a4ba8SAndrew Turner * Single-precision acosh(x) function.
*072a4ba8SAndrew Turner *
*072a4ba8SAndrew Turner * Copyright (c) 2022-2023, Arm Limited.
*072a4ba8SAndrew Turner * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*072a4ba8SAndrew Turner */
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner#include "math_config.h"
*072a4ba8SAndrew Turner#include "pl_sig.h"
*072a4ba8SAndrew Turner#include "pl_test.h"
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner#define Ln2 (0x1.62e4p-1f)
*072a4ba8SAndrew Turner#define MinusZero 0x80000000
*072a4ba8SAndrew Turner#define SquareLim 0x5f800000 /* asuint(0x1p64).  */
*072a4ba8SAndrew Turner#define Two 0x40000000
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner/* Single-precision log from math/.  */
*072a4ba8SAndrew Turnerfloat
*072a4ba8SAndrew Turneroptr_aor_log_f32 (float);
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner/* Single-precision log(1+x) from pl/math.  */
*072a4ba8SAndrew Turnerfloat
*072a4ba8SAndrew Turnerlog1pf (float);
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner/* acoshf approximation using a variety of approaches on different intervals:
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner   x >= 2^64: We cannot square x without overflow. For huge x, sqrt(x*x - 1) is
*072a4ba8SAndrew Turner   close enough to x that we can calculate the result by ln(2x) == ln(x) +
*072a4ba8SAndrew Turner   ln(2). The greatest error in the region is 0.94 ULP:
*072a4ba8SAndrew Turner   acoshf(0x1.15f706p+92) got 0x1.022e14p+6 want 0x1.022e16p+6.
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner   x > 2: Calculate the result directly using definition of asinh(x) = ln(x +
*072a4ba8SAndrew Turner   sqrt(x*x - 1)). Greatest error in this region is 1.30 ULP:
*072a4ba8SAndrew Turner   acoshf(0x1.249d8p+1) got 0x1.77e1aep+0 want 0x1.77e1bp+0.
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner   0 <= x <= 2: Calculate the result using log1p. For x < 1, acosh(x) is
*072a4ba8SAndrew Turner   undefined. For 1 <= x <= 2, the greatest error is 2.78 ULP:
*072a4ba8SAndrew Turner   acoshf(0x1.07887p+0) got 0x1.ef9e9cp-3 want 0x1.ef9ea2p-3.  */
*072a4ba8SAndrew Turnerfloat
*072a4ba8SAndrew Turneracoshf (float x)
*072a4ba8SAndrew Turner{
*072a4ba8SAndrew Turner  uint32_t ix = asuint (x);
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner  if (unlikely (ix >= MinusZero))
*072a4ba8SAndrew Turner    return __math_invalidf (x);
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner  if (unlikely (ix >= SquareLim))
*072a4ba8SAndrew Turner    return optr_aor_log_f32 (x) + Ln2;
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner  if (ix > Two)
*072a4ba8SAndrew Turner    return optr_aor_log_f32 (x + sqrtf (x * x - 1));
*072a4ba8SAndrew Turner
*072a4ba8SAndrew Turner  float xm1 = x - 1;
*072a4ba8SAndrew Turner  return log1pf (xm1 + sqrtf (2 * xm1 + xm1 * xm1));
*072a4ba8SAndrew Turner}
*072a4ba8SAndrew Turner
*072a4ba8SAndrew TurnerPL_SIG (S, F, 1, acosh, 1.0, 10.0)
*072a4ba8SAndrew TurnerPL_TEST_ULP (acoshf, 2.30)
*072a4ba8SAndrew TurnerPL_TEST_INTERVAL (acoshf, 0, 1, 100)
*072a4ba8SAndrew TurnerPL_TEST_INTERVAL (acoshf, 1, 2, 10000)
*072a4ba8SAndrew TurnerPL_TEST_INTERVAL (acoshf, 2, 0x1p64, 100000)
*072a4ba8SAndrew TurnerPL_TEST_INTERVAL (acoshf, 0x1p64, inf, 100000)
*072a4ba8SAndrew TurnerPL_TEST_INTERVAL (acoshf, -0, -inf, 10000)