__support/math/expf.h

*bb722a7dSDimitry Andric//===-- Implementation header for expf --------------------------*- C++ -*-===//
*bb722a7dSDimitry Andric//
*bb722a7dSDimitry Andric// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
*bb722a7dSDimitry Andric// See https://llvm.org/LICENSE.txt for license information.
*bb722a7dSDimitry Andric// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
*bb722a7dSDimitry Andric//
*bb722a7dSDimitry Andric//===----------------------------------------------------------------------===//
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric#ifndef LLVM_LIBC_SRC___SUPPORT_MATH_EXPF_H
*bb722a7dSDimitry Andric#define LLVM_LIBC_SRC___SUPPORT_MATH_EXPF_H
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric#include "exp_float_constants.h" // Lookup tables EXP_M1 and EXP_M2.
*bb722a7dSDimitry Andric#include "src/__support/FPUtil/FEnvImpl.h"
*bb722a7dSDimitry Andric#include "src/__support/FPUtil/FPBits.h"
*bb722a7dSDimitry Andric#include "src/__support/FPUtil/PolyEval.h"
*bb722a7dSDimitry Andric#include "src/__support/FPUtil/multiply_add.h"
*bb722a7dSDimitry Andric#include "src/__support/FPUtil/nearest_integer.h"
*bb722a7dSDimitry Andric#include "src/__support/FPUtil/rounding_mode.h"
*bb722a7dSDimitry Andric#include "src/__support/common.h"
*bb722a7dSDimitry Andric#include "src/__support/macros/config.h"
*bb722a7dSDimitry Andric#include "src/__support/macros/optimization.h" // LIBC_UNLIKELY
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andricnamespace LIBC_NAMESPACE_DECL {
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andricnamespace math {
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andricstatic constexpr float expf(float x) {
*bb722a7dSDimitry Andric  using FPBits = typename fputil::FPBits<float>;
*bb722a7dSDimitry Andric  FPBits xbits(x);
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric  uint32_t x_u = xbits.uintval();
*bb722a7dSDimitry Andric  uint32_t x_abs = x_u & 0x7fff'ffffU;
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric#ifndef LIBC_MATH_HAS_SKIP_ACCURATE_PASS
*bb722a7dSDimitry Andric  // Exceptional values
*bb722a7dSDimitry Andric  if (LIBC_UNLIKELY(x_u == 0xc236'bd8cU)) { // x = -0x1.6d7b18p+5f
*bb722a7dSDimitry Andric    return 0x1.108a58p-66f - x * 0x1.0p-95f;
*bb722a7dSDimitry Andric  }
*bb722a7dSDimitry Andric#endif // !LIBC_MATH_HAS_SKIP_ACCURATE_PASS
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric  // When |x| >= 89, |x| < 2^-25, or x is nan
*bb722a7dSDimitry Andric  if (LIBC_UNLIKELY(x_abs >= 0x42b2'0000U || x_abs <= 0x3280'0000U)) {
*bb722a7dSDimitry Andric    // |x| < 2^-25
*bb722a7dSDimitry Andric    if (xbits.get_biased_exponent() <= 101) {
*bb722a7dSDimitry Andric      return 1.0f + x;
*bb722a7dSDimitry Andric    }
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric    // When x < log(2^-150) or nan
*bb722a7dSDimitry Andric    if (xbits.uintval() >= 0xc2cf'f1b5U) {
*bb722a7dSDimitry Andric      // exp(-Inf) = 0
*bb722a7dSDimitry Andric      if (xbits.is_inf())
*bb722a7dSDimitry Andric        return 0.0f;
*bb722a7dSDimitry Andric      // exp(nan) = nan
*bb722a7dSDimitry Andric      if (xbits.is_nan())
*bb722a7dSDimitry Andric        return x;
*bb722a7dSDimitry Andric      if (fputil::fenv_is_round_up())
*bb722a7dSDimitry Andric        return FPBits::min_subnormal().get_val();
*bb722a7dSDimitry Andric      fputil::set_errno_if_required(ERANGE);
*bb722a7dSDimitry Andric      fputil::raise_except_if_required(FE_UNDERFLOW);
*bb722a7dSDimitry Andric      return 0.0f;
*bb722a7dSDimitry Andric    }
*bb722a7dSDimitry Andric    // x >= 89 or nan
*bb722a7dSDimitry Andric    if (xbits.is_pos() && (xbits.uintval() >= 0x42b2'0000)) {
*bb722a7dSDimitry Andric      // x is finite
*bb722a7dSDimitry Andric      if (xbits.uintval() < 0x7f80'0000U) {
*bb722a7dSDimitry Andric        int rounding = fputil::quick_get_round();
*bb722a7dSDimitry Andric        if (rounding == FE_DOWNWARD || rounding == FE_TOWARDZERO)
*bb722a7dSDimitry Andric          return FPBits::max_normal().get_val();
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric        fputil::set_errno_if_required(ERANGE);
*bb722a7dSDimitry Andric        fputil::raise_except_if_required(FE_OVERFLOW);
*bb722a7dSDimitry Andric      }
*bb722a7dSDimitry Andric      // x is +inf or nan
*bb722a7dSDimitry Andric      return x + FPBits::inf().get_val();
*bb722a7dSDimitry Andric    }
*bb722a7dSDimitry Andric  }
*bb722a7dSDimitry Andric  // For -104 < x < 89, to compute exp(x), we perform the following range
*bb722a7dSDimitry Andric  // reduction: find hi, mid, lo such that:
*bb722a7dSDimitry Andric  //   x = hi + mid + lo, in which
*bb722a7dSDimitry Andric  //     hi is an integer,
*bb722a7dSDimitry Andric  //     mid * 2^7 is an integer
*bb722a7dSDimitry Andric  //     -2^(-8) <= lo < 2^-8.
*bb722a7dSDimitry Andric  // In particular,
*bb722a7dSDimitry Andric  //   hi + mid = round(x * 2^7) * 2^(-7).
*bb722a7dSDimitry Andric  // Then,
*bb722a7dSDimitry Andric  //   exp(x) = exp(hi + mid + lo) = exp(hi) * exp(mid) * exp(lo).
*bb722a7dSDimitry Andric  // We store exp(hi) and exp(mid) in the lookup tables EXP_M1 and EXP_M2
*bb722a7dSDimitry Andric  // respectively.  exp(lo) is computed using a degree-4 minimax polynomial
*bb722a7dSDimitry Andric  // generated by Sollya.
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric  // x_hi = (hi + mid) * 2^7 = round(x * 2^7).
*bb722a7dSDimitry Andric  float kf = fputil::nearest_integer(x * 0x1.0p7f);
*bb722a7dSDimitry Andric  // Subtract (hi + mid) from x to get lo.
*bb722a7dSDimitry Andric  double xd = static_cast<double>(fputil::multiply_add(kf, -0x1.0p-7f, x));
*bb722a7dSDimitry Andric  int x_hi = static_cast<int>(kf);
*bb722a7dSDimitry Andric  x_hi += 104 << 7;
*bb722a7dSDimitry Andric  // hi = x_hi >> 7
*bb722a7dSDimitry Andric  double exp_hi = EXP_M1[x_hi >> 7];
*bb722a7dSDimitry Andric  // mid * 2^7 = x_hi & 0x0000'007fU;
*bb722a7dSDimitry Andric  double exp_mid = EXP_M2[x_hi & 0x7f];
*bb722a7dSDimitry Andric  // Degree-4 minimax polynomial generated by Sollya with the following
*bb722a7dSDimitry Andric  // commands:
*bb722a7dSDimitry Andric  //   > display = hexadecimal;
*bb722a7dSDimitry Andric  //   > Q = fpminimax(expm1(x)/x, 3, [|D...|], [-2^-8, 2^-8]);
*bb722a7dSDimitry Andric  //   > Q;
*bb722a7dSDimitry Andric  double exp_lo =
*bb722a7dSDimitry Andric      fputil::polyeval(xd, 0x1p0, 0x1.ffffffffff777p-1, 0x1.000000000071cp-1,
*bb722a7dSDimitry Andric                       0x1.555566668e5e7p-3, 0x1.55555555ef243p-5);
*bb722a7dSDimitry Andric  return static_cast<float>(exp_hi * exp_mid * exp_lo);
*bb722a7dSDimitry Andric}
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric} // namespace math
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric} // namespace LIBC_NAMESPACE_DECL
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric#endif // LLVM_LIBC_SRC___SUPPORT_MATH_EXPF_H