aarch64/sve/powf.c

*f3087befSAndrew Turner/*
*f3087befSAndrew Turner * Single-precision SVE powf function.
*f3087befSAndrew Turner *
*f3087befSAndrew Turner * Copyright (c) 2023-2025, Arm Limited.
*f3087befSAndrew Turner * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*f3087befSAndrew Turner */
*f3087befSAndrew Turner
*f3087befSAndrew Turner#include "sv_math.h"
*f3087befSAndrew Turner#include "test_sig.h"
*f3087befSAndrew Turner#include "test_defs.h"
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* The following data is used in the SVE pow core computation
*f3087befSAndrew Turner   and special case detection.  */
*f3087befSAndrew Turner#define Tinvc __v_powf_data.invc
*f3087befSAndrew Turner#define Tlogc __v_powf_data.logc
*f3087befSAndrew Turner#define Texp __v_powf_data.scale
*f3087befSAndrew Turner#define SignBias (1 << (V_POWF_EXP2_TABLE_BITS + 11))
*f3087befSAndrew Turner#define Norm 0x1p23f /* 0x4b000000.  */
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Overall ULP error bound for pow is 2.6 ulp
*f3087befSAndrew Turner   ~ 0.5 + 2^24 (128*Ln2*relerr_log2 + relerr_exp2).  */
*f3087befSAndrew Turnerstatic const struct data
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  double log_poly[4];
*f3087befSAndrew Turner  double exp_poly[3];
*f3087befSAndrew Turner  float uflow_bound, oflow_bound, small_bound;
*f3087befSAndrew Turner  uint32_t sign_bias, subnormal_bias, off;
*f3087befSAndrew Turner} data = {
*f3087befSAndrew Turner  /* rel err: 1.5 * 2^-30. Each coefficients is multiplied the value of
*f3087befSAndrew Turner     V_POWF_EXP2_N.  */
*f3087befSAndrew Turner  .log_poly = { -0x1.6ff5daa3b3d7cp+3, 0x1.ec81d03c01aebp+3,
*f3087befSAndrew Turner		-0x1.71547bb43f101p+4, 0x1.7154764a815cbp+5 },
*f3087befSAndrew Turner  /* rel err: 1.69 * 2^-34.  */
*f3087befSAndrew Turner  .exp_poly = {
*f3087befSAndrew Turner    0x1.c6af84b912394p-20, /* A0 / V_POWF_EXP2_N^3.  */
*f3087befSAndrew Turner    0x1.ebfce50fac4f3p-13, /* A1 / V_POWF_EXP2_N^2.  */
*f3087befSAndrew Turner    0x1.62e42ff0c52d6p-6,   /* A3 / V_POWF_EXP2_N.  */
*f3087befSAndrew Turner  },
*f3087befSAndrew Turner  .uflow_bound = -0x1.2cp+12f, /* -150.0 * V_POWF_EXP2_N.  */
*f3087befSAndrew Turner  .oflow_bound = 0x1p+12f, /* 128.0 * V_POWF_EXP2_N.  */
*f3087befSAndrew Turner  .small_bound = 0x1p-126f,
*f3087befSAndrew Turner  .off = 0x3f35d000,
*f3087befSAndrew Turner  .sign_bias = SignBias,
*f3087befSAndrew Turner  .subnormal_bias = 0x0b800000, /* 23 << 23.  */
*f3087befSAndrew Turner};
*f3087befSAndrew Turner
*f3087befSAndrew Turner#define A(i) sv_f64 (d->log_poly[i])
*f3087befSAndrew Turner#define C(i) sv_f64 (d->exp_poly[i])
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Check if x is an integer.  */
*f3087befSAndrew Turnerstatic inline svbool_t
*f3087befSAndrew Turnersvisint (svbool_t pg, svfloat32_t x)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  return svcmpeq (pg, svrintz_z (pg, x), x);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Check if x is real not integer valued.  */
*f3087befSAndrew Turnerstatic inline svbool_t
*f3087befSAndrew Turnersvisnotint (svbool_t pg, svfloat32_t x)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  return svcmpne (pg, svrintz_z (pg, x), x);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Check if x is an odd integer.  */
*f3087befSAndrew Turnerstatic inline svbool_t
*f3087befSAndrew Turnersvisodd (svbool_t pg, svfloat32_t x)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  svfloat32_t y = svmul_x (pg, x, 0.5f);
*f3087befSAndrew Turner  return svisnotint (pg, y);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Check if zero, inf or nan.  */
*f3087befSAndrew Turnerstatic inline svbool_t
*f3087befSAndrew Turnersv_zeroinfnan (svbool_t pg, svuint32_t i)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  return svcmpge (pg, svsub_x (pg, svadd_x (pg, i, i), 1),
*f3087befSAndrew Turner		  2u * 0x7f800000 - 1);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Returns 0 if not int, 1 if odd int, 2 if even int.  The argument is
*f3087befSAndrew Turner   the bit representation of a non-zero finite floating-point value.  */
*f3087befSAndrew Turnerstatic inline int
*f3087befSAndrew Turnercheckint (uint32_t iy)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  int e = iy >> 23 & 0xff;
*f3087befSAndrew Turner  if (e < 0x7f)
*f3087befSAndrew Turner    return 0;
*f3087befSAndrew Turner  if (e > 0x7f + 23)
*f3087befSAndrew Turner    return 2;
*f3087befSAndrew Turner  if (iy & ((1 << (0x7f + 23 - e)) - 1))
*f3087befSAndrew Turner    return 0;
*f3087befSAndrew Turner  if (iy & (1 << (0x7f + 23 - e)))
*f3087befSAndrew Turner    return 1;
*f3087befSAndrew Turner  return 2;
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Check if zero, inf or nan.  */
*f3087befSAndrew Turnerstatic inline int
*f3087befSAndrew Turnerzeroinfnan (uint32_t ix)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  return 2 * ix - 1 >= 2u * 0x7f800000 - 1;
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* A scalar subroutine used to fix main power special cases. Similar to the
*f3087befSAndrew Turner   preamble of scalar powf except that we do not update ix and sign_bias. This
*f3087befSAndrew Turner   is done in the preamble of the SVE powf.  */
*f3087befSAndrew Turnerstatic inline float
*f3087befSAndrew Turnerpowf_specialcase (float x, float y, float z)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  uint32_t ix = asuint (x);
*f3087befSAndrew Turner  uint32_t iy = asuint (y);
*f3087befSAndrew Turner  /* Either (x < 0x1p-126 or inf or nan) or (y is 0 or inf or nan).  */
*f3087befSAndrew Turner  if (unlikely (zeroinfnan (iy)))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      if (2 * iy == 0)
*f3087befSAndrew Turner	return issignalingf_inline (x) ? x + y : 1.0f;
*f3087befSAndrew Turner      if (ix == 0x3f800000)
*f3087befSAndrew Turner	return issignalingf_inline (y) ? x + y : 1.0f;
*f3087befSAndrew Turner      if (2 * ix > 2u * 0x7f800000 || 2 * iy > 2u * 0x7f800000)
*f3087befSAndrew Turner	return x + y;
*f3087befSAndrew Turner      if (2 * ix == 2 * 0x3f800000)
*f3087befSAndrew Turner	return 1.0f;
*f3087befSAndrew Turner      if ((2 * ix < 2 * 0x3f800000) == !(iy & 0x80000000))
*f3087befSAndrew Turner	return 0.0f; /* |x|<1 && y==inf or |x|>1 && y==-inf.  */
*f3087befSAndrew Turner      return y * y;
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner  if (unlikely (zeroinfnan (ix)))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      float_t x2 = x * x;
*f3087befSAndrew Turner      if (ix & 0x80000000 && checkint (iy) == 1)
*f3087befSAndrew Turner	x2 = -x2;
*f3087befSAndrew Turner      return iy & 0x80000000 ? 1 / x2 : x2;
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner  /* We need a return here in case x<0 and y is integer, but all other tests
*f3087befSAndrew Turner   need to be run.  */
*f3087befSAndrew Turner  return z;
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Scalar fallback for special case routines with custom signature.  */
*f3087befSAndrew Turnerstatic svfloat32_t NOINLINE
*f3087befSAndrew Turnersv_call_powf_sc (svfloat32_t x1, svfloat32_t x2, svfloat32_t y)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  /* Special cases of x or y: zero, inf and nan.  */
*f3087befSAndrew Turner  svbool_t xspecial = sv_zeroinfnan (svptrue_b32 (), svreinterpret_u32 (x1));
*f3087befSAndrew Turner  svbool_t yspecial = sv_zeroinfnan (svptrue_b32 (), svreinterpret_u32 (x2));
*f3087befSAndrew Turner  svbool_t cmp = svorr_z (svptrue_b32 (), xspecial, yspecial);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  svbool_t p = svpfirst (cmp, svpfalse ());
*f3087befSAndrew Turner  while (svptest_any (cmp, p))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      float sx1 = svclastb (p, 0, x1);
*f3087befSAndrew Turner      float sx2 = svclastb (p, 0, x2);
*f3087befSAndrew Turner      float elem = svclastb (p, 0, y);
*f3087befSAndrew Turner      elem = powf_specialcase (sx1, sx2, elem);
*f3087befSAndrew Turner      svfloat32_t y2 = sv_f32 (elem);
*f3087befSAndrew Turner      y = svsel (p, y2, y);
*f3087befSAndrew Turner      p = svpnext_b32 (cmp, p);
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner  return y;
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Compute core for half of the lanes in double precision.  */
*f3087befSAndrew Turnerstatic inline svfloat64_t
*f3087befSAndrew Turnersv_powf_core_ext (const svbool_t pg, svuint64_t i, svfloat64_t z, svint64_t k,
*f3087befSAndrew Turner		  svfloat64_t y, svuint64_t sign_bias, svfloat64_t *pylogx,
*f3087befSAndrew Turner		  const struct data *d)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  svfloat64_t invc = svld1_gather_index (pg, Tinvc, i);
*f3087befSAndrew Turner  svfloat64_t logc = svld1_gather_index (pg, Tlogc, i);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* log2(x) = log1p(z/c-1)/ln2 + log2(c) + k.  */
*f3087befSAndrew Turner  svfloat64_t r = svmla_x (pg, sv_f64 (-1.0), z, invc);
*f3087befSAndrew Turner  svfloat64_t y0 = svadd_x (pg, logc, svcvt_f64_x (pg, k));
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Polynomial to approximate log1p(r)/ln2.  */
*f3087befSAndrew Turner  svfloat64_t logx = A (0);
*f3087befSAndrew Turner  logx = svmad_x (pg, r, logx, A (1));
*f3087befSAndrew Turner  logx = svmad_x (pg, r, logx, A (2));
*f3087befSAndrew Turner  logx = svmad_x (pg, r, logx, A (3));
*f3087befSAndrew Turner  logx = svmad_x (pg, r, logx, y0);
*f3087befSAndrew Turner  *pylogx = svmul_x (pg, y, logx);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* z - kd is in [-1, 1] in non-nearest rounding modes.  */
*f3087befSAndrew Turner  svfloat64_t kd = svrinta_x (svptrue_b64 (), *pylogx);
*f3087befSAndrew Turner  svuint64_t ki = svreinterpret_u64 (svcvt_s64_x (svptrue_b64 (), kd));
*f3087befSAndrew Turner
*f3087befSAndrew Turner  r = svsub_x (pg, *pylogx, kd);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* exp2(x) = 2^(k/N) * 2^r ~= s * (C0*r^3 + C1*r^2 + C2*r + 1).  */
*f3087befSAndrew Turner  svuint64_t t = svld1_gather_index (
*f3087befSAndrew Turner      svptrue_b64 (), Texp, svand_x (svptrue_b64 (), ki, V_POWF_EXP2_N - 1));
*f3087befSAndrew Turner  svuint64_t ski = svadd_x (svptrue_b64 (), ki, sign_bias);
*f3087befSAndrew Turner  t = svadd_x (svptrue_b64 (), t,
*f3087befSAndrew Turner	       svlsl_x (svptrue_b64 (), ski, 52 - V_POWF_EXP2_TABLE_BITS));
*f3087befSAndrew Turner  svfloat64_t s = svreinterpret_f64 (t);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  svfloat64_t p = C (0);
*f3087befSAndrew Turner  p = svmla_x (pg, C (1), p, r);
*f3087befSAndrew Turner  p = svmla_x (pg, C (2), p, r);
*f3087befSAndrew Turner  p = svmla_x (pg, s, p, svmul_x (svptrue_b64 (), s, r));
*f3087befSAndrew Turner
*f3087befSAndrew Turner  return p;
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Widen vector to double precision and compute core on both halves of the
*f3087befSAndrew Turner   vector. Lower cost of promotion by considering all lanes active.  */
*f3087befSAndrew Turnerstatic inline svfloat32_t
*f3087befSAndrew Turnersv_powf_core (const svbool_t pg, svuint32_t i, svuint32_t iz, svint32_t k,
*f3087befSAndrew Turner	      svfloat32_t y, svuint32_t sign_bias, svfloat32_t *pylogx,
*f3087befSAndrew Turner	      const struct data *d)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  const svbool_t ptrue = svptrue_b64 ();
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Unpack and promote input vectors (pg, y, z, i, k and sign_bias) into two
*f3087befSAndrew Turner     in order to perform core computation in double precision.  */
*f3087befSAndrew Turner  const svbool_t pg_lo = svunpklo (pg);
*f3087befSAndrew Turner  const svbool_t pg_hi = svunpkhi (pg);
*f3087befSAndrew Turner  svfloat64_t y_lo
*f3087befSAndrew Turner      = svcvt_f64_x (pg, svreinterpret_f32 (svunpklo (svreinterpret_u32 (y))));
*f3087befSAndrew Turner  svfloat64_t y_hi
*f3087befSAndrew Turner      = svcvt_f64_x (pg, svreinterpret_f32 (svunpkhi (svreinterpret_u32 (y))));
*f3087befSAndrew Turner  svfloat64_t z_lo = svcvt_f64_x (pg, svreinterpret_f32 (svunpklo (iz)));
*f3087befSAndrew Turner  svfloat64_t z_hi = svcvt_f64_x (pg, svreinterpret_f32 (svunpkhi (iz)));
*f3087befSAndrew Turner  svuint64_t i_lo = svunpklo (i);
*f3087befSAndrew Turner  svuint64_t i_hi = svunpkhi (i);
*f3087befSAndrew Turner  svint64_t k_lo = svunpklo (k);
*f3087befSAndrew Turner  svint64_t k_hi = svunpkhi (k);
*f3087befSAndrew Turner  svuint64_t sign_bias_lo = svunpklo (sign_bias);
*f3087befSAndrew Turner  svuint64_t sign_bias_hi = svunpkhi (sign_bias);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Compute each part in double precision.  */
*f3087befSAndrew Turner  svfloat64_t ylogx_lo, ylogx_hi;
*f3087befSAndrew Turner  svfloat64_t lo = sv_powf_core_ext (pg_lo, i_lo, z_lo, k_lo, y_lo,
*f3087befSAndrew Turner				     sign_bias_lo, &ylogx_lo, d);
*f3087befSAndrew Turner  svfloat64_t hi = sv_powf_core_ext (pg_hi, i_hi, z_hi, k_hi, y_hi,
*f3087befSAndrew Turner				     sign_bias_hi, &ylogx_hi, d);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Convert back to single-precision and interleave.  */
*f3087befSAndrew Turner  svfloat32_t ylogx_lo_32 = svcvt_f32_x (ptrue, ylogx_lo);
*f3087befSAndrew Turner  svfloat32_t ylogx_hi_32 = svcvt_f32_x (ptrue, ylogx_hi);
*f3087befSAndrew Turner  *pylogx = svuzp1 (ylogx_lo_32, ylogx_hi_32);
*f3087befSAndrew Turner  svfloat32_t lo_32 = svcvt_f32_x (ptrue, lo);
*f3087befSAndrew Turner  svfloat32_t hi_32 = svcvt_f32_x (ptrue, hi);
*f3087befSAndrew Turner  return svuzp1 (lo_32, hi_32);
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew Turner/* Implementation of SVE powf.
*f3087befSAndrew Turner   Provides the same accuracy as AdvSIMD powf, since it relies on the same
*f3087befSAndrew Turner   algorithm. The theoretical maximum error is under 2.60 ULPs.
*f3087befSAndrew Turner   Maximum measured error is 2.57 ULPs:
*f3087befSAndrew Turner   SV_NAME_F2 (pow) (0x1.031706p+0, 0x1.ce2ec2p+12) got 0x1.fff868p+127
*f3087befSAndrew Turner						   want 0x1.fff862p+127.  */
*f3087befSAndrew Turnersvfloat32_t SV_NAME_F2 (pow) (svfloat32_t x, svfloat32_t y, const svbool_t pg)
*f3087befSAndrew Turner{
*f3087befSAndrew Turner  const struct data *d = ptr_barrier (&data);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  svuint32_t vix0 = svreinterpret_u32 (x);
*f3087befSAndrew Turner  svuint32_t viy0 = svreinterpret_u32 (y);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Negative x cases.  */
*f3087befSAndrew Turner  svbool_t xisneg = svcmplt (pg, x, sv_f32 (0));
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Set sign_bias and ix depending on sign of x and nature of y.  */
*f3087befSAndrew Turner  svbool_t yint_or_xpos = pg;
*f3087befSAndrew Turner  svuint32_t sign_bias = sv_u32 (0);
*f3087befSAndrew Turner  svuint32_t vix = vix0;
*f3087befSAndrew Turner  if (unlikely (svptest_any (pg, xisneg)))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      /* Determine nature of y.  */
*f3087befSAndrew Turner      yint_or_xpos = svisint (xisneg, y);
*f3087befSAndrew Turner      svbool_t yisodd_xisneg = svisodd (xisneg, y);
*f3087befSAndrew Turner      /* ix set to abs(ix) if y is integer.  */
*f3087befSAndrew Turner      vix = svand_m (yint_or_xpos, vix0, 0x7fffffff);
*f3087befSAndrew Turner      /* Set to SignBias if x is negative and y is odd.  */
*f3087befSAndrew Turner      sign_bias = svsel (yisodd_xisneg, sv_u32 (d->sign_bias), sv_u32 (0));
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Special cases of x or y: zero, inf and nan.  */
*f3087befSAndrew Turner  svbool_t xspecial = sv_zeroinfnan (pg, vix0);
*f3087befSAndrew Turner  svbool_t yspecial = sv_zeroinfnan (pg, viy0);
*f3087befSAndrew Turner  svbool_t cmp = svorr_z (pg, xspecial, yspecial);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Small cases of x: |x| < 0x1p-126.  */
*f3087befSAndrew Turner  svbool_t xsmall = svaclt (yint_or_xpos, x, d->small_bound);
*f3087befSAndrew Turner  if (unlikely (svptest_any (yint_or_xpos, xsmall)))
*f3087befSAndrew Turner    {
*f3087befSAndrew Turner      /* Normalize subnormal x so exponent becomes negative.  */
*f3087befSAndrew Turner      svuint32_t vix_norm = svreinterpret_u32 (svmul_x (xsmall, x, Norm));
*f3087befSAndrew Turner      vix_norm = svand_x (xsmall, vix_norm, 0x7fffffff);
*f3087befSAndrew Turner      vix_norm = svsub_x (xsmall, vix_norm, d->subnormal_bias);
*f3087befSAndrew Turner      vix = svsel (xsmall, vix_norm, vix);
*f3087befSAndrew Turner    }
*f3087befSAndrew Turner  /* Part of core computation carried in working precision.  */
*f3087befSAndrew Turner  svuint32_t tmp = svsub_x (yint_or_xpos, vix, d->off);
*f3087befSAndrew Turner  svuint32_t i = svand_x (
*f3087befSAndrew Turner      yint_or_xpos, svlsr_x (yint_or_xpos, tmp, (23 - V_POWF_LOG2_TABLE_BITS)),
*f3087befSAndrew Turner      V_POWF_LOG2_N - 1);
*f3087befSAndrew Turner  svuint32_t top = svand_x (yint_or_xpos, tmp, 0xff800000);
*f3087befSAndrew Turner  svuint32_t iz = svsub_x (yint_or_xpos, vix, top);
*f3087befSAndrew Turner  svint32_t k = svasr_x (yint_or_xpos, svreinterpret_s32 (top),
*f3087befSAndrew Turner			 (23 - V_POWF_EXP2_TABLE_BITS));
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Compute core in extended precision and return intermediate ylogx results
*f3087befSAndrew Turner     to handle cases of underflow and underflow in exp.  */
*f3087befSAndrew Turner  svfloat32_t ylogx;
*f3087befSAndrew Turner  svfloat32_t ret
*f3087befSAndrew Turner      = sv_powf_core (yint_or_xpos, i, iz, k, y, sign_bias, &ylogx, d);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Handle exp special cases of underflow and overflow.  */
*f3087befSAndrew Turner  svuint32_t sign
*f3087befSAndrew Turner      = svlsl_x (yint_or_xpos, sign_bias, 20 - V_POWF_EXP2_TABLE_BITS);
*f3087befSAndrew Turner  svfloat32_t ret_oflow
*f3087befSAndrew Turner      = svreinterpret_f32 (svorr_x (yint_or_xpos, sign, asuint (INFINITY)));
*f3087befSAndrew Turner  svfloat32_t ret_uflow = svreinterpret_f32 (sign);
*f3087befSAndrew Turner  ret = svsel (svcmple (yint_or_xpos, ylogx, d->uflow_bound), ret_uflow, ret);
*f3087befSAndrew Turner  ret = svsel (svcmpgt (yint_or_xpos, ylogx, d->oflow_bound), ret_oflow, ret);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  /* Cases of finite y and finite negative x.  */
*f3087befSAndrew Turner  ret = svsel (yint_or_xpos, ret, sv_f32 (__builtin_nanf ("")));
*f3087befSAndrew Turner
*f3087befSAndrew Turner  if (unlikely (svptest_any (cmp, cmp)))
*f3087befSAndrew Turner    return sv_call_powf_sc (x, y, ret);
*f3087befSAndrew Turner
*f3087befSAndrew Turner  return ret;
*f3087befSAndrew Turner}
*f3087befSAndrew Turner
*f3087befSAndrew TurnerTEST_SIG (SV, F, 2, pow)
*f3087befSAndrew TurnerTEST_ULP (SV_NAME_F2 (pow), 2.08)
*f3087befSAndrew TurnerTEST_DISABLE_FENV (SV_NAME_F2 (pow))
*f3087befSAndrew Turner/* Wide intervals spanning the whole domain but shared between x and y.  */
*f3087befSAndrew Turner#define SV_POWF_INTERVAL2(xlo, xhi, ylo, yhi, n)                              \
*f3087befSAndrew Turner  TEST_INTERVAL2 (SV_NAME_F2 (pow), xlo, xhi, ylo, yhi, n)                    \
*f3087befSAndrew Turner  TEST_INTERVAL2 (SV_NAME_F2 (pow), xlo, xhi, -ylo, -yhi, n)                  \
*f3087befSAndrew Turner  TEST_INTERVAL2 (SV_NAME_F2 (pow), -xlo, -xhi, ylo, yhi, n)                  \
*f3087befSAndrew Turner  TEST_INTERVAL2 (SV_NAME_F2 (pow), -xlo, -xhi, -ylo, -yhi, n)
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (0, 0x1p-126, 0, inf, 40000)
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (0x1p-126, 1, 0, inf, 50000)
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (1, inf, 0, inf, 50000)
*f3087befSAndrew Turner/* x~1 or y~1.  */
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (0x1p-1, 0x1p1, 0x1p-10, 0x1p10, 10000)
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (0x1.ep-1, 0x1.1p0, 0x1p8, 0x1p16, 10000)
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (0x1p-500, 0x1p500, 0x1p-1, 0x1p1, 10000)
*f3087befSAndrew Turner/* around estimated argmaxs of ULP error.  */
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (0x1p-300, 0x1p-200, 0x1p-20, 0x1p-10, 10000)
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (0x1p50, 0x1p100, 0x1p-20, 0x1p-10, 10000)
*f3087befSAndrew Turner/* x is negative, y is odd or even integer, or y is real not integer.  */
*f3087befSAndrew TurnerTEST_INTERVAL2 (SV_NAME_F2 (pow), -0.0, -10.0, 3.0, 3.0, 10000)
*f3087befSAndrew TurnerTEST_INTERVAL2 (SV_NAME_F2 (pow), -0.0, -10.0, 4.0, 4.0, 10000)
*f3087befSAndrew TurnerTEST_INTERVAL2 (SV_NAME_F2 (pow), -0.0, -10.0, 0.0, 10.0, 10000)
*f3087befSAndrew TurnerTEST_INTERVAL2 (SV_NAME_F2 (pow), 0.0, 10.0, -0.0, -10.0, 10000)
*f3087befSAndrew Turner/* |x| is inf, y is odd or even integer, or y is real not integer.  */
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (inf, inf, 0.5, 0.5, 1)
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (inf, inf, 1.0, 1.0, 1)
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (inf, inf, 2.0, 2.0, 1)
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (inf, inf, 3.0, 3.0, 1)
*f3087befSAndrew Turner/* 0.0^y.  */
*f3087befSAndrew TurnerSV_POWF_INTERVAL2 (0.0, 0.0, 0.0, 0x1p120, 1000)
*f3087befSAndrew Turner/* 1.0^y.  */
*f3087befSAndrew TurnerTEST_INTERVAL2 (SV_NAME_F2 (pow), 1.0, 1.0, 0.0, 0x1p-50, 1000)
*f3087befSAndrew TurnerTEST_INTERVAL2 (SV_NAME_F2 (pow), 1.0, 1.0, 0x1p-50, 1.0, 1000)
*f3087befSAndrew TurnerTEST_INTERVAL2 (SV_NAME_F2 (pow), 1.0, 1.0, 1.0, 0x1p100, 1000)
*f3087befSAndrew TurnerTEST_INTERVAL2 (SV_NAME_F2 (pow), 1.0, 1.0, -1.0, -0x1p120, 1000)
*f3087befSAndrew TurnerCLOSE_SVE_ATTR