lib/Headers/__clang_cuda_cmath.h

0b57cec5SDimitry Andric/*===---- __clang_cuda_cmath.h - Device-side CUDA cmath support ------------===
0b57cec5SDimitry Andric *
0b57cec5SDimitry Andric * Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
0b57cec5SDimitry Andric * See https://llvm.org/LICENSE.txt for license information.
0b57cec5SDimitry Andric * SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
0b57cec5SDimitry Andric *
0b57cec5SDimitry Andric *===-----------------------------------------------------------------------===
0b57cec5SDimitry Andric */
0b57cec5SDimitry Andric#ifndef __CLANG_CUDA_CMATH_H__
0b57cec5SDimitry Andric#define __CLANG_CUDA_CMATH_H__
0b57cec5SDimitry Andric#ifndef __CUDA__
0b57cec5SDimitry Andric#error "This file is for CUDA compilation only."
0b57cec5SDimitry Andric#endif
0b57cec5SDimitry Andric
5ffd83dbSDimitry Andric#ifndef __OPENMP_NVPTX__
0b57cec5SDimitry Andric#include <limits>
5ffd83dbSDimitry Andric#endif
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric// CUDA lets us use various std math functions on the device side.  This file
0b57cec5SDimitry Andric// works in concert with __clang_cuda_math_forward_declares.h to make this work.
0b57cec5SDimitry Andric//
0b57cec5SDimitry Andric// Specifically, the forward-declares header declares __device__ overloads for
0b57cec5SDimitry Andric// these functions in the global namespace, then pulls them into namespace std
0b57cec5SDimitry Andric// with 'using' statements.  Then this file implements those functions, after
0b57cec5SDimitry Andric// their implementations have been pulled in.
0b57cec5SDimitry Andric//
0b57cec5SDimitry Andric// It's important that we declare the functions in the global namespace and pull
0b57cec5SDimitry Andric// them into namespace std with using statements, as opposed to simply declaring
0b57cec5SDimitry Andric// these functions in namespace std, because our device functions need to
0b57cec5SDimitry Andric// overload the standard library functions, which may be declared in the global
0b57cec5SDimitry Andric// namespace or in std, depending on the degree of conformance of the stdlib
0b57cec5SDimitry Andric// implementation.  Declaring in the global namespace and pulling into namespace
0b57cec5SDimitry Andric// std covers all of the known knowns.
0b57cec5SDimitry Andric
5ffd83dbSDimitry Andric#ifdef __OPENMP_NVPTX__
5ffd83dbSDimitry Andric#define __DEVICE__ static constexpr __attribute__((always_inline, nothrow))
0b57cec5SDimitry Andric#else
0b57cec5SDimitry Andric#define __DEVICE__ static __device__ __inline__ __attribute__((always_inline))
0b57cec5SDimitry Andric#endif
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric__DEVICE__ long long abs(long long __n) { return ::llabs(__n); }
0b57cec5SDimitry Andric__DEVICE__ long abs(long __n) { return ::labs(__n); }
0b57cec5SDimitry Andric__DEVICE__ float abs(float __x) { return ::fabsf(__x); }
0b57cec5SDimitry Andric__DEVICE__ double abs(double __x) { return ::fabs(__x); }
0b57cec5SDimitry Andric__DEVICE__ float acos(float __x) { return ::acosf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float asin(float __x) { return ::asinf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float atan(float __x) { return ::atanf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float atan2(float __x, float __y) { return ::atan2f(__x, __y); }
0b57cec5SDimitry Andric__DEVICE__ float ceil(float __x) { return ::ceilf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float cos(float __x) { return ::cosf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float cosh(float __x) { return ::coshf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float exp(float __x) { return ::expf(__x); }
5ffd83dbSDimitry Andric__DEVICE__ float fabs(float __x) { return ::fabsf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float floor(float __x) { return ::floorf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float fmod(float __x, float __y) { return ::fmodf(__x, __y); }
0b57cec5SDimitry Andric__DEVICE__ int fpclassify(float __x) {
0b57cec5SDimitry Andric  return __builtin_fpclassify(FP_NAN, FP_INFINITE, FP_NORMAL, FP_SUBNORMAL,
0b57cec5SDimitry Andric                              FP_ZERO, __x);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ int fpclassify(double __x) {
0b57cec5SDimitry Andric  return __builtin_fpclassify(FP_NAN, FP_INFINITE, FP_NORMAL, FP_SUBNORMAL,
0b57cec5SDimitry Andric                              FP_ZERO, __x);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ float frexp(float __arg, int *__exp) {
0b57cec5SDimitry Andric  return ::frexpf(__arg, __exp);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric// For inscrutable reasons, the CUDA headers define these functions for us on
*e8d8bef9SDimitry Andric// Windows.
*e8d8bef9SDimitry Andric#if !defined(_MSC_VER) || defined(__OPENMP_NVPTX__)
*e8d8bef9SDimitry Andric
*e8d8bef9SDimitry Andric// For OpenMP we work around some old system headers that have non-conforming
*e8d8bef9SDimitry Andric// `isinf(float)` and `isnan(float)` implementations that return an `int`. We do
*e8d8bef9SDimitry Andric// this by providing two versions of these functions, differing only in the
*e8d8bef9SDimitry Andric// return type. To avoid conflicting definitions we disable implicit base
*e8d8bef9SDimitry Andric// function generation. That means we will end up with two specializations, one
*e8d8bef9SDimitry Andric// per type, but only one has a base function defined by the system header.
*e8d8bef9SDimitry Andric#if defined(__OPENMP_NVPTX__)
*e8d8bef9SDimitry Andric#pragma omp begin declare variant match(                                       \
*e8d8bef9SDimitry Andric    implementation = {extension(disable_implicit_base)})
*e8d8bef9SDimitry Andric
*e8d8bef9SDimitry Andric// FIXME: We lack an extension to customize the mangling of the variants, e.g.,
*e8d8bef9SDimitry Andric//        add a suffix. This means we would clash with the names of the variants
*e8d8bef9SDimitry Andric//        (note that we do not create implicit base functions here). To avoid
*e8d8bef9SDimitry Andric//        this clash we add a new trait to some of them that is always true
*e8d8bef9SDimitry Andric//        (this is LLVM after all ;)). It will only influence the mangled name
*e8d8bef9SDimitry Andric//        of the variants inside the inner region and avoid the clash.
*e8d8bef9SDimitry Andric#pragma omp begin declare variant match(implementation = {vendor(llvm)})
*e8d8bef9SDimitry Andric
*e8d8bef9SDimitry Andric__DEVICE__ int isinf(float __x) { return ::__isinff(__x); }
*e8d8bef9SDimitry Andric__DEVICE__ int isinf(double __x) { return ::__isinf(__x); }
*e8d8bef9SDimitry Andric__DEVICE__ int isfinite(float __x) { return ::__finitef(__x); }
*e8d8bef9SDimitry Andric__DEVICE__ int isfinite(double __x) { return ::__isfinited(__x); }
*e8d8bef9SDimitry Andric__DEVICE__ int isnan(float __x) { return ::__isnanf(__x); }
*e8d8bef9SDimitry Andric__DEVICE__ int isnan(double __x) { return ::__isnan(__x); }
*e8d8bef9SDimitry Andric
*e8d8bef9SDimitry Andric#pragma omp end declare variant
*e8d8bef9SDimitry Andric
*e8d8bef9SDimitry Andric#endif
*e8d8bef9SDimitry Andric
0b57cec5SDimitry Andric__DEVICE__ bool isinf(float __x) { return ::__isinff(__x); }
0b57cec5SDimitry Andric__DEVICE__ bool isinf(double __x) { return ::__isinf(__x); }
0b57cec5SDimitry Andric__DEVICE__ bool isfinite(float __x) { return ::__finitef(__x); }
0b57cec5SDimitry Andric// For inscrutable reasons, __finite(), the double-precision version of
0b57cec5SDimitry Andric// __finitef, does not exist when compiling for MacOS.  __isfinited is available
0b57cec5SDimitry Andric// everywhere and is just as good.
0b57cec5SDimitry Andric__DEVICE__ bool isfinite(double __x) { return ::__isfinited(__x); }
0b57cec5SDimitry Andric__DEVICE__ bool isnan(float __x) { return ::__isnanf(__x); }
0b57cec5SDimitry Andric__DEVICE__ bool isnan(double __x) { return ::__isnan(__x); }
*e8d8bef9SDimitry Andric
*e8d8bef9SDimitry Andric#if defined(__OPENMP_NVPTX__)
*e8d8bef9SDimitry Andric#pragma omp end declare variant
*e8d8bef9SDimitry Andric#endif
*e8d8bef9SDimitry Andric
0b57cec5SDimitry Andric#endif
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric__DEVICE__ bool isgreater(float __x, float __y) {
0b57cec5SDimitry Andric  return __builtin_isgreater(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool isgreater(double __x, double __y) {
0b57cec5SDimitry Andric  return __builtin_isgreater(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool isgreaterequal(float __x, float __y) {
0b57cec5SDimitry Andric  return __builtin_isgreaterequal(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool isgreaterequal(double __x, double __y) {
0b57cec5SDimitry Andric  return __builtin_isgreaterequal(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool isless(float __x, float __y) {
0b57cec5SDimitry Andric  return __builtin_isless(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool isless(double __x, double __y) {
0b57cec5SDimitry Andric  return __builtin_isless(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool islessequal(float __x, float __y) {
0b57cec5SDimitry Andric  return __builtin_islessequal(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool islessequal(double __x, double __y) {
0b57cec5SDimitry Andric  return __builtin_islessequal(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool islessgreater(float __x, float __y) {
0b57cec5SDimitry Andric  return __builtin_islessgreater(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool islessgreater(double __x, double __y) {
0b57cec5SDimitry Andric  return __builtin_islessgreater(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool isnormal(float __x) { return __builtin_isnormal(__x); }
0b57cec5SDimitry Andric__DEVICE__ bool isnormal(double __x) { return __builtin_isnormal(__x); }
0b57cec5SDimitry Andric__DEVICE__ bool isunordered(float __x, float __y) {
0b57cec5SDimitry Andric  return __builtin_isunordered(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool isunordered(double __x, double __y) {
0b57cec5SDimitry Andric  return __builtin_isunordered(__x, __y);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ float ldexp(float __arg, int __exp) {
0b57cec5SDimitry Andric  return ::ldexpf(__arg, __exp);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ float log(float __x) { return ::logf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float log10(float __x) { return ::log10f(__x); }
0b57cec5SDimitry Andric__DEVICE__ float modf(float __x, float *__iptr) { return ::modff(__x, __iptr); }
0b57cec5SDimitry Andric__DEVICE__ float pow(float __base, float __exp) {
0b57cec5SDimitry Andric  return ::powf(__base, __exp);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ float pow(float __base, int __iexp) {
0b57cec5SDimitry Andric  return ::powif(__base, __iexp);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ double pow(double __base, int __iexp) {
0b57cec5SDimitry Andric  return ::powi(__base, __iexp);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric__DEVICE__ bool signbit(float __x) { return ::__signbitf(__x); }
0b57cec5SDimitry Andric__DEVICE__ bool signbit(double __x) { return ::__signbitd(__x); }
0b57cec5SDimitry Andric__DEVICE__ float sin(float __x) { return ::sinf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float sinh(float __x) { return ::sinhf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float sqrt(float __x) { return ::sqrtf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float tan(float __x) { return ::tanf(__x); }
0b57cec5SDimitry Andric__DEVICE__ float tanh(float __x) { return ::tanhf(__x); }
0b57cec5SDimitry Andric
*e8d8bef9SDimitry Andric// There was a redefinition error for this this overload in CUDA mode.
*e8d8bef9SDimitry Andric// We restrict it to OpenMP mode for now, that is where it is actually needed
*e8d8bef9SDimitry Andric// anyway.
*e8d8bef9SDimitry Andric#ifdef __OPENMP_NVPTX__
*e8d8bef9SDimitry Andric__DEVICE__ float remquo(float __n, float __d, int *__q) {
*e8d8bef9SDimitry Andric  return ::remquof(__n, __d, __q);
*e8d8bef9SDimitry Andric}
*e8d8bef9SDimitry Andric#endif
*e8d8bef9SDimitry Andric
0b57cec5SDimitry Andric// Notably missing above is nexttoward.  We omit it because
0b57cec5SDimitry Andric// libdevice doesn't provide an implementation, and we don't want to be in the
0b57cec5SDimitry Andric// business of implementing tricky libm functions in this header.
0b57cec5SDimitry Andric
5ffd83dbSDimitry Andric#ifndef __OPENMP_NVPTX__
5ffd83dbSDimitry Andric
0b57cec5SDimitry Andric// Now we've defined everything we promised we'd define in
0b57cec5SDimitry Andric// __clang_cuda_math_forward_declares.h.  We need to do two additional things to
0b57cec5SDimitry Andric// fix up our math functions.
0b57cec5SDimitry Andric//
0b57cec5SDimitry Andric// 1) Define __device__ overloads for e.g. sin(int).  The CUDA headers define
0b57cec5SDimitry Andric//    only sin(float) and sin(double), which means that e.g. sin(0) is
0b57cec5SDimitry Andric//    ambiguous.
0b57cec5SDimitry Andric//
0b57cec5SDimitry Andric// 2) Pull the __device__ overloads of "foobarf" math functions into namespace
0b57cec5SDimitry Andric//    std.  These are defined in the CUDA headers in the global namespace,
0b57cec5SDimitry Andric//    independent of everything else we've done here.
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric// We can't use std::enable_if, because we want to be pre-C++11 compatible.  But
0b57cec5SDimitry Andric// we go ahead and unconditionally define functions that are only available when
0b57cec5SDimitry Andric// compiling for C++11 to match the behavior of the CUDA headers.
0b57cec5SDimitry Andrictemplate<bool __B, class __T = void>
0b57cec5SDimitry Andricstruct __clang_cuda_enable_if {};
0b57cec5SDimitry Andric
0b57cec5SDimitry Andrictemplate <class __T> struct __clang_cuda_enable_if<true, __T> {
0b57cec5SDimitry Andric  typedef __T type;
0b57cec5SDimitry Andric};
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric// Defines an overload of __fn that accepts one integral argument, calls
0b57cec5SDimitry Andric// __fn((double)x), and returns __retty.
0b57cec5SDimitry Andric#define __CUDA_CLANG_FN_INTEGER_OVERLOAD_1(__retty, __fn)                      \
0b57cec5SDimitry Andric  template <typename __T>                                                      \
0b57cec5SDimitry Andric  __DEVICE__                                                                   \
0b57cec5SDimitry Andric      typename __clang_cuda_enable_if<std::numeric_limits<__T>::is_integer,    \
0b57cec5SDimitry Andric                                      __retty>::type                           \
0b57cec5SDimitry Andric      __fn(__T __x) {                                                          \
0b57cec5SDimitry Andric    return ::__fn((double)__x);                                                \
0b57cec5SDimitry Andric  }
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric// Defines an overload of __fn that accepts one two arithmetic arguments, calls
0b57cec5SDimitry Andric// __fn((double)x, (double)y), and returns a double.
0b57cec5SDimitry Andric//
0b57cec5SDimitry Andric// Note this is different from OVERLOAD_1, which generates an overload that
0b57cec5SDimitry Andric// accepts only *integral* arguments.
0b57cec5SDimitry Andric#define __CUDA_CLANG_FN_INTEGER_OVERLOAD_2(__retty, __fn)                      \
0b57cec5SDimitry Andric  template <typename __T1, typename __T2>                                      \
0b57cec5SDimitry Andric  __DEVICE__ typename __clang_cuda_enable_if<                                  \
0b57cec5SDimitry Andric      std::numeric_limits<__T1>::is_specialized &&                             \
0b57cec5SDimitry Andric          std::numeric_limits<__T2>::is_specialized,                           \
0b57cec5SDimitry Andric      __retty>::type                                                           \
0b57cec5SDimitry Andric  __fn(__T1 __x, __T2 __y) {                                                   \
0b57cec5SDimitry Andric    return __fn((double)__x, (double)__y);                                     \
0b57cec5SDimitry Andric  }
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, acos)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, acosh)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, asin)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, asinh)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, atan)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(double, atan2);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, atanh)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, cbrt)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, ceil)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(double, copysign);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, cos)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, cosh)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, erf)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, erfc)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, exp)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, exp2)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, expm1)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, fabs)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(double, fdim);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, floor)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(double, fmax);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(double, fmin);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(double, fmod);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(int, fpclassify)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(double, hypot);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(int, ilogb)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(bool, isfinite)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(bool, isgreater);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(bool, isgreaterequal);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(bool, isinf);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(bool, isless);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(bool, islessequal);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(bool, islessgreater);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(bool, isnan);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(bool, isnormal)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(bool, isunordered);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, lgamma)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, log)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, log10)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, log1p)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, log2)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, logb)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(long long, llrint)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(long long, llround)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(long, lrint)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(long, lround)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, nearbyint);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(double, nextafter);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(double, pow);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_2(double, remainder);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, rint);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, round);
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(bool, signbit)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, sin)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, sinh)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, sqrt)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, tan)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, tanh)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, tgamma)
0b57cec5SDimitry Andric__CUDA_CLANG_FN_INTEGER_OVERLOAD_1(double, trunc);
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#undef __CUDA_CLANG_FN_INTEGER_OVERLOAD_1
0b57cec5SDimitry Andric#undef __CUDA_CLANG_FN_INTEGER_OVERLOAD_2
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric// Overloads for functions that don't match the patterns expected by
0b57cec5SDimitry Andric// __CUDA_CLANG_FN_INTEGER_OVERLOAD_{1,2}.
0b57cec5SDimitry Andrictemplate <typename __T1, typename __T2, typename __T3>
0b57cec5SDimitry Andric__DEVICE__ typename __clang_cuda_enable_if<
0b57cec5SDimitry Andric    std::numeric_limits<__T1>::is_specialized &&
0b57cec5SDimitry Andric        std::numeric_limits<__T2>::is_specialized &&
0b57cec5SDimitry Andric        std::numeric_limits<__T3>::is_specialized,
0b57cec5SDimitry Andric    double>::type
0b57cec5SDimitry Andricfma(__T1 __x, __T2 __y, __T3 __z) {
0b57cec5SDimitry Andric  return std::fma((double)__x, (double)__y, (double)__z);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric
0b57cec5SDimitry Andrictemplate <typename __T>
0b57cec5SDimitry Andric__DEVICE__ typename __clang_cuda_enable_if<std::numeric_limits<__T>::is_integer,
0b57cec5SDimitry Andric                                           double>::type
0b57cec5SDimitry Andricfrexp(__T __x, int *__exp) {
0b57cec5SDimitry Andric  return std::frexp((double)__x, __exp);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric
0b57cec5SDimitry Andrictemplate <typename __T>
0b57cec5SDimitry Andric__DEVICE__ typename __clang_cuda_enable_if<std::numeric_limits<__T>::is_integer,
0b57cec5SDimitry Andric                                           double>::type
0b57cec5SDimitry Andricldexp(__T __x, int __exp) {
0b57cec5SDimitry Andric  return std::ldexp((double)__x, __exp);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric
0b57cec5SDimitry Andrictemplate <typename __T1, typename __T2>
0b57cec5SDimitry Andric__DEVICE__ typename __clang_cuda_enable_if<
0b57cec5SDimitry Andric    std::numeric_limits<__T1>::is_specialized &&
0b57cec5SDimitry Andric        std::numeric_limits<__T2>::is_specialized,
0b57cec5SDimitry Andric    double>::type
0b57cec5SDimitry Andricremquo(__T1 __x, __T2 __y, int *__quo) {
0b57cec5SDimitry Andric  return std::remquo((double)__x, (double)__y, __quo);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric
0b57cec5SDimitry Andrictemplate <typename __T>
0b57cec5SDimitry Andric__DEVICE__ typename __clang_cuda_enable_if<std::numeric_limits<__T>::is_integer,
0b57cec5SDimitry Andric                                           double>::type
0b57cec5SDimitry Andricscalbln(__T __x, long __exp) {
0b57cec5SDimitry Andric  return std::scalbln((double)__x, __exp);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric
0b57cec5SDimitry Andrictemplate <typename __T>
0b57cec5SDimitry Andric__DEVICE__ typename __clang_cuda_enable_if<std::numeric_limits<__T>::is_integer,
0b57cec5SDimitry Andric                                           double>::type
0b57cec5SDimitry Andricscalbn(__T __x, int __exp) {
0b57cec5SDimitry Andric  return std::scalbn((double)__x, __exp);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric// We need to define these overloads in exactly the namespace our standard
0b57cec5SDimitry Andric// library uses (including the right inline namespace), otherwise they won't be
0b57cec5SDimitry Andric// picked up by other functions in the standard library (e.g. functions in
0b57cec5SDimitry Andric// <complex>).  Thus the ugliness below.
0b57cec5SDimitry Andric#ifdef _LIBCPP_BEGIN_NAMESPACE_STD
0b57cec5SDimitry Andric_LIBCPP_BEGIN_NAMESPACE_STD
0b57cec5SDimitry Andric#else
0b57cec5SDimitry Andricnamespace std {
0b57cec5SDimitry Andric#ifdef _GLIBCXX_BEGIN_NAMESPACE_VERSION
0b57cec5SDimitry Andric_GLIBCXX_BEGIN_NAMESPACE_VERSION
0b57cec5SDimitry Andric#endif
0b57cec5SDimitry Andric#endif
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric// Pull the new overloads we defined above into namespace std.
0b57cec5SDimitry Andricusing ::acos;
0b57cec5SDimitry Andricusing ::acosh;
0b57cec5SDimitry Andricusing ::asin;
0b57cec5SDimitry Andricusing ::asinh;
0b57cec5SDimitry Andricusing ::atan;
0b57cec5SDimitry Andricusing ::atan2;
0b57cec5SDimitry Andricusing ::atanh;
0b57cec5SDimitry Andricusing ::cbrt;
0b57cec5SDimitry Andricusing ::ceil;
0b57cec5SDimitry Andricusing ::copysign;
0b57cec5SDimitry Andricusing ::cos;
0b57cec5SDimitry Andricusing ::cosh;
0b57cec5SDimitry Andricusing ::erf;
0b57cec5SDimitry Andricusing ::erfc;
0b57cec5SDimitry Andricusing ::exp;
0b57cec5SDimitry Andricusing ::exp2;
0b57cec5SDimitry Andricusing ::expm1;
0b57cec5SDimitry Andricusing ::fabs;
0b57cec5SDimitry Andricusing ::fdim;
0b57cec5SDimitry Andricusing ::floor;
0b57cec5SDimitry Andricusing ::fma;
0b57cec5SDimitry Andricusing ::fmax;
0b57cec5SDimitry Andricusing ::fmin;
0b57cec5SDimitry Andricusing ::fmod;
0b57cec5SDimitry Andricusing ::fpclassify;
0b57cec5SDimitry Andricusing ::frexp;
0b57cec5SDimitry Andricusing ::hypot;
0b57cec5SDimitry Andricusing ::ilogb;
0b57cec5SDimitry Andricusing ::isfinite;
0b57cec5SDimitry Andricusing ::isgreater;
0b57cec5SDimitry Andricusing ::isgreaterequal;
0b57cec5SDimitry Andricusing ::isless;
0b57cec5SDimitry Andricusing ::islessequal;
0b57cec5SDimitry Andricusing ::islessgreater;
0b57cec5SDimitry Andricusing ::isnormal;
0b57cec5SDimitry Andricusing ::isunordered;
0b57cec5SDimitry Andricusing ::ldexp;
0b57cec5SDimitry Andricusing ::lgamma;
0b57cec5SDimitry Andricusing ::llrint;
0b57cec5SDimitry Andricusing ::llround;
0b57cec5SDimitry Andricusing ::log;
0b57cec5SDimitry Andricusing ::log10;
0b57cec5SDimitry Andricusing ::log1p;
0b57cec5SDimitry Andricusing ::log2;
0b57cec5SDimitry Andricusing ::logb;
0b57cec5SDimitry Andricusing ::lrint;
0b57cec5SDimitry Andricusing ::lround;
0b57cec5SDimitry Andricusing ::nearbyint;
0b57cec5SDimitry Andricusing ::nextafter;
0b57cec5SDimitry Andricusing ::pow;
0b57cec5SDimitry Andricusing ::remainder;
0b57cec5SDimitry Andricusing ::remquo;
0b57cec5SDimitry Andricusing ::rint;
0b57cec5SDimitry Andricusing ::round;
0b57cec5SDimitry Andricusing ::scalbln;
0b57cec5SDimitry Andricusing ::scalbn;
0b57cec5SDimitry Andricusing ::signbit;
0b57cec5SDimitry Andricusing ::sin;
0b57cec5SDimitry Andricusing ::sinh;
0b57cec5SDimitry Andricusing ::sqrt;
0b57cec5SDimitry Andricusing ::tan;
0b57cec5SDimitry Andricusing ::tanh;
0b57cec5SDimitry Andricusing ::tgamma;
0b57cec5SDimitry Andricusing ::trunc;
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric// Well this is fun: We need to pull these symbols in for libc++, but we can't
0b57cec5SDimitry Andric// pull them in with libstdc++, because its ::isinf and ::isnan are different
0b57cec5SDimitry Andric// than its std::isinf and std::isnan.
0b57cec5SDimitry Andric#ifndef __GLIBCXX__
0b57cec5SDimitry Andricusing ::isinf;
0b57cec5SDimitry Andricusing ::isnan;
0b57cec5SDimitry Andric#endif
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric// Finally, pull the "foobarf" functions that CUDA defines in its headers into
0b57cec5SDimitry Andric// namespace std.
0b57cec5SDimitry Andricusing ::acosf;
0b57cec5SDimitry Andricusing ::acoshf;
0b57cec5SDimitry Andricusing ::asinf;
0b57cec5SDimitry Andricusing ::asinhf;
0b57cec5SDimitry Andricusing ::atan2f;
0b57cec5SDimitry Andricusing ::atanf;
0b57cec5SDimitry Andricusing ::atanhf;
0b57cec5SDimitry Andricusing ::cbrtf;
0b57cec5SDimitry Andricusing ::ceilf;
0b57cec5SDimitry Andricusing ::copysignf;
0b57cec5SDimitry Andricusing ::cosf;
0b57cec5SDimitry Andricusing ::coshf;
0b57cec5SDimitry Andricusing ::erfcf;
0b57cec5SDimitry Andricusing ::erff;
0b57cec5SDimitry Andricusing ::exp2f;
0b57cec5SDimitry Andricusing ::expf;
0b57cec5SDimitry Andricusing ::expm1f;
0b57cec5SDimitry Andricusing ::fabsf;
0b57cec5SDimitry Andricusing ::fdimf;
0b57cec5SDimitry Andricusing ::floorf;
0b57cec5SDimitry Andricusing ::fmaf;
0b57cec5SDimitry Andricusing ::fmaxf;
0b57cec5SDimitry Andricusing ::fminf;
0b57cec5SDimitry Andricusing ::fmodf;
0b57cec5SDimitry Andricusing ::frexpf;
0b57cec5SDimitry Andricusing ::hypotf;
0b57cec5SDimitry Andricusing ::ilogbf;
0b57cec5SDimitry Andricusing ::ldexpf;
0b57cec5SDimitry Andricusing ::lgammaf;
0b57cec5SDimitry Andricusing ::llrintf;
0b57cec5SDimitry Andricusing ::llroundf;
0b57cec5SDimitry Andricusing ::log10f;
0b57cec5SDimitry Andricusing ::log1pf;
0b57cec5SDimitry Andricusing ::log2f;
0b57cec5SDimitry Andricusing ::logbf;
0b57cec5SDimitry Andricusing ::logf;
0b57cec5SDimitry Andricusing ::lrintf;
0b57cec5SDimitry Andricusing ::lroundf;
0b57cec5SDimitry Andricusing ::modff;
0b57cec5SDimitry Andricusing ::nearbyintf;
0b57cec5SDimitry Andricusing ::nextafterf;
0b57cec5SDimitry Andricusing ::powf;
0b57cec5SDimitry Andricusing ::remainderf;
0b57cec5SDimitry Andricusing ::remquof;
0b57cec5SDimitry Andricusing ::rintf;
0b57cec5SDimitry Andricusing ::roundf;
0b57cec5SDimitry Andricusing ::scalblnf;
0b57cec5SDimitry Andricusing ::scalbnf;
0b57cec5SDimitry Andricusing ::sinf;
0b57cec5SDimitry Andricusing ::sinhf;
0b57cec5SDimitry Andricusing ::sqrtf;
0b57cec5SDimitry Andricusing ::tanf;
0b57cec5SDimitry Andricusing ::tanhf;
0b57cec5SDimitry Andricusing ::tgammaf;
0b57cec5SDimitry Andricusing ::truncf;
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#ifdef _LIBCPP_END_NAMESPACE_STD
0b57cec5SDimitry Andric_LIBCPP_END_NAMESPACE_STD
0b57cec5SDimitry Andric#else
0b57cec5SDimitry Andric#ifdef _GLIBCXX_BEGIN_NAMESPACE_VERSION
0b57cec5SDimitry Andric_GLIBCXX_END_NAMESPACE_VERSION
0b57cec5SDimitry Andric#endif
0b57cec5SDimitry Andric} // namespace std
0b57cec5SDimitry Andric#endif
0b57cec5SDimitry Andric
5ffd83dbSDimitry Andric#endif // __OPENMP_NVPTX__
5ffd83dbSDimitry Andric
0b57cec5SDimitry Andric#undef __DEVICE__
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#endif