lib/builtins/fp_trunc.h

0b57cec5SDimitry Andric//=== lib/fp_trunc.h - high precision -> low precision conversion *- C -*-===//
0b57cec5SDimitry Andric//
0b57cec5SDimitry Andric// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
0b57cec5SDimitry Andric// See https://llvm.org/LICENSE.txt for license information.
0b57cec5SDimitry Andric// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
0b57cec5SDimitry Andric//
0b57cec5SDimitry Andric//===----------------------------------------------------------------------===//
0b57cec5SDimitry Andric//
0b57cec5SDimitry Andric// Set source and destination precision setting
0b57cec5SDimitry Andric//
0b57cec5SDimitry Andric//===----------------------------------------------------------------------===//
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#ifndef FP_TRUNC_HEADER
0b57cec5SDimitry Andric#define FP_TRUNC_HEADER
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#include "int_lib.h"
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#if defined SRC_SINGLE
0b57cec5SDimitry Andrictypedef float src_t;
0b57cec5SDimitry Andrictypedef uint32_t src_rep_t;
0b57cec5SDimitry Andric#define SRC_REP_C UINT32_C
*5f757f3fSDimitry Andricstatic const int srcBits = sizeof(src_t) * CHAR_BIT;
*5f757f3fSDimitry Andricstatic const int srcSigFracBits = 23;
*5f757f3fSDimitry Andric// -1 accounts for the sign bit.
*5f757f3fSDimitry Andric// srcBits - srcSigFracBits - 1
*5f757f3fSDimitry Andricstatic const int srcExpBits = 8;
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#elif defined SRC_DOUBLE
0b57cec5SDimitry Andrictypedef double src_t;
0b57cec5SDimitry Andrictypedef uint64_t src_rep_t;
0b57cec5SDimitry Andric#define SRC_REP_C UINT64_C
*5f757f3fSDimitry Andricstatic const int srcBits = sizeof(src_t) * CHAR_BIT;
*5f757f3fSDimitry Andricstatic const int srcSigFracBits = 52;
*5f757f3fSDimitry Andric// -1 accounts for the sign bit.
*5f757f3fSDimitry Andric// srcBits - srcSigFracBits - 1
*5f757f3fSDimitry Andricstatic const int srcExpBits = 11;
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#elif defined SRC_QUAD
*5f757f3fSDimitry Andrictypedef tf_float src_t;
0b57cec5SDimitry Andrictypedef __uint128_t src_rep_t;
0b57cec5SDimitry Andric#define SRC_REP_C (__uint128_t)
*5f757f3fSDimitry Andricstatic const int srcBits = sizeof(src_t) * CHAR_BIT;
*5f757f3fSDimitry Andricstatic const int srcSigFracBits = 112;
*5f757f3fSDimitry Andric// -1 accounts for the sign bit.
*5f757f3fSDimitry Andric// srcBits - srcSigFracBits - 1
*5f757f3fSDimitry Andricstatic const int srcExpBits = 15;
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#else
0b57cec5SDimitry Andric#error Source should be double precision or quad precision!
0b57cec5SDimitry Andric#endif // end source precision
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#if defined DST_DOUBLE
0b57cec5SDimitry Andrictypedef double dst_t;
0b57cec5SDimitry Andrictypedef uint64_t dst_rep_t;
0b57cec5SDimitry Andric#define DST_REP_C UINT64_C
*5f757f3fSDimitry Andricstatic const int dstBits = sizeof(dst_t) * CHAR_BIT;
*5f757f3fSDimitry Andricstatic const int dstSigFracBits = 52;
*5f757f3fSDimitry Andric// -1 accounts for the sign bit.
*5f757f3fSDimitry Andric// dstBits - dstSigFracBits - 1
*5f757f3fSDimitry Andricstatic const int dstExpBits = 11;
*5f757f3fSDimitry Andric
*5f757f3fSDimitry Andric#elif defined DST_80
*5f757f3fSDimitry Andrictypedef xf_float dst_t;
*5f757f3fSDimitry Andrictypedef __uint128_t dst_rep_t;
*5f757f3fSDimitry Andric#define DST_REP_C (__uint128_t)
*5f757f3fSDimitry Andricstatic const int dstBits = 80;
*5f757f3fSDimitry Andricstatic const int dstSigFracBits = 63;
*5f757f3fSDimitry Andric// -1 accounts for the sign bit.
*5f757f3fSDimitry Andric// -1 accounts for the explicitly stored integer bit.
*5f757f3fSDimitry Andric// dstBits - dstSigFracBits - 1 - 1
*5f757f3fSDimitry Andricstatic const int dstExpBits = 15;
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#elif defined DST_SINGLE
0b57cec5SDimitry Andrictypedef float dst_t;
0b57cec5SDimitry Andrictypedef uint32_t dst_rep_t;
0b57cec5SDimitry Andric#define DST_REP_C UINT32_C
*5f757f3fSDimitry Andricstatic const int dstBits = sizeof(dst_t) * CHAR_BIT;
*5f757f3fSDimitry Andricstatic const int dstSigFracBits = 23;
*5f757f3fSDimitry Andric// -1 accounts for the sign bit.
*5f757f3fSDimitry Andric// dstBits - dstSigFracBits - 1
*5f757f3fSDimitry Andricstatic const int dstExpBits = 8;
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#elif defined DST_HALF
e8d8bef9SDimitry Andric#ifdef COMPILER_RT_HAS_FLOAT16
e8d8bef9SDimitry Andrictypedef _Float16 dst_t;
e8d8bef9SDimitry Andric#else
0b57cec5SDimitry Andrictypedef uint16_t dst_t;
e8d8bef9SDimitry Andric#endif
0b57cec5SDimitry Andrictypedef uint16_t dst_rep_t;
0b57cec5SDimitry Andric#define DST_REP_C UINT16_C
*5f757f3fSDimitry Andricstatic const int dstBits = sizeof(dst_t) * CHAR_BIT;
*5f757f3fSDimitry Andricstatic const int dstSigFracBits = 10;
*5f757f3fSDimitry Andric// -1 accounts for the sign bit.
*5f757f3fSDimitry Andric// dstBits - dstSigFracBits - 1
*5f757f3fSDimitry Andricstatic const int dstExpBits = 5;
0b57cec5SDimitry Andric
81ad6265SDimitry Andric#elif defined DST_BFLOAT
61cfbce3SDimitry Andrictypedef __bf16 dst_t;
81ad6265SDimitry Andrictypedef uint16_t dst_rep_t;
81ad6265SDimitry Andric#define DST_REP_C UINT16_C
*5f757f3fSDimitry Andricstatic const int dstBits = sizeof(dst_t) * CHAR_BIT;
*5f757f3fSDimitry Andricstatic const int dstSigFracBits = 7;
*5f757f3fSDimitry Andric// -1 accounts for the sign bit.
*5f757f3fSDimitry Andric// dstBits - dstSigFracBits - 1
*5f757f3fSDimitry Andricstatic const int dstExpBits = 8;
81ad6265SDimitry Andric
0b57cec5SDimitry Andric#else
0b57cec5SDimitry Andric#error Destination should be single precision or double precision!
0b57cec5SDimitry Andric#endif // end destination precision
0b57cec5SDimitry Andric
*5f757f3fSDimitry Andric// TODO: These helper routines should be placed into fp_lib.h
*5f757f3fSDimitry Andric// Currently they depend on macros/constants defined above.
*5f757f3fSDimitry Andric
*5f757f3fSDimitry Andricstatic inline src_rep_t extract_sign_from_src(src_rep_t x) {
*5f757f3fSDimitry Andric  const src_rep_t srcSignMask = SRC_REP_C(1) << (srcBits - 1);
*5f757f3fSDimitry Andric  return (x & srcSignMask) >> (srcBits - 1);
*5f757f3fSDimitry Andric}
*5f757f3fSDimitry Andric
*5f757f3fSDimitry Andricstatic inline src_rep_t extract_exp_from_src(src_rep_t x) {
*5f757f3fSDimitry Andric  const int srcSigBits = srcBits - 1 - srcExpBits;
*5f757f3fSDimitry Andric  const src_rep_t srcExpMask = ((SRC_REP_C(1) << srcExpBits) - 1) << srcSigBits;
*5f757f3fSDimitry Andric  return (x & srcExpMask) >> srcSigBits;
*5f757f3fSDimitry Andric}
*5f757f3fSDimitry Andric
*5f757f3fSDimitry Andricstatic inline src_rep_t extract_sig_frac_from_src(src_rep_t x) {
*5f757f3fSDimitry Andric  const src_rep_t srcSigFracMask = (SRC_REP_C(1) << srcSigFracBits) - 1;
*5f757f3fSDimitry Andric  return x & srcSigFracMask;
*5f757f3fSDimitry Andric}
*5f757f3fSDimitry Andric
*5f757f3fSDimitry Andricstatic inline dst_rep_t construct_dst_rep(dst_rep_t sign, dst_rep_t exp, dst_rep_t sigFrac) {
*5f757f3fSDimitry Andric  dst_rep_t result = (sign << (dstBits - 1)) | (exp << (dstBits - 1 - dstExpBits)) | sigFrac;
*5f757f3fSDimitry Andric  // Set the explicit integer bit in F80 if present.
*5f757f3fSDimitry Andric  if (dstBits == 80 && exp) {
*5f757f3fSDimitry Andric    result |= (DST_REP_C(1) << dstSigFracBits);
*5f757f3fSDimitry Andric  }
*5f757f3fSDimitry Andric  return result;
*5f757f3fSDimitry Andric}
*5f757f3fSDimitry Andric
0b57cec5SDimitry Andric// End of specialization parameters.  Two helper routines for conversion to and
0b57cec5SDimitry Andric// from the representation of floating-point data as integer values follow.
0b57cec5SDimitry Andric
*5f757f3fSDimitry Andricstatic inline src_rep_t srcToRep(src_t x) {
0b57cec5SDimitry Andric  const union {
0b57cec5SDimitry Andric    src_t f;
0b57cec5SDimitry Andric    src_rep_t i;
0b57cec5SDimitry Andric  } rep = {.f = x};
0b57cec5SDimitry Andric  return rep.i;
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric
*5f757f3fSDimitry Andricstatic inline dst_t dstFromRep(dst_rep_t x) {
0b57cec5SDimitry Andric  const union {
0b57cec5SDimitry Andric    dst_t f;
0b57cec5SDimitry Andric    dst_rep_t i;
0b57cec5SDimitry Andric  } rep = {.i = x};
0b57cec5SDimitry Andric  return rep.f;
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#endif // FP_TRUNC_HEADER