__support/FPUtil/bfloat16.h

*bb722a7dSDimitry Andric//===-- Definition of bfloat16 data type. -----------------------*- C++ -*-===//
*bb722a7dSDimitry Andric//
*bb722a7dSDimitry Andric// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
*bb722a7dSDimitry Andric// See https://llvm.org/LICENSE.txt for license information.
*bb722a7dSDimitry Andric// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
*bb722a7dSDimitry Andric//
*bb722a7dSDimitry Andric//===----------------------------------------------------------------------===//
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric#ifndef LLVM_LIBC_SRC___SUPPORT_FPUTIL_BFLOAT16_H
*bb722a7dSDimitry Andric#define LLVM_LIBC_SRC___SUPPORT_FPUTIL_BFLOAT16_H
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric#include "src/__support/CPP/bit.h"
*bb722a7dSDimitry Andric#include "src/__support/CPP/type_traits.h"
*bb722a7dSDimitry Andric#include "src/__support/FPUtil/cast.h"
*bb722a7dSDimitry Andric#include "src/__support/FPUtil/dyadic_float.h"
*bb722a7dSDimitry Andric#include "src/__support/macros/config.h"
*bb722a7dSDimitry Andric#include "src/__support/macros/properties/types.h"
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric#include <stdint.h>
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andricnamespace LIBC_NAMESPACE_DECL {
*bb722a7dSDimitry Andricnamespace fputil {
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andricstruct BFloat16 {
*bb722a7dSDimitry Andric  uint16_t bits;
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric  LIBC_INLINE BFloat16() = default;
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric  LIBC_INLINE constexpr explicit BFloat16(uint16_t bits) : bits(bits) {}
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric  template <typename T> LIBC_INLINE constexpr explicit BFloat16(T value) {
*bb722a7dSDimitry Andric    if constexpr (cpp::is_floating_point_v<T>) {
*bb722a7dSDimitry Andric      bits = fputil::cast<bfloat16>(value).bits;
*bb722a7dSDimitry Andric    } else if constexpr (cpp::is_integral_v<T>) {
*bb722a7dSDimitry Andric      Sign sign = Sign::POS;
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric      if constexpr (cpp::is_signed_v<T>) {
*bb722a7dSDimitry Andric        if (value < 0) {
*bb722a7dSDimitry Andric          sign = Sign::NEG;
*bb722a7dSDimitry Andric          value = -value;
*bb722a7dSDimitry Andric        }
*bb722a7dSDimitry Andric      }
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric      fputil::DyadicFloat<cpp::numeric_limits<cpp::make_unsigned_t<T>>::digits>
*bb722a7dSDimitry Andric          xd(sign, 0, value);
*bb722a7dSDimitry Andric      bits = xd.template as<bfloat16, /*ShouldSignalExceptions=*/true>().bits;
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric    } else {
*bb722a7dSDimitry Andric      bits = fputil::cast<bfloat16>(static_cast<float>(value)).bits;
*bb722a7dSDimitry Andric    }
*bb722a7dSDimitry Andric  }
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric  template <cpp::enable_if_t<fputil::get_fp_type<float>() ==
*bb722a7dSDimitry Andric                                 fputil::FPType::IEEE754_Binary32,
*bb722a7dSDimitry Andric                             int> = 0>
*bb722a7dSDimitry Andric  LIBC_INLINE constexpr operator float() const {
*bb722a7dSDimitry Andric    uint32_t x_bits = static_cast<uint32_t>(bits) << 16U;
*bb722a7dSDimitry Andric    return cpp::bit_cast<float>(x_bits);
*bb722a7dSDimitry Andric  }
*bb722a7dSDimitry Andric}; // struct BFloat16
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric} // namespace fputil
*bb722a7dSDimitry Andric} // namespace LIBC_NAMESPACE_DECL
*bb722a7dSDimitry Andric
*bb722a7dSDimitry Andric#endif // LLVM_LIBC_SRC___SUPPORT_FPUTIL_BFLOAT16_H