Target/AMDGPU/AMDGPUMachineFunction.cpp

0b57cec5SDimitry Andric//===-- AMDGPUMachineFunctionInfo.cpp ---------------------------------------=//
0b57cec5SDimitry Andric//
0b57cec5SDimitry Andric// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
0b57cec5SDimitry Andric// See https://llvm.org/LICENSE.txt for license information.
0b57cec5SDimitry Andric// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
0b57cec5SDimitry Andric//
0b57cec5SDimitry Andric//===----------------------------------------------------------------------===//
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric#include "AMDGPUMachineFunction.h"
0b57cec5SDimitry Andric#include "AMDGPUSubtarget.h"
0b57cec5SDimitry Andric#include "AMDGPUPerfHintAnalysis.h"
0b57cec5SDimitry Andric#include "llvm/CodeGen/MachineModuleInfo.h"
0b57cec5SDimitry Andric
0b57cec5SDimitry Andricusing namespace llvm;
0b57cec5SDimitry Andric
0b57cec5SDimitry AndricAMDGPUMachineFunction::AMDGPUMachineFunction(const MachineFunction &MF) :
0b57cec5SDimitry Andric  MachineFunctionInfo(),
*5ffd83dbSDimitry Andric  Mode(MF.getFunction()),
0b57cec5SDimitry Andric  IsEntryFunction(AMDGPU::isEntryFunctionCC(MF.getFunction().getCallingConv())),
*5ffd83dbSDimitry Andric  NoSignedZerosFPMath(MF.getTarget().Options.NoSignedZerosFPMath) {
0b57cec5SDimitry Andric  const AMDGPUSubtarget &ST = AMDGPUSubtarget::get(MF);
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric  // FIXME: Should initialize KernArgSize based on ExplicitKernelArgOffset,
0b57cec5SDimitry Andric  // except reserved size is not correctly aligned.
0b57cec5SDimitry Andric  const Function &F = MF.getFunction();
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric  Attribute MemBoundAttr = F.getFnAttribute("amdgpu-memory-bound");
0b57cec5SDimitry Andric  MemoryBound = MemBoundAttr.isStringAttribute() &&
0b57cec5SDimitry Andric                MemBoundAttr.getValueAsString() == "true";
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric  Attribute WaveLimitAttr = F.getFnAttribute("amdgpu-wave-limiter");
0b57cec5SDimitry Andric  WaveLimiter = WaveLimitAttr.isStringAttribute() &&
0b57cec5SDimitry Andric                WaveLimitAttr.getValueAsString() == "true";
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric  CallingConv::ID CC = F.getCallingConv();
0b57cec5SDimitry Andric  if (CC == CallingConv::AMDGPU_KERNEL || CC == CallingConv::SPIR_KERNEL)
0b57cec5SDimitry Andric    ExplicitKernArgSize = ST.getExplicitKernArgSize(F, MaxKernArgAlign);
0b57cec5SDimitry Andric}
0b57cec5SDimitry Andric
0b57cec5SDimitry Andricunsigned AMDGPUMachineFunction::allocateLDSGlobal(const DataLayout &DL,
*5ffd83dbSDimitry Andric                                                  const GlobalVariable &GV) {
0b57cec5SDimitry Andric  auto Entry = LocalMemoryObjects.insert(std::make_pair(&GV, 0));
0b57cec5SDimitry Andric  if (!Entry.second)
0b57cec5SDimitry Andric    return Entry.first->second;
0b57cec5SDimitry Andric
*5ffd83dbSDimitry Andric  Align Alignment =
*5ffd83dbSDimitry Andric      DL.getValueOrABITypeAlignment(GV.getAlign(), GV.getValueType());
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric  /// TODO: We should sort these to minimize wasted space due to alignment
0b57cec5SDimitry Andric  /// padding. Currently the padding is decided by the first encountered use
0b57cec5SDimitry Andric  /// during lowering.
*5ffd83dbSDimitry Andric  unsigned Offset = LDSSize = alignTo(LDSSize, Alignment);
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric  Entry.first->second = Offset;
0b57cec5SDimitry Andric  LDSSize += DL.getTypeAllocSize(GV.getValueType());
0b57cec5SDimitry Andric
0b57cec5SDimitry Andric  return Offset;
0b57cec5SDimitry Andric}