powerpc/fpu/fpu_arith.h

7e76048aSMarcel Moolenaar/*	$NetBSD: fpu_arith.h,v 1.4 2005/12/24 20:07:28 perry Exp $ */
7e76048aSMarcel Moolenaar
*51369649SPedro F. Giffuni/*-
*51369649SPedro F. Giffuni * SPDX-License-Identifier: BSD-3-Clause
*51369649SPedro F. Giffuni *
7e76048aSMarcel Moolenaar * Copyright (c) 1992, 1993
7e76048aSMarcel Moolenaar *	The Regents of the University of California.  All rights reserved.
7e76048aSMarcel Moolenaar *
7e76048aSMarcel Moolenaar * This software was developed by the Computer Systems Engineering group
7e76048aSMarcel Moolenaar * at Lawrence Berkeley Laboratory under DARPA contract BG 91-66 and
7e76048aSMarcel Moolenaar * contributed to Berkeley.
7e76048aSMarcel Moolenaar *
7e76048aSMarcel Moolenaar * All advertising materials mentioning features or use of this software
7e76048aSMarcel Moolenaar * must display the following acknowledgement:
7e76048aSMarcel Moolenaar *	This product includes software developed by the University of
7e76048aSMarcel Moolenaar *	California, Lawrence Berkeley Laboratory.
7e76048aSMarcel Moolenaar *
7e76048aSMarcel Moolenaar * Redistribution and use in source and binary forms, with or without
7e76048aSMarcel Moolenaar * modification, are permitted provided that the following conditions
7e76048aSMarcel Moolenaar * are met:
7e76048aSMarcel Moolenaar * 1. Redistributions of source code must retain the above copyright
7e76048aSMarcel Moolenaar *    notice, this list of conditions and the following disclaimer.
7e76048aSMarcel Moolenaar * 2. Redistributions in binary form must reproduce the above copyright
7e76048aSMarcel Moolenaar *    notice, this list of conditions and the following disclaimer in the
7e76048aSMarcel Moolenaar *    documentation and/or other materials provided with the distribution.
7e76048aSMarcel Moolenaar * 3. Neither the name of the University nor the names of its contributors
7e76048aSMarcel Moolenaar *    may be used to endorse or promote products derived from this software
7e76048aSMarcel Moolenaar *    without specific prior written permission.
7e76048aSMarcel Moolenaar *
7e76048aSMarcel Moolenaar * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
7e76048aSMarcel Moolenaar * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
7e76048aSMarcel Moolenaar * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
7e76048aSMarcel Moolenaar * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
7e76048aSMarcel Moolenaar * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
7e76048aSMarcel Moolenaar * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
7e76048aSMarcel Moolenaar * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
7e76048aSMarcel Moolenaar * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
7e76048aSMarcel Moolenaar * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
7e76048aSMarcel Moolenaar * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
7e76048aSMarcel Moolenaar * SUCH DAMAGE.
7e76048aSMarcel Moolenaar */
7e76048aSMarcel Moolenaar
7e76048aSMarcel Moolenaar/*
7e76048aSMarcel Moolenaar * Extended-precision arithmetic.
7e76048aSMarcel Moolenaar *
7e76048aSMarcel Moolenaar * We hold the notion of a `carry register', which may or may not be a
7e76048aSMarcel Moolenaar * machine carry bit or register.  On the SPARC, it is just the machine's
7e76048aSMarcel Moolenaar * carry bit.
7e76048aSMarcel Moolenaar *
7e76048aSMarcel Moolenaar * In the worst case, you can compute the carry from x+y as
7e76048aSMarcel Moolenaar *	(unsigned)(x + y) < (unsigned)x
7e76048aSMarcel Moolenaar * and from x+y+c as
7e76048aSMarcel Moolenaar *	((unsigned)(x + y + c) <= (unsigned)x && (y|c) != 0)
7e76048aSMarcel Moolenaar * for example.
7e76048aSMarcel Moolenaar */
7e76048aSMarcel Moolenaar
7e76048aSMarcel Moolenaar#ifndef FPE_USE_ASM
7e76048aSMarcel Moolenaar
7e76048aSMarcel Moolenaar/* set up for extended-precision arithemtic */
7e76048aSMarcel Moolenaar#define	FPU_DECL_CARRY quad_t fpu_carry, fpu_tmp;
7e76048aSMarcel Moolenaar
7e76048aSMarcel Moolenaar/*
7e76048aSMarcel Moolenaar * We have three kinds of add:
7e76048aSMarcel Moolenaar *	add with carry:					  r = x + y + c
7e76048aSMarcel Moolenaar *	add (ignoring current carry) and set carry:	c'r = x + y + 0
7e76048aSMarcel Moolenaar *	add with carry and set carry:			c'r = x + y + c
7e76048aSMarcel Moolenaar * The macros use `C' for `use carry' and `S' for `set carry'.
7e76048aSMarcel Moolenaar * Note that the state of the carry is undefined after ADDC and SUBC,
7e76048aSMarcel Moolenaar * so if all you have for these is `add with carry and set carry',
7e76048aSMarcel Moolenaar * that is OK.
7e76048aSMarcel Moolenaar *
7e76048aSMarcel Moolenaar * The same goes for subtract, except that we compute x - y - c.
7e76048aSMarcel Moolenaar *
7e76048aSMarcel Moolenaar * Finally, we have a way to get the carry into a `regular' variable,
7e76048aSMarcel Moolenaar * or set it from a value.  SET_CARRY turns 0 into no-carry, nonzero
7e76048aSMarcel Moolenaar * into carry; GET_CARRY sets its argument to 0 or 1.
7e76048aSMarcel Moolenaar */
7e76048aSMarcel Moolenaar#define	FPU_ADDC(r, x, y) \
7e76048aSMarcel Moolenaar	(r) = (x) + (y) + (!!fpu_carry)
7e76048aSMarcel Moolenaar#define	FPU_ADDS(r, x, y) \
7e76048aSMarcel Moolenaar	{ \
7e76048aSMarcel Moolenaar		fpu_tmp = (quad_t)(x) + (quad_t)(y); \
7e76048aSMarcel Moolenaar		(r) = (u_int)fpu_tmp; \
7e76048aSMarcel Moolenaar		fpu_carry = ((fpu_tmp & 0xffffffff00000000LL) != 0); \
7e76048aSMarcel Moolenaar	}
7e76048aSMarcel Moolenaar#define	FPU_ADDCS(r, x, y) \
7e76048aSMarcel Moolenaar	{ \
7e76048aSMarcel Moolenaar		fpu_tmp = (quad_t)(x) + (quad_t)(y) + (!!fpu_carry); \
7e76048aSMarcel Moolenaar		(r) = (u_int)fpu_tmp; \
7e76048aSMarcel Moolenaar		fpu_carry = ((fpu_tmp & 0xffffffff00000000LL) != 0); \
7e76048aSMarcel Moolenaar	}
7e76048aSMarcel Moolenaar#define	FPU_SUBC(r, x, y) \
7e76048aSMarcel Moolenaar	(r) = (x) - (y) - (!!fpu_carry)
7e76048aSMarcel Moolenaar#define	FPU_SUBS(r, x, y) \
7e76048aSMarcel Moolenaar	{ \
7e76048aSMarcel Moolenaar		fpu_tmp = (quad_t)(x) - (quad_t)(y); \
7e76048aSMarcel Moolenaar		(r) = (u_int)fpu_tmp; \
7e76048aSMarcel Moolenaar		fpu_carry = ((fpu_tmp & 0xffffffff00000000LL) != 0); \
7e76048aSMarcel Moolenaar	}
7e76048aSMarcel Moolenaar#define	FPU_SUBCS(r, x, y) \
7e76048aSMarcel Moolenaar	{ \
7e76048aSMarcel Moolenaar		fpu_tmp = (quad_t)(x) - (quad_t)(y) - (!!fpu_carry); \
7e76048aSMarcel Moolenaar		(r) = (u_int)fpu_tmp; \
7e76048aSMarcel Moolenaar		fpu_carry = ((fpu_tmp & 0xffffffff00000000LL) != 0); \
7e76048aSMarcel Moolenaar	}
7e76048aSMarcel Moolenaar
7e76048aSMarcel Moolenaar#define	FPU_GET_CARRY(r) (r) = (!!fpu_carry)
7e76048aSMarcel Moolenaar#define	FPU_SET_CARRY(v) fpu_carry = ((v) != 0)
7e76048aSMarcel Moolenaar
7e76048aSMarcel Moolenaar#else
7e76048aSMarcel Moolenaar/* set up for extended-precision arithemtic */
7e76048aSMarcel Moolenaar#define	FPU_DECL_CARRY
7e76048aSMarcel Moolenaar
7e76048aSMarcel Moolenaar/*
7e76048aSMarcel Moolenaar * We have three kinds of add:
7e76048aSMarcel Moolenaar *	add with carry:					  r = x + y + c
7e76048aSMarcel Moolenaar *	add (ignoring current carry) and set carry:	c'r = x + y + 0
7e76048aSMarcel Moolenaar *	add with carry and set carry:			c'r = x + y + c
7e76048aSMarcel Moolenaar * The macros use `C' for `use carry' and `S' for `set carry'.
7e76048aSMarcel Moolenaar * Note that the state of the carry is undefined after ADDC and SUBC,
7e76048aSMarcel Moolenaar * so if all you have for these is `add with carry and set carry',
7e76048aSMarcel Moolenaar * that is OK.
7e76048aSMarcel Moolenaar *
7e76048aSMarcel Moolenaar * The same goes for subtract, except that we compute x - y - c.
7e76048aSMarcel Moolenaar *
7e76048aSMarcel Moolenaar * Finally, we have a way to get the carry into a `regular' variable,
7e76048aSMarcel Moolenaar * or set it from a value.  SET_CARRY turns 0 into no-carry, nonzero
7e76048aSMarcel Moolenaar * into carry; GET_CARRY sets its argument to 0 or 1.
7e76048aSMarcel Moolenaar */
7e76048aSMarcel Moolenaar#define	FPU_ADDC(r, x, y) \
7e76048aSMarcel Moolenaar	__asm volatile("adde %0,%1,%2" : "=r"(r) : "r"(x), "r"(y))
7e76048aSMarcel Moolenaar#define	FPU_ADDS(r, x, y) \
7e76048aSMarcel Moolenaar	__asm volatile("addc %0,%1,%2" : "=r"(r) : "r"(x), "r"(y))
7e76048aSMarcel Moolenaar#define	FPU_ADDCS(r, x, y) \
7e76048aSMarcel Moolenaar	__asm volatile("adde %0,%1,%2" : "=r"(r) : "r"(x), "r"(y))
7e76048aSMarcel Moolenaar#define	FPU_SUBC(r, x, y) \
7e76048aSMarcel Moolenaar	__asm volatile("subfe %0,%2,%1" : "=r"(r) : "r"(x), "r"(y))
7e76048aSMarcel Moolenaar#define	FPU_SUBS(r, x, y) \
7e76048aSMarcel Moolenaar	__asm volatile("subfc %0,%2,%1" : "=r"(r) : "r"(x), "r"(y))
7e76048aSMarcel Moolenaar#define	FPU_SUBCS(r, x, y) \
7e76048aSMarcel Moolenaar	__asm volatile("subfe %0,%2,%1" : "=r"(r) : "r"(x), "r"(y))
7e76048aSMarcel Moolenaar
7e76048aSMarcel Moolenaar#define	FPU_GET_CARRY(r) __asm volatile("li %0,0; addie %0,%0,0" : "=r"(r))
7e76048aSMarcel Moolenaar/* This one needs to destroy a temp register. */
7e76048aSMarcel Moolenaar#define	FPU_SET_CARRY(v) do { int __tmp;				\
7e76048aSMarcel Moolenaar		__asm volatile("addic %0,%0,-1" : "r"(__tmp) : "r"(v)); \
7e76048aSMarcel Moolenaar	} while (0)
7e76048aSMarcel Moolenaar
7e76048aSMarcel Moolenaar#define	FPU_SHL1_BY_ADD	/* shift left 1 faster by ADDC than (a<<1)|(b>>31) */
7e76048aSMarcel Moolenaar#endif