common/Q/sqrtl.c

5b2ba9d3SPiotr Jasiukajtis/*
5b2ba9d3SPiotr Jasiukajtis * CDDL HEADER START
5b2ba9d3SPiotr Jasiukajtis *
5b2ba9d3SPiotr Jasiukajtis * The contents of this file are subject to the terms of the
5b2ba9d3SPiotr Jasiukajtis * Common Development and Distribution License (the "License").
5b2ba9d3SPiotr Jasiukajtis * You may not use this file except in compliance with the License.
5b2ba9d3SPiotr Jasiukajtis *
5b2ba9d3SPiotr Jasiukajtis * You can obtain a copy of the license at usr/src/OPENSOLARIS.LICENSE
5b2ba9d3SPiotr Jasiukajtis * or http://www.opensolaris.org/os/licensing.
5b2ba9d3SPiotr Jasiukajtis * See the License for the specific language governing permissions
5b2ba9d3SPiotr Jasiukajtis * and limitations under the License.
5b2ba9d3SPiotr Jasiukajtis *
5b2ba9d3SPiotr Jasiukajtis * When distributing Covered Code, include this CDDL HEADER in each
5b2ba9d3SPiotr Jasiukajtis * file and include the License file at usr/src/OPENSOLARIS.LICENSE.
5b2ba9d3SPiotr Jasiukajtis * If applicable, add the following below this CDDL HEADER, with the
5b2ba9d3SPiotr Jasiukajtis * fields enclosed by brackets "[]" replaced with your own identifying
5b2ba9d3SPiotr Jasiukajtis * information: Portions Copyright [yyyy] [name of copyright owner]
5b2ba9d3SPiotr Jasiukajtis *
5b2ba9d3SPiotr Jasiukajtis * CDDL HEADER END
5b2ba9d3SPiotr Jasiukajtis */
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/*
5b2ba9d3SPiotr Jasiukajtis * Copyright 2011 Nexenta Systems, Inc.  All rights reserved.
5b2ba9d3SPiotr Jasiukajtis */
5b2ba9d3SPiotr Jasiukajtis/*
5b2ba9d3SPiotr Jasiukajtis * Copyright 2006 Sun Microsystems, Inc.  All rights reserved.
5b2ba9d3SPiotr Jasiukajtis * Use is subject to license terms.
5b2ba9d3SPiotr Jasiukajtis */
5b2ba9d3SPiotr Jasiukajtis
*a9d3dcd5SRichard Lowe#pragma weak __sqrtl = sqrtl
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis#include "libm.h"
5b2ba9d3SPiotr Jasiukajtis#include "longdouble.h"
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtisextern int __swapTE(int);
5b2ba9d3SPiotr Jasiukajtisextern int __swapEX(int);
5b2ba9d3SPiotr Jasiukajtisextern enum fp_direction_type __swapRD(enum fp_direction_type);
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/*
5b2ba9d3SPiotr Jasiukajtis * in struct longdouble, msw consists of
5b2ba9d3SPiotr Jasiukajtis *	unsigned short	sgn:1;
5b2ba9d3SPiotr Jasiukajtis *	unsigned short	exp:15;
5b2ba9d3SPiotr Jasiukajtis *	unsigned short	frac1:16;
5b2ba9d3SPiotr Jasiukajtis */
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis#ifdef __LITTLE_ENDIAN
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/* array indices used to access words within a double */
5b2ba9d3SPiotr Jasiukajtis#define	HIWORD	1
5b2ba9d3SPiotr Jasiukajtis#define	LOWORD	0
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/* structure used to access words within a quad */
5b2ba9d3SPiotr Jasiukajtisunion longdouble {
5b2ba9d3SPiotr Jasiukajtis	struct {
5b2ba9d3SPiotr Jasiukajtis		unsigned int	frac4;
5b2ba9d3SPiotr Jasiukajtis		unsigned int	frac3;
5b2ba9d3SPiotr Jasiukajtis		unsigned int	frac2;
5b2ba9d3SPiotr Jasiukajtis		unsigned int	msw;
5b2ba9d3SPiotr Jasiukajtis	} l;
5b2ba9d3SPiotr Jasiukajtis	long double	d;
5b2ba9d3SPiotr Jasiukajtis};
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/* default NaN returned for sqrt(neg) */
5b2ba9d3SPiotr Jasiukajtisstatic const union longdouble
5b2ba9d3SPiotr Jasiukajtis	qnan = { 0xffffffff, 0xffffffff, 0xffffffff, 0x7fffffff };
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/* signalling NaN used to raise invalid */
5b2ba9d3SPiotr Jasiukajtisstatic const union {
5b2ba9d3SPiotr Jasiukajtis	unsigned u[2];
5b2ba9d3SPiotr Jasiukajtis	double d;
5b2ba9d3SPiotr Jasiukajtis} snan = { 0, 0x7ff00001 };
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis#else
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/* array indices used to access words within a double */
5b2ba9d3SPiotr Jasiukajtis#define	HIWORD	0
5b2ba9d3SPiotr Jasiukajtis#define	LOWORD	1
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/* structure used to access words within a quad */
5b2ba9d3SPiotr Jasiukajtisunion longdouble {
5b2ba9d3SPiotr Jasiukajtis	struct {
5b2ba9d3SPiotr Jasiukajtis		unsigned int	msw;
5b2ba9d3SPiotr Jasiukajtis		unsigned int	frac2;
5b2ba9d3SPiotr Jasiukajtis		unsigned int	frac3;
5b2ba9d3SPiotr Jasiukajtis		unsigned int	frac4;
5b2ba9d3SPiotr Jasiukajtis	} l;
5b2ba9d3SPiotr Jasiukajtis	long double	d;
5b2ba9d3SPiotr Jasiukajtis};
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/* default NaN returned for sqrt(neg) */
5b2ba9d3SPiotr Jasiukajtisstatic const union longdouble
5b2ba9d3SPiotr Jasiukajtis	qnan = { 0x7fffffff, 0xffffffff, 0xffffffff, 0xffffffff };
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/* signalling NaN used to raise invalid */
5b2ba9d3SPiotr Jasiukajtisstatic const union {
5b2ba9d3SPiotr Jasiukajtis	unsigned u[2];
5b2ba9d3SPiotr Jasiukajtis	double d;
5b2ba9d3SPiotr Jasiukajtis} snan = { 0x7ff00001, 0 };
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis#endif /* __LITTLE_ENDIAN */
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtisstatic const double
5b2ba9d3SPiotr Jasiukajtis	zero = 0.0,
5b2ba9d3SPiotr Jasiukajtis	half = 0.5,
5b2ba9d3SPiotr Jasiukajtis	one = 1.0,
5b2ba9d3SPiotr Jasiukajtis	huge = 1.0e300,
5b2ba9d3SPiotr Jasiukajtis	tiny = 1.0e-300,
5b2ba9d3SPiotr Jasiukajtis	two36 = 6.87194767360000000000e+10,
5b2ba9d3SPiotr Jasiukajtis	two30 = 1.07374182400000000000e+09,
5b2ba9d3SPiotr Jasiukajtis	two6 = 6.40000000000000000000e+01,
5b2ba9d3SPiotr Jasiukajtis	two4 = 1.60000000000000000000e+01,
5b2ba9d3SPiotr Jasiukajtis	twom18 = 3.81469726562500000000e-06,
5b2ba9d3SPiotr Jasiukajtis	twom28 = 3.72529029846191406250e-09,
5b2ba9d3SPiotr Jasiukajtis	twom42 = 2.27373675443232059479e-13,
5b2ba9d3SPiotr Jasiukajtis	twom60 = 8.67361737988403547206e-19,
5b2ba9d3SPiotr Jasiukajtis	twom62 = 2.16840434497100886801e-19,
5b2ba9d3SPiotr Jasiukajtis	twom66 = 1.35525271560688054251e-20,
5b2ba9d3SPiotr Jasiukajtis	twom90 = 8.07793566946316088742e-28,
5b2ba9d3SPiotr Jasiukajtis	twom113 = 9.62964972193617926528e-35,
5b2ba9d3SPiotr Jasiukajtis	twom124 = 4.70197740328915003187e-38;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/*
5b2ba9d3SPiotr Jasiukajtis*	Extract the exponent and normalized significand (represented as
5b2ba9d3SPiotr Jasiukajtis*	an array of five doubles) from a finite, nonzero quad.
5b2ba9d3SPiotr Jasiukajtis*/
5b2ba9d3SPiotr Jasiukajtisstatic int
5b2ba9d3SPiotr Jasiukajtis__q_unpack(const union longdouble *x, double *s)
5b2ba9d3SPiotr Jasiukajtis{
5b2ba9d3SPiotr Jasiukajtis	union {
5b2ba9d3SPiotr Jasiukajtis		double			d;
5b2ba9d3SPiotr Jasiukajtis		unsigned int	l[2];
5b2ba9d3SPiotr Jasiukajtis	} u;
5b2ba9d3SPiotr Jasiukajtis	double			b;
5b2ba9d3SPiotr Jasiukajtis	unsigned int	lx, w[3];
5b2ba9d3SPiotr Jasiukajtis	int				ex;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* get the normalized significand and exponent */
5b2ba9d3SPiotr Jasiukajtis	ex = (int) ((x->l.msw & 0x7fffffff) >> 16);
5b2ba9d3SPiotr Jasiukajtis	lx = x->l.msw & 0xffff;
5b2ba9d3SPiotr Jasiukajtis	if (ex)
5b2ba9d3SPiotr Jasiukajtis	{
5b2ba9d3SPiotr Jasiukajtis		lx |= 0x10000;
5b2ba9d3SPiotr Jasiukajtis		w[0] = x->l.frac2;
5b2ba9d3SPiotr Jasiukajtis		w[1] = x->l.frac3;
5b2ba9d3SPiotr Jasiukajtis		w[2] = x->l.frac4;
5b2ba9d3SPiotr Jasiukajtis	}
5b2ba9d3SPiotr Jasiukajtis	else
5b2ba9d3SPiotr Jasiukajtis	{
5b2ba9d3SPiotr Jasiukajtis		if (lx | (x->l.frac2 & 0xfffe0000))
5b2ba9d3SPiotr Jasiukajtis		{
5b2ba9d3SPiotr Jasiukajtis			w[0] = x->l.frac2;
5b2ba9d3SPiotr Jasiukajtis			w[1] = x->l.frac3;
5b2ba9d3SPiotr Jasiukajtis			w[2] = x->l.frac4;
5b2ba9d3SPiotr Jasiukajtis			ex = 1;
5b2ba9d3SPiotr Jasiukajtis		}
5b2ba9d3SPiotr Jasiukajtis		else if (x->l.frac2 | (x->l.frac3 & 0xfffe0000))
5b2ba9d3SPiotr Jasiukajtis		{
5b2ba9d3SPiotr Jasiukajtis			lx = x->l.frac2;
5b2ba9d3SPiotr Jasiukajtis			w[0] = x->l.frac3;
5b2ba9d3SPiotr Jasiukajtis			w[1] = x->l.frac4;
5b2ba9d3SPiotr Jasiukajtis			w[2] = 0;
5b2ba9d3SPiotr Jasiukajtis			ex = -31;
5b2ba9d3SPiotr Jasiukajtis		}
5b2ba9d3SPiotr Jasiukajtis		else if (x->l.frac3 | (x->l.frac4 & 0xfffe0000))
5b2ba9d3SPiotr Jasiukajtis		{
5b2ba9d3SPiotr Jasiukajtis			lx = x->l.frac3;
5b2ba9d3SPiotr Jasiukajtis			w[0] = x->l.frac4;
5b2ba9d3SPiotr Jasiukajtis			w[1] = w[2] = 0;
5b2ba9d3SPiotr Jasiukajtis			ex = -63;
5b2ba9d3SPiotr Jasiukajtis		}
5b2ba9d3SPiotr Jasiukajtis		else
5b2ba9d3SPiotr Jasiukajtis		{
5b2ba9d3SPiotr Jasiukajtis			lx = x->l.frac4;
5b2ba9d3SPiotr Jasiukajtis			w[0] = w[1] = w[2] = 0;
5b2ba9d3SPiotr Jasiukajtis			ex = -95;
5b2ba9d3SPiotr Jasiukajtis		}
5b2ba9d3SPiotr Jasiukajtis		while ((lx & 0x10000) == 0)
5b2ba9d3SPiotr Jasiukajtis		{
5b2ba9d3SPiotr Jasiukajtis			lx = (lx << 1) | (w[0] >> 31);
5b2ba9d3SPiotr Jasiukajtis			w[0] = (w[0] << 1) | (w[1] >> 31);
5b2ba9d3SPiotr Jasiukajtis			w[1] = (w[1] << 1) | (w[2] >> 31);
5b2ba9d3SPiotr Jasiukajtis			w[2] <<= 1;
5b2ba9d3SPiotr Jasiukajtis			ex--;
5b2ba9d3SPiotr Jasiukajtis		}
5b2ba9d3SPiotr Jasiukajtis	}
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* extract the significand into five doubles */
5b2ba9d3SPiotr Jasiukajtis	u.l[HIWORD] = 0x42300000;
5b2ba9d3SPiotr Jasiukajtis	u.l[LOWORD] = 0;
5b2ba9d3SPiotr Jasiukajtis	b = u.d;
5b2ba9d3SPiotr Jasiukajtis	u.l[LOWORD] = lx;
5b2ba9d3SPiotr Jasiukajtis	s[0] = u.d - b;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	u.l[HIWORD] = 0x40300000;
5b2ba9d3SPiotr Jasiukajtis	u.l[LOWORD] = 0;
5b2ba9d3SPiotr Jasiukajtis	b = u.d;
5b2ba9d3SPiotr Jasiukajtis	u.l[LOWORD] = w[0] & 0xffffff00;
5b2ba9d3SPiotr Jasiukajtis	s[1] = u.d - b;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	u.l[HIWORD] = 0x3e300000;
5b2ba9d3SPiotr Jasiukajtis	u.l[LOWORD] = 0;
5b2ba9d3SPiotr Jasiukajtis	b = u.d;
5b2ba9d3SPiotr Jasiukajtis	u.l[HIWORD] |= w[0] & 0xff;
5b2ba9d3SPiotr Jasiukajtis	u.l[LOWORD] = w[1] & 0xffff0000;
5b2ba9d3SPiotr Jasiukajtis	s[2] = u.d - b;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	u.l[HIWORD] = 0x3c300000;
5b2ba9d3SPiotr Jasiukajtis	u.l[LOWORD] = 0;
5b2ba9d3SPiotr Jasiukajtis	b = u.d;
5b2ba9d3SPiotr Jasiukajtis	u.l[HIWORD] |= w[1] & 0xffff;
5b2ba9d3SPiotr Jasiukajtis	u.l[LOWORD] = w[2] & 0xff000000;
5b2ba9d3SPiotr Jasiukajtis	s[3] = u.d - b;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	u.l[HIWORD] = 0x3c300000;
5b2ba9d3SPiotr Jasiukajtis	u.l[LOWORD] = 0;
5b2ba9d3SPiotr Jasiukajtis	b = u.d;
5b2ba9d3SPiotr Jasiukajtis	u.l[LOWORD] = w[2] & 0xffffff;
5b2ba9d3SPiotr Jasiukajtis	s[4] = u.d - b;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	return ex - 0x3fff;
5b2ba9d3SPiotr Jasiukajtis}
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/*
5b2ba9d3SPiotr Jasiukajtis*	Pack an exponent and array of three doubles representing a finite,
5b2ba9d3SPiotr Jasiukajtis*	nonzero number into a quad.  Assume the sign is already there and
5b2ba9d3SPiotr Jasiukajtis*	the rounding mode has been fudged accordingly.
5b2ba9d3SPiotr Jasiukajtis*/
5b2ba9d3SPiotr Jasiukajtisstatic void
5b2ba9d3SPiotr Jasiukajtis__q_pack(const double *z, int exp, enum fp_direction_type rm,
5b2ba9d3SPiotr Jasiukajtis	union longdouble *x, int *inexact)
5b2ba9d3SPiotr Jasiukajtis{
5b2ba9d3SPiotr Jasiukajtis	union {
5b2ba9d3SPiotr Jasiukajtis		double			d;
5b2ba9d3SPiotr Jasiukajtis		unsigned int	l[2];
5b2ba9d3SPiotr Jasiukajtis	} u;
5b2ba9d3SPiotr Jasiukajtis	double			s[3], t, t2;
5b2ba9d3SPiotr Jasiukajtis	unsigned int	msw, frac2, frac3, frac4;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* bias exponent and strip off integer bit */
5b2ba9d3SPiotr Jasiukajtis	exp += 0x3fff;
5b2ba9d3SPiotr Jasiukajtis	s[0] = z[0] - one;
5b2ba9d3SPiotr Jasiukajtis	s[1] = z[1];
5b2ba9d3SPiotr Jasiukajtis	s[2] = z[2];
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/*
5b2ba9d3SPiotr Jasiukajtis	 * chop the significand to obtain the fraction;
5b2ba9d3SPiotr Jasiukajtis	 * use round-to-minus-infinity to ensure chopping
5b2ba9d3SPiotr Jasiukajtis	 */
5b2ba9d3SPiotr Jasiukajtis	(void) __swapRD(fp_negative);
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* extract the first eighty bits of fraction */
5b2ba9d3SPiotr Jasiukajtis	t = s[1] + s[2];
5b2ba9d3SPiotr Jasiukajtis	u.d = two36 + (s[0] + t);
5b2ba9d3SPiotr Jasiukajtis	msw = u.l[LOWORD];
5b2ba9d3SPiotr Jasiukajtis	s[0] -= (u.d - two36);
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	u.d = two4 + (s[0] + t);
5b2ba9d3SPiotr Jasiukajtis	frac2 = u.l[LOWORD];
5b2ba9d3SPiotr Jasiukajtis	s[0] -= (u.d - two4);
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	u.d = twom28 + (s[0] + t);
5b2ba9d3SPiotr Jasiukajtis	frac3 = u.l[LOWORD];
5b2ba9d3SPiotr Jasiukajtis	s[0] -= (u.d - twom28);
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* condense the remaining fraction; errors here won't matter */
5b2ba9d3SPiotr Jasiukajtis	t = s[0] + s[1];
5b2ba9d3SPiotr Jasiukajtis	s[1] = ((s[0] - t) + s[1]) + s[2];
5b2ba9d3SPiotr Jasiukajtis	s[0] = t;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* get the last word of fraction */
5b2ba9d3SPiotr Jasiukajtis	u.d = twom60 + (s[0] + s[1]);
5b2ba9d3SPiotr Jasiukajtis	frac4 = u.l[LOWORD];
5b2ba9d3SPiotr Jasiukajtis	s[0] -= (u.d - twom60);
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/*
5b2ba9d3SPiotr Jasiukajtis	 * keep track of what's left for rounding; note that
5b2ba9d3SPiotr Jasiukajtis	 * t2 will be non-negative due to rounding mode
5b2ba9d3SPiotr Jasiukajtis	 */
5b2ba9d3SPiotr Jasiukajtis	t = s[0] + s[1];
5b2ba9d3SPiotr Jasiukajtis	t2 = (s[0] - t) + s[1];
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	if (t != zero)
5b2ba9d3SPiotr Jasiukajtis	{
5b2ba9d3SPiotr Jasiukajtis		*inexact = 1;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis		/* decide whether to round the fraction up */
5b2ba9d3SPiotr Jasiukajtis		if (rm == fp_positive || (rm == fp_nearest && (t > twom113 ||
5b2ba9d3SPiotr Jasiukajtis			(t == twom113 && (t2 != zero || frac4 & 1)))))
5b2ba9d3SPiotr Jasiukajtis		{
5b2ba9d3SPiotr Jasiukajtis			/* round up and renormalize if necessary */
5b2ba9d3SPiotr Jasiukajtis			if (++frac4 == 0)
5b2ba9d3SPiotr Jasiukajtis				if (++frac3 == 0)
5b2ba9d3SPiotr Jasiukajtis					if (++frac2 == 0)
5b2ba9d3SPiotr Jasiukajtis						if (++msw == 0x10000)
5b2ba9d3SPiotr Jasiukajtis						{
5b2ba9d3SPiotr Jasiukajtis							msw = 0;
5b2ba9d3SPiotr Jasiukajtis							exp++;
5b2ba9d3SPiotr Jasiukajtis						}
5b2ba9d3SPiotr Jasiukajtis		}
5b2ba9d3SPiotr Jasiukajtis	}
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* assemble the result */
5b2ba9d3SPiotr Jasiukajtis	x->l.msw |= msw | (exp << 16);
5b2ba9d3SPiotr Jasiukajtis	x->l.frac2 = frac2;
5b2ba9d3SPiotr Jasiukajtis	x->l.frac3 = frac3;
5b2ba9d3SPiotr Jasiukajtis	x->l.frac4 = frac4;
5b2ba9d3SPiotr Jasiukajtis}
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis/*
5b2ba9d3SPiotr Jasiukajtis*	Compute the square root of x and place the TP result in s.
5b2ba9d3SPiotr Jasiukajtis*/
5b2ba9d3SPiotr Jasiukajtisstatic void
5b2ba9d3SPiotr Jasiukajtis__q_tp_sqrt(const double *x, double *s)
5b2ba9d3SPiotr Jasiukajtis{
5b2ba9d3SPiotr Jasiukajtis	double	c, rr, r[3], tt[3], t[5];
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* approximate the divisor for the Newton iteration */
5b2ba9d3SPiotr Jasiukajtis	c = sqrt((x[0] + x[1]) + x[2]);
5b2ba9d3SPiotr Jasiukajtis	rr = half / c;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* compute the first five "digits" of the square root */
5b2ba9d3SPiotr Jasiukajtis	t[0] = (c + two30) - two30;
5b2ba9d3SPiotr Jasiukajtis	tt[0] = t[0] + t[0];
5b2ba9d3SPiotr Jasiukajtis	r[0] = ((x[0] - t[0] * t[0]) + x[1]) + x[2];
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	t[1] = (rr * (r[0] + x[3]) + two6) - two6;
5b2ba9d3SPiotr Jasiukajtis	tt[1] = t[1] + t[1];
5b2ba9d3SPiotr Jasiukajtis	r[0] -= tt[0] * t[1];
5b2ba9d3SPiotr Jasiukajtis	r[1] = x[3] - t[1] * t[1];
5b2ba9d3SPiotr Jasiukajtis	c = (r[1] + twom18) - twom18;
5b2ba9d3SPiotr Jasiukajtis	r[0] += c;
5b2ba9d3SPiotr Jasiukajtis	r[1] = (r[1] - c) + x[4];
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	t[2] = (rr * (r[0] + r[1]) + twom18) - twom18;
5b2ba9d3SPiotr Jasiukajtis	tt[2] = t[2] + t[2];
5b2ba9d3SPiotr Jasiukajtis	r[0] -= tt[0] * t[2];
5b2ba9d3SPiotr Jasiukajtis	r[1] -= tt[1] * t[2];
5b2ba9d3SPiotr Jasiukajtis	c = (r[1] + twom42) - twom42;
5b2ba9d3SPiotr Jasiukajtis	r[0] += c;
5b2ba9d3SPiotr Jasiukajtis	r[1] = (r[1] - c) - t[2] * t[2];
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	t[3] = (rr * (r[0] + r[1]) + twom42) - twom42;
5b2ba9d3SPiotr Jasiukajtis	r[0] = ((r[0] - tt[0] * t[3]) + r[1]) - tt[1] * t[3];
5b2ba9d3SPiotr Jasiukajtis	r[1] = -tt[2] * t[3];
5b2ba9d3SPiotr Jasiukajtis	c = (r[1] + twom90) - twom90;
5b2ba9d3SPiotr Jasiukajtis	r[0] += c;
5b2ba9d3SPiotr Jasiukajtis	r[1] = (r[1] - c) - t[3] * t[3];
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	t[4] = (rr * (r[0] + r[1]) + twom66) - twom66;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* here we just need to get the sign of the remainder */
5b2ba9d3SPiotr Jasiukajtis	c = (((((r[0] - tt[0] * t[4]) - tt[1] * t[4]) + r[1])
5b2ba9d3SPiotr Jasiukajtis		- tt[2] * t[4]) - (t[3] + t[3]) * t[4]) - t[4] * t[4];
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* reduce to three doubles */
5b2ba9d3SPiotr Jasiukajtis	t[0] += t[1];
5b2ba9d3SPiotr Jasiukajtis	t[1] = t[2] + t[3];
5b2ba9d3SPiotr Jasiukajtis	t[2] = t[4];
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* if the third term might lie on a rounding boundary, perturb it */
5b2ba9d3SPiotr Jasiukajtis	if (c != zero && t[2] == (twom62 + t[2]) - twom62)
5b2ba9d3SPiotr Jasiukajtis	{
5b2ba9d3SPiotr Jasiukajtis		if (c < zero)
5b2ba9d3SPiotr Jasiukajtis			t[2] -= twom124;
5b2ba9d3SPiotr Jasiukajtis		else
5b2ba9d3SPiotr Jasiukajtis			t[2] += twom124;
5b2ba9d3SPiotr Jasiukajtis	}
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* condense the square root */
5b2ba9d3SPiotr Jasiukajtis	c = t[1] + t[2];
5b2ba9d3SPiotr Jasiukajtis	t[2] += (t[1] - c);
5b2ba9d3SPiotr Jasiukajtis	t[1] = c;
5b2ba9d3SPiotr Jasiukajtis	c = t[0] + t[1];
5b2ba9d3SPiotr Jasiukajtis	s[1] = t[1] + (t[0] - c);
5b2ba9d3SPiotr Jasiukajtis	s[0] = c;
5b2ba9d3SPiotr Jasiukajtis	if (s[1] == zero)
5b2ba9d3SPiotr Jasiukajtis	{
5b2ba9d3SPiotr Jasiukajtis		c = s[0] + t[2];
5b2ba9d3SPiotr Jasiukajtis		s[1] = t[2] + (s[0] - c);
5b2ba9d3SPiotr Jasiukajtis		s[0] = c;
5b2ba9d3SPiotr Jasiukajtis		s[2] = zero;
5b2ba9d3SPiotr Jasiukajtis	}
5b2ba9d3SPiotr Jasiukajtis	else
5b2ba9d3SPiotr Jasiukajtis	{
5b2ba9d3SPiotr Jasiukajtis		c = s[1] + t[2];
5b2ba9d3SPiotr Jasiukajtis		s[2] = t[2] + (s[1] - c);
5b2ba9d3SPiotr Jasiukajtis		s[1] = c;
5b2ba9d3SPiotr Jasiukajtis	}
5b2ba9d3SPiotr Jasiukajtis}
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtislong double
5b2ba9d3SPiotr Jasiukajtissqrtl(long double ldx)
5b2ba9d3SPiotr Jasiukajtis{
5b2ba9d3SPiotr Jasiukajtis	union	longdouble		x;
5b2ba9d3SPiotr Jasiukajtis	volatile double			t;
5b2ba9d3SPiotr Jasiukajtis	double					xx[5], zz[3];
5b2ba9d3SPiotr Jasiukajtis	enum fp_direction_type	rm;
5b2ba9d3SPiotr Jasiukajtis	int				ex, inexact, exc, traps;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* clear cexc */
5b2ba9d3SPiotr Jasiukajtis	t = zero;
5b2ba9d3SPiotr Jasiukajtis	t -= zero;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* check for zero operand */
5b2ba9d3SPiotr Jasiukajtis	x.d = ldx;
5b2ba9d3SPiotr Jasiukajtis	if (!((x.l.msw & 0x7fffffff) | x.l.frac2 | x.l.frac3 | x.l.frac4))
5b2ba9d3SPiotr Jasiukajtis		return ldx;
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* handle nan and inf cases */
5b2ba9d3SPiotr Jasiukajtis	if ((x.l.msw & 0x7fffffff) >= 0x7fff0000)
5b2ba9d3SPiotr Jasiukajtis	{
5b2ba9d3SPiotr Jasiukajtis		if ((x.l.msw & 0xffff) | x.l.frac2 | x.l.frac3 | x.l.frac4)
5b2ba9d3SPiotr Jasiukajtis		{
5b2ba9d3SPiotr Jasiukajtis			if (!(x.l.msw & 0x8000))
5b2ba9d3SPiotr Jasiukajtis			{
5b2ba9d3SPiotr Jasiukajtis				/* snan, signal invalid */
5b2ba9d3SPiotr Jasiukajtis				t += snan.d;
5b2ba9d3SPiotr Jasiukajtis			}
5b2ba9d3SPiotr Jasiukajtis			x.l.msw |= 0x8000;
5b2ba9d3SPiotr Jasiukajtis			return x.d;
5b2ba9d3SPiotr Jasiukajtis		}
5b2ba9d3SPiotr Jasiukajtis		if (x.l.msw & 0x80000000)
5b2ba9d3SPiotr Jasiukajtis		{
5b2ba9d3SPiotr Jasiukajtis			/* sqrt(-inf), signal invalid */
5b2ba9d3SPiotr Jasiukajtis			t = -one;
5b2ba9d3SPiotr Jasiukajtis			t = sqrt(t);
5b2ba9d3SPiotr Jasiukajtis			return qnan.d;
5b2ba9d3SPiotr Jasiukajtis		}
5b2ba9d3SPiotr Jasiukajtis		/* sqrt(inf), return inf */
5b2ba9d3SPiotr Jasiukajtis		return x.d;
5b2ba9d3SPiotr Jasiukajtis	}
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* handle negative numbers */
5b2ba9d3SPiotr Jasiukajtis	if (x.l.msw & 0x80000000)
5b2ba9d3SPiotr Jasiukajtis	{
5b2ba9d3SPiotr Jasiukajtis		t = -one;
5b2ba9d3SPiotr Jasiukajtis		t = sqrt(t);
5b2ba9d3SPiotr Jasiukajtis		return qnan.d;
5b2ba9d3SPiotr Jasiukajtis	}
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* now x is finite, positive */
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	traps = __swapTE(0);
5b2ba9d3SPiotr Jasiukajtis	exc = __swapEX(0);
5b2ba9d3SPiotr Jasiukajtis	rm = __swapRD(fp_nearest);
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	ex = __q_unpack(&x, xx);
5b2ba9d3SPiotr Jasiukajtis	if (ex & 1)
5b2ba9d3SPiotr Jasiukajtis	{
5b2ba9d3SPiotr Jasiukajtis		/* make exponent even */
5b2ba9d3SPiotr Jasiukajtis		xx[0] += xx[0];
5b2ba9d3SPiotr Jasiukajtis		xx[1] += xx[1];
5b2ba9d3SPiotr Jasiukajtis		xx[2] += xx[2];
5b2ba9d3SPiotr Jasiukajtis		xx[3] += xx[3];
5b2ba9d3SPiotr Jasiukajtis		xx[4] += xx[4];
5b2ba9d3SPiotr Jasiukajtis		ex--;
5b2ba9d3SPiotr Jasiukajtis	}
5b2ba9d3SPiotr Jasiukajtis	__q_tp_sqrt(xx, zz);
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	/* put everything together */
5b2ba9d3SPiotr Jasiukajtis	x.l.msw = 0;
5b2ba9d3SPiotr Jasiukajtis	inexact = 0;
5b2ba9d3SPiotr Jasiukajtis	__q_pack(zz, ex >> 1, rm, &x, &inexact);
5b2ba9d3SPiotr Jasiukajtis
5b2ba9d3SPiotr Jasiukajtis	(void) __swapRD(rm);
5b2ba9d3SPiotr Jasiukajtis	(void) __swapEX(exc);
5b2ba9d3SPiotr Jasiukajtis	(void) __swapTE(traps);
5b2ba9d3SPiotr Jasiukajtis	if (inexact)
5b2ba9d3SPiotr Jasiukajtis	{
5b2ba9d3SPiotr Jasiukajtis		t = huge;
5b2ba9d3SPiotr Jasiukajtis		t += tiny;
5b2ba9d3SPiotr Jasiukajtis	}
5b2ba9d3SPiotr Jasiukajtis	return x.d;
5b2ba9d3SPiotr Jasiukajtis}