msun/src/s_tanpi.c

*dce5f3abSSteve Kargl/*-
*dce5f3abSSteve Kargl * Copyright (c) 2017 Steven G. Kargl
*dce5f3abSSteve Kargl * All rights reserved.
*dce5f3abSSteve Kargl *
*dce5f3abSSteve Kargl * Redistribution and use in source and binary forms, with or without
*dce5f3abSSteve Kargl * modification, are permitted provided that the following conditions
*dce5f3abSSteve Kargl * are met:
*dce5f3abSSteve Kargl * 1. Redistributions of source code must retain the above copyright
*dce5f3abSSteve Kargl *    notice unmodified, this list of conditions, and the following
*dce5f3abSSteve Kargl *    disclaimer.
*dce5f3abSSteve Kargl * 2. Redistributions in binary form must reproduce the above copyright
*dce5f3abSSteve Kargl *    notice, this list of conditions and the following disclaimer in the
*dce5f3abSSteve Kargl *    documentation and/or other materials provided with the distribution.
*dce5f3abSSteve Kargl *
*dce5f3abSSteve Kargl * THIS SOFTWARE IS PROVIDED BY THE AUTHOR ``AS IS'' AND ANY EXPRESS OR
*dce5f3abSSteve Kargl * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
*dce5f3abSSteve Kargl * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
*dce5f3abSSteve Kargl * IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY DIRECT, INDIRECT,
*dce5f3abSSteve Kargl * INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT
*dce5f3abSSteve Kargl * NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
*dce5f3abSSteve Kargl * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
*dce5f3abSSteve Kargl * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
*dce5f3abSSteve Kargl * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
*dce5f3abSSteve Kargl * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*dce5f3abSSteve Kargl */
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl/**
*dce5f3abSSteve Kargl * tanpi(x) computes tan(pi*x) without multiplication by pi (almost).  First,
*dce5f3abSSteve Kargl * note that tanpi(-x) = -tanpi(x), so the algorithm considers only |x| and
*dce5f3abSSteve Kargl * includes reflection symmetry by considering the sign of x on output.  The
*dce5f3abSSteve Kargl * method used depends on the magnitude of x.
*dce5f3abSSteve Kargl *
*dce5f3abSSteve Kargl * 1. For small |x|, tanpi(x) = pi * x where a sloppy threshold is used.  The
*dce5f3abSSteve Kargl *    threshold is |x| < 0x1pN with N = -(P/2+M).  P is the precision of the
*dce5f3abSSteve Kargl *    floating-point type and M = 2 to 4.  To achieve high accuracy, pi is
*dce5f3abSSteve Kargl *    decomposed into high and low parts with the high part containing a
*dce5f3abSSteve Kargl *    number of trailing zero bits.  x is also split into high and low parts.
*dce5f3abSSteve Kargl *
*dce5f3abSSteve Kargl * 2. For |x| < 1, argument reduction is not required and tanpi(x) is
*dce5f3abSSteve Kargl *    computed by a direct call to a kernel, which uses the kernel for
*dce5f3abSSteve Kargl *    tan(x).  See below.
*dce5f3abSSteve Kargl *
*dce5f3abSSteve Kargl * 3. For 1 <= |x| < 0x1p(P-1), argument reduction is required where
*dce5f3abSSteve Kargl *    |x| = j0 + r with j0 an integer and the remainder r satisfies
*dce5f3abSSteve Kargl *    0 <= r < 1.  With the given domain, a simplified inline floor(x)
*dce5f3abSSteve Kargl *    is used.  Also, note the following identity
*dce5f3abSSteve Kargl *
*dce5f3abSSteve Kargl *                                   tan(pi*j0) + tan(pi*r)
*dce5f3abSSteve Kargl *    tanpi(x) = tan(pi*(j0+r)) = ---------------------------- = tanpi(r)
*dce5f3abSSteve Kargl *                                 1 - tan(pi*j0) * tan(pi*r)
*dce5f3abSSteve Kargl *
*dce5f3abSSteve Kargl *    So, after argument reduction, the kernel is again invoked.
*dce5f3abSSteve Kargl *
*dce5f3abSSteve Kargl * 4. For |x| >= 0x1p(P-1), |x| is integral and tanpi(x) = copysign(0,x).
*dce5f3abSSteve Kargl *
*dce5f3abSSteve Kargl * 5. Special cases:
*dce5f3abSSteve Kargl *
*dce5f3abSSteve Kargl *    tanpi(+-0) = +-0
*dce5f3abSSteve Kargl *    tanpi(+-n) = +-0, for positive integers n.
*dce5f3abSSteve Kargl *    tanpi(+-n+1/4) = +-1, for positive integers n.
*dce5f3abSSteve Kargl *    tanpi(+-n+1/2) = NaN, for positive integers n.
*dce5f3abSSteve Kargl *    tanpi(+-inf) = NaN.  Raises the "invalid" floating-point exception.
*dce5f3abSSteve Kargl *    tanpi(nan) = NaN.  Raises the "invalid" floating-point exception.
*dce5f3abSSteve Kargl */
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl#include "math.h"
*dce5f3abSSteve Kargl#include "math_private.h"
*dce5f3abSSteve Kargl
*dce5f3abSSteve Karglstatic const double
*dce5f3abSSteve Karglpi_hi =  3.1415926814079285e+00,	/* 0x400921fb 0x58000000 */
*dce5f3abSSteve Karglpi_lo = -2.7818135228334233e-08;	/* 0xbe5dde97 0x3dcb3b3a */
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl/*
*dce5f3abSSteve Kargl * The kernel for tanpi(x) multiplies x by an 80-bit approximation of
*dce5f3abSSteve Kargl * pi, where the hi and lo parts are used with with kernel for tan(x).
*dce5f3abSSteve Kargl */
*dce5f3abSSteve Karglstatic inline double
*dce5f3abSSteve Kargl__kernel_tanpi(double x)
*dce5f3abSSteve Kargl{
*dce5f3abSSteve Kargl	double_t hi, lo, t;
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl	if (x < 0.25) {
*dce5f3abSSteve Kargl		hi = (float)x;
*dce5f3abSSteve Kargl		lo = x - hi;
*dce5f3abSSteve Kargl		lo = lo * (pi_lo + pi_hi) + hi * pi_lo;
*dce5f3abSSteve Kargl		hi *= pi_hi;
*dce5f3abSSteve Kargl		_2sumF(hi, lo);
*dce5f3abSSteve Kargl		t = __kernel_tan(hi, lo, 1);
*dce5f3abSSteve Kargl	} else if (x > 0.25) {
*dce5f3abSSteve Kargl		x = 0.5 - x;
*dce5f3abSSteve Kargl		hi = (float)x;
*dce5f3abSSteve Kargl		lo = x - hi;
*dce5f3abSSteve Kargl		lo = lo * (pi_lo + pi_hi) + hi * pi_lo;
*dce5f3abSSteve Kargl		hi *= pi_hi;
*dce5f3abSSteve Kargl		_2sumF(hi, lo);
*dce5f3abSSteve Kargl		t = - __kernel_tan(hi, lo, -1);
*dce5f3abSSteve Kargl	} else
*dce5f3abSSteve Kargl		t = 1;
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl	return (t);
*dce5f3abSSteve Kargl}
*dce5f3abSSteve Kargl
*dce5f3abSSteve Karglvolatile static const double vzero = 0;
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargldouble
*dce5f3abSSteve Kargltanpi(double x)
*dce5f3abSSteve Kargl{
*dce5f3abSSteve Kargl	double ax, hi, lo, t;
*dce5f3abSSteve Kargl	uint32_t hx, ix, j0, lx;
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl	EXTRACT_WORDS(hx, lx, x);
*dce5f3abSSteve Kargl	ix = hx & 0x7fffffff;
*dce5f3abSSteve Kargl	INSERT_WORDS(ax, ix, lx);
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl	if (ix < 0x3ff00000) {			/* |x| < 1 */
*dce5f3abSSteve Kargl		if (ix < 0x3fe00000) {		/* |x| < 0.5 */
*dce5f3abSSteve Kargl			if (ix < 0x3e200000) {	/* |x| < 0x1p-29 */
*dce5f3abSSteve Kargl				if (x == 0)
*dce5f3abSSteve Kargl					return (x);
*dce5f3abSSteve Kargl				/*
*dce5f3abSSteve Kargl				 * To avoid issues with subnormal values,
*dce5f3abSSteve Kargl				 * scale the computation and rescale on
*dce5f3abSSteve Kargl				 * return.
*dce5f3abSSteve Kargl				 */
*dce5f3abSSteve Kargl				INSERT_WORDS(hi, hx, 0);
*dce5f3abSSteve Kargl				hi *= 0x1p53;
*dce5f3abSSteve Kargl				lo = x * 0x1p53 - hi;
*dce5f3abSSteve Kargl				t = (pi_lo + pi_hi) * lo + pi_lo * hi +
*dce5f3abSSteve Kargl				    pi_hi * hi;
*dce5f3abSSteve Kargl				return (t * 0x1p-53);
*dce5f3abSSteve Kargl			}
*dce5f3abSSteve Kargl			t = __kernel_tanpi(ax);
*dce5f3abSSteve Kargl		} else if (ax == 0.5)
*dce5f3abSSteve Kargl			return ((ax - ax) / (ax - ax));
*dce5f3abSSteve Kargl		else
*dce5f3abSSteve Kargl			t = - __kernel_tanpi(1 - ax);
*dce5f3abSSteve Kargl		return ((hx & 0x80000000) ? -t : t);
*dce5f3abSSteve Kargl	}
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl	if (ix < 0x43300000) {		/* 1 <= |x| < 0x1p52 */
*dce5f3abSSteve Kargl		/* Determine integer part of ax. */
*dce5f3abSSteve Kargl		j0 = ((ix >> 20) & 0x7ff) - 0x3ff;
*dce5f3abSSteve Kargl		if (j0 < 20) {
*dce5f3abSSteve Kargl			ix &= ~(0x000fffff >> j0);
*dce5f3abSSteve Kargl			lx = 0;
*dce5f3abSSteve Kargl		} else {
*dce5f3abSSteve Kargl			lx &= ~(((uint32_t)(0xffffffff)) >> (j0 - 20));
*dce5f3abSSteve Kargl		}
*dce5f3abSSteve Kargl		INSERT_WORDS(x,ix,lx);
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl		ax -= x;
*dce5f3abSSteve Kargl		EXTRACT_WORDS(ix, lx, ax);
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl		if (ix < 0x3fe00000)		/* |x| < 0.5 */
*dce5f3abSSteve Kargl			t = ax == 0 ? 0 : __kernel_tanpi(ax);
*dce5f3abSSteve Kargl		else if (ax == 0.5)
*dce5f3abSSteve Kargl			return ((ax - ax) / (ax - ax));
*dce5f3abSSteve Kargl		else
*dce5f3abSSteve Kargl			t = - __kernel_tanpi(1 - ax);
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl		return ((hx & 0x80000000) ? -t : t);
*dce5f3abSSteve Kargl	}
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl	/* x = +-inf or nan. */
*dce5f3abSSteve Kargl	if (ix >= 0x7f800000)
*dce5f3abSSteve Kargl		return (vzero / vzero);
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl	/*
*dce5f3abSSteve Kargl	 * |x| >= 0x1p52 is always an integer, so return +-0.
*dce5f3abSSteve Kargl	 */
*dce5f3abSSteve Kargl	return (copysign(0, x));
*dce5f3abSSteve Kargl}
*dce5f3abSSteve Kargl
*dce5f3abSSteve Kargl#if LDBL_MANT_DIG == 53
*dce5f3abSSteve Kargl__weak_reference(tanpi, tanpil);
*dce5f3abSSteve Kargl#endif