msun/src/s_cbrtf.c

3a8617a8SJordan K. Hubbard/* s_cbrtf.c -- float version of s_cbrt.c.
3a8617a8SJordan K. Hubbard * Conversion to float by Ian Lance Taylor, Cygnus Support, ian@cygnus.com.
ec761d75SBruce Evans * Debugged and optimized by Bruce D. Evans.
3a8617a8SJordan K. Hubbard */
3a8617a8SJordan K. Hubbard
3a8617a8SJordan K. Hubbard/*
3a8617a8SJordan K. Hubbard * ====================================================
3a8617a8SJordan K. Hubbard * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
3a8617a8SJordan K. Hubbard *
3a8617a8SJordan K. Hubbard * Developed at SunPro, a Sun Microsystems, Inc. business.
3a8617a8SJordan K. Hubbard * Permission to use, copy, modify, and distribute this
3a8617a8SJordan K. Hubbard * software is freely granted, provided that this notice
3a8617a8SJordan K. Hubbard * is preserved.
3a8617a8SJordan K. Hubbard * ====================================================
3a8617a8SJordan K. Hubbard */
3a8617a8SJordan K. Hubbard
3a8617a8SJordan K. Hubbard#include "math.h"
3a8617a8SJordan K. Hubbard#include "math_private.h"
3a8617a8SJordan K. Hubbard
3a8617a8SJordan K. Hubbard/* cbrtf(x)
3a8617a8SJordan K. Hubbard * Return cube root of x
3a8617a8SJordan K. Hubbard */
3a8617a8SJordan K. Hubbardstatic const unsigned
af7f9913SBruce Evans	B1 = 709958130, /* B1 = (127-127.0/3-0.03306235651)*2**23 */
af7f9913SBruce Evans	B2 = 642849266; /* B2 = (127-127.0/3-24/3-0.03306235651)*2**23 */
3a8617a8SJordan K. Hubbard
59b19ff1SAlfred Perlsteinfloat
59b19ff1SAlfred Perlsteincbrtf(float x)
3a8617a8SJordan K. Hubbard{
4bb97803SBruce Evans	double r,T;
4bb97803SBruce Evans	float t;
3a8617a8SJordan K. Hubbard	int32_t hx;
3a8617a8SJordan K. Hubbard	u_int32_t sign;
3a8617a8SJordan K. Hubbard	u_int32_t high;
3a8617a8SJordan K. Hubbard
3a8617a8SJordan K. Hubbard	GET_FLOAT_WORD(hx,x);
3a8617a8SJordan K. Hubbard	sign=hx&0x80000000; 		/* sign= sign(x) */
3a8617a8SJordan K. Hubbard	hx  ^=sign;
3a8617a8SJordan K. Hubbard	if(hx>=0x7f800000) return(x+x); /* cbrt(NaN,INF) is itself */
3a8617a8SJordan K. Hubbard
3a8617a8SJordan K. Hubbard    /* rough cbrt to 5 bits */
20a99011SBruce Evans	if(hx<0x00800000) { 		/* zero or subnormal? */
20a99011SBruce Evans	    if(hx==0)
20a99011SBruce Evans		return(x);		/* cbrt(+-0) is itself */
7d5a4821SBruce Evans	    SET_FLOAT_WORD(t,0x4b800000); /* set t= 2**24 */
7d5a4821SBruce Evans	    t*=x;
7d5a4821SBruce Evans	    GET_FLOAT_WORD(high,t);
ec761d75SBruce Evans	    SET_FLOAT_WORD(t,sign|((high&0x7fffffff)/3+B2));
7d5a4821SBruce Evans	} else
ec761d75SBruce Evans	    SET_FLOAT_WORD(t,sign|(hx/3+B1));
3a8617a8SJordan K. Hubbard
fd289100SBruce Evans    /*
fd289100SBruce Evans     * First step Newton iteration (solving t*t-x/t == 0) to 16 bits.  In
fd289100SBruce Evans     * double precision so that its terms can be arranged for efficiency
fd289100SBruce Evans     * without causing overflow or underflow.
fd289100SBruce Evans     */
4bb97803SBruce Evans	T=t;
4bb97803SBruce Evans	r=T*T*T;
fd289100SBruce Evans	T=T*((double)x+x+r)/(x+r+r);
3a8617a8SJordan K. Hubbard
fd289100SBruce Evans    /*
fd289100SBruce Evans     * Second step Newton iteration to 47 bits.  In double precision for
fd289100SBruce Evans     * efficiency and accuracy.
fd289100SBruce Evans     */
4bb97803SBruce Evans	r=T*T*T;
fd289100SBruce Evans	T=T*((double)x+x+r)/(x+r+r);
6de073b4SBruce Evans
4bb97803SBruce Evans    /* rounding to 24 bits is perfect in round-to-nearest mode */
4bb97803SBruce Evans	return(T);
3a8617a8SJordan K. Hubbard}