crypto/ecc/ecl_gf.c

*f9fbec18Smcpowers/*
*f9fbec18Smcpowers * ***** BEGIN LICENSE BLOCK *****
*f9fbec18Smcpowers * Version: MPL 1.1/GPL 2.0/LGPL 2.1
*f9fbec18Smcpowers *
*f9fbec18Smcpowers * The contents of this file are subject to the Mozilla Public License Version
*f9fbec18Smcpowers * 1.1 (the "License"); you may not use this file except in compliance with
*f9fbec18Smcpowers * the License. You may obtain a copy of the License at
*f9fbec18Smcpowers * http://www.mozilla.org/MPL/
*f9fbec18Smcpowers *
*f9fbec18Smcpowers * Software distributed under the License is distributed on an "AS IS" basis,
*f9fbec18Smcpowers * WITHOUT WARRANTY OF ANY KIND, either express or implied. See the License
*f9fbec18Smcpowers * for the specific language governing rights and limitations under the
*f9fbec18Smcpowers * License.
*f9fbec18Smcpowers *
*f9fbec18Smcpowers * The Original Code is the elliptic curve math library.
*f9fbec18Smcpowers *
*f9fbec18Smcpowers * The Initial Developer of the Original Code is
*f9fbec18Smcpowers * Sun Microsystems, Inc.
*f9fbec18Smcpowers * Portions created by the Initial Developer are Copyright (C) 2003
*f9fbec18Smcpowers * the Initial Developer. All Rights Reserved.
*f9fbec18Smcpowers *
*f9fbec18Smcpowers * Contributor(s):
*f9fbec18Smcpowers *   Stephen Fung <fungstep@hotmail.com> and
*f9fbec18Smcpowers *   Douglas Stebila <douglas@stebila.ca>, Sun Microsystems Laboratories
*f9fbec18Smcpowers *
*f9fbec18Smcpowers * Alternatively, the contents of this file may be used under the terms of
*f9fbec18Smcpowers * either the GNU General Public License Version 2 or later (the "GPL"), or
*f9fbec18Smcpowers * the GNU Lesser General Public License Version 2.1 or later (the "LGPL"),
*f9fbec18Smcpowers * in which case the provisions of the GPL or the LGPL are applicable instead
*f9fbec18Smcpowers * of those above. If you wish to allow use of your version of this file only
*f9fbec18Smcpowers * under the terms of either the GPL or the LGPL, and not to allow others to
*f9fbec18Smcpowers * use your version of this file under the terms of the MPL, indicate your
*f9fbec18Smcpowers * decision by deleting the provisions above and replace them with the notice
*f9fbec18Smcpowers * and other provisions required by the GPL or the LGPL. If you do not delete
*f9fbec18Smcpowers * the provisions above, a recipient may use your version of this file under
*f9fbec18Smcpowers * the terms of any one of the MPL, the GPL or the LGPL.
*f9fbec18Smcpowers *
*f9fbec18Smcpowers * ***** END LICENSE BLOCK ***** */
*f9fbec18Smcpowers/*
*f9fbec18Smcpowers * Copyright 2007 Sun Microsystems, Inc.  All rights reserved.
*f9fbec18Smcpowers * Use is subject to license terms.
*f9fbec18Smcpowers *
*f9fbec18Smcpowers * Sun elects to use this software under the MPL license.
*f9fbec18Smcpowers */
*f9fbec18Smcpowers
*f9fbec18Smcpowers#pragma ident	"%Z%%M%	%I%	%E% SMI"
*f9fbec18Smcpowers
*f9fbec18Smcpowers#include "mpi.h"
*f9fbec18Smcpowers#include "mp_gf2m.h"
*f9fbec18Smcpowers#include "ecl-priv.h"
*f9fbec18Smcpowers#include "mpi-priv.h"
*f9fbec18Smcpowers#ifndef _KERNEL
*f9fbec18Smcpowers#include <stdlib.h>
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Allocate memory for a new GFMethod object. */
*f9fbec18SmcpowersGFMethod *
*f9fbec18SmcpowersGFMethod_new(int kmflag)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	GFMethod *meth;
*f9fbec18Smcpowers#ifdef _KERNEL
*f9fbec18Smcpowers	meth = (GFMethod *) kmem_alloc(sizeof(GFMethod), kmflag);
*f9fbec18Smcpowers#else
*f9fbec18Smcpowers	meth = (GFMethod *) malloc(sizeof(GFMethod));
*f9fbec18Smcpowers	if (meth == NULL)
*f9fbec18Smcpowers		return NULL;
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers	meth->constructed = MP_YES;
*f9fbec18Smcpowers	MP_DIGITS(&meth->irr) = 0;
*f9fbec18Smcpowers	meth->extra_free = NULL;
*f9fbec18Smcpowers	MP_CHECKOK(mp_init(&meth->irr, kmflag));
*f9fbec18Smcpowers
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	if (res != MP_OKAY) {
*f9fbec18Smcpowers		GFMethod_free(meth);
*f9fbec18Smcpowers		return NULL;
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	return meth;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Construct a generic GFMethod for arithmetic over prime fields with
*f9fbec18Smcpowers * irreducible irr. */
*f9fbec18SmcpowersGFMethod *
*f9fbec18SmcpowersGFMethod_consGFp(const mp_int *irr)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	GFMethod *meth = NULL;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	meth = GFMethod_new(FLAG(irr));
*f9fbec18Smcpowers	if (meth == NULL)
*f9fbec18Smcpowers		return NULL;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	MP_CHECKOK(mp_copy(irr, &meth->irr));
*f9fbec18Smcpowers	meth->irr_arr[0] = mpl_significant_bits(irr);
*f9fbec18Smcpowers	meth->irr_arr[1] = meth->irr_arr[2] = meth->irr_arr[3] =
*f9fbec18Smcpowers		meth->irr_arr[4] = 0;
*f9fbec18Smcpowers	switch(MP_USED(&meth->irr)) {
*f9fbec18Smcpowers	/* maybe we need 1 and 2 words here as well?*/
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		meth->field_add = &ec_GFp_add_3;
*f9fbec18Smcpowers		meth->field_sub = &ec_GFp_sub_3;
*f9fbec18Smcpowers		break;
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		meth->field_add = &ec_GFp_add_4;
*f9fbec18Smcpowers		meth->field_sub = &ec_GFp_sub_4;
*f9fbec18Smcpowers		break;
*f9fbec18Smcpowers	case 5:
*f9fbec18Smcpowers		meth->field_add = &ec_GFp_add_5;
*f9fbec18Smcpowers		meth->field_sub = &ec_GFp_sub_5;
*f9fbec18Smcpowers		break;
*f9fbec18Smcpowers	case 6:
*f9fbec18Smcpowers		meth->field_add = &ec_GFp_add_6;
*f9fbec18Smcpowers		meth->field_sub = &ec_GFp_sub_6;
*f9fbec18Smcpowers		break;
*f9fbec18Smcpowers	default:
*f9fbec18Smcpowers		meth->field_add = &ec_GFp_add;
*f9fbec18Smcpowers		meth->field_sub = &ec_GFp_sub;
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	meth->field_neg = &ec_GFp_neg;
*f9fbec18Smcpowers	meth->field_mod = &ec_GFp_mod;
*f9fbec18Smcpowers	meth->field_mul = &ec_GFp_mul;
*f9fbec18Smcpowers	meth->field_sqr = &ec_GFp_sqr;
*f9fbec18Smcpowers	meth->field_div = &ec_GFp_div;
*f9fbec18Smcpowers	meth->field_enc = NULL;
*f9fbec18Smcpowers	meth->field_dec = NULL;
*f9fbec18Smcpowers	meth->extra1 = NULL;
*f9fbec18Smcpowers	meth->extra2 = NULL;
*f9fbec18Smcpowers	meth->extra_free = NULL;
*f9fbec18Smcpowers
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	if (res != MP_OKAY) {
*f9fbec18Smcpowers		GFMethod_free(meth);
*f9fbec18Smcpowers		return NULL;
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	return meth;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Construct a generic GFMethod for arithmetic over binary polynomial
*f9fbec18Smcpowers * fields with irreducible irr that has array representation irr_arr (see
*f9fbec18Smcpowers * ecl-priv.h for description of the representation).  If irr_arr is NULL,
*f9fbec18Smcpowers * then it is constructed from the bitstring representation. */
*f9fbec18SmcpowersGFMethod *
*f9fbec18SmcpowersGFMethod_consGF2m(const mp_int *irr, const unsigned int irr_arr[5])
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	int ret;
*f9fbec18Smcpowers	GFMethod *meth = NULL;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	meth = GFMethod_new(FLAG(irr));
*f9fbec18Smcpowers	if (meth == NULL)
*f9fbec18Smcpowers		return NULL;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	MP_CHECKOK(mp_copy(irr, &meth->irr));
*f9fbec18Smcpowers	if (irr_arr != NULL) {
*f9fbec18Smcpowers		/* Irreducible polynomials are either trinomials or pentanomials. */
*f9fbec18Smcpowers		meth->irr_arr[0] = irr_arr[0];
*f9fbec18Smcpowers		meth->irr_arr[1] = irr_arr[1];
*f9fbec18Smcpowers		meth->irr_arr[2] = irr_arr[2];
*f9fbec18Smcpowers		if (irr_arr[2] > 0) {
*f9fbec18Smcpowers			meth->irr_arr[3] = irr_arr[3];
*f9fbec18Smcpowers			meth->irr_arr[4] = irr_arr[4];
*f9fbec18Smcpowers		} else {
*f9fbec18Smcpowers			meth->irr_arr[3] = meth->irr_arr[4] = 0;
*f9fbec18Smcpowers		}
*f9fbec18Smcpowers	} else {
*f9fbec18Smcpowers		ret = mp_bpoly2arr(irr, meth->irr_arr, 5);
*f9fbec18Smcpowers		/* Irreducible polynomials are either trinomials or pentanomials. */
*f9fbec18Smcpowers		if ((ret != 5) && (ret != 3)) {
*f9fbec18Smcpowers			res = MP_UNDEF;
*f9fbec18Smcpowers			goto CLEANUP;
*f9fbec18Smcpowers		}
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	meth->field_add = &ec_GF2m_add;
*f9fbec18Smcpowers	meth->field_neg = &ec_GF2m_neg;
*f9fbec18Smcpowers	meth->field_sub = &ec_GF2m_add;
*f9fbec18Smcpowers	meth->field_mod = &ec_GF2m_mod;
*f9fbec18Smcpowers	meth->field_mul = &ec_GF2m_mul;
*f9fbec18Smcpowers	meth->field_sqr = &ec_GF2m_sqr;
*f9fbec18Smcpowers	meth->field_div = &ec_GF2m_div;
*f9fbec18Smcpowers	meth->field_enc = NULL;
*f9fbec18Smcpowers	meth->field_dec = NULL;
*f9fbec18Smcpowers	meth->extra1 = NULL;
*f9fbec18Smcpowers	meth->extra2 = NULL;
*f9fbec18Smcpowers	meth->extra_free = NULL;
*f9fbec18Smcpowers
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	if (res != MP_OKAY) {
*f9fbec18Smcpowers		GFMethod_free(meth);
*f9fbec18Smcpowers		return NULL;
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	return meth;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Free the memory allocated (if any) to a GFMethod object. */
*f9fbec18Smcpowersvoid
*f9fbec18SmcpowersGFMethod_free(GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	if (meth == NULL)
*f9fbec18Smcpowers		return;
*f9fbec18Smcpowers	if (meth->constructed == MP_NO)
*f9fbec18Smcpowers		return;
*f9fbec18Smcpowers	mp_clear(&meth->irr);
*f9fbec18Smcpowers	if (meth->extra_free != NULL)
*f9fbec18Smcpowers		meth->extra_free(meth);
*f9fbec18Smcpowers#ifdef _KERNEL
*f9fbec18Smcpowers	kmem_free(meth, sizeof(GFMethod));
*f9fbec18Smcpowers#else
*f9fbec18Smcpowers	free(meth);
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Wrapper functions for generic prime field arithmetic. */
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Add two field elements.  Assumes that 0 <= a, b < meth->irr */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_add(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers		   const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	/* PRE: 0 <= a, b < p = meth->irr POST: 0 <= r < p, r = a + b (mod p) */
*f9fbec18Smcpowers	mp_err res;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	if ((res = mp_add(a, b, r)) != MP_OKAY) {
*f9fbec18Smcpowers		return res;
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	if (mp_cmp(r, &meth->irr) >= 0) {
*f9fbec18Smcpowers		return mp_sub(r, &meth->irr, r);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	return res;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Negates a field element.  Assumes that 0 <= a < meth->irr */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_neg(const mp_int *a, mp_int *r, const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	/* PRE: 0 <= a < p = meth->irr POST: 0 <= r < p, r = -a (mod p) */
*f9fbec18Smcpowers
*f9fbec18Smcpowers	if (mp_cmp_z(a) == 0) {
*f9fbec18Smcpowers		mp_zero(r);
*f9fbec18Smcpowers		return MP_OKAY;
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	return mp_sub(&meth->irr, a, r);
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Subtracts two field elements.  Assumes that 0 <= a, b < meth->irr */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_sub(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers		   const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	/* PRE: 0 <= a, b < p = meth->irr POST: 0 <= r < p, r = a - b (mod p) */
*f9fbec18Smcpowers	res = mp_sub(a, b, r);
*f9fbec18Smcpowers	if (res == MP_RANGE) {
*f9fbec18Smcpowers		MP_CHECKOK(mp_sub(b, a, r));
*f9fbec18Smcpowers		if (mp_cmp_z(r) < 0) {
*f9fbec18Smcpowers			MP_CHECKOK(mp_add(r, &meth->irr, r));
*f9fbec18Smcpowers		}
*f9fbec18Smcpowers		MP_CHECKOK(ec_GFp_neg(r, r, meth));
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	if (mp_cmp_z(r) < 0) {
*f9fbec18Smcpowers		MP_CHECKOK(mp_add(r, &meth->irr, r));
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	return res;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers/*
*f9fbec18Smcpowers * Inline adds for small curve lengths.
*f9fbec18Smcpowers */
*f9fbec18Smcpowers/* 3 words */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_add_3(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers			const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	mp_digit a0 = 0, a1 = 0, a2 = 0;
*f9fbec18Smcpowers	mp_digit r0 = 0, r1 = 0, r2 = 0;
*f9fbec18Smcpowers	mp_digit carry;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	switch(MP_USED(a)) {
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		a2 = MP_DIGIT(a,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		a1 = MP_DIGIT(a,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		a0 = MP_DIGIT(a,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	switch(MP_USED(b)) {
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		r2 = MP_DIGIT(b,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		r1 = MP_DIGIT(b,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		r0 = MP_DIGIT(b,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers#ifndef MPI_AMD64_ADD
*f9fbec18Smcpowers	MP_ADD_CARRY(a0, r0, r0, 0,     carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a1, r1, r1, carry, carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a2, r2, r2, carry, carry);
*f9fbec18Smcpowers#else
*f9fbec18Smcpowers	__asm__ (
*f9fbec18Smcpowers                "xorq   %3,%3           \n\t"
*f9fbec18Smcpowers                "addq   %4,%0           \n\t"
*f9fbec18Smcpowers                "adcq   %5,%1           \n\t"
*f9fbec18Smcpowers                "adcq   %6,%2           \n\t"
*f9fbec18Smcpowers                "adcq   $0,%3           \n\t"
*f9fbec18Smcpowers                : "=r"(r0), "=r"(r1), "=r"(r2), "=r"(carry)
*f9fbec18Smcpowers                : "r" (a0), "r" (a1), "r" (a2),
*f9fbec18Smcpowers		  "0" (r0), "1" (r1), "2" (r2)
*f9fbec18Smcpowers                : "%cc" );
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers
*f9fbec18Smcpowers	MP_CHECKOK(s_mp_pad(r, 3));
*f9fbec18Smcpowers	MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers	MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers	MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	MP_SIGN(r) = MP_ZPOS;
*f9fbec18Smcpowers	MP_USED(r) = 3;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	/* Do quick 'subract' if we've gone over
*f9fbec18Smcpowers	 * (add the 2's complement of the curve field) */
*f9fbec18Smcpowers	 a2 = MP_DIGIT(&meth->irr,2);
*f9fbec18Smcpowers	if (carry ||  r2 >  a2 ||
*f9fbec18Smcpowers		((r2 == a2) && mp_cmp(r,&meth->irr) != MP_LT)) {
*f9fbec18Smcpowers		a1 = MP_DIGIT(&meth->irr,1);
*f9fbec18Smcpowers		a0 = MP_DIGIT(&meth->irr,0);
*f9fbec18Smcpowers#ifndef MPI_AMD64_ADD
*f9fbec18Smcpowers		MP_SUB_BORROW(r0, a0, r0, 0,     carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r1, a1, r1, carry, carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r2, a2, r2, carry, carry);
*f9fbec18Smcpowers#else
*f9fbec18Smcpowers		__asm__ (
*f9fbec18Smcpowers			"subq   %3,%0           \n\t"
*f9fbec18Smcpowers			"sbbq   %4,%1           \n\t"
*f9fbec18Smcpowers			"sbbq   %5,%2           \n\t"
*f9fbec18Smcpowers			: "=r"(r0), "=r"(r1), "=r"(r2)
*f9fbec18Smcpowers			: "r" (a0), "r" (a1), "r" (a2),
*f9fbec18Smcpowers			  "0" (r0), "1" (r1), "2" (r2)
*f9fbec18Smcpowers			: "%cc" );
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers		MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers		MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers		MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers	s_mp_clamp(r);
*f9fbec18Smcpowers
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	return res;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* 4 words */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_add_4(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers			const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	mp_digit a0 = 0, a1 = 0, a2 = 0, a3 = 0;
*f9fbec18Smcpowers	mp_digit r0 = 0, r1 = 0, r2 = 0, r3 = 0;
*f9fbec18Smcpowers	mp_digit carry;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	switch(MP_USED(a)) {
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		a3 = MP_DIGIT(a,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		a2 = MP_DIGIT(a,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		a1 = MP_DIGIT(a,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		a0 = MP_DIGIT(a,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	switch(MP_USED(b)) {
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		r3 = MP_DIGIT(b,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		r2 = MP_DIGIT(b,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		r1 = MP_DIGIT(b,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		r0 = MP_DIGIT(b,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers#ifndef MPI_AMD64_ADD
*f9fbec18Smcpowers	MP_ADD_CARRY(a0, r0, r0, 0,     carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a1, r1, r1, carry, carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a2, r2, r2, carry, carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a3, r3, r3, carry, carry);
*f9fbec18Smcpowers#else
*f9fbec18Smcpowers	__asm__ (
*f9fbec18Smcpowers                "xorq   %4,%4           \n\t"
*f9fbec18Smcpowers                "addq   %5,%0           \n\t"
*f9fbec18Smcpowers                "adcq   %6,%1           \n\t"
*f9fbec18Smcpowers                "adcq   %7,%2           \n\t"
*f9fbec18Smcpowers                "adcq   %8,%3           \n\t"
*f9fbec18Smcpowers                "adcq   $0,%4           \n\t"
*f9fbec18Smcpowers                : "=r"(r0), "=r"(r1), "=r"(r2), "=r"(r3), "=r"(carry)
*f9fbec18Smcpowers                : "r" (a0), "r" (a1), "r" (a2), "r" (a3),
*f9fbec18Smcpowers		  "0" (r0), "1" (r1), "2" (r2), "3" (r3)
*f9fbec18Smcpowers                : "%cc" );
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers
*f9fbec18Smcpowers	MP_CHECKOK(s_mp_pad(r, 4));
*f9fbec18Smcpowers	MP_DIGIT(r, 3) = r3;
*f9fbec18Smcpowers	MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers	MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers	MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	MP_SIGN(r) = MP_ZPOS;
*f9fbec18Smcpowers	MP_USED(r) = 4;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	/* Do quick 'subract' if we've gone over
*f9fbec18Smcpowers	 * (add the 2's complement of the curve field) */
*f9fbec18Smcpowers	 a3 = MP_DIGIT(&meth->irr,3);
*f9fbec18Smcpowers	if (carry ||  r3 >  a3 ||
*f9fbec18Smcpowers		((r3 == a3) && mp_cmp(r,&meth->irr) != MP_LT)) {
*f9fbec18Smcpowers		a2 = MP_DIGIT(&meth->irr,2);
*f9fbec18Smcpowers		a1 = MP_DIGIT(&meth->irr,1);
*f9fbec18Smcpowers		a0 = MP_DIGIT(&meth->irr,0);
*f9fbec18Smcpowers#ifndef MPI_AMD64_ADD
*f9fbec18Smcpowers		MP_SUB_BORROW(r0, a0, r0, 0,     carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r1, a1, r1, carry, carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r2, a2, r2, carry, carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r3, a3, r3, carry, carry);
*f9fbec18Smcpowers#else
*f9fbec18Smcpowers		__asm__ (
*f9fbec18Smcpowers			"subq   %4,%0           \n\t"
*f9fbec18Smcpowers			"sbbq   %5,%1           \n\t"
*f9fbec18Smcpowers			"sbbq   %6,%2           \n\t"
*f9fbec18Smcpowers			"sbbq   %7,%3           \n\t"
*f9fbec18Smcpowers			: "=r"(r0), "=r"(r1), "=r"(r2), "=r"(r3)
*f9fbec18Smcpowers			: "r" (a0), "r" (a1), "r" (a2), "r" (a3),
*f9fbec18Smcpowers			  "0" (r0), "1" (r1), "2" (r2), "3" (r3)
*f9fbec18Smcpowers			: "%cc" );
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers		MP_DIGIT(r, 3) = r3;
*f9fbec18Smcpowers		MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers		MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers		MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers	s_mp_clamp(r);
*f9fbec18Smcpowers
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	return res;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* 5 words */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_add_5(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers			const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	mp_digit a0 = 0, a1 = 0, a2 = 0, a3 = 0, a4 = 0;
*f9fbec18Smcpowers	mp_digit r0 = 0, r1 = 0, r2 = 0, r3 = 0, r4 = 0;
*f9fbec18Smcpowers	mp_digit carry;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	switch(MP_USED(a)) {
*f9fbec18Smcpowers	case 5:
*f9fbec18Smcpowers		a4 = MP_DIGIT(a,4);
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		a3 = MP_DIGIT(a,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		a2 = MP_DIGIT(a,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		a1 = MP_DIGIT(a,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		a0 = MP_DIGIT(a,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	switch(MP_USED(b)) {
*f9fbec18Smcpowers	case 5:
*f9fbec18Smcpowers		r4 = MP_DIGIT(b,4);
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		r3 = MP_DIGIT(b,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		r2 = MP_DIGIT(b,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		r1 = MP_DIGIT(b,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		r0 = MP_DIGIT(b,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers	MP_ADD_CARRY(a0, r0, r0, 0,     carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a1, r1, r1, carry, carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a2, r2, r2, carry, carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a3, r3, r3, carry, carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a4, r4, r4, carry, carry);
*f9fbec18Smcpowers
*f9fbec18Smcpowers	MP_CHECKOK(s_mp_pad(r, 5));
*f9fbec18Smcpowers	MP_DIGIT(r, 4) = r4;
*f9fbec18Smcpowers	MP_DIGIT(r, 3) = r3;
*f9fbec18Smcpowers	MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers	MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers	MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	MP_SIGN(r) = MP_ZPOS;
*f9fbec18Smcpowers	MP_USED(r) = 5;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	/* Do quick 'subract' if we've gone over
*f9fbec18Smcpowers	 * (add the 2's complement of the curve field) */
*f9fbec18Smcpowers	 a4 = MP_DIGIT(&meth->irr,4);
*f9fbec18Smcpowers	if (carry ||  r4 >  a4 ||
*f9fbec18Smcpowers		((r4 == a4) && mp_cmp(r,&meth->irr) != MP_LT)) {
*f9fbec18Smcpowers		a3 = MP_DIGIT(&meth->irr,3);
*f9fbec18Smcpowers		a2 = MP_DIGIT(&meth->irr,2);
*f9fbec18Smcpowers		a1 = MP_DIGIT(&meth->irr,1);
*f9fbec18Smcpowers		a0 = MP_DIGIT(&meth->irr,0);
*f9fbec18Smcpowers		MP_SUB_BORROW(r0, a0, r0, 0,     carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r1, a1, r1, carry, carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r2, a2, r2, carry, carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r3, a3, r3, carry, carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r4, a4, r4, carry, carry);
*f9fbec18Smcpowers		MP_DIGIT(r, 4) = r4;
*f9fbec18Smcpowers		MP_DIGIT(r, 3) = r3;
*f9fbec18Smcpowers		MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers		MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers		MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers	s_mp_clamp(r);
*f9fbec18Smcpowers
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	return res;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* 6 words */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_add_6(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers			const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	mp_digit a0 = 0, a1 = 0, a2 = 0, a3 = 0, a4 = 0, a5 = 0;
*f9fbec18Smcpowers	mp_digit r0 = 0, r1 = 0, r2 = 0, r3 = 0, r4 = 0, r5 = 0;
*f9fbec18Smcpowers	mp_digit carry;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	switch(MP_USED(a)) {
*f9fbec18Smcpowers	case 6:
*f9fbec18Smcpowers		a5 = MP_DIGIT(a,5);
*f9fbec18Smcpowers	case 5:
*f9fbec18Smcpowers		a4 = MP_DIGIT(a,4);
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		a3 = MP_DIGIT(a,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		a2 = MP_DIGIT(a,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		a1 = MP_DIGIT(a,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		a0 = MP_DIGIT(a,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	switch(MP_USED(b)) {
*f9fbec18Smcpowers	case 6:
*f9fbec18Smcpowers		r5 = MP_DIGIT(b,5);
*f9fbec18Smcpowers	case 5:
*f9fbec18Smcpowers		r4 = MP_DIGIT(b,4);
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		r3 = MP_DIGIT(b,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		r2 = MP_DIGIT(b,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		r1 = MP_DIGIT(b,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		r0 = MP_DIGIT(b,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers	MP_ADD_CARRY(a0, r0, r0, 0,     carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a1, r1, r1, carry, carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a2, r2, r2, carry, carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a3, r3, r3, carry, carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a4, r4, r4, carry, carry);
*f9fbec18Smcpowers	MP_ADD_CARRY(a5, r5, r5, carry, carry);
*f9fbec18Smcpowers
*f9fbec18Smcpowers	MP_CHECKOK(s_mp_pad(r, 6));
*f9fbec18Smcpowers	MP_DIGIT(r, 5) = r5;
*f9fbec18Smcpowers	MP_DIGIT(r, 4) = r4;
*f9fbec18Smcpowers	MP_DIGIT(r, 3) = r3;
*f9fbec18Smcpowers	MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers	MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers	MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	MP_SIGN(r) = MP_ZPOS;
*f9fbec18Smcpowers	MP_USED(r) = 6;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	/* Do quick 'subract' if we've gone over
*f9fbec18Smcpowers	 * (add the 2's complement of the curve field) */
*f9fbec18Smcpowers	a5 = MP_DIGIT(&meth->irr,5);
*f9fbec18Smcpowers	if (carry ||  r5 >  a5 ||
*f9fbec18Smcpowers		((r5 == a5) && mp_cmp(r,&meth->irr) != MP_LT)) {
*f9fbec18Smcpowers		a4 = MP_DIGIT(&meth->irr,4);
*f9fbec18Smcpowers		a3 = MP_DIGIT(&meth->irr,3);
*f9fbec18Smcpowers		a2 = MP_DIGIT(&meth->irr,2);
*f9fbec18Smcpowers		a1 = MP_DIGIT(&meth->irr,1);
*f9fbec18Smcpowers		a0 = MP_DIGIT(&meth->irr,0);
*f9fbec18Smcpowers		MP_SUB_BORROW(r0, a0, r0, 0,     carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r1, a1, r1, carry, carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r2, a2, r2, carry, carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r3, a3, r3, carry, carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r4, a4, r4, carry, carry);
*f9fbec18Smcpowers		MP_SUB_BORROW(r5, a5, r5, carry, carry);
*f9fbec18Smcpowers		MP_DIGIT(r, 5) = r5;
*f9fbec18Smcpowers		MP_DIGIT(r, 4) = r4;
*f9fbec18Smcpowers		MP_DIGIT(r, 3) = r3;
*f9fbec18Smcpowers		MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers		MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers		MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers	s_mp_clamp(r);
*f9fbec18Smcpowers
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	return res;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/*
*f9fbec18Smcpowers * The following subraction functions do in-line subractions based
*f9fbec18Smcpowers * on our curve size.
*f9fbec18Smcpowers *
*f9fbec18Smcpowers * ... 3 words
*f9fbec18Smcpowers */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_sub_3(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers			const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	mp_digit b0 = 0, b1 = 0, b2 = 0;
*f9fbec18Smcpowers	mp_digit r0 = 0, r1 = 0, r2 = 0;
*f9fbec18Smcpowers	mp_digit borrow;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	switch(MP_USED(a)) {
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		r2 = MP_DIGIT(a,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		r1 = MP_DIGIT(a,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		r0 = MP_DIGIT(a,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	switch(MP_USED(b)) {
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		b2 = MP_DIGIT(b,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		b1 = MP_DIGIT(b,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		b0 = MP_DIGIT(b,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers#ifndef MPI_AMD64_ADD
*f9fbec18Smcpowers	MP_SUB_BORROW(r0, b0, r0, 0,     borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r1, b1, r1, borrow, borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r2, b2, r2, borrow, borrow);
*f9fbec18Smcpowers#else
*f9fbec18Smcpowers	__asm__ (
*f9fbec18Smcpowers                "xorq   %3,%3           \n\t"
*f9fbec18Smcpowers                "subq   %4,%0           \n\t"
*f9fbec18Smcpowers                "sbbq   %5,%1           \n\t"
*f9fbec18Smcpowers                "sbbq   %6,%2           \n\t"
*f9fbec18Smcpowers                "adcq   $0,%3           \n\t"
*f9fbec18Smcpowers                : "=r"(r0), "=r"(r1), "=r"(r2), "=r" (borrow)
*f9fbec18Smcpowers                : "r" (b0), "r" (b1), "r" (b2),
*f9fbec18Smcpowers		  "0" (r0), "1" (r1), "2" (r2)
*f9fbec18Smcpowers                : "%cc" );
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers
*f9fbec18Smcpowers	/* Do quick 'add' if we've gone under 0
*f9fbec18Smcpowers	 * (subtract the 2's complement of the curve field) */
*f9fbec18Smcpowers	if (borrow) {
*f9fbec18Smcpowers	 	b2 = MP_DIGIT(&meth->irr,2);
*f9fbec18Smcpowers		b1 = MP_DIGIT(&meth->irr,1);
*f9fbec18Smcpowers		b0 = MP_DIGIT(&meth->irr,0);
*f9fbec18Smcpowers#ifndef MPI_AMD64_ADD
*f9fbec18Smcpowers		MP_ADD_CARRY(b0, r0, r0, 0,      borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b1, r1, r1, borrow, borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b2, r2, r2, borrow, borrow);
*f9fbec18Smcpowers#else
*f9fbec18Smcpowers		__asm__ (
*f9fbec18Smcpowers			"addq   %3,%0           \n\t"
*f9fbec18Smcpowers			"adcq   %4,%1           \n\t"
*f9fbec18Smcpowers			"adcq   %5,%2           \n\t"
*f9fbec18Smcpowers			: "=r"(r0), "=r"(r1), "=r"(r2)
*f9fbec18Smcpowers			: "r" (b0), "r" (b1), "r" (b2),
*f9fbec18Smcpowers  			  "0" (r0), "1" (r1), "2" (r2)
*f9fbec18Smcpowers			: "%cc" );
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers#ifdef MPI_AMD64_ADD
*f9fbec18Smcpowers	/* compiler fakeout? */
*f9fbec18Smcpowers	if ((r2 == b0) && (r1 == b0) && (r0 == b0)) {
*f9fbec18Smcpowers		MP_CHECKOK(s_mp_pad(r, 4));
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers	MP_CHECKOK(s_mp_pad(r, 3));
*f9fbec18Smcpowers	MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers	MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers	MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	MP_SIGN(r) = MP_ZPOS;
*f9fbec18Smcpowers	MP_USED(r) = 3;
*f9fbec18Smcpowers	s_mp_clamp(r);
*f9fbec18Smcpowers
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	return res;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* 4 words */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_sub_4(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers			const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	mp_digit b0 = 0, b1 = 0, b2 = 0, b3 = 0;
*f9fbec18Smcpowers	mp_digit r0 = 0, r1 = 0, r2 = 0, r3 = 0;
*f9fbec18Smcpowers	mp_digit borrow;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	switch(MP_USED(a)) {
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		r3 = MP_DIGIT(a,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		r2 = MP_DIGIT(a,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		r1 = MP_DIGIT(a,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		r0 = MP_DIGIT(a,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	switch(MP_USED(b)) {
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		b3 = MP_DIGIT(b,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		b2 = MP_DIGIT(b,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		b1 = MP_DIGIT(b,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		b0 = MP_DIGIT(b,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers#ifndef MPI_AMD64_ADD
*f9fbec18Smcpowers	MP_SUB_BORROW(r0, b0, r0, 0,     borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r1, b1, r1, borrow, borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r2, b2, r2, borrow, borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r3, b3, r3, borrow, borrow);
*f9fbec18Smcpowers#else
*f9fbec18Smcpowers	__asm__ (
*f9fbec18Smcpowers                "xorq   %4,%4           \n\t"
*f9fbec18Smcpowers                "subq   %5,%0           \n\t"
*f9fbec18Smcpowers                "sbbq   %6,%1           \n\t"
*f9fbec18Smcpowers                "sbbq   %7,%2           \n\t"
*f9fbec18Smcpowers                "sbbq   %8,%3           \n\t"
*f9fbec18Smcpowers                "adcq   $0,%4           \n\t"
*f9fbec18Smcpowers                : "=r"(r0), "=r"(r1), "=r"(r2), "=r"(r3), "=r" (borrow)
*f9fbec18Smcpowers                : "r" (b0), "r" (b1), "r" (b2), "r" (b3),
*f9fbec18Smcpowers		  "0" (r0), "1" (r1), "2" (r2), "3" (r3)
*f9fbec18Smcpowers                : "%cc" );
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers
*f9fbec18Smcpowers	/* Do quick 'add' if we've gone under 0
*f9fbec18Smcpowers	 * (subtract the 2's complement of the curve field) */
*f9fbec18Smcpowers	if (borrow) {
*f9fbec18Smcpowers	 	b3 = MP_DIGIT(&meth->irr,3);
*f9fbec18Smcpowers	 	b2 = MP_DIGIT(&meth->irr,2);
*f9fbec18Smcpowers		b1 = MP_DIGIT(&meth->irr,1);
*f9fbec18Smcpowers		b0 = MP_DIGIT(&meth->irr,0);
*f9fbec18Smcpowers#ifndef MPI_AMD64_ADD
*f9fbec18Smcpowers		MP_ADD_CARRY(b0, r0, r0, 0,      borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b1, r1, r1, borrow, borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b2, r2, r2, borrow, borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b3, r3, r3, borrow, borrow);
*f9fbec18Smcpowers#else
*f9fbec18Smcpowers		__asm__ (
*f9fbec18Smcpowers			"addq   %4,%0           \n\t"
*f9fbec18Smcpowers			"adcq   %5,%1           \n\t"
*f9fbec18Smcpowers			"adcq   %6,%2           \n\t"
*f9fbec18Smcpowers			"adcq   %7,%3           \n\t"
*f9fbec18Smcpowers			: "=r"(r0), "=r"(r1), "=r"(r2), "=r"(r3)
*f9fbec18Smcpowers			: "r" (b0), "r" (b1), "r" (b2), "r" (b3),
*f9fbec18Smcpowers  			  "0" (r0), "1" (r1), "2" (r2), "3" (r3)
*f9fbec18Smcpowers			: "%cc" );
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers#ifdef MPI_AMD64_ADD
*f9fbec18Smcpowers	/* compiler fakeout? */
*f9fbec18Smcpowers	if ((r3 == b0) && (r1 == b0) && (r0 == b0)) {
*f9fbec18Smcpowers		MP_CHECKOK(s_mp_pad(r, 4));
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers#endif
*f9fbec18Smcpowers	MP_CHECKOK(s_mp_pad(r, 4));
*f9fbec18Smcpowers	MP_DIGIT(r, 3) = r3;
*f9fbec18Smcpowers	MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers	MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers	MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	MP_SIGN(r) = MP_ZPOS;
*f9fbec18Smcpowers	MP_USED(r) = 4;
*f9fbec18Smcpowers	s_mp_clamp(r);
*f9fbec18Smcpowers
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	return res;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* 5 words */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_sub_5(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers			const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	mp_digit b0 = 0, b1 = 0, b2 = 0, b3 = 0, b4 = 0;
*f9fbec18Smcpowers	mp_digit r0 = 0, r1 = 0, r2 = 0, r3 = 0, r4 = 0;
*f9fbec18Smcpowers	mp_digit borrow;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	switch(MP_USED(a)) {
*f9fbec18Smcpowers	case 5:
*f9fbec18Smcpowers		r4 = MP_DIGIT(a,4);
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		r3 = MP_DIGIT(a,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		r2 = MP_DIGIT(a,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		r1 = MP_DIGIT(a,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		r0 = MP_DIGIT(a,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	switch(MP_USED(b)) {
*f9fbec18Smcpowers	case 5:
*f9fbec18Smcpowers		b4 = MP_DIGIT(b,4);
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		b3 = MP_DIGIT(b,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		b2 = MP_DIGIT(b,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		b1 = MP_DIGIT(b,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		b0 = MP_DIGIT(b,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers	MP_SUB_BORROW(r0, b0, r0, 0,     borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r1, b1, r1, borrow, borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r2, b2, r2, borrow, borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r3, b3, r3, borrow, borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r4, b4, r4, borrow, borrow);
*f9fbec18Smcpowers
*f9fbec18Smcpowers	/* Do quick 'add' if we've gone under 0
*f9fbec18Smcpowers	 * (subtract the 2's complement of the curve field) */
*f9fbec18Smcpowers	if (borrow) {
*f9fbec18Smcpowers	 	b4 = MP_DIGIT(&meth->irr,4);
*f9fbec18Smcpowers	 	b3 = MP_DIGIT(&meth->irr,3);
*f9fbec18Smcpowers	 	b2 = MP_DIGIT(&meth->irr,2);
*f9fbec18Smcpowers		b1 = MP_DIGIT(&meth->irr,1);
*f9fbec18Smcpowers		b0 = MP_DIGIT(&meth->irr,0);
*f9fbec18Smcpowers		MP_ADD_CARRY(b0, r0, r0, 0,      borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b1, r1, r1, borrow, borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b2, r2, r2, borrow, borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b3, r3, r3, borrow, borrow);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	MP_CHECKOK(s_mp_pad(r, 5));
*f9fbec18Smcpowers	MP_DIGIT(r, 4) = r4;
*f9fbec18Smcpowers	MP_DIGIT(r, 3) = r3;
*f9fbec18Smcpowers	MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers	MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers	MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	MP_SIGN(r) = MP_ZPOS;
*f9fbec18Smcpowers	MP_USED(r) = 5;
*f9fbec18Smcpowers	s_mp_clamp(r);
*f9fbec18Smcpowers
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	return res;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* 6 words */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_sub_6(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers			const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	mp_digit b0 = 0, b1 = 0, b2 = 0, b3 = 0, b4 = 0, b5 = 0;
*f9fbec18Smcpowers	mp_digit r0 = 0, r1 = 0, r2 = 0, r3 = 0, r4 = 0, r5 = 0;
*f9fbec18Smcpowers	mp_digit borrow;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	switch(MP_USED(a)) {
*f9fbec18Smcpowers	case 6:
*f9fbec18Smcpowers		r5 = MP_DIGIT(a,5);
*f9fbec18Smcpowers	case 5:
*f9fbec18Smcpowers		r4 = MP_DIGIT(a,4);
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		r3 = MP_DIGIT(a,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		r2 = MP_DIGIT(a,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		r1 = MP_DIGIT(a,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		r0 = MP_DIGIT(a,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers	switch(MP_USED(b)) {
*f9fbec18Smcpowers	case 6:
*f9fbec18Smcpowers		b5 = MP_DIGIT(b,5);
*f9fbec18Smcpowers	case 5:
*f9fbec18Smcpowers		b4 = MP_DIGIT(b,4);
*f9fbec18Smcpowers	case 4:
*f9fbec18Smcpowers		b3 = MP_DIGIT(b,3);
*f9fbec18Smcpowers	case 3:
*f9fbec18Smcpowers		b2 = MP_DIGIT(b,2);
*f9fbec18Smcpowers	case 2:
*f9fbec18Smcpowers		b1 = MP_DIGIT(b,1);
*f9fbec18Smcpowers	case 1:
*f9fbec18Smcpowers		b0 = MP_DIGIT(b,0);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers	MP_SUB_BORROW(r0, b0, r0, 0,     borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r1, b1, r1, borrow, borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r2, b2, r2, borrow, borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r3, b3, r3, borrow, borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r4, b4, r4, borrow, borrow);
*f9fbec18Smcpowers	MP_SUB_BORROW(r5, b5, r5, borrow, borrow);
*f9fbec18Smcpowers
*f9fbec18Smcpowers	/* Do quick 'add' if we've gone under 0
*f9fbec18Smcpowers	 * (subtract the 2's complement of the curve field) */
*f9fbec18Smcpowers	if (borrow) {
*f9fbec18Smcpowers	 	b5 = MP_DIGIT(&meth->irr,5);
*f9fbec18Smcpowers	 	b4 = MP_DIGIT(&meth->irr,4);
*f9fbec18Smcpowers	 	b3 = MP_DIGIT(&meth->irr,3);
*f9fbec18Smcpowers	 	b2 = MP_DIGIT(&meth->irr,2);
*f9fbec18Smcpowers		b1 = MP_DIGIT(&meth->irr,1);
*f9fbec18Smcpowers		b0 = MP_DIGIT(&meth->irr,0);
*f9fbec18Smcpowers		MP_ADD_CARRY(b0, r0, r0, 0,      borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b1, r1, r1, borrow, borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b2, r2, r2, borrow, borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b3, r3, r3, borrow, borrow);
*f9fbec18Smcpowers		MP_ADD_CARRY(b4, r4, r4, borrow, borrow);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers
*f9fbec18Smcpowers	MP_CHECKOK(s_mp_pad(r, 6));
*f9fbec18Smcpowers	MP_DIGIT(r, 5) = r5;
*f9fbec18Smcpowers	MP_DIGIT(r, 4) = r4;
*f9fbec18Smcpowers	MP_DIGIT(r, 3) = r3;
*f9fbec18Smcpowers	MP_DIGIT(r, 2) = r2;
*f9fbec18Smcpowers	MP_DIGIT(r, 1) = r1;
*f9fbec18Smcpowers	MP_DIGIT(r, 0) = r0;
*f9fbec18Smcpowers	MP_SIGN(r) = MP_ZPOS;
*f9fbec18Smcpowers	MP_USED(r) = 6;
*f9fbec18Smcpowers	s_mp_clamp(r);
*f9fbec18Smcpowers
*f9fbec18Smcpowers  CLEANUP:
*f9fbec18Smcpowers	return res;
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Reduces an integer to a field element. */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_mod(const mp_int *a, mp_int *r, const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	return mp_mod(a, &meth->irr, r);
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Multiplies two field elements. */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_mul(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers		   const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	return mp_mulmod(a, b, &meth->irr, r);
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Squares a field element. */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_sqr(const mp_int *a, mp_int *r, const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	return mp_sqrmod(a, &meth->irr, r);
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Divides two field elements. If a is NULL, then returns the inverse of
*f9fbec18Smcpowers * b. */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GFp_div(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers		   const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	mp_int t;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	/* If a is NULL, then return the inverse of b, otherwise return a/b. */
*f9fbec18Smcpowers	if (a == NULL) {
*f9fbec18Smcpowers		return mp_invmod(b, &meth->irr, r);
*f9fbec18Smcpowers	} else {
*f9fbec18Smcpowers		/* MPI doesn't support divmod, so we implement it using invmod and
*f9fbec18Smcpowers		 * mulmod. */
*f9fbec18Smcpowers		MP_CHECKOK(mp_init(&t, FLAG(b)));
*f9fbec18Smcpowers		MP_CHECKOK(mp_invmod(b, &meth->irr, &t));
*f9fbec18Smcpowers		MP_CHECKOK(mp_mulmod(a, &t, &meth->irr, r));
*f9fbec18Smcpowers	  CLEANUP:
*f9fbec18Smcpowers		mp_clear(&t);
*f9fbec18Smcpowers		return res;
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Wrapper functions for generic binary polynomial field arithmetic. */
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Adds two field elements. */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GF2m_add(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers			const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	return mp_badd(a, b, r);
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Negates a field element. Note that for binary polynomial fields, the
*f9fbec18Smcpowers * negation of a field element is the field element itself. */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GF2m_neg(const mp_int *a, mp_int *r, const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	if (a == r) {
*f9fbec18Smcpowers		return MP_OKAY;
*f9fbec18Smcpowers	} else {
*f9fbec18Smcpowers		return mp_copy(a, r);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Reduces a binary polynomial to a field element. */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GF2m_mod(const mp_int *a, mp_int *r, const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	return mp_bmod(a, meth->irr_arr, r);
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Multiplies two field elements. */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GF2m_mul(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers			const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	return mp_bmulmod(a, b, meth->irr_arr, r);
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Squares a field element. */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GF2m_sqr(const mp_int *a, mp_int *r, const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	return mp_bsqrmod(a, meth->irr_arr, r);
*f9fbec18Smcpowers}
*f9fbec18Smcpowers
*f9fbec18Smcpowers/* Divides two field elements. If a is NULL, then returns the inverse of
*f9fbec18Smcpowers * b. */
*f9fbec18Smcpowersmp_err
*f9fbec18Smcpowersec_GF2m_div(const mp_int *a, const mp_int *b, mp_int *r,
*f9fbec18Smcpowers			const GFMethod *meth)
*f9fbec18Smcpowers{
*f9fbec18Smcpowers	mp_err res = MP_OKAY;
*f9fbec18Smcpowers	mp_int t;
*f9fbec18Smcpowers
*f9fbec18Smcpowers	/* If a is NULL, then return the inverse of b, otherwise return a/b. */
*f9fbec18Smcpowers	if (a == NULL) {
*f9fbec18Smcpowers		/* The GF(2^m) portion of MPI doesn't support invmod, so we
*f9fbec18Smcpowers		 * compute 1/b. */
*f9fbec18Smcpowers		MP_CHECKOK(mp_init(&t, FLAG(b)));
*f9fbec18Smcpowers		MP_CHECKOK(mp_set_int(&t, 1));
*f9fbec18Smcpowers		MP_CHECKOK(mp_bdivmod(&t, b, &meth->irr, meth->irr_arr, r));
*f9fbec18Smcpowers	  CLEANUP:
*f9fbec18Smcpowers		mp_clear(&t);
*f9fbec18Smcpowers		return res;
*f9fbec18Smcpowers	} else {
*f9fbec18Smcpowers		return mp_bdivmod(a, b, &meth->irr, meth->irr_arr, r);
*f9fbec18Smcpowers	}
*f9fbec18Smcpowers}