1/* 2 * CDDL HEADER START 3 * 4 * The contents of this file are subject to the terms of the 5 * Common Development and Distribution License, Version 1.0 only 6 * (the "License"). You may not use this file except in compliance 7 * with the License. 8 * 9 * You can obtain a copy of the license at usr/src/OPENSOLARIS.LICENSE 10 * or http://www.opensolaris.org/os/licensing. 11 * See the License for the specific language governing permissions 12 * and limitations under the License. 13 * 14 * When distributing Covered Code, include this CDDL HEADER in each 15 * file and include the License file at usr/src/OPENSOLARIS.LICENSE. 16 * If applicable, add the following below this CDDL HEADER, with the 17 * fields enclosed by brackets "[]" replaced with your own identifying 18 * information: Portions Copyright [yyyy] [name of copyright owner] 19 * 20 * CDDL HEADER END 21 */ 22/* 23 * Copyright 2004 Sun Microsystems, Inc. All rights reserved. 24 * Use is subject to license terms. 25 */ 26 27#pragma ident "%Z%%M% %I% %E% SMI" 28 29 30 .section ".text",#alloc,#execinstr 31 .file "mont_mulf_asm_v8plus.s" 32 33/* 34 * This file is a result of compiling the mont_mulf.c file to generate an 35 * assembly output and then hand-editing that output to replace the 36 * compiler-generated loop for the 512-bit case (nlen == 16) in the 37 * mont_mulf_noconv routine with a hand-crafted version. 38 * To compile this: 39 * 40 * cc -c -xarch=v8plus -KPIC mont_mulf_asm.s 41 * 42 * Note, this file does not support sparcv9 (64-bit). 43 */ 44 45 46 .section ".rodata",#alloc 47 .align 8 48! 49! CONSTANT POOL 50! 51TwoTo16: 52 .word 1089470464 53 .word 0 54 .type TwoTo16,#object 55 .size TwoTo16,8 56! 57! CONSTANT POOL 58! 59TwoToMinus16: 60 .word 1055916032 61 .word 0 62 .type TwoToMinus16,#object 63 .size TwoToMinus16,8 64! 65! CONSTANT POOL 66! 67Zero: 68 .word 0 69 .word 0 70 .type Zero,#object 71 .size Zero,8 72! 73! CONSTANT POOL 74! 75TwoTo32: 76 .word 1106247680 77 .word 0 78 .type TwoTo32,#object 79 .size TwoTo32,8 80! 81! CONSTANT POOL 82! 83TwoToMinus32: 84 .word 1039138816 85 .word 0 86 .type TwoToMinus32,#object 87 .size TwoToMinus32,8 88 89 .section ".text",#alloc,#execinstr 90/* 000000 0 */ .align 4 91! 92! SUBROUTINE conv_d16_to_i32 93! 94! OFFSET SOURCE LINE LABEL INSTRUCTION 95 96 .global conv_d16_to_i32 97 conv_d16_to_i32: 98/* 000000 */ save %sp,-128,%sp 99! FILE mont_mulf.c 100 101! 1 !#define RF_INLINE_MACROS 102! 3 !static const double TwoTo16=65536.0; 103! 4 !static const double TwoToMinus16=1.0/65536.0; 104! 5 !static const double Zero=0.0; 105! 6 !static const double TwoTo32=65536.0*65536.0; 106! 7 !static const double TwoToMinus32=1.0/(65536.0*65536.0); 107! 9 !#ifdef RF_INLINE_MACROS 108! 11 !double upper32(double); 109! 12 !double lower32(double, double); 110! 13 !double mod(double, double, double); 111! 15 !#else 112! 17 !static double upper32(double x) 113! 18 !{ 114! 19 ! return floor(x*TwoToMinus32); 115! 20 !} 116! 22 !static double lower32(double x, double y) 117! 23 !{ 118! 24 ! return x-TwoTo32*floor(x*TwoToMinus32); 119! 25 !} 120! 27 !static double mod(double x, double oneoverm, double m) 121! 28 !{ 122! 29 ! return x-m*floor(x*oneoverm); 123! 30 !} 124! 32 !#endif 125! 35 !static void cleanup(double *dt, int from, int tlen) 126! 36 !{ 127! 37 ! int i; 128! 38 ! double tmp,tmp1,x,x1; 129! 40 ! tmp=tmp1=Zero; 130! 41 ! /* original code ** 131! 42 ! for(i=2*from;i<2*tlen-2;i++) 132! 43 ! { 133! 44 ! x=dt[i]; 134! 45 ! dt[i]=lower32(x,Zero)+tmp1; 135! 46 ! tmp1=tmp; 136! 47 ! tmp=upper32(x); 137! 48 ! } 138! 49 ! dt[tlen-2]+=tmp1; 139! 50 ! dt[tlen-1]+=tmp; 140! 51 ! **end original code ***/ 141! 52 ! /* new code ***/ 142! 53 ! for(i=2*from;i<2*tlen;i+=2) 143! 54 ! { 144! 55 ! x=dt[i]; 145! 56 ! x1=dt[i+1]; 146! 57 ! dt[i]=lower32(x,Zero)+tmp; 147! 58 ! dt[i+1]=lower32(x1,Zero)+tmp1; 148! 59 ! tmp=upper32(x); 149! 60 ! tmp1=upper32(x1); 150! 61 ! } 151! 62 ! /** end new code **/ 152! 63 !} 153! 66 !void conv_d16_to_i32(unsigned int *i32, double *d16, long long *tmp, int ilen) 154! 67 !{ 155! 68 !int i; 156! 69 !long long t, t1, a, b, c, d; 157! 71 ! t1=0; 158! 72 ! a=(long long)d16[0]; 159 160/* 0x0004 72 */ ldd [%i1],%f0 161/* 0x0008 67 */ or %g0,%i1,%o0 162 163! 73 ! b=(long long)d16[1]; 164! 74 ! for(i=0; i<ilen-1; i++) 165 166/* 0x000c 74 */ sub %i3,1,%g2 167/* 0x0010 */ cmp %g2,0 168/* 0x0014 71 */ or %g0,0,%o4 169/* 0x0018 72 */ fdtox %f0,%f0 170/* 0x001c */ std %f0,[%sp+120] 171/* 0x0020 74 */ or %g0,0,%o7 172/* 0x0024 67 */ or %g0,%i3,%o1 173/* 0x0028 */ sub %i3,2,%o2 174/* 0x002c 73 */ ldd [%o0+8],%f0 175/* 0x0030 67 */ sethi %hi(0xfc00),%o1 176/* 0x0034 */ add %o2,1,%g3 177/* 0x0038 */ add %o1,1023,%o1 178/* 0x003c */ or %g0,%i0,%o5 179/* 0x0040 73 */ fdtox %f0,%f0 180/* 0x0044 */ std %f0,[%sp+112] 181/* 0x0048 */ ldx [%sp+112],%g1 182/* 0x004c 72 */ ldx [%sp+120],%g4 183/* 0x0050 74 */ ble,pt %icc,.L900000117 184/* 0x0054 */ sethi %hi(0xfc00),%g2 185/* 0x0058 67 */ or %g0,-1,%g2 186/* 0x005c 74 */ cmp %g3,3 187/* 0x0060 67 */ srl %g2,0,%o3 188/* 0x0064 74 */ bl,pn %icc,.L77000134 189/* 0x0068 */ or %g0,%o0,%g2 190 191! 75 ! { 192! 76 ! c=(long long)d16[2*i+2]; 193 194/* 0x006c 76 */ ldd [%o0+16],%f0 195 196! 77 ! t1+=a&0xffffffff; 197! 78 ! t=(a>>32); 198! 79 ! d=(long long)d16[2*i+3]; 199! 80 ! t1+=(b&0xffff)<<16; 200! 81 ! t+=(b>>16)+(t1>>32); 201! 82 ! i32[i]=t1&0xffffffff; 202! 83 ! t1=t; 203! 84 ! a=c; 204! 85 ! b=d; 205 206/* 0x0070 85 */ add %o0,16,%g2 207/* 0x0074 80 */ and %g1,%o1,%o0 208/* 0x0078 */ sllx %o0,16,%g3 209/* 0x007c 77 */ and %g4,%o3,%o0 210/* 0x0080 74 */ add %o0,%g3,%o4 211/* 0x0084 76 */ fdtox %f0,%f0 212/* 0x0088 */ std %f0,[%sp+104] 213/* 0x008c 82 */ and %o4,%o3,%g5 214/* 0x0090 79 */ ldd [%g2+8],%f2 215/* 0x0094 85 */ add %o5,4,%o5 216/* 0x0098 81 */ srax %o4,32,%o4 217/* 0x009c */ stx %o4,[%sp+112] 218/* 0x00a0 79 */ fdtox %f2,%f0 219/* 0x00a4 */ std %f0,[%sp+96] 220/* 0x00a8 81 */ srax %g1,16,%o0 221/* 0x00ac */ ldx [%sp+112],%o7 222/* 0x00b0 78 */ srax %g4,32,%o4 223/* 0x00b4 81 */ add %o0,%o7,%g4 224/* 0x00b8 85 */ or %g0,1,%o7 225/* 0x00bc 76 */ ldx [%sp+104],%g3 226/* 0x00c0 81 */ add %o4,%g4,%o4 227/* 0x00c4 79 */ ldx [%sp+96],%g1 228/* 0x00c8 82 */ st %g5,[%o5-4] 229/* 0x00cc 84 */ or %g0,%g3,%g4 230 .L900000112: 231/* 0x00d0 76 */ ldd [%g2+16],%f0 232/* 0x00d4 85 */ add %o7,1,%o7 233/* 0x00d8 */ add %o5,4,%o5 234/* 0x00dc */ cmp %o7,%o2 235/* 0x00e0 */ add %g2,16,%g2 236/* 0x00e4 76 */ fdtox %f0,%f0 237/* 0x00e8 */ std %f0,[%sp+104] 238/* 0x00ec 79 */ ldd [%g2+8],%f0 239/* 0x00f0 */ fdtox %f0,%f0 240/* 0x00f4 */ std %f0,[%sp+96] 241/* 0x00f8 80 */ and %g1,%o1,%g3 242/* 0x00fc */ sllx %g3,16,%g5 243/* 0x0100 77 */ and %g4,%o3,%g3 244/* 0x0104 74 */ add %g3,%g5,%g3 245/* 0x0108 81 */ srax %g1,16,%g1 246/* 0x010c 74 */ add %g3,%o4,%g3 247/* 0x0110 81 */ srax %g3,32,%o4 248/* 0x0114 */ stx %o4,[%sp+112] 249/* 0x0118 76 */ ldx [%sp+104],%g5 250/* 0x011c 78 */ srax %g4,32,%o4 251/* 0x0120 81 */ ldx [%sp+112],%g4 252/* 0x0124 */ add %g1,%g4,%g4 253/* 0x0128 79 */ ldx [%sp+96],%g1 254/* 0x012c 81 */ add %o4,%g4,%o4 255/* 0x0130 82 */ and %g3,%o3,%g3 256/* 0x0134 84 */ or %g0,%g5,%g4 257/* 0x0138 85 */ ble,pt %icc,.L900000112 258/* 0x013c */ st %g3,[%o5-4] 259 .L900000115: 260/* 0x0140 85 */ ba .L900000117 261/* 0x0144 */ sethi %hi(0xfc00),%g2 262 .L77000134: 263/* 0x0148 76 */ ldd [%g2+16],%f0 264 .L900000116: 265/* 0x014c 77 */ and %g4,%o3,%o0 266/* 0x0150 80 */ and %g1,%o1,%g3 267/* 0x0154 76 */ fdtox %f0,%f0 268/* 0x0158 77 */ add %o4,%o0,%o0 269/* 0x015c 76 */ std %f0,[%sp+104] 270/* 0x0160 85 */ add %o7,1,%o7 271/* 0x0164 80 */ sllx %g3,16,%o4 272/* 0x0168 79 */ ldd [%g2+24],%f2 273/* 0x016c 85 */ add %g2,16,%g2 274/* 0x0170 80 */ add %o0,%o4,%o0 275/* 0x0174 85 */ cmp %o7,%o2 276/* 0x0178 82 */ and %o0,%o3,%g3 277/* 0x017c 79 */ fdtox %f2,%f0 278/* 0x0180 */ std %f0,[%sp+96] 279/* 0x0184 81 */ srax %o0,32,%o0 280/* 0x0188 */ stx %o0,[%sp+112] 281/* 0x018c 78 */ srax %g4,32,%o4 282/* 0x0190 79 */ ldx [%sp+96],%o0 283/* 0x0194 81 */ srax %g1,16,%g5 284/* 0x0198 */ ldx [%sp+112],%g4 285/* 0x019c 76 */ ldx [%sp+104],%g1 286/* 0x01a0 82 */ st %g3,[%o5] 287/* 0x01a4 81 */ add %g5,%g4,%g4 288/* 0x01a8 85 */ add %o5,4,%o5 289/* 0x01ac 81 */ add %o4,%g4,%o4 290/* 0x01b0 84 */ or %g0,%g1,%g4 291/* 0x01b4 85 */ or %g0,%o0,%g1 292/* 0x01b8 */ ble,a,pt %icc,.L900000116 293/* 0x01bc */ ldd [%g2+16],%f0 294 .L77000127: 295 296! 86 ! } 297! 87 ! t1+=a&0xffffffff; 298! 88 ! t=(a>>32); 299! 89 ! t1+=(b&0xffff)<<16; 300! 90 ! i32[i]=t1&0xffffffff; 301 302/* 0x01c0 90 */ sethi %hi(0xfc00),%g2 303 .L900000117: 304/* 0x01c4 90 */ or %g0,-1,%g3 305/* 0x01c8 */ add %g2,1023,%g2 306/* 0x01cc */ srl %g3,0,%g3 307/* 0x01d0 */ and %g1,%g2,%g2 308/* 0x01d4 */ and %g4,%g3,%g4 309/* 0x01d8 */ sllx %g2,16,%g2 310/* 0x01dc */ add %o4,%g4,%g4 311/* 0x01e0 */ add %g4,%g2,%g2 312/* 0x01e4 */ sll %o7,2,%g4 313/* 0x01e8 */ and %g2,%g3,%g2 314/* 0x01ec */ st %g2,[%i0+%g4] 315/* 0x01f0 */ ret ! Result = 316/* 0x01f4 */ restore %g0,%g0,%g0 317/* 0x01f8 0 */ .type conv_d16_to_i32,2 318/* 0x01f8 */ .size conv_d16_to_i32,(.-conv_d16_to_i32) 319 320 .section ".text",#alloc,#execinstr 321/* 000000 0 */ .align 8 322! 323! CONSTANT POOL 324! 325 .L_const_seg_900000201: 326/* 000000 0 */ .word 1127219200,0 327/* 0x0008 0 */ .align 4 328/* 0x0008 */ .skip 16 329! 330! SUBROUTINE conv_i32_to_d32 331! 332! OFFSET SOURCE LINE LABEL INSTRUCTION 333 334 .global conv_i32_to_d32 335 conv_i32_to_d32: 336/* 000000 */ or %g0,%o7,%g2 337/* 0x0004 */ or %g0,%o1,%g4 338 .L900000210: 339/* 0x0008 */ call .+8 340/* 0x000c */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g3 341 342! 92 !} 343! 94 !void conv_i32_to_d32(double *d32, unsigned int *i32, int len) 344! 95 !{ 345! 96 !int i; 346! 98 !#pragma pipeloop(0) 347! 99 ! for(i=0;i<len;i++) d32[i]=(double)(i32[i]); 348 349/* 0x0010 99 */ or %g0,0,%o5 350/* 0x0014 95 */ add %g3,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g3 351/* 0x0018 */ or %g0,%o0,%g5 352/* 0x001c */ add %g3,%o7,%g1 353/* 0x0020 */ orcc %g0,%o2,%g3 354/* 0x0024 99 */ ble,pt %icc,.L77000140 355/* 0x0028 */ or %g0,%g2,%o7 356/* 0x002c */ sethi %hi(.L_const_seg_900000201),%g2 357/* 0x0030 */ add %g2,%lo(.L_const_seg_900000201),%g2 358/* 0x0034 */ sub %o2,1,%g3 359/* 0x0038 */ ld [%g1+%g2],%g2 360/* 0x003c */ cmp %o2,9 361/* 0x0040 */ bl,pn %icc,.L77000144 362/* 0x0044 */ ldd [%g2],%f8 363/* 0x0048 */ add %o1,16,%g4 364/* 0x004c */ sub %o2,5,%g1 365/* 0x0050 */ ld [%o1],%f7 366/* 0x0054 */ or %g0,4,%o5 367/* 0x0058 */ ld [%o1+4],%f5 368/* 0x005c */ ld [%o1+8],%f3 369/* 0x0060 */ fmovs %f8,%f6 370/* 0x0064 */ ld [%o1+12],%f1 371 .L900000205: 372/* 0x0068 */ ld [%g4],%f11 373/* 0x006c */ add %o5,5,%o5 374/* 0x0070 */ add %g4,20,%g4 375/* 0x0074 */ fsubd %f6,%f8,%f6 376/* 0x0078 */ std %f6,[%g5] 377/* 0x007c */ cmp %o5,%g1 378/* 0x0080 */ add %g5,40,%g5 379/* 0x0084 */ fmovs %f8,%f4 380/* 0x0088 */ ld [%g4-16],%f7 381/* 0x008c */ fsubd %f4,%f8,%f12 382/* 0x0090 */ fmovs %f8,%f2 383/* 0x0094 */ std %f12,[%g5-32] 384/* 0x0098 */ ld [%g4-12],%f5 385/* 0x009c */ fsubd %f2,%f8,%f12 386/* 0x00a0 */ fmovs %f8,%f0 387/* 0x00a4 */ std %f12,[%g5-24] 388/* 0x00a8 */ ld [%g4-8],%f3 389/* 0x00ac */ fsubd %f0,%f8,%f12 390/* 0x00b0 */ fmovs %f8,%f10 391/* 0x00b4 */ std %f12,[%g5-16] 392/* 0x00b8 */ ld [%g4-4],%f1 393/* 0x00bc */ fsubd %f10,%f8,%f10 394/* 0x00c0 */ fmovs %f8,%f6 395/* 0x00c4 */ ble,pt %icc,.L900000205 396/* 0x00c8 */ std %f10,[%g5-8] 397 .L900000208: 398/* 0x00cc */ fmovs %f8,%f4 399/* 0x00d0 */ add %g5,32,%g5 400/* 0x00d4 */ cmp %o5,%g3 401/* 0x00d8 */ fmovs %f8,%f2 402/* 0x00dc */ fmovs %f8,%f0 403/* 0x00e0 */ fsubd %f6,%f8,%f6 404/* 0x00e4 */ std %f6,[%g5-32] 405/* 0x00e8 */ fsubd %f4,%f8,%f4 406/* 0x00ec */ std %f4,[%g5-24] 407/* 0x00f0 */ fsubd %f2,%f8,%f2 408/* 0x00f4 */ std %f2,[%g5-16] 409/* 0x00f8 */ fsubd %f0,%f8,%f0 410/* 0x00fc */ bg,pn %icc,.L77000140 411/* 0x0100 */ std %f0,[%g5-8] 412 .L77000144: 413/* 0x0104 */ ld [%g4],%f1 414 .L900000211: 415/* 0x0108 */ ldd [%g2],%f8 416/* 0x010c */ add %o5,1,%o5 417/* 0x0110 */ add %g4,4,%g4 418/* 0x0114 */ cmp %o5,%g3 419/* 0x0118 */ fmovs %f8,%f0 420/* 0x011c */ fsubd %f0,%f8,%f0 421/* 0x0120 */ std %f0,[%g5] 422/* 0x0124 */ add %g5,8,%g5 423/* 0x0128 */ ble,a,pt %icc,.L900000211 424/* 0x012c */ ld [%g4],%f1 425 .L77000140: 426/* 0x0130 */ retl ! Result = 427/* 0x0134 */ nop 428/* 0x0138 0 */ .type conv_i32_to_d32,2 429/* 0x0138 */ .size conv_i32_to_d32,(.-conv_i32_to_d32) 430 431 .section ".text",#alloc,#execinstr 432/* 000000 0 */ .align 8 433! 434! CONSTANT POOL 435! 436 .L_const_seg_900000301: 437/* 000000 0 */ .word 1127219200,0 438/* 0x0008 0 */ .align 4 439/* 0x0008 */ .skip 16 440! 441! SUBROUTINE conv_i32_to_d16 442! 443! OFFSET SOURCE LINE LABEL INSTRUCTION 444 445 .global conv_i32_to_d16 446 conv_i32_to_d16: 447/* 000000 */ save %sp,-104,%sp 448 .L900000310: 449/* 0x0004 */ call .+8 450/* 0x0008 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3 451/* 0x000c */ orcc %g0,%i2,%o0 452/* 0x0010 */ add %g3,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3 453 454! 100 !} 455! 103 !void conv_i32_to_d16(double *d16, unsigned int *i32, int len) 456! 104 !{ 457! 105 !int i; 458! 106 !unsigned int a; 459! 108 !#pragma pipeloop(0) 460! 109 ! for(i=0;i<len;i++) 461 462/* 0x0014 109 */ ble,pt %icc,.L77000150 463/* 0x0018 */ add %g3,%o7,%o2 464 465! 110 ! { 466! 111 ! a=i32[i]; 467! 112 ! d16[2*i]=(double)(a&0xffff); 468! 113 ! d16[2*i+1]=(double)(a>>16); 469 470/* 0x001c 113 */ sethi %hi(.L_const_seg_900000301),%g2 471/* 0x0020 109 */ sub %o0,1,%o5 472/* 0x0024 113 */ add %g2,%lo(.L_const_seg_900000301),%o1 473/* 0x0028 */ ld [%o2+%o1],%o3 474/* 0x002c 109 */ sethi %hi(0xfc00),%o0 475/* 0x0030 */ add %o5,1,%g2 476/* 0x0034 */ or %g0,0,%g1 477/* 0x0038 */ cmp %g2,3 478/* 0x003c 112 */ ldd [%o3],%f0 479/* 0x0040 */ or %g0,%i1,%o7 480/* 0x0044 */ add %o0,1023,%o4 481/* 0x0048 */ or %g0,%i0,%g3 482/* 0x004c 109 */ bl,pn %icc,.L77000154 483/* 0x0050 */ add %o7,4,%o0 484/* 0x0054 111 */ ld [%o0-4],%o1 485/* 0x0058 0 */ or %g0,%o0,%o7 486/* 0x005c 113 */ or %g0,1,%g1 487/* 0x0060 112 */ and %o1,%o4,%o0 488 .L900000306: 489/* 0x0064 112 */ st %o0,[%sp+96] 490/* 0x0068 113 */ add %g1,1,%g1 491/* 0x006c */ add %g3,16,%g3 492/* 0x0070 */ cmp %g1,%o5 493/* 0x0074 */ add %o7,4,%o7 494/* 0x0078 112 */ ld [%sp+96],%f3 495/* 0x007c */ fmovs %f0,%f2 496/* 0x0080 */ fsubd %f2,%f0,%f2 497/* 0x0084 113 */ srl %o1,16,%o0 498/* 0x0088 112 */ std %f2,[%g3-16] 499/* 0x008c 113 */ st %o0,[%sp+92] 500/* 0x0090 */ ld [%sp+92],%f3 501/* 0x0094 111 */ ld [%o7-4],%o1 502/* 0x0098 113 */ fmovs %f0,%f2 503/* 0x009c */ fsubd %f2,%f0,%f2 504/* 0x00a0 112 */ and %o1,%o4,%o0 505/* 0x00a4 113 */ ble,pt %icc,.L900000306 506/* 0x00a8 */ std %f2,[%g3-8] 507 .L900000309: 508/* 0x00ac 112 */ st %o0,[%sp+96] 509/* 0x00b0 */ fmovs %f0,%f2 510/* 0x00b4 113 */ add %g3,16,%g3 511/* 0x00b8 */ srl %o1,16,%o0 512/* 0x00bc 112 */ ld [%sp+96],%f3 513/* 0x00c0 */ fsubd %f2,%f0,%f2 514/* 0x00c4 */ std %f2,[%g3-16] 515/* 0x00c8 113 */ st %o0,[%sp+92] 516/* 0x00cc */ fmovs %f0,%f2 517/* 0x00d0 */ ld [%sp+92],%f3 518/* 0x00d4 */ fsubd %f2,%f0,%f0 519/* 0x00d8 */ std %f0,[%g3-8] 520/* 0x00dc */ ret ! Result = 521/* 0x00e0 */ restore %g0,%g0,%g0 522 .L77000154: 523/* 0x00e4 111 */ ld [%o7],%o0 524 .L900000311: 525/* 0x00e8 112 */ and %o0,%o4,%o1 526/* 0x00ec */ st %o1,[%sp+96] 527/* 0x00f0 113 */ add %g1,1,%g1 528/* 0x00f4 112 */ ldd [%o3],%f0 529/* 0x00f8 113 */ srl %o0,16,%o0 530/* 0x00fc */ add %o7,4,%o7 531/* 0x0100 */ cmp %g1,%o5 532/* 0x0104 112 */ fmovs %f0,%f2 533/* 0x0108 */ ld [%sp+96],%f3 534/* 0x010c */ fsubd %f2,%f0,%f2 535/* 0x0110 */ std %f2,[%g3] 536/* 0x0114 113 */ st %o0,[%sp+92] 537/* 0x0118 */ fmovs %f0,%f2 538/* 0x011c */ ld [%sp+92],%f3 539/* 0x0120 */ fsubd %f2,%f0,%f0 540/* 0x0124 */ std %f0,[%g3+8] 541/* 0x0128 */ add %g3,16,%g3 542/* 0x012c */ ble,a,pt %icc,.L900000311 543/* 0x0130 */ ld [%o7],%o0 544 .L77000150: 545/* 0x0134 */ ret ! Result = 546/* 0x0138 */ restore %g0,%g0,%g0 547/* 0x013c 0 */ .type conv_i32_to_d16,2 548/* 0x013c */ .size conv_i32_to_d16,(.-conv_i32_to_d16) 549 550 .section ".text",#alloc,#execinstr 551/* 000000 0 */ .align 8 552! 553! CONSTANT POOL 554! 555 .L_const_seg_900000401: 556/* 000000 0 */ .word 1127219200,0 557/* 0x0008 0 */ .align 4 558/* 0x0008 */ .skip 16 559! 560! SUBROUTINE conv_i32_to_d32_and_d16 561! 562! OFFSET SOURCE LINE LABEL INSTRUCTION 563 564 .global conv_i32_to_d32_and_d16 565 conv_i32_to_d32_and_d16: 566/* 000000 */ save %sp,-104,%sp 567 .L900000413: 568/* 0x0004 */ call .+8 569/* 0x0008 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000413-.)),%g4 570 571! 114 ! } 572! 115 !} 573! 118 !void i16_to_d16_and_d32x4(const double * /*1/(2^16)*/, 574! 119 ! const double * /* 2^16*/, const double * /* 0 */, 575! 120 ! double * /*result16*/, double * /* result32 */, 576! 121 ! float * /*source - should be */ 577! 122 ! unsigned int* converted to float* */); 578! 126 !void conv_i32_to_d32_and_d16(double *d32, double *d16, 579! 127 ! unsigned int *i32, int len) 580! 128 !{ 581! 129 !int i; 582! 130 !unsigned int a; 583! 132 !#pragma pipeloop(0) 584! 133 ! for(i=0;i<len-3;i+=4) 585 586/* 0x000c 133 */ sub %i3,3,%g2 587/* 0x0010 */ cmp %g2,0 588/* 0x0014 128 */ add %g4,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000413-.)),%g4 589/* 0x0018 */ or %g0,%i2,%g5 590 591! 134 ! { 592! 135 ! i16_to_d16_and_d32x4(&TwoToMinus16, &TwoTo16, &Zero, 593! 136 ! &(d16[2*i]), &(d32[i]), (float *)(&(i32[i]))); 594 595/* 0x001c 136 */ sethi %hi(Zero),%g2 596/* 0x0020 128 */ add %g4,%o7,%o2 597/* 0x0024 133 */ or %g0,0,%g1 598/* 0x0028 128 */ or %g0,%i0,%i4 599/* 0x002c 136 */ add %g2,%lo(Zero),%g2 600/* 0x0030 133 */ ble,pt %icc,.L900000416 601/* 0x0034 */ cmp %g1,%i3 602/* 0x0038 */ or %g0,%g5,%o4 603/* 0x003c 136 */ ld [%o2+%g2],%o1 604/* 0x0040 133 */ sub %i3,4,%o3 605/* 0x0044 */ or %g0,0,%o7 606/* 0x0048 */ or %g0,0,%o5 607/* 0x004c 136 */ or %g0,%o4,%g4 608 .L900000415: 609/* 0x0050 */ ldd [%o1],%f2 610/* 0x0054 136 */ add %i4,%o7,%g2 611/* 0x0058 */ add %i1,%o5,%g3 612/* 0x005c */ ldd [%o1-8],%f0 613/* 0x0060 */ add %g1,4,%g1 614/* 0x0064 */ add %o4,16,%o4 615/* 0x0068 */ fmovd %f2,%f14 616/* 0x006c */ ld [%g4],%f15 617/* 0x0070 */ cmp %g1,%o3 618/* 0x0074 */ fmovd %f2,%f10 619/* 0x0078 */ ld [%g4+4],%f11 620/* 0x007c */ fmovd %f2,%f6 621/* 0x0080 */ ld [%g4+8],%f7 622/* 0x0084 */ ld [%g4+12],%f3 623/* 0x0088 */ fxtod %f14,%f14 624/* 0x008c */ fxtod %f10,%f10 625/* 0x0090 */ ldd [%o1-16],%f16 626/* 0x0094 */ fxtod %f6,%f6 627/* 0x0098 */ std %f14,[%i4+%o7] 628/* 0x009c */ add %o7,32,%o7 629/* 0x00a0 */ fxtod %f2,%f2 630/* 0x00a4 */ fmuld %f0,%f14,%f12 631/* 0x00a8 */ std %f10,[%g2+8] 632/* 0x00ac */ fmuld %f0,%f10,%f8 633/* 0x00b0 */ std %f6,[%g2+16] 634/* 0x00b4 */ fmuld %f0,%f6,%f4 635/* 0x00b8 */ std %f2,[%g2+24] 636/* 0x00bc */ fmuld %f0,%f2,%f0 637/* 0x00c0 */ fdtox %f12,%f12 638/* 0x00c4 */ fdtox %f8,%f8 639/* 0x00c8 */ fdtox %f4,%f4 640/* 0x00cc */ fdtox %f0,%f0 641/* 0x00d0 */ fxtod %f12,%f12 642/* 0x00d4 */ std %f12,[%g3+8] 643/* 0x00d8 */ fxtod %f8,%f8 644/* 0x00dc */ std %f8,[%g3+24] 645/* 0x00e0 */ fxtod %f4,%f4 646/* 0x00e4 */ std %f4,[%g3+40] 647/* 0x00e8 */ fxtod %f0,%f0 648/* 0x00ec */ fmuld %f12,%f16,%f12 649/* 0x00f0 */ std %f0,[%g3+56] 650/* 0x00f4 */ fmuld %f8,%f16,%f8 651/* 0x00f8 */ fmuld %f4,%f16,%f4 652/* 0x00fc */ fmuld %f0,%f16,%f0 653/* 0x0100 */ fsubd %f14,%f12,%f12 654/* 0x0104 */ std %f12,[%i1+%o5] 655/* 0x0108 */ fsubd %f10,%f8,%f8 656/* 0x010c */ std %f8,[%g3+16] 657/* 0x0110 */ add %o5,64,%o5 658/* 0x0114 */ fsubd %f6,%f4,%f4 659/* 0x0118 */ std %f4,[%g3+32] 660/* 0x011c */ fsubd %f2,%f0,%f0 661/* 0x0120 */ std %f0,[%g3+48] 662/* 0x0124 */ ble,pt %icc,.L900000415 663/* 0x0128 */ or %g0,%o4,%g4 664 .L77000159: 665 666! 137 ! } 667! 138 ! for(;i<len;i++) 668 669/* 0x012c 138 */ cmp %g1,%i3 670 .L900000416: 671/* 0x0130 138 */ bge,pt %icc,.L77000164 672/* 0x0134 */ nop 673 674! 139 ! { 675! 140 ! a=i32[i]; 676! 141 ! d32[i]=(double)(i32[i]); 677! 142 ! d16[2*i]=(double)(a&0xffff); 678! 143 ! d16[2*i+1]=(double)(a>>16); 679 680/* 0x0138 143 */ sethi %hi(.L_const_seg_900000401),%g2 681/* 0x013c */ add %g2,%lo(.L_const_seg_900000401),%o1 682/* 0x0140 138 */ sethi %hi(0xfc00),%o0 683/* 0x0144 */ ld [%o2+%o1],%o2 684/* 0x0148 */ sll %g1,2,%o3 685/* 0x014c */ sub %i3,%g1,%g3 686/* 0x0150 */ sll %g1,3,%g2 687/* 0x0154 */ add %o0,1023,%o4 688/* 0x0158 141 */ ldd [%o2],%f0 689/* 0x015c */ add %g5,%o3,%o0 690/* 0x0160 138 */ cmp %g3,3 691/* 0x0164 */ add %i4,%g2,%o3 692/* 0x0168 */ sub %i3,1,%o1 693/* 0x016c */ sll %g1,4,%g4 694/* 0x0170 */ bl,pn %icc,.L77000161 695/* 0x0174 */ add %i1,%g4,%o5 696/* 0x0178 141 */ ld [%o0],%f3 697/* 0x017c 143 */ add %o3,8,%o3 698/* 0x0180 140 */ ld [%o0],%o7 699/* 0x0184 143 */ add %o5,16,%o5 700/* 0x0188 */ add %g1,1,%g1 701/* 0x018c 141 */ fmovs %f0,%f2 702/* 0x0190 143 */ add %o0,4,%o0 703/* 0x0194 142 */ and %o7,%o4,%g2 704/* 0x0198 141 */ fsubd %f2,%f0,%f2 705/* 0x019c */ std %f2,[%o3-8] 706/* 0x01a0 143 */ srl %o7,16,%o7 707/* 0x01a4 142 */ st %g2,[%sp+96] 708/* 0x01a8 */ fmovs %f0,%f2 709/* 0x01ac */ ld [%sp+96],%f3 710/* 0x01b0 */ fsubd %f2,%f0,%f2 711/* 0x01b4 */ std %f2,[%o5-16] 712/* 0x01b8 143 */ st %o7,[%sp+92] 713/* 0x01bc */ fmovs %f0,%f2 714/* 0x01c0 */ ld [%sp+92],%f3 715/* 0x01c4 */ fsubd %f2,%f0,%f2 716/* 0x01c8 */ std %f2,[%o5-8] 717 .L900000409: 718/* 0x01cc 141 */ ld [%o0],%f3 719/* 0x01d0 143 */ add %g1,2,%g1 720/* 0x01d4 */ add %o5,32,%o5 721/* 0x01d8 140 */ ld [%o0],%o7 722/* 0x01dc 143 */ cmp %g1,%o1 723/* 0x01e0 */ add %o3,16,%o3 724/* 0x01e4 141 */ fmovs %f0,%f2 725/* 0x01e8 */ fsubd %f2,%f0,%f2 726/* 0x01ec */ std %f2,[%o3-16] 727/* 0x01f0 142 */ and %o7,%o4,%g2 728/* 0x01f4 */ st %g2,[%sp+96] 729/* 0x01f8 */ ld [%sp+96],%f3 730/* 0x01fc */ fmovs %f0,%f2 731/* 0x0200 */ fsubd %f2,%f0,%f2 732/* 0x0204 143 */ srl %o7,16,%o7 733/* 0x0208 142 */ std %f2,[%o5-32] 734/* 0x020c 143 */ st %o7,[%sp+92] 735/* 0x0210 */ ld [%sp+92],%f3 736/* 0x0214 */ fmovs %f0,%f2 737/* 0x0218 */ fsubd %f2,%f0,%f2 738/* 0x021c */ std %f2,[%o5-24] 739/* 0x0220 */ add %o0,4,%o0 740/* 0x0224 141 */ ld [%o0],%f3 741/* 0x0228 140 */ ld [%o0],%o7 742/* 0x022c 141 */ fmovs %f0,%f2 743/* 0x0230 */ fsubd %f2,%f0,%f2 744/* 0x0234 */ std %f2,[%o3-8] 745/* 0x0238 142 */ and %o7,%o4,%g2 746/* 0x023c */ st %g2,[%sp+96] 747/* 0x0240 */ ld [%sp+96],%f3 748/* 0x0244 */ fmovs %f0,%f2 749/* 0x0248 */ fsubd %f2,%f0,%f2 750/* 0x024c 143 */ srl %o7,16,%o7 751/* 0x0250 142 */ std %f2,[%o5-16] 752/* 0x0254 143 */ st %o7,[%sp+92] 753/* 0x0258 */ ld [%sp+92],%f3 754/* 0x025c */ fmovs %f0,%f2 755/* 0x0260 */ fsubd %f2,%f0,%f2 756/* 0x0264 */ std %f2,[%o5-8] 757/* 0x0268 */ bl,pt %icc,.L900000409 758/* 0x026c */ add %o0,4,%o0 759 .L900000412: 760/* 0x0270 143 */ cmp %g1,%i3 761/* 0x0274 */ bge,pn %icc,.L77000164 762/* 0x0278 */ nop 763 .L77000161: 764/* 0x027c 141 */ ld [%o0],%f3 765 .L900000414: 766/* 0x0280 141 */ ldd [%o2],%f0 767/* 0x0284 143 */ add %g1,1,%g1 768/* 0x0288 140 */ ld [%o0],%o1 769/* 0x028c 143 */ add %o0,4,%o0 770/* 0x0290 */ cmp %g1,%i3 771/* 0x0294 141 */ fmovs %f0,%f2 772/* 0x0298 142 */ and %o1,%o4,%o7 773/* 0x029c 141 */ fsubd %f2,%f0,%f2 774/* 0x02a0 */ std %f2,[%o3] 775/* 0x02a4 143 */ srl %o1,16,%o1 776/* 0x02a8 142 */ st %o7,[%sp+96] 777/* 0x02ac 143 */ add %o3,8,%o3 778/* 0x02b0 142 */ fmovs %f0,%f2 779/* 0x02b4 */ ld [%sp+96],%f3 780/* 0x02b8 */ fsubd %f2,%f0,%f2 781/* 0x02bc */ std %f2,[%o5] 782/* 0x02c0 143 */ st %o1,[%sp+92] 783/* 0x02c4 */ fmovs %f0,%f2 784/* 0x02c8 */ ld [%sp+92],%f3 785/* 0x02cc */ fsubd %f2,%f0,%f0 786/* 0x02d0 */ std %f0,[%o5+8] 787/* 0x02d4 */ add %o5,16,%o5 788/* 0x02d8 */ bl,a,pt %icc,.L900000414 789/* 0x02dc */ ld [%o0],%f3 790 .L77000164: 791/* 0x02e0 */ ret ! Result = 792/* 0x02e4 */ restore %g0,%g0,%g0 793/* 0x02e8 0 */ .type conv_i32_to_d32_and_d16,2 794/* 0x02e8 */ .size conv_i32_to_d32_and_d16,(.-conv_i32_to_d32_and_d16) 795 796 .section ".text",#alloc,#execinstr 797/* 000000 0 */ .align 4 798! 799! SUBROUTINE adjust_montf_result 800! 801! OFFSET SOURCE LINE LABEL INSTRUCTION 802 803 .global adjust_montf_result 804 adjust_montf_result: 805 806! 144 ! } 807! 145 !} 808! 148 !void adjust_montf_result(unsigned int *i32, unsigned int *nint, int len) 809! 149 !{ 810! 150 !long long acc; 811! 151 !int i; 812! 153 ! if(i32[len]>0) i=-1; 813 814/* 000000 153 */ sll %o2,2,%g1 815/* 0x0004 */ or %g0,-1,%g3 816/* 0x0008 */ ld [%o0+%g1],%g1 817/* 0x000c */ cmp %g1,0 818/* 0x0010 */ bleu,pn %icc,.L77000175 819/* 0x0014 */ or %g0,%o1,%o3 820/* 0x0018 */ ba .L900000511 821/* 0x001c */ cmp %g3,0 822 .L77000175: 823 824! 154 ! else 825! 155 ! { 826! 156 ! for(i=len-1; i>=0; i--) 827 828/* 0x0020 156 */ subcc %o2,1,%g3 829/* 0x0024 */ bneg,pt %icc,.L900000511 830/* 0x0028 */ cmp %g3,0 831/* 0x002c */ sll %g3,2,%g1 832/* 0x0030 */ add %o0,%g1,%g2 833/* 0x0034 */ add %o1,%g1,%g1 834 835! 157 ! { 836! 158 ! if(i32[i]!=nint[i]) break; 837 838/* 0x0038 158 */ ld [%g1],%g5 839 .L900000510: 840/* 0x003c 158 */ ld [%g2],%o5 841/* 0x0040 */ sub %g1,4,%g1 842/* 0x0044 */ sub %g2,4,%g2 843/* 0x0048 */ cmp %o5,%g5 844/* 0x004c */ bne,pn %icc,.L77000182 845/* 0x0050 */ nop 846/* 0x0054 */ subcc %g3,1,%g3 847/* 0x0058 */ bpos,a,pt %icc,.L900000510 848/* 0x005c */ ld [%g1],%g5 849 .L77000182: 850 851! 159 ! } 852! 160 ! } 853! 161 ! if((i<0)||(i32[i]>nint[i])) 854 855/* 0x0060 161 */ cmp %g3,0 856 .L900000511: 857/* 0x0064 161 */ bl,pn %icc,.L77000198 858/* 0x0068 */ sll %g3,2,%g2 859/* 0x006c */ ld [%o1+%g2],%g1 860/* 0x0070 */ ld [%o0+%g2],%g2 861/* 0x0074 */ cmp %g2,%g1 862/* 0x0078 */ bleu,pt %icc,.L77000191 863/* 0x007c */ nop 864 .L77000198: 865 866! 162 ! { 867! 163 ! acc=0; 868! 164 ! for(i=0;i<len;i++) 869 870/* 0x0080 164 */ cmp %o2,0 871/* 0x0084 */ ble,pt %icc,.L77000191 872/* 0x0088 */ nop 873/* 0x008c 161 */ or %g0,-1,%g2 874/* 0x0090 */ sub %o2,1,%g4 875/* 0x0094 */ srl %g2,0,%g3 876/* 0x0098 163 */ or %g0,0,%g5 877/* 0x009c 164 */ or %g0,0,%o5 878/* 0x00a0 161 */ or %g0,%o0,%o4 879/* 0x00a4 */ cmp %o2,3 880/* 0x00a8 */ add %o1,4,%g2 881/* 0x00ac 164 */ bl,pn %icc,.L77000199 882/* 0x00b0 */ add %o0,8,%g1 883 884! 165 ! { 885! 166 ! acc=acc+(unsigned long long)(i32[i])-(unsigned long long)(nint[i]); 886 887/* 0x00b4 166 */ ld [%o0],%o2 888/* 0x00b8 0 */ or %g0,%g2,%o3 889/* 0x00bc 166 */ ld [%o1],%o1 890/* 0x00c0 0 */ or %g0,%g1,%o4 891 892! 167 ! i32[i]=acc&0xffffffff; 893! 168 ! acc=acc>>32; 894 895/* 0x00c4 168 */ or %g0,2,%o5 896/* 0x00c8 166 */ ld [%o0+4],%g1 897/* 0x00cc 164 */ sub %o2,%o1,%o2 898/* 0x00d0 */ or %g0,%o2,%g5 899/* 0x00d4 167 */ and %o2,%g3,%o2 900/* 0x00d8 */ st %o2,[%o0] 901/* 0x00dc 168 */ srax %g5,32,%g5 902 .L900000505: 903/* 0x00e0 166 */ ld [%o3],%o2 904/* 0x00e4 168 */ add %o5,1,%o5 905/* 0x00e8 */ add %o3,4,%o3 906/* 0x00ec */ cmp %o5,%g4 907/* 0x00f0 */ add %o4,4,%o4 908/* 0x00f4 164 */ sub %g1,%o2,%g1 909/* 0x00f8 */ add %g1,%g5,%g5 910/* 0x00fc 167 */ and %g5,%g3,%o2 911/* 0x0100 166 */ ld [%o4-4],%g1 912/* 0x0104 167 */ st %o2,[%o4-8] 913/* 0x0108 168 */ ble,pt %icc,.L900000505 914/* 0x010c */ srax %g5,32,%g5 915 .L900000508: 916/* 0x0110 166 */ ld [%o3],%g2 917/* 0x0114 164 */ sub %g1,%g2,%g1 918/* 0x0118 */ add %g1,%g5,%g1 919/* 0x011c 167 */ and %g1,%g3,%g2 920/* 0x0120 */ retl ! Result = 921/* 0x0124 */ st %g2,[%o4-4] 922 .L77000199: 923/* 0x0128 166 */ ld [%o4],%g1 924 .L900000509: 925/* 0x012c 166 */ ld [%o3],%g2 926/* 0x0130 */ add %g5,%g1,%g1 927/* 0x0134 168 */ add %o5,1,%o5 928/* 0x0138 */ add %o3,4,%o3 929/* 0x013c */ cmp %o5,%g4 930/* 0x0140 166 */ sub %g1,%g2,%g1 931/* 0x0144 167 */ and %g1,%g3,%g2 932/* 0x0148 */ st %g2,[%o4] 933/* 0x014c 168 */ add %o4,4,%o4 934/* 0x0150 */ srax %g1,32,%g5 935/* 0x0154 */ ble,a,pt %icc,.L900000509 936/* 0x0158 */ ld [%o4],%g1 937 .L77000191: 938/* 0x015c */ retl ! Result = 939/* 0x0160 */ nop 940/* 0x0164 0 */ .type adjust_montf_result,2 941/* 0x0164 */ .size adjust_montf_result,(.-adjust_montf_result) 942 943 .section ".text",#alloc,#execinstr 944/* 000000 0 */ .align 4 945/* 000000 */ .skip 16 946! 947! SUBROUTINE mont_mulf_noconv 948! 949! OFFSET SOURCE LINE LABEL INSTRUCTION 950 951 .global mont_mulf_noconv 952 mont_mulf_noconv: 953/* 000000 */ save %sp,-144,%sp 954 .L900000644: 955/* 0x0004 */ call .+8 956/* 0x0008 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000644-.)),%g4 957 958! 169 ! } 959! 170 ! } 960! 171 !} 961! 175 !void cleanup(double *dt, int from, int tlen); 962! 177 !/* 963! 178 !** the lengths of the input arrays should be at least the following: 964! 179 !** result[nlen+1], dm1[nlen], dm2[2*nlen+1], dt[4*nlen+2], dn[nlen], nint[nlen] 965! 180 !** all of them should be different from one another 966! 181 !** 967! 182 !*/ 968! 183 !void mont_mulf_noconv(unsigned int *result, 969! 184 ! double *dm1, double *dm2, double *dt, 970! 185 ! double *dn, unsigned int *nint, 971! 186 ! int nlen, double dn0) 972! 187 !{ 973! 188 ! int i, j, jj; 974! 189 ! int tmp; 975! 190 ! double digit, m2j, nextm2j, a, b; 976! 191 ! double *dptmp, *pdm1, *pdm2, *pdn, *pdtj, pdn_0, pdm1_0; 977! 193 ! pdm1=&(dm1[0]); 978! 194 ! pdm2=&(dm2[0]); 979! 195 ! pdn=&(dn[0]); 980! 196 ! pdm2[2*nlen]=Zero; 981 982/* 0x000c 196 */ sethi %hi(Zero),%g2 983/* 0x0010 */ ld [%fp+92],%o0 984/* 0x0014 187 */ add %g4,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000644-.)),%g4 985/* 0x0018 196 */ add %g2,%lo(Zero),%g2 986/* 0x001c 187 */ ldd [%fp+96],%f2 987/* 0x0020 */ add %g4,%o7,%o3 988/* 0x0024 */ st %i0,[%fp+68] 989/* 0x0028 */ or %g0,%i3,%o1 990/* 0x002c 196 */ ld [%o3+%g2],%g3 991/* 0x0030 */ sll %o0,4,%g2 992/* 0x0034 187 */ or %g0,%i1,%g4 993/* 0x0038 */ fmovd %f2,%f16 994/* 0x003c */ st %i5,[%fp+88] 995/* 0x0040 */ or %g0,%o1,%g5 996/* 0x0044 */ or %g0,%i2,%o2 997/* 0x0048 196 */ ldd [%g3],%f0 998/* 0x004c */ or %g0,%o0,%g1 999 1000! 198 ! if (nlen!=16) 1001 1002/* 0x0050 198 */ cmp %o0,16 1003/* 0x0054 */ be,pn %icc,.L77000289 1004/* 0x0058 */ std %f0,[%o2+%g2] 1005 1006! 199 ! { 1007! 200 ! for(i=0;i<4*nlen+2;i++) dt[i]=Zero; 1008 1009/* 0x005c 200 */ sll %o0,2,%g2 1010/* 0x0060 187 */ or %g0,%i4,%i0 1011/* 0x0064 196 */ sll %o0,1,%o7 1012/* 0x0068 200 */ add %g2,2,%o2 1013/* 0x006c */ cmp %o2,0 1014/* 0x0070 196 */ or %g0,%i2,%i1 1015/* 0x0074 200 */ ble,a,pt %icc,.L900000658 1016/* 0x0078 */ ldd [%g4],%f0 1017 1018! 202 ! a=dt[0]=pdm1[0]*pdm2[0]; 1019! 203 ! digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16); 1020! 205 ! pdtj=&(dt[0]); 1021! 206 ! for(j=jj=0;j<2*nlen;j++,jj++,pdtj++) 1022! 207 ! { 1023! 208 ! m2j=pdm2[j]; 1024! 209 ! a=pdtj[0]+pdn[0]*digit; 1025! 210 ! b=pdtj[1]+pdm1[0]*pdm2[j+1]+a*TwoToMinus16; 1026! 211 ! pdtj[1]=b; 1027! 213 !#pragma pipeloop(0) 1028! 214 ! for(i=1;i<nlen;i++) 1029! 215 ! { 1030! 216 ! pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit; 1031! 217 ! } 1032! 218 ! if((jj==30)) {cleanup(dt,j/2+1,2*nlen+1); jj=0;} 1033! 219 ! 1034! 220 ! digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16); 1035! 221 ! } 1036! 222 ! } 1037! 223 ! else 1038! 224 ! { 1039! 225 ! a=dt[0]=pdm1[0]*pdm2[0]; 1040! 227 ! dt[65]= dt[64]= dt[63]= dt[62]= dt[61]= dt[60]= 1041! 228 ! dt[59]= dt[58]= dt[57]= dt[56]= dt[55]= dt[54]= 1042! 229 ! dt[53]= dt[52]= dt[51]= dt[50]= dt[49]= dt[48]= 1043! 230 ! dt[47]= dt[46]= dt[45]= dt[44]= dt[43]= dt[42]= 1044! 231 ! dt[41]= dt[40]= dt[39]= dt[38]= dt[37]= dt[36]= 1045! 232 ! dt[35]= dt[34]= dt[33]= dt[32]= dt[31]= dt[30]= 1046! 233 ! dt[29]= dt[28]= dt[27]= dt[26]= dt[25]= dt[24]= 1047! 234 ! dt[23]= dt[22]= dt[21]= dt[20]= dt[19]= dt[18]= 1048! 235 ! dt[17]= dt[16]= dt[15]= dt[14]= dt[13]= dt[12]= 1049! 236 ! dt[11]= dt[10]= dt[ 9]= dt[ 8]= dt[ 7]= dt[ 6]= 1050! 237 ! dt[ 5]= dt[ 4]= dt[ 3]= dt[ 2]= dt[ 1]=Zero; 1051! 239 ! pdn_0=pdn[0]; 1052! 240 ! pdm1_0=pdm1[0]; 1053! 242 ! digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16); 1054! 243 ! pdtj=&(dt[0]); 1055! 245 ! for(j=0;j<32;j++,pdtj++) 1056! 246 ! { 1057! 248 ! m2j=pdm2[j]; 1058! 249 ! a=pdtj[0]+pdn_0*digit; 1059! 250 ! b=pdtj[1]+pdm1_0*pdm2[j+1]+a*TwoToMinus16; 1060! 251 ! pdtj[1]=b; 1061! 253 ! /**** this loop will be fully unrolled: 1062! 254 ! for(i=1;i<16;i++) 1063! 255 ! { 1064! 256 ! pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit; 1065! 257 ! } 1066! 258 ! *************************************/ 1067! 259 ! pdtj[2]+=pdm1[1]*m2j+pdn[1]*digit; 1068! 260 ! pdtj[4]+=pdm1[2]*m2j+pdn[2]*digit; 1069! 261 ! pdtj[6]+=pdm1[3]*m2j+pdn[3]*digit; 1070! 262 ! pdtj[8]+=pdm1[4]*m2j+pdn[4]*digit; 1071! 263 ! pdtj[10]+=pdm1[5]*m2j+pdn[5]*digit; 1072! 264 ! pdtj[12]+=pdm1[6]*m2j+pdn[6]*digit; 1073! 265 ! pdtj[14]+=pdm1[7]*m2j+pdn[7]*digit; 1074! 266 ! pdtj[16]+=pdm1[8]*m2j+pdn[8]*digit; 1075! 267 ! pdtj[18]+=pdm1[9]*m2j+pdn[9]*digit; 1076! 268 ! pdtj[20]+=pdm1[10]*m2j+pdn[10]*digit; 1077! 269 ! pdtj[22]+=pdm1[11]*m2j+pdn[11]*digit; 1078! 270 ! pdtj[24]+=pdm1[12]*m2j+pdn[12]*digit; 1079! 271 ! pdtj[26]+=pdm1[13]*m2j+pdn[13]*digit; 1080! 272 ! pdtj[28]+=pdm1[14]*m2j+pdn[14]*digit; 1081! 273 ! pdtj[30]+=pdm1[15]*m2j+pdn[15]*digit; 1082! 274 ! /* no need for cleenup, cannot overflow */ 1083! 275 ! digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16); 1084! 276 ! } 1085! 277 ! } 1086! 279 ! conv_d16_to_i32(result,dt+2*nlen,(long long *)dt,nlen+1); 1087! 281 ! adjust_montf_result(result,nint,nlen); 1088 1089/* 0x007c 281 */ add %g2,2,%o0 1090/* 0x0080 200 */ add %g2,1,%o2 1091/* 0x0084 281 */ cmp %o0,3 1092/* 0x0088 */ bl,pn %icc,.L77000279 1093/* 0x008c */ or %g0,1,%o0 1094/* 0x0090 */ add %o1,8,%o1 1095/* 0x0094 */ or %g0,1,%o3 1096/* 0x0098 */ std %f0,[%g5] 1097 .L900000628: 1098/* 0x009c */ std %f0,[%o1] 1099/* 0x00a0 */ add %o3,2,%o3 1100/* 0x00a4 */ add %o1,16,%o1 1101/* 0x00a8 */ cmp %o3,%g2 1102/* 0x00ac */ ble,pt %icc,.L900000628 1103/* 0x00b0 */ std %f0,[%o1-8] 1104 .L900000631: 1105/* 0x00b4 */ cmp %o3,%o2 1106/* 0x00b8 */ bg,pn %icc,.L77000284 1107/* 0x00bc */ add %o3,1,%o0 1108 .L77000279: 1109/* 0x00c0 */ std %f0,[%o1] 1110 .L900000657: 1111/* 0x00c4 */ ldd [%g3],%f0 1112/* 0x00c8 */ cmp %o0,%o2 1113/* 0x00cc */ add %o1,8,%o1 1114/* 0x00d0 */ add %o0,1,%o0 1115/* 0x00d4 */ ble,a,pt %icc,.L900000657 1116/* 0x00d8 */ std %f0,[%o1] 1117 .L77000284: 1118/* 0x00dc 202 */ ldd [%g4],%f0 1119 .L900000658: 1120/* 0x00e0 202 */ ldd [%i2],%f2 1121/* 0x00e4 */ add %o7,1,%o2 1122/* 0x00e8 206 */ cmp %o7,0 1123/* 0x00ec */ sll %o2,1,%o0 1124/* 0x00f0 */ sub %o7,1,%o1 1125/* 0x00f4 202 */ fmuld %f0,%f2,%f0 1126/* 0x00f8 */ std %f0,[%g5] 1127/* 0x00fc */ sub %g1,1,%o7 1128/* 0x0100 */ ldd [%g3],%f6 1129/* 0x0104 0 */ or %g0,%o7,%i2 1130/* 0x0108 */ or %g0,0,%l0 1131/* 0x010c */ ldd [%g3-8],%f2 1132/* 0x0110 */ or %g0,0,%i5 1133/* 0x0114 */ or %g0,%o1,%o5 1134/* 0x0118 */ fdtox %f0,%f0 1135/* 0x011c */ ldd [%g3-16],%f4 1136/* 0x0120 */ or %g0,%o0,%o3 1137/* 0x0124 210 */ add %i1,8,%o4 1138/* 0x0128 */ or %g0,0,%i4 1139/* 0x012c */ fmovs %f6,%f0 1140/* 0x0130 */ fxtod %f0,%f0 1141/* 0x0134 203 */ fmuld %f0,%f16,%f0 1142/* 0x0138 */ fmuld %f0,%f2,%f2 1143/* 0x013c */ fdtox %f2,%f2 1144/* 0x0140 */ fxtod %f2,%f2 1145/* 0x0144 */ fmuld %f2,%f4,%f2 1146/* 0x0148 */ fsubd %f0,%f2,%f22 1147/* 0x014c 206 */ ble,pt %icc,.L900000651 1148/* 0x0150 */ sll %g1,4,%g2 1149/* 0x0154 210 */ ldd [%i0],%f0 1150 .L900000652: 1151/* 0x0158 210 */ fmuld %f0,%f22,%f8 1152/* 0x015c */ ldd [%g4],%f0 1153/* 0x0160 214 */ cmp %g1,1 1154/* 0x0164 210 */ ldd [%o4+%i4],%f6 1155/* 0x0168 */ add %g4,8,%o0 1156/* 0x016c 214 */ or %g0,1,%o1 1157/* 0x0170 210 */ ldd [%i3],%f2 1158/* 0x0174 */ add %i3,16,%l1 1159/* 0x0178 */ fmuld %f0,%f6,%f6 1160/* 0x017c */ ldd [%g3-8],%f4 1161/* 0x0180 */ faddd %f2,%f8,%f2 1162/* 0x0184 */ ldd [%i3+8],%f0 1163/* 0x0188 208 */ ldd [%i1+%i4],%f20 1164/* 0x018c 210 */ faddd %f0,%f6,%f0 1165/* 0x0190 */ fmuld %f2,%f4,%f2 1166/* 0x0194 */ faddd %f0,%f2,%f18 1167/* 0x0198 211 */ std %f18,[%i3+8] 1168/* 0x019c 214 */ ble,pt %icc,.L900000656 1169/* 0x01a0 */ srl %i5,31,%g2 1170/* 0x01a4 */ cmp %i2,7 1171/* 0x01a8 210 */ add %i0,8,%g2 1172/* 0x01ac 214 */ bl,pn %icc,.L77000281 1173/* 0x01b0 */ add %g2,24,%o2 1174/* 0x01b4 216 */ ldd [%g4+8],%f2 1175/* 0x01b8 */ add %g4,40,%o0 1176/* 0x01bc */ ldd [%g4+16],%f6 1177/* 0x01c0 0 */ or %g0,%o2,%g2 1178/* 0x01c4 216 */ add %i3,48,%l1 1179/* 0x01c8 */ ldd [%g2-24],%f0 1180/* 0x01cc */ fmuld %f2,%f20,%f2 1181/* 0x01d0 214 */ sub %i2,2,%o2 1182/* 0x01d4 216 */ ldd [%g2-16],%f8 1183/* 0x01d8 */ fmuld %f6,%f20,%f10 1184/* 0x01dc */ or %g0,5,%o1 1185/* 0x01e0 */ ldd [%g4+24],%f14 1186/* 0x01e4 */ fmuld %f0,%f22,%f4 1187/* 0x01e8 */ ldd [%i3+16],%f0 1188/* 0x01ec */ ldd [%g2-8],%f6 1189/* 0x01f0 */ ldd [%g4+32],%f12 1190/* 0x01f4 */ faddd %f2,%f4,%f4 1191/* 0x01f8 */ ldd [%i3+32],%f2 1192 .L900000640: 1193/* 0x01fc 216 */ ldd [%g2],%f24 1194/* 0x0200 */ add %o1,3,%o1 1195/* 0x0204 */ add %g2,24,%g2 1196/* 0x0208 */ fmuld %f8,%f22,%f8 1197/* 0x020c */ ldd [%l1],%f28 1198/* 0x0210 */ cmp %o1,%o2 1199/* 0x0214 */ add %o0,24,%o0 1200/* 0x0218 */ ldd [%o0-24],%f26 1201/* 0x021c */ faddd %f0,%f4,%f0 1202/* 0x0220 */ add %l1,48,%l1 1203/* 0x0224 */ faddd %f10,%f8,%f10 1204/* 0x0228 */ fmuld %f14,%f20,%f4 1205/* 0x022c */ std %f0,[%l1-80] 1206/* 0x0230 */ ldd [%g2-16],%f8 1207/* 0x0234 */ fmuld %f6,%f22,%f6 1208/* 0x0238 */ ldd [%l1-32],%f0 1209/* 0x023c */ ldd [%o0-16],%f14 1210/* 0x0240 */ faddd %f2,%f10,%f2 1211/* 0x0244 */ faddd %f4,%f6,%f10 1212/* 0x0248 */ fmuld %f12,%f20,%f4 1213/* 0x024c */ std %f2,[%l1-64] 1214/* 0x0250 */ ldd [%g2-8],%f6 1215/* 0x0254 */ fmuld %f24,%f22,%f24 1216/* 0x0258 */ ldd [%l1-16],%f2 1217/* 0x025c */ ldd [%o0-8],%f12 1218/* 0x0260 */ faddd %f28,%f10,%f10 1219/* 0x0264 */ std %f10,[%l1-48] 1220/* 0x0268 */ fmuld %f26,%f20,%f10 1221/* 0x026c */ ble,pt %icc,.L900000640 1222/* 0x0270 */ faddd %f4,%f24,%f4 1223 .L900000643: 1224/* 0x0274 216 */ fmuld %f8,%f22,%f28 1225/* 0x0278 */ ldd [%g2],%f24 1226/* 0x027c */ faddd %f0,%f4,%f26 1227/* 0x0280 */ fmuld %f12,%f20,%f8 1228/* 0x0284 */ add %l1,32,%l1 1229/* 0x0288 */ cmp %o1,%i2 1230/* 0x028c */ fmuld %f14,%f20,%f14 1231/* 0x0290 */ ldd [%l1-32],%f4 1232/* 0x0294 */ add %g2,8,%g2 1233/* 0x0298 */ faddd %f10,%f28,%f12 1234/* 0x029c */ fmuld %f6,%f22,%f6 1235/* 0x02a0 */ ldd [%l1-16],%f0 1236/* 0x02a4 */ fmuld %f24,%f22,%f10 1237/* 0x02a8 */ std %f26,[%l1-64] 1238/* 0x02ac */ faddd %f2,%f12,%f2 1239/* 0x02b0 */ std %f2,[%l1-48] 1240/* 0x02b4 */ faddd %f14,%f6,%f6 1241/* 0x02b8 */ faddd %f8,%f10,%f2 1242/* 0x02bc */ faddd %f4,%f6,%f4 1243/* 0x02c0 */ std %f4,[%l1-32] 1244/* 0x02c4 */ faddd %f0,%f2,%f0 1245/* 0x02c8 */ bg,pn %icc,.L77000213 1246/* 0x02cc */ std %f0,[%l1-16] 1247 .L77000281: 1248/* 0x02d0 216 */ ldd [%o0],%f0 1249 .L900000655: 1250/* 0x02d4 216 */ ldd [%g2],%f4 1251/* 0x02d8 */ fmuld %f0,%f20,%f2 1252/* 0x02dc */ add %o1,1,%o1 1253/* 0x02e0 */ ldd [%l1],%f0 1254/* 0x02e4 */ add %o0,8,%o0 1255/* 0x02e8 */ add %g2,8,%g2 1256/* 0x02ec */ fmuld %f4,%f22,%f4 1257/* 0x02f0 */ cmp %o1,%i2 1258/* 0x02f4 */ faddd %f2,%f4,%f2 1259/* 0x02f8 */ faddd %f0,%f2,%f0 1260/* 0x02fc */ std %f0,[%l1] 1261/* 0x0300 */ add %l1,16,%l1 1262/* 0x0304 */ ble,a,pt %icc,.L900000655 1263/* 0x0308 */ ldd [%o0],%f0 1264 .L77000213: 1265/* 0x030c */ srl %i5,31,%g2 1266 .L900000656: 1267/* 0x0310 218 */ cmp %l0,30 1268/* 0x0314 */ bne,a,pt %icc,.L900000654 1269/* 0x0318 */ fdtox %f18,%f0 1270/* 0x031c */ add %i5,%g2,%g2 1271/* 0x0320 */ sub %o3,1,%o2 1272/* 0x0324 */ sra %g2,1,%o0 1273/* 0x0328 216 */ ldd [%g3],%f0 1274/* 0x032c */ add %o0,1,%g2 1275/* 0x0330 */ sll %g2,1,%o0 1276/* 0x0334 */ fmovd %f0,%f2 1277/* 0x0338 */ sll %g2,4,%o1 1278/* 0x033c */ cmp %o0,%o3 1279/* 0x0340 */ bge,pt %icc,.L77000215 1280/* 0x0344 */ or %g0,0,%l0 1281/* 0x0348 218 */ add %g5,%o1,%o1 1282/* 0x034c 216 */ ldd [%o1],%f6 1283 .L900000653: 1284/* 0x0350 */ fdtox %f6,%f10 1285/* 0x0354 */ ldd [%o1+8],%f4 1286/* 0x0358 */ add %o0,2,%o0 1287/* 0x035c */ ldd [%g3],%f12 1288/* 0x0360 */ fdtox %f6,%f6 1289/* 0x0364 */ cmp %o0,%o2 1290/* 0x0368 */ fdtox %f4,%f8 1291/* 0x036c */ fdtox %f4,%f4 1292/* 0x0370 */ fmovs %f12,%f10 1293/* 0x0374 */ fmovs %f12,%f8 1294/* 0x0378 */ fxtod %f10,%f10 1295/* 0x037c */ fxtod %f8,%f8 1296/* 0x0380 */ faddd %f10,%f2,%f2 1297/* 0x0384 */ std %f2,[%o1] 1298/* 0x0388 */ faddd %f8,%f0,%f0 1299/* 0x038c */ std %f0,[%o1+8] 1300/* 0x0390 */ add %o1,16,%o1 1301/* 0x0394 */ fitod %f6,%f2 1302/* 0x0398 */ fitod %f4,%f0 1303/* 0x039c */ ble,a,pt %icc,.L900000653 1304/* 0x03a0 */ ldd [%o1],%f6 1305 .L77000233: 1306/* 0x03a4 */ or %g0,0,%l0 1307 .L77000215: 1308/* 0x03a8 */ fdtox %f18,%f0 1309 .L900000654: 1310/* 0x03ac */ ldd [%g3],%f6 1311/* 0x03b0 220 */ add %i5,1,%i5 1312/* 0x03b4 */ add %i4,8,%i4 1313/* 0x03b8 */ ldd [%g3-8],%f2 1314/* 0x03bc */ add %l0,1,%l0 1315/* 0x03c0 */ add %i3,8,%i3 1316/* 0x03c4 */ fmovs %f6,%f0 1317/* 0x03c8 */ ldd [%g3-16],%f4 1318/* 0x03cc */ cmp %i5,%o5 1319/* 0x03d0 */ fxtod %f0,%f0 1320/* 0x03d4 */ fmuld %f0,%f16,%f0 1321/* 0x03d8 */ fmuld %f0,%f2,%f2 1322/* 0x03dc */ fdtox %f2,%f2 1323/* 0x03e0 */ fxtod %f2,%f2 1324/* 0x03e4 */ fmuld %f2,%f4,%f2 1325/* 0x03e8 */ fsubd %f0,%f2,%f22 1326/* 0x03ec */ ble,a,pt %icc,.L900000652 1327/* 0x03f0 */ ldd [%i0],%f0 1328 .L900000627: 1329/* 0x03f4 220 */ ba .L900000651 1330/* 0x03f8 */ sll %g1,4,%g2 1331 .L77000289: 1332/* 0x03fc 225 */ ldd [%o2],%f6 1333/* 0x0400 243 */ or %g0,%o1,%o4 1334/* 0x0404 245 */ or %g0,0,%o3 1335/* 0x0408 225 */ ldd [%g4],%f4 1336/* 0x040c 237 */ std %f0,[%o1+8] 1337/* 0x0410 */ std %f0,[%o1+16] 1338/* 0x0414 225 */ fmuld %f4,%f6,%f4 1339/* 0x0418 */ std %f4,[%o1] 1340/* 0x041c 237 */ std %f0,[%o1+24] 1341/* 0x0420 */ std %f0,[%o1+32] 1342/* 0x0424 */ fdtox %f4,%f4 1343/* 0x0428 */ std %f0,[%o1+40] 1344/* 0x042c */ std %f0,[%o1+48] 1345/* 0x0430 */ std %f0,[%o1+56] 1346/* 0x0434 */ std %f0,[%o1+64] 1347/* 0x0438 */ std %f0,[%o1+72] 1348/* 0x043c */ std %f0,[%o1+80] 1349/* 0x0440 */ std %f0,[%o1+88] 1350/* 0x0444 */ std %f0,[%o1+96] 1351/* 0x0448 */ std %f0,[%o1+104] 1352/* 0x044c */ std %f0,[%o1+112] 1353/* 0x0450 */ std %f0,[%o1+120] 1354/* 0x0454 */ std %f0,[%o1+128] 1355/* 0x0458 */ std %f0,[%o1+136] 1356/* 0x045c */ std %f0,[%o1+144] 1357/* 0x0460 */ std %f0,[%o1+152] 1358/* 0x0464 */ std %f0,[%o1+160] 1359/* 0x0468 */ std %f0,[%o1+168] 1360/* 0x046c */ fmovs %f0,%f4 1361/* 0x0470 */ std %f0,[%o1+176] 1362/* 0x0474 245 */ or %g0,0,%o0 1363/* 0x0478 237 */ std %f0,[%o1+184] 1364/* 0x047c */ fxtod %f4,%f4 1365/* 0x0480 */ std %f0,[%o1+192] 1366/* 0x0484 */ std %f0,[%o1+200] 1367/* 0x0488 */ std %f0,[%o1+208] 1368/* 0x048c 242 */ fmuld %f4,%f2,%f2 1369/* 0x0490 237 */ std %f0,[%o1+216] 1370/* 0x0494 */ std %f0,[%o1+224] 1371/* 0x0498 */ std %f0,[%o1+232] 1372/* 0x049c */ std %f0,[%o1+240] 1373/* 0x04a0 */ std %f0,[%o1+248] 1374/* 0x04a4 */ std %f0,[%o1+256] 1375/* 0x04a8 */ std %f0,[%o1+264] 1376/* 0x04ac */ std %f0,[%o1+272] 1377/* 0x04b0 */ std %f0,[%o1+280] 1378/* 0x04b4 */ std %f0,[%o1+288] 1379/* 0x04b8 */ std %f0,[%o1+296] 1380/* 0x04bc */ std %f0,[%o1+304] 1381/* 0x04c0 */ std %f0,[%o1+312] 1382/* 0x04c4 */ std %f0,[%o1+320] 1383/* 0x04c8 */ std %f0,[%o1+328] 1384/* 0x04cc */ std %f0,[%o1+336] 1385/* 0x04d0 */ std %f0,[%o1+344] 1386/* 0x04d4 */ std %f0,[%o1+352] 1387/* 0x04d8 */ std %f0,[%o1+360] 1388/* 0x04dc */ std %f0,[%o1+368] 1389/* 0x04e0 */ std %f0,[%o1+376] 1390/* 0x04e4 */ std %f0,[%o1+384] 1391/* 0x04e8 */ std %f0,[%o1+392] 1392/* 0x04ec */ std %f0,[%o1+400] 1393/* 0x04f0 */ std %f0,[%o1+408] 1394/* 0x04f4 */ std %f0,[%o1+416] 1395/* 0x04f8 */ std %f0,[%o1+424] 1396/* 0x04fc */ std %f0,[%o1+432] 1397/* 0x0500 */ std %f0,[%o1+440] 1398/* 0x0504 */ std %f0,[%o1+448] 1399/* 0x0508 */ std %f0,[%o1+456] 1400/* 0x050c */ std %f0,[%o1+464] 1401/* 0x0510 */ std %f0,[%o1+472] 1402/* 0x0514 */ std %f0,[%o1+480] 1403/* 0x0518 */ std %f0,[%o1+488] 1404/* 0x051c */ std %f0,[%o1+496] 1405/* 0x0520 */ std %f0,[%o1+504] 1406/* 0x0524 */ std %f0,[%o1+512] 1407/* 0x0528 */ std %f0,[%o1+520] 1408/* 0x052c */ ldd [%g3-8],%f0 1409/* 0x0530 */ ldd [%g3-16],%f8 1410/* 0x0534 */ fmuld %f2,%f0,%f6 1411/* 0x0538 239 */ ldd [%i4],%f4 1412/* 0x053c 240 */ ldd [%g4],%f0 1413/* 0x0540 */ fdtox %f6,%f6 1414/* 0x0544 */ fxtod %f6,%f6 1415/* 0x0548 */ fmuld %f6,%f8,%f6 1416/* 0x054c */ fsubd %f2,%f6,%f2 1417/* 0x0550 250 */ fmuld %f4,%f2,%f12 1418 .L900000650: 1419 1420 1421 fmovd %f2,%f0 1422 fmovd %f16,%f18 1423 ldd [%i4],%f2 1424 ldd [%o4],%f8 1425 ldd [%g4],%f10 1426 ldd [%g3-8],%f14 1427 ldd [%g3-16],%f16 1428 ldd [%i2],%f24 1429 1430 ldd [%g4+8],%f26 1431 ldd [%g4+16],%f40 1432 ldd [%g4+48],%f46 1433 ldd [%g4+56],%f30 1434 ldd [%g4+64],%f54 1435 ldd [%g4+104],%f34 1436 ldd [%g4+112],%f58 1437 1438 ldd [%i4+8],%f28 1439 ldd [%i4+104],%f38 1440 ldd [%i4+112],%f60 1441 1442 1443 .L99999999: 1444!1 1445 ldd [%g4+24],%f32 1446 fmuld %f0,%f2,%f4 1447!2 1448 ldd [%i4+24],%f36 1449 fmuld %f26,%f24,%f20 1450!3 1451 ldd [%g4+40],%f42 1452 fmuld %f28,%f0,%f22 1453!4 1454 ldd [%i4+40],%f44 1455 fmuld %f32,%f24,%f32 1456!5 1457 ldd [%i2+8],%f6 1458 faddd %f4,%f8,%f4 1459 fmuld %f36,%f0,%f36 1460!6 1461 add %i2,8,%i2 1462 ldd [%i4+56],%f50 1463 fmuld %f42,%f24,%f42 1464!7 1465 ldd [%g4+72],%f52 1466 faddd %f20,%f22,%f20 1467 fmuld %f44,%f0,%f44 1468!8 1469 ldd [%o4+16],%f22 1470 fmuld %f10,%f6,%f12 1471!9 1472 ldd [%i4+72],%f56 1473 faddd %f32,%f36,%f32 1474 fmuld %f14,%f4,%f4 1475!10 1476 ldd [%o4+48],%f36 1477 fmuld %f30,%f24,%f48 1478!11 1479 ldd [%o4+8],%f8 1480 faddd %f20,%f22,%f20 1481 fmuld %f50,%f0,%f50 1482!12 1483 std %f20,[%o4+16] 1484 faddd %f42,%f44,%f42 1485 fmuld %f52,%f24,%f52 1486!13 1487 ldd [%o4+80],%f44 1488 faddd %f4,%f12,%f4 1489 fmuld %f56,%f0,%f56 1490!14 1491 ldd [%g4+88],%f20 1492 faddd %f32,%f36,%f32 1493!15 1494 ldd [%i4+88],%f22 1495 faddd %f48,%f50,%f48 1496!16 1497 ldd [%o4+112],%f50 1498 faddd %f52,%f56,%f52 1499!17 1500 ldd [%o4+144],%f56 1501 faddd %f4,%f8,%f8 1502 fmuld %f20,%f24,%f20 1503!18 1504 std %f32,[%o4+48] 1505 faddd %f42,%f44,%f42 1506 fmuld %f22,%f0,%f22 1507!19 1508 std %f42,[%o4+80] 1509 faddd %f48,%f50,%f48 1510 fmuld %f34,%f24,%f32 1511!20 1512 std %f48,[%o4+112] 1513 faddd %f52,%f56,%f52 1514 fmuld %f38,%f0,%f36 1515!21 1516 ldd [%g4+120],%f42 1517 fdtox %f8,%f4 1518!22 1519 std %f52,[%o4+144] 1520 faddd %f20,%f22,%f20 1521!23 1522 ldd [%i4+120],%f44 1523!24 1524 ldd [%o4+176],%f22 1525 faddd %f32,%f36,%f32 1526 fmuld %f42,%f24,%f42 1527!25 1528 ldd [%i4+16],%f50 1529 fmovs %f17,%f4 1530!26 1531 ldd [%g4+32],%f52 1532 fmuld %f44,%f0,%f44 1533!27 1534 ldd [%i4+32],%f56 1535 fmuld %f40,%f24,%f48 1536!28 1537 ldd [%o4+208],%f36 1538 faddd %f20,%f22,%f20 1539 fmuld %f50,%f0,%f50 1540!29 1541 std %f20,[%o4+176] 1542 fxtod %f4,%f4 1543 fmuld %f52,%f24,%f52 1544!30 1545 ldd [%i4+48],%f22 1546 faddd %f42,%f44,%f42 1547 fmuld %f56,%f0,%f56 1548!31 1549 ldd [%o4+240],%f44 1550 faddd %f32,%f36,%f32 1551!32 1552 std %f32,[%o4+208] 1553 faddd %f48,%f50,%f48 1554 fmuld %f46,%f24,%f20 1555!33 1556 ldd [%o4+32],%f50 1557 fmuld %f4,%f18,%f12 1558!34 1559 ldd [%i4+64],%f36 1560 faddd %f52,%f56,%f52 1561 fmuld %f22,%f0,%f22 1562!35 1563 ldd [%o4+64],%f56 1564 faddd %f42,%f44,%f42 1565!36 1566 std %f42,[%o4+240] 1567 faddd %f48,%f50,%f48 1568 fmuld %f54,%f24,%f32 1569!37 1570 std %f48,[%o4+32] 1571 fmuld %f12,%f14,%f4 1572!38 1573 ldd [%g4+80],%f42 1574 faddd %f52,%f56,%f56 ! yes, tmp52! 1575 fmuld %f36,%f0,%f36 1576!39 1577 ldd [%i4+80],%f44 1578 faddd %f20,%f22,%f20 1579!40 1580 ldd [%g4+96],%f48 1581 fmuld %f58,%f24,%f52 1582!41 1583 ldd [%i4+96],%f50 1584 fdtox %f4,%f4 1585 fmuld %f42,%f24,%f42 1586!42 1587 std %f56,[%o4+64] ! yes, tmp52! 1588 faddd %f32,%f36,%f32 1589 fmuld %f44,%f0,%f44 1590!43 1591 ldd [%o4+96],%f22 1592 fmuld %f48,%f24,%f48 1593!44 1594 ldd [%o4+128],%f36 1595 fmovd %f6,%f24 1596 fmuld %f50,%f0,%f50 1597!45 1598 fxtod %f4,%f4 1599 fmuld %f60,%f0,%f56 1600!46 1601 add %o4,8,%o4 1602 faddd %f42,%f44,%f42 1603!47 1604 ldd [%o4+160-8],%f44 1605 faddd %f20,%f22,%f20 1606!48 1607 std %f20,[%o4+96-8] 1608 faddd %f48,%f50,%f48 1609!49 1610 ldd [%o4+192-8],%f50 1611 faddd %f52,%f56,%f52 1612 fmuld %f4,%f16,%f4 1613!50 1614 ldd [%o4+224-8],%f56 1615 faddd %f32,%f36,%f32 1616!51 1617 std %f32,[%o4+128-8] 1618 faddd %f42,%f44,%f42 1619!52 1620 add %o3,1,%o3 1621 std %f42,[%o4+160-8] 1622 faddd %f48,%f50,%f48 1623!53 1624 cmp %o3,31 1625 std %f48,[%o4+192-8] 1626 fsubd %f12,%f4,%f0 1627!54 1628 faddd %f52,%f56,%f52 1629 ble,pt %icc,.L99999999 1630 std %f52,[%o4+224-8] 1631!55 1632 std %f8,[%o4] 1633 1634 1635 .L77000285: 1636/* 0x07a8 279 */ sll %g1,4,%g2 1637 .L900000651: 1638/* 0x07ac 279 */ ldd [%g5+%g2],%f0 1639/* 0x07b0 */ add %g5,%g2,%i1 1640/* 0x07b4 */ or %g0,0,%o4 1641/* 0x07b8 206 */ ld [%fp+68],%o0 1642/* 0x07bc 279 */ or %g0,0,%i0 1643/* 0x07c0 */ cmp %g1,0 1644/* 0x07c4 */ fdtox %f0,%f0 1645/* 0x07c8 */ std %f0,[%sp+120] 1646/* 0x07cc 275 */ sethi %hi(0xfc00),%o1 1647/* 0x07d0 206 */ or %g0,%o0,%o3 1648/* 0x07d4 275 */ sub %g1,1,%g4 1649/* 0x07d8 279 */ ldd [%i1+8],%f0 1650/* 0x07dc */ or %g0,%o0,%g5 1651/* 0x07e0 */ add %o1,1023,%o1 1652/* 0x07e4 */ fdtox %f0,%f0 1653/* 0x07e8 */ std %f0,[%sp+112] 1654/* 0x07ec */ ldx [%sp+112],%o5 1655/* 0x07f0 */ ldx [%sp+120],%o7 1656/* 0x07f4 */ ble,pt %icc,.L900000649 1657/* 0x07f8 */ sethi %hi(0xfc00),%g2 1658/* 0x07fc 275 */ or %g0,-1,%g2 1659/* 0x0800 279 */ cmp %g1,3 1660/* 0x0804 275 */ srl %g2,0,%o2 1661/* 0x0808 279 */ bl,pn %icc,.L77000286 1662/* 0x080c */ or %g0,%i1,%g2 1663/* 0x0810 */ ldd [%i1+16],%f0 1664/* 0x0814 */ and %o5,%o1,%o0 1665/* 0x0818 */ add %i1,16,%g2 1666/* 0x081c */ sllx %o0,16,%g3 1667/* 0x0820 */ and %o7,%o2,%o0 1668/* 0x0824 */ fdtox %f0,%f0 1669/* 0x0828 */ std %f0,[%sp+104] 1670/* 0x082c */ add %o0,%g3,%o4 1671/* 0x0830 */ ldd [%i1+24],%f2 1672/* 0x0834 */ srax %o5,16,%o0 1673/* 0x0838 */ add %o3,4,%g5 1674/* 0x083c */ stx %o0,[%sp+128] 1675/* 0x0840 */ and %o4,%o2,%o0 1676/* 0x0844 */ or %g0,1,%i0 1677/* 0x0848 */ stx %o0,[%sp+112] 1678/* 0x084c */ srax %o4,32,%o0 1679/* 0x0850 */ fdtox %f2,%f0 1680/* 0x0854 */ stx %o0,[%sp+136] 1681/* 0x0858 */ srax %o7,32,%o4 1682/* 0x085c */ std %f0,[%sp+96] 1683/* 0x0860 */ ldx [%sp+136],%o7 1684/* 0x0864 */ ldx [%sp+128],%o0 1685/* 0x0868 */ ldx [%sp+104],%g3 1686/* 0x086c */ add %o0,%o7,%o0 1687/* 0x0870 */ ldx [%sp+112],%o7 1688/* 0x0874 */ add %o4,%o0,%o4 1689/* 0x0878 */ ldx [%sp+96],%o5 1690/* 0x087c */ st %o7,[%o3] 1691/* 0x0880 */ or %g0,%g3,%o7 1692 .L900000632: 1693/* 0x0884 */ ldd [%g2+16],%f0 1694/* 0x0888 */ add %i0,1,%i0 1695/* 0x088c */ add %g5,4,%g5 1696/* 0x0890 */ cmp %i0,%g4 1697/* 0x0894 */ add %g2,16,%g2 1698/* 0x0898 */ fdtox %f0,%f0 1699/* 0x089c */ std %f0,[%sp+104] 1700/* 0x08a0 */ ldd [%g2+8],%f0 1701/* 0x08a4 */ fdtox %f0,%f0 1702/* 0x08a8 */ std %f0,[%sp+96] 1703/* 0x08ac */ and %o5,%o1,%g3 1704/* 0x08b0 */ sllx %g3,16,%g3 1705/* 0x08b4 */ stx %g3,[%sp+120] 1706/* 0x08b8 */ and %o7,%o2,%g3 1707/* 0x08bc */ stx %o7,[%sp+128] 1708/* 0x08c0 */ ldx [%sp+120],%o7 1709/* 0x08c4 */ add %g3,%o7,%g3 1710/* 0x08c8 */ ldx [%sp+128],%o7 1711/* 0x08cc */ srax %o5,16,%o5 1712/* 0x08d0 */ add %g3,%o4,%g3 1713/* 0x08d4 */ srax %g3,32,%o4 1714/* 0x08d8 */ stx %o4,[%sp+112] 1715/* 0x08dc */ srax %o7,32,%o4 1716/* 0x08e0 */ ldx [%sp+112],%o7 1717/* 0x08e4 */ add %o5,%o7,%o7 1718/* 0x08e8 */ ldx [%sp+96],%o5 1719/* 0x08ec */ add %o4,%o7,%o4 1720/* 0x08f0 */ and %g3,%o2,%g3 1721/* 0x08f4 */ ldx [%sp+104],%o7 1722/* 0x08f8 */ ble,pt %icc,.L900000632 1723/* 0x08fc */ st %g3,[%g5-4] 1724 .L900000635: 1725/* 0x0900 */ ba .L900000649 1726/* 0x0904 */ sethi %hi(0xfc00),%g2 1727 .L77000286: 1728/* 0x0908 */ ldd [%g2+16],%f0 1729 .L900000648: 1730/* 0x090c */ and %o7,%o2,%o0 1731/* 0x0910 */ and %o5,%o1,%g3 1732/* 0x0914 */ fdtox %f0,%f0 1733/* 0x0918 */ add %o4,%o0,%o0 1734/* 0x091c */ std %f0,[%sp+104] 1735/* 0x0920 */ add %i0,1,%i0 1736/* 0x0924 */ sllx %g3,16,%o4 1737/* 0x0928 */ ldd [%g2+24],%f2 1738/* 0x092c */ add %g2,16,%g2 1739/* 0x0930 */ add %o0,%o4,%o4 1740/* 0x0934 */ cmp %i0,%g4 1741/* 0x0938 */ srax %o5,16,%o0 1742/* 0x093c */ stx %o0,[%sp+112] 1743/* 0x0940 */ and %o4,%o2,%g3 1744/* 0x0944 */ srax %o4,32,%o5 1745/* 0x0948 */ fdtox %f2,%f0 1746/* 0x094c */ std %f0,[%sp+96] 1747/* 0x0950 */ srax %o7,32,%o4 1748/* 0x0954 */ ldx [%sp+112],%o7 1749/* 0x0958 */ add %o7,%o5,%o7 1750/* 0x095c */ ldx [%sp+104],%o5 1751/* 0x0960 */ add %o4,%o7,%o4 1752/* 0x0964 */ ldx [%sp+96],%o0 1753/* 0x0968 */ st %g3,[%g5] 1754/* 0x096c */ or %g0,%o5,%o7 1755/* 0x0970 */ add %g5,4,%g5 1756/* 0x0974 */ or %g0,%o0,%o5 1757/* 0x0978 */ ble,a,pt %icc,.L900000648 1758/* 0x097c */ ldd [%g2+16],%f0 1759 .L77000236: 1760/* 0x0980 */ sethi %hi(0xfc00),%g2 1761 .L900000649: 1762/* 0x0984 */ or %g0,-1,%o0 1763/* 0x0988 */ add %g2,1023,%g2 1764/* 0x098c */ ld [%fp+88],%o1 1765/* 0x0990 */ srl %o0,0,%g3 1766/* 0x0994 */ and %o5,%g2,%g2 1767/* 0x0998 */ and %o7,%g3,%g4 1768/* 0x099c */ sllx %g2,16,%g2 1769/* 0x09a0 */ add %o4,%g4,%g4 1770/* 0x09a4 */ add %g4,%g2,%g2 1771/* 0x09a8 */ sll %i0,2,%g4 1772/* 0x09ac */ and %g2,%g3,%g2 1773/* 0x09b0 */ st %g2,[%o3+%g4] 1774/* 0x09b4 281 */ sll %g1,2,%g2 1775/* 0x09b8 */ ld [%o3+%g2],%g2 1776/* 0x09bc */ cmp %g2,0 1777/* 0x09c0 */ bleu,pn %icc,.L77000241 1778/* 0x09c4 */ or %g0,-1,%o5 1779/* 0x09c8 */ ba .L900000647 1780/* 0x09cc */ cmp %o5,0 1781 .L77000241: 1782/* 0x09d0 */ subcc %g1,1,%o5 1783/* 0x09d4 */ bneg,pt %icc,.L900000647 1784/* 0x09d8 */ cmp %o5,0 1785/* 0x09dc */ sll %o5,2,%g2 1786/* 0x09e0 */ add %o1,%g2,%o0 1787/* 0x09e4 */ add %o3,%g2,%o4 1788/* 0x09e8 */ ld [%o0],%g2 1789 .L900000646: 1790/* 0x09ec */ ld [%o4],%g3 1791/* 0x09f0 */ sub %o0,4,%o0 1792/* 0x09f4 */ sub %o4,4,%o4 1793/* 0x09f8 */ cmp %g3,%g2 1794/* 0x09fc */ bne,pn %icc,.L77000244 1795/* 0x0a00 */ nop 1796/* 0x0a04 */ subcc %o5,1,%o5 1797/* 0x0a08 */ bpos,a,pt %icc,.L900000646 1798/* 0x0a0c */ ld [%o0],%g2 1799 .L77000244: 1800/* 0x0a10 */ cmp %o5,0 1801 .L900000647: 1802/* 0x0a14 */ bl,pn %icc,.L77000287 1803/* 0x0a18 */ sll %o5,2,%g2 1804/* 0x0a1c */ ld [%o1+%g2],%g3 1805/* 0x0a20 */ ld [%o3+%g2],%g2 1806/* 0x0a24 */ cmp %g2,%g3 1807/* 0x0a28 */ bleu,pt %icc,.L77000224 1808/* 0x0a2c */ nop 1809 .L77000287: 1810/* 0x0a30 */ cmp %g1,0 1811/* 0x0a34 */ ble,pt %icc,.L77000224 1812/* 0x0a38 */ nop 1813/* 0x0a3c 281 */ sub %g1,1,%o7 1814/* 0x0a40 */ or %g0,-1,%g2 1815/* 0x0a44 */ srl %g2,0,%o4 1816/* 0x0a48 */ add %o7,1,%o0 1817/* 0x0a4c */ or %g0,%o1,%o2 1818/* 0x0a50 279 */ or %g0,0,%o5 1819/* 0x0a54 */ or %g0,0,%g1 1820/* 0x0a58 */ cmp %o0,3 1821/* 0x0a5c */ add %o1,4,%o0 1822/* 0x0a60 */ bl,pn %icc,.L77000288 1823/* 0x0a64 */ add %o3,8,%o1 1824/* 0x0a68 */ ld [%o0-4],%g3 1825/* 0x0a6c 0 */ or %g0,%o1,%o3 1826/* 0x0a70 */ or %g0,%o0,%o2 1827/* 0x0a74 279 */ ld [%o1-8],%g2 1828/* 0x0a78 */ or %g0,2,%g1 1829/* 0x0a7c */ ld [%o3-4],%o0 1830/* 0x0a80 */ sub %g2,%g3,%g2 1831/* 0x0a84 */ or %g0,%g2,%o5 1832/* 0x0a88 */ and %g2,%o4,%g2 1833/* 0x0a8c */ st %g2,[%o3-8] 1834/* 0x0a90 */ srax %o5,32,%o5 1835 .L900000636: 1836/* 0x0a94 */ ld [%o2],%g2 1837/* 0x0a98 */ add %g1,1,%g1 1838/* 0x0a9c */ add %o2,4,%o2 1839/* 0x0aa0 */ cmp %g1,%o7 1840/* 0x0aa4 */ add %o3,4,%o3 1841/* 0x0aa8 */ sub %o0,%g2,%o0 1842/* 0x0aac */ add %o0,%o5,%o5 1843/* 0x0ab0 */ and %o5,%o4,%g2 1844/* 0x0ab4 */ ld [%o3-4],%o0 1845/* 0x0ab8 */ st %g2,[%o3-8] 1846/* 0x0abc */ ble,pt %icc,.L900000636 1847/* 0x0ac0 */ srax %o5,32,%o5 1848 .L900000639: 1849/* 0x0ac4 */ ld [%o2],%o1 1850/* 0x0ac8 */ sub %o0,%o1,%o0 1851/* 0x0acc */ add %o0,%o5,%o0 1852/* 0x0ad0 */ and %o0,%o4,%o1 1853/* 0x0ad4 */ st %o1,[%o3-4] 1854/* 0x0ad8 */ ret ! Result = 1855/* 0x0adc */ restore %g0,%g0,%g0 1856 .L77000288: 1857/* 0x0ae0 */ ld [%o3],%o0 1858 .L900000645: 1859/* 0x0ae4 */ ld [%o2],%o1 1860/* 0x0ae8 */ add %o5,%o0,%o0 1861/* 0x0aec */ add %g1,1,%g1 1862/* 0x0af0 */ add %o2,4,%o2 1863/* 0x0af4 */ cmp %g1,%o7 1864/* 0x0af8 */ sub %o0,%o1,%o0 1865/* 0x0afc */ and %o0,%o4,%o1 1866/* 0x0b00 */ st %o1,[%o3] 1867/* 0x0b04 */ add %o3,4,%o3 1868/* 0x0b08 */ srax %o0,32,%o5 1869/* 0x0b0c */ ble,a,pt %icc,.L900000645 1870/* 0x0b10 */ ld [%o3],%o0 1871 .L77000224: 1872/* 0x0b14 */ ret ! Result = 1873/* 0x0b18 */ restore %g0,%g0,%g0 1874/* 0x0b1c 0 */ .type mont_mulf_noconv,2 1875/* 0x0b1c */ .size mont_mulf_noconv,(.-mont_mulf_noconv) 1876 1877! Begin Disassembling Stabs 1878 .xstabs ".stab.index","Xa ; O ; P ; V=3.1 ; R=WorkShop Compilers 5.0 99/02/25 C 5.0 patch 107289-01",60,0,0,0 ! (/tmp/acompAAAhNaOly:1) 1879 .xstabs ".stab.index","/home/ferenc/venus/userland/rsa; /usr/dist/pkgs/devpro,v5.0/5.x-sparc/SC5.0/bin/cc -fast -xarch=v8plus -xO5 -xstrconst -xdepend -Xa -xchip=ultra2 -KPIC -Wc,-Qrm-Qd -Wc,-Qrm-Qf -Wc,-assembly -V -c proba.il -o mont_mulf.o mont_mulf.c -W0,-xp",52,0,0,0 ! (/tmp/acompAAAhNaOly:2) 1880! End Disassembling Stabs 1881 1882! Begin Disassembling Ident 1883 .ident "cg: WorkShop Compilers 5.0 99/04/15 Compiler Common 5.0 Patch 107357-02" ! (NO SOURCE LINE) 1884 .ident "acomp: WorkShop Compilers 5.0 99/02/25 C 5.0 patch 107289-01" ! (/tmp/acompAAAhNaOly:31) 1885! End Disassembling Ident 1886