Lines Matching refs:L

47 #define L(s) .memcpy/**/s  macro
103 jbe L(CopyForward) # then do copy forward
107 jb L(CopyBackwards) # then do copy backwards
108 jmp L(CopyForward)
111 L(CopyForward):
116 lea L(fwdPxQx)(%rip),%r11
118 jg L(ck_use_sse2)
127 L(ShrtAlignNew):
128 lea L(AliPxQx)(%rip),%r11
137 L(fwdPxQx): .int L(P0Q0)-L(fwdPxQx)
138 .int L(P1Q0)-L(fwdPxQx)
139 .int L(P2Q0)-L(fwdPxQx)
140 .int L(P3Q0)-L(fwdPxQx)
141 .int L(P4Q0)-L(fwdPxQx)
142 .int L(P5Q0)-L(fwdPxQx)
143 .int L(P6Q0)-L(fwdPxQx)
144 .int L(P7Q0)-L(fwdPxQx)
146 .int L(P0Q1)-L(fwdPxQx)
147 .int L(P1Q1)-L(fwdPxQx)
148 .int L(P2Q1)-L(fwdPxQx)
149 .int L(P3Q1)-L(fwdPxQx)
150 .int L(P4Q1)-L(fwdPxQx)
151 .int L(P5Q1)-L(fwdPxQx)
152 .int L(P6Q1)-L(fwdPxQx)
153 .int L(P7Q1)-L(fwdPxQx)
155 .int L(P0Q2)-L(fwdPxQx)
156 .int L(P1Q2)-L(fwdPxQx)
157 .int L(P2Q2)-L(fwdPxQx)
158 .int L(P3Q2)-L(fwdPxQx)
159 .int L(P4Q2)-L(fwdPxQx)
160 .int L(P5Q2)-L(fwdPxQx)
161 .int L(P6Q2)-L(fwdPxQx)
162 .int L(P7Q2)-L(fwdPxQx)
164 .int L(P0Q3)-L(fwdPxQx)
165 .int L(P1Q3)-L(fwdPxQx)
166 .int L(P2Q3)-L(fwdPxQx)
167 .int L(P3Q3)-L(fwdPxQx)
168 .int L(P4Q3)-L(fwdPxQx)
169 .int L(P5Q3)-L(fwdPxQx)
170 .int L(P6Q3)-L(fwdPxQx)
171 .int L(P7Q3)-L(fwdPxQx)
173 .int L(P0Q4)-L(fwdPxQx)
174 .int L(P1Q4)-L(fwdPxQx)
175 .int L(P2Q4)-L(fwdPxQx)
176 .int L(P3Q4)-L(fwdPxQx)
177 .int L(P4Q4)-L(fwdPxQx)
178 .int L(P5Q4)-L(fwdPxQx)
179 .int L(P6Q4)-L(fwdPxQx)
180 .int L(P7Q4)-L(fwdPxQx)
182 .int L(P0Q5)-L(fwdPxQx)
183 .int L(P1Q5)-L(fwdPxQx)
184 .int L(P2Q5)-L(fwdPxQx)
185 .int L(P3Q5)-L(fwdPxQx)
186 .int L(P4Q5)-L(fwdPxQx)
187 .int L(P5Q5)-L(fwdPxQx)
188 .int L(P6Q5)-L(fwdPxQx)
189 .int L(P7Q5)-L(fwdPxQx)
191 .int L(P0Q6)-L(fwdPxQx)
192 .int L(P1Q6)-L(fwdPxQx)
193 .int L(P2Q6)-L(fwdPxQx)
194 .int L(P3Q6)-L(fwdPxQx)
195 .int L(P4Q6)-L(fwdPxQx)
196 .int L(P5Q6)-L(fwdPxQx)
197 .int L(P6Q6)-L(fwdPxQx)
198 .int L(P7Q6)-L(fwdPxQx)
200 .int L(P0Q7)-L(fwdPxQx)
201 .int L(P1Q7)-L(fwdPxQx)
202 .int L(P2Q7)-L(fwdPxQx)
203 .int L(P3Q7)-L(fwdPxQx)
204 .int L(P4Q7)-L(fwdPxQx)
205 .int L(P5Q7)-L(fwdPxQx)
206 .int L(P6Q7)-L(fwdPxQx)
207 .int L(P7Q7)-L(fwdPxQx)
209 .int L(P0Q8)-L(fwdPxQx)
210 .int L(P1Q8)-L(fwdPxQx)
211 .int L(P2Q8)-L(fwdPxQx)
212 .int L(P3Q8)-L(fwdPxQx)
213 .int L(P4Q8)-L(fwdPxQx)
214 .int L(P5Q8)-L(fwdPxQx)
215 .int L(P6Q8)-L(fwdPxQx)
216 .int L(P7Q8)-L(fwdPxQx)
218 .int L(P0Q9)-L(fwdPxQx)
219 .int L(P1Q9)-L(fwdPxQx)
220 .int L(P2Q9)-L(fwdPxQx)
221 .int L(P3Q9)-L(fwdPxQx)
222 .int L(P4Q9)-L(fwdPxQx)
223 .int L(P5Q9)-L(fwdPxQx)
224 .int L(P6Q9)-L(fwdPxQx)
225 .int L(P7Q9)-L(fwdPxQx)
227 .int L(P0QA)-L(fwdPxQx)
228 .int L(P1QA)-L(fwdPxQx)
229 .int L(P2QA)-L(fwdPxQx)
230 .int L(P3QA)-L(fwdPxQx)
231 .int L(P4QA)-L(fwdPxQx)
232 .int L(P5QA)-L(fwdPxQx)
233 .int L(P6QA)-L(fwdPxQx)
234 .int L(P7QA)-L(fwdPxQx)
236 .int L(P0QB)-L(fwdPxQx)
237 .int L(P1QB)-L(fwdPxQx)
238 .int L(P2QB)-L(fwdPxQx)
239 .int L(P3QB)-L(fwdPxQx)
240 .int L(P4QB)-L(fwdPxQx)
241 .int L(P5QB)-L(fwdPxQx)
242 .int L(P6QB)-L(fwdPxQx)
243 .int L(P7QB)-L(fwdPxQx)
245 .int L(P0QC)-L(fwdPxQx)
246 .int L(P1QC)-L(fwdPxQx)
247 .int L(P2QC)-L(fwdPxQx)
248 .int L(P3QC)-L(fwdPxQx)
249 .int L(P4QC)-L(fwdPxQx)
250 .int L(P5QC)-L(fwdPxQx)
251 .int L(P6QC)-L(fwdPxQx)
252 .int L(P7QC)-L(fwdPxQx)
254 .int L(P0QD)-L(fwdPxQx)
255 .int L(P1QD)-L(fwdPxQx)
256 .int L(P2QD)-L(fwdPxQx)
257 .int L(P3QD)-L(fwdPxQx)
258 .int L(P4QD)-L(fwdPxQx)
259 .int L(P5QD)-L(fwdPxQx)
260 .int L(P6QD)-L(fwdPxQx)
261 .int L(P7QD)-L(fwdPxQx)
263 .int L(P0QE)-L(fwdPxQx)
264 .int L(P1QE)-L(fwdPxQx)
265 .int L(P2QE)-L(fwdPxQx)
266 .int L(P3QE)-L(fwdPxQx)
267 .int L(P4QE)-L(fwdPxQx)
268 .int L(P5QE)-L(fwdPxQx)
269 .int L(P6QE)-L(fwdPxQx)
270 .int L(P7QE)-L(fwdPxQx)
272 .int L(P0QF)-L(fwdPxQx)
273 .int L(P1QF)-L(fwdPxQx)
274 .int L(P2QF)-L(fwdPxQx)
275 .int L(P3QF)-L(fwdPxQx)
276 .int L(P4QF)-L(fwdPxQx)
277 .int L(P5QF)-L(fwdPxQx)
278 .int L(P6QF)-L(fwdPxQx)
279 .int L(P7QF)-L(fwdPxQx)
281 .int L(P0QG)-L(fwdPxQx) # 0x80
284 L(AliPxQx): .int L(now_qw_aligned)-L(AliPxQx)
285 .int L(A1Q0)-L(AliPxQx)
286 .int L(A2Q0)-L(AliPxQx)
287 .int L(A3Q0)-L(AliPxQx)
288 .int L(A4Q0)-L(AliPxQx)
289 .int L(A5Q0)-L(AliPxQx)
290 .int L(A6Q0)-L(AliPxQx)
291 .int L(A7Q0)-L(AliPxQx)
292 .int L(A0Q1)-L(AliPxQx)
293 .int L(A1Q1)-L(AliPxQx)
294 .int L(A2Q1)-L(AliPxQx)
295 .int L(A3Q1)-L(AliPxQx)
296 .int L(A4Q1)-L(AliPxQx)
297 .int L(A5Q1)-L(AliPxQx)
298 .int L(A6Q1)-L(AliPxQx)
299 .int L(A7Q1)-L(AliPxQx)
302 L(A1Q0): # ; need to move 8+ 7=1+2+4 bytes
318 jmp L(now_qw_aligned)
321 L(A2Q0): # ; need to move 8+ 6=2+4 bytes
333 jmp L(now_qw_aligned)
336 L(A3Q0): # ; need to move 8+ 5=1+4 bytes
349 jmp L(now_qw_aligned)
352 L(A4Q0): # ; need to move 8+4 bytes
362 jmp L(now_qw_aligned)
365 L(A5Q0): # ; need to move 8+ 3=1+2 bytes
378 jmp L(now_qw_aligned)
381 L(A6Q0): # ; need to move 8+2 bytes
391 jmp L(now_qw_aligned)
394 L(A7Q0): # ; need to move 8+1 byte
404 jmp L(now_qw_aligned)
407 L(A0Q1): # ; need to move 8 bytes
415 jmp L(now_qw_aligned)
418 L(A1Q1): # ; need to move 7=1+2+4 bytes
430 jmp L(now_qw_aligned)
433 L(A2Q1): # ; need to move 6=2+4 bytes
441 jmp L(now_qw_aligned)
444 L(A3Q1): # ; need to move 5=1+4 bytes
452 jmp L(now_qw_aligned)
455 L(A4Q1): # ; need to move 4 bytes
461 jmp L(now_qw_aligned)
464 L(A5Q1): # ; need to move 3=1+2 bytes
474 jmp L(now_qw_aligned)
477 L(A6Q1): # ; need to move 2 bytes
483 jmp L(now_qw_aligned)
486 L(A7Q1): # ; need to move 1 byte
492 jmp L(now_qw_aligned)
496 L(P0QG):
499 L(P0QF):
502 L(P0QE):
505 L(P0QD):
508 L(P0QC):
511 L(P0QB):
514 L(P0QA):
517 L(P0Q9):
520 L(P0Q8):
523 L(P0Q7):
526 L(P0Q6):
529 L(P0Q5):
532 L(P0Q4):
535 L(P0Q3):
538 L(P0Q2):
541 L(P0Q1):
544 L(P0Q0):
548 L(P1QF):
551 L(P1QE):
554 L(P1QD):
557 L(P1QC):
560 L(P1QB):
563 L(P1QA):
566 L(P1Q9):
569 L(P1Q8):
572 L(P1Q7):
575 L(P1Q6):
578 L(P1Q5):
581 L(P1Q4):
584 L(P1Q3):
587 L(P1Q2):
590 L(P1Q1):
593 L(P1Q0):
599 L(P2QF):
602 L(P2QE):
605 L(P2QD):
608 L(P2QC):
611 L(P2QB):
614 L(P2QA):
617 L(P2Q9):
620 L(P2Q8):
623 L(P2Q7):
626 L(P2Q6):
629 L(P2Q5):
632 L(P2Q4):
635 L(P2Q3):
638 L(P2Q2):
641 L(P2Q1):
644 L(P2Q0):
650 L(P3QF):
653 L(P3QE):
656 L(P3QD):
659 L(P3QC):
662 L(P3QB):
665 L(P3QA):
668 L(P3Q9):
671 L(P3Q8):
674 L(P3Q7):
677 L(P3Q6):
680 L(P3Q5):
683 L(P3Q4):
686 L(P3Q3):
689 L(P3Q2):
692 L(P3Q1):
699 L(P3Q0):
707 L(P4QF):
710 L(P4QE):
713 L(P4QD):
716 L(P4QC):
719 L(P4QB):
722 L(P4QA):
725 L(P4Q9):
728 L(P4Q8):
731 L(P4Q7):
734 L(P4Q6):
737 L(P4Q5):
740 L(P4Q4):
743 L(P4Q3):
746 L(P4Q2):
749 L(P4Q1):
752 L(P4Q0):
758 L(P5QF):
761 L(P5QE):
764 L(P5QD):
767 L(P5QC):
770 L(P5QB):
773 L(P5QA):
776 L(P5Q9):
779 L(P5Q8):
782 L(P5Q7):
785 L(P5Q6):
788 L(P5Q5):
791 L(P5Q4):
794 L(P5Q3):
797 L(P5Q2):
800 L(P5Q1):
807 L(P5Q0):
815 L(P6QF):
818 L(P6QE):
821 L(P6QD):
824 L(P6QC):
827 L(P6QB):
830 L(P6QA):
833 L(P6Q9):
836 L(P6Q8):
839 L(P6Q7):
842 L(P6Q6):
845 L(P6Q5):
848 L(P6Q4):
851 L(P6Q3):
854 L(P6Q2):
857 L(P6Q1):
864 L(P6Q0):
872 L(P7QF):
875 L(P7QE):
878 L(P7QD):
881 L(P7QC):
884 L(P7QB):
887 L(P7QA):
890 L(P7Q9):
893 L(P7Q8):
896 L(P7Q7):
899 L(P7Q6):
902 L(P7Q5):
905 L(P7Q4):
908 L(P7Q3):
911 L(P7Q2):
914 L(P7Q1):
921 L(P7Q0):
931 L(ck_use_sse2):
936 jnz L(ShrtAlignNew)
938 L(now_qw_aligned):
940 je L(Loop8byte_pre)
953 jg L(sse2_nt_move)
960 jz L(pre_both_aligned)
962 lea L(SSE_src)(%rip),%r10 # SSE2 (default)
965 lea L(SSSE3_src)(%rip),%r10 # SSSE3
986 L(SSSE3_src): .int L(pre_both_aligned)-L(SSSE3_src)
987 .int L(mov3dqa1) -L(SSSE3_src)
988 .int L(mov3dqa2) -L(SSSE3_src)
989 .int L(mov3dqa3) -L(SSSE3_src)
990 .int L(mov3dqa4) -L(SSSE3_src)
991 .int L(mov3dqa5) -L(SSSE3_src)
992 .int L(mov3dqa6) -L(SSSE3_src)
993 .int L(mov3dqa7) -L(SSSE3_src)
994 .int L(movdqa8) -L(SSSE3_src)
995 .int L(mov3dqa9) -L(SSSE3_src)
996 .int L(mov3dqa10)-L(SSSE3_src)
997 .int L(mov3dqa11)-L(SSSE3_src)
998 .int L(mov3dqa12)-L(SSSE3_src)
999 .int L(mov3dqa13)-L(SSSE3_src)
1000 .int L(mov3dqa14)-L(SSSE3_src)
1001 .int L(mov3dqa15)-L(SSSE3_src)
1002 L(SSE_src): .int L(pre_both_aligned)-L(SSE_src)
1003 .int L(movdqa1) -L(SSE_src)
1004 .int L(movdqa2) -L(SSE_src)
1005 .int L(movdqa3) -L(SSE_src)
1006 .int L(movdqa4) -L(SSE_src)
1007 .int L(movdqa5) -L(SSE_src)
1008 .int L(movdqa6) -L(SSE_src)
1009 .int L(movdqa7) -L(SSE_src)
1010 .int L(movdqa8) -L(SSE_src)
1011 .int L(movdqa9) -L(SSE_src)
1012 .int L(movdqa10)-L(SSE_src)
1013 .int L(movdqa11)-L(SSE_src)
1014 .int L(movdqa12)-L(SSE_src)
1015 .int L(movdqa13)-L(SSE_src)
1016 .int L(movdqa14)-L(SSE_src)
1017 .int L(movdqa15)-L(SSE_src)
1020 L(movdqa1):
1040 jge L(movdqa1)
1041 jmp L(movdqa_epi)
1044 L(movdqa2):
1064 jge L(movdqa2)
1065 jmp L(movdqa_epi)
1068 L(movdqa3):
1088 jge L(movdqa3)
1089 jmp L(movdqa_epi)
1092 L(movdqa4):
1113 jge L(movdqa4)
1114 jmp L(movdqa_epi)
1117 L(movdqa5):
1138 jge L(movdqa5)
1139 jmp L(movdqa_epi)
1142 L(movdqa6):
1162 jge L(movdqa6)
1163 jmp L(movdqa_epi)
1166 L(movdqa7):
1186 jge L(movdqa7)
1187 jmp L(movdqa_epi)
1190 L(movdqa8):
1211 jge L(movdqa8)
1212 jmp L(movdqa_epi)
1215 L(movdqa9):
1235 jge L(movdqa9)
1236 jmp L(movdqa_epi)
1239 L(movdqa10):
1259 jge L(movdqa10)
1260 jmp L(movdqa_epi)
1263 L(movdqa11):
1283 jge L(movdqa11)
1284 jmp L(movdqa_epi)
1287 L(movdqa12):
1307 jge L(movdqa12)
1308 jmp L(movdqa_epi)
1311 L(movdqa13):
1331 jge L(movdqa13)
1332 jmp L(movdqa_epi)
1335 L(movdqa14):
1355 jge L(movdqa14)
1356 jmp L(movdqa_epi)
1359 L(movdqa15):
1379 jge L(movdqa15)
1380 #jmp L(movdqa_epi)
1383 L(movdqa_epi):
1384 lea L(fwdPxQx)(%rip),%r10
1394 L(mov3dqa1):
1421 jge L(mov3dqa1)
1424 jl L(movdqa_epi)
1436 jl L(movdqa_epi)
1446 jmp L(movdqa_epi)
1449 L(mov3dqa2):
1476 jge L(mov3dqa2)
1479 jl L(movdqa_epi)
1491 jl L(movdqa_epi)
1501 jmp L(movdqa_epi)
1504 L(mov3dqa3):
1531 jge L(mov3dqa3)
1534 jl L(movdqa_epi)
1546 jl L(movdqa_epi)
1556 jmp L(movdqa_epi)
1559 L(mov3dqa4):
1586 jge L(mov3dqa4)
1589 jl L(movdqa_epi)
1601 jl L(movdqa_epi)
1611 jmp L(movdqa_epi)
1614 L(mov3dqa5):
1641 jge L(mov3dqa5)
1644 jl L(movdqa_epi)
1656 jl L(movdqa_epi)
1666 jmp L(movdqa_epi)
1669 L(mov3dqa6):
1696 jge L(mov3dqa6)
1699 jl L(movdqa_epi)
1711 jl L(movdqa_epi)
1721 jmp L(movdqa_epi)
1724 L(mov3dqa7):
1751 jge L(mov3dqa7)
1754 jl L(movdqa_epi)
1766 jl L(movdqa_epi)
1776 jmp L(movdqa_epi)
1779 L(mov3dqa9):
1806 jge L(mov3dqa9)
1809 jl L(movdqa_epi)
1821 jl L(movdqa_epi)
1831 jmp L(movdqa_epi)
1834 L(mov3dqa10):
1861 jge L(mov3dqa10)
1864 jl L(movdqa_epi)
1876 jl L(movdqa_epi)
1886 jmp L(movdqa_epi)
1889 L(mov3dqa11):
1916 jge L(mov3dqa11)
1919 jl L(movdqa_epi)
1931 jl L(movdqa_epi)
1941 jmp L(movdqa_epi)
1944 L(mov3dqa12):
1971 jge L(mov3dqa12)
1974 jl L(movdqa_epi)
1986 jl L(movdqa_epi)
1996 jmp L(movdqa_epi)
1999 L(mov3dqa13):
2026 jge L(mov3dqa13)
2029 jl L(movdqa_epi)
2041 jl L(movdqa_epi)
2051 jmp L(movdqa_epi)
2054 L(mov3dqa14):
2081 jge L(mov3dqa14)
2084 jl L(movdqa_epi)
2096 jl L(movdqa_epi)
2106 jmp L(movdqa_epi)
2109 L(mov3dqa15):
2136 jge L(mov3dqa15)
2139 jl L(movdqa_epi)
2151 jl L(movdqa_epi)
2161 jmp L(movdqa_epi)
2164 L(sse2_nt_move):
2187 jge L(sse2_nt_move)
2189 lea L(Fix16EndTable)(%rip),%r10
2203 L(Fix16EndTable):
2204 .int L(fix16_0)-L(Fix16EndTable)
2205 .int L(fix16_1)-L(Fix16EndTable)
2206 .int L(fix16_2)-L(Fix16EndTable)
2207 .int L(fix16_3)-L(Fix16EndTable)
2210 L(fix16_3):
2213 L(fix16_2):
2216 L(fix16_1):
2219 L(fix16_0):
2220 lea L(fwdPxQx)(%rip),%r10
2229 L(pre_both_aligned):
2231 jl L(fix_16b)
2234 L(both_aligned):
2265 jge L(both_aligned)
2267 L(fix_16b):
2269 lea L(fwdPxQx)(%rip),%r10
2277 L(Loop8byte_pre):
2282 jge L(byte8_nt_top)
2285 jle L(byte8_top)
2288 jle L(use_rep)
2291 L(byte8_top):
2313 jg L(byte8_top)
2315 L(byte8_end):
2316 lea L(fwdPxQx)(%rip),%r10
2325 L(use_rep):
2335 jnz L(byte8_end)
2339 L(byte8_nt_top):
2362 jge L(byte8_nt_top)
2364 jmp L(byte8_end)
2369 L(CopyBackwards):
2379 jne L(bk_align)
2381 L(bk_qw_aligned):
2382 lea L(bkPxQx)(%rip),%r10
2385 jg L(bk_ck_sse2_alignment)
2395 L(bk_align):
2398 jle L(bk_qw_aligned)
2400 je L(bk_tst2)
2407 L(bk_tst2):
2409 je L(bk_tst3)
2411 L(bk_got2):
2418 L(bk_tst3):
2420 je L(bk_qw_aligned)
2422 L(bk_got3):
2428 jmp L(bk_qw_aligned)
2431 L(bk_ck_sse2_alignment):
2433 je L(bk_use_rep)
2436 jz L(bk_sse2_cpy)
2438 L(bk_sse2_align):
2445 #jmp L(bk_sse2_cpy)
2448 L(bk_sse2_cpy):
2470 jge L(bk_sse2_cpy)
2472 L(bk_sse2_cpy_end):
2473 lea L(bkPxQx)(%rip),%r10
2481 L(bk_use_rep):
2495 lea L(bkPxQx)(%rip),%r10
2507 L(bkP0QI):
2510 L(bkP0QH):
2513 L(bkP0QG):
2516 L(bkP0QF):
2519 L(bkP0QE):
2522 L(bkP0QD):
2525 L(bkP0QC):
2528 L(bkP0QB):
2531 L(bkP0QA):
2534 L(bkP0Q9):
2537 L(bkP0Q8):
2540 L(bkP0Q7):
2543 L(bkP0Q6):
2546 L(bkP0Q5):
2549 L(bkP0Q4):
2552 L(bkP0Q3):
2555 L(bkP0Q2):
2558 L(bkP0Q1):
2561 L(bkP0Q0):
2565 L(bkP1QI):
2568 L(bkP1QH):
2571 L(bkP1QG):
2574 L(bkP1QF):
2577 L(bkP1QE):
2580 L(bkP1QD):
2583 L(bkP1QC):
2586 L(bkP1QB):
2589 L(bkP1QA):
2592 L(bkP1Q9):
2595 L(bkP1Q8):
2598 L(bkP1Q7):
2601 L(bkP1Q6):
2604 L(bkP1Q5):
2607 L(bkP1Q4):
2610 L(bkP1Q3):
2613 L(bkP1Q2):
2616 L(bkP1Q1):
2619 L(bkP1Q0):
2625 L(bkP2QI):
2628 L(bkP2QH):
2631 L(bkP2QG):
2634 L(bkP2QF):
2637 L(bkP2QE):
2640 L(bkP2QD):
2643 L(bkP2QC):
2646 L(bkP2QB):
2649 L(bkP2QA):
2652 L(bkP2Q9):
2655 L(bkP2Q8):
2658 L(bkP2Q7):
2661 L(bkP2Q6):
2664 L(bkP2Q5):
2667 L(bkP2Q4):
2670 L(bkP2Q3):
2673 L(bkP2Q2):
2676 L(bkP2Q1):
2679 L(bkP2Q0):
2685 L(bkP3QI):
2688 L(bkP3QH):
2691 L(bkP3QG):
2694 L(bkP3QF):
2697 L(bkP3QE):
2700 L(bkP3QD):
2703 L(bkP3QC):
2706 L(bkP3QB):
2709 L(bkP3QA):
2712 L(bkP3Q9):
2715 L(bkP3Q8):
2718 L(bkP3Q7):
2721 L(bkP3Q6):
2724 L(bkP3Q5):
2727 L(bkP3Q4):
2730 L(bkP3Q3):
2733 L(bkP3Q2):
2736 L(bkP3Q1):
2739 L(bkP3Q0): # trailing loads/stores do all their loads 1st, then do the stores
2747 L(bkP4QI):
2750 L(bkP4QH):
2753 L(bkP4QG):
2756 L(bkP4QF):
2759 L(bkP4QE):
2762 L(bkP4QD):
2765 L(bkP4QC):
2768 L(bkP4QB):
2771 L(bkP4QA):
2774 L(bkP4Q9):
2777 L(bkP4Q8):
2780 L(bkP4Q7):
2783 L(bkP4Q6):
2786 L(bkP4Q5):
2789 L(bkP4Q4):
2792 L(bkP4Q3):
2795 L(bkP4Q2):
2798 L(bkP4Q1):
2801 L(bkP4Q0):
2807 L(bkP5QI):
2810 L(bkP5QH):
2813 L(bkP5QG):
2816 L(bkP5QF):
2819 L(bkP5QE):
2822 L(bkP5QD):
2825 L(bkP5QC):
2828 L(bkP5QB):
2831 L(bkP5QA):
2834 L(bkP5Q9):
2837 L(bkP5Q8):
2840 L(bkP5Q7):
2843 L(bkP5Q6):
2846 L(bkP5Q5):
2849 L(bkP5Q4):
2852 L(bkP5Q3):
2855 L(bkP5Q2):
2858 L(bkP5Q1):
2861 L(bkP5Q0): # trailing loads/stores do all their loads 1st, then do the stores
2869 L(bkP6QI):
2872 L(bkP6QH):
2875 L(bkP6QG):
2878 L(bkP6QF):
2881 L(bkP6QE):
2884 L(bkP6QD):
2887 L(bkP6QC):
2890 L(bkP6QB):
2893 L(bkP6QA):
2896 L(bkP6Q9):
2899 L(bkP6Q8):
2902 L(bkP6Q7):
2905 L(bkP6Q6):
2908 L(bkP6Q5):
2911 L(bkP6Q4):
2914 L(bkP6Q3):
2917 L(bkP6Q2):
2920 L(bkP6Q1):
2923 L(bkP6Q0): # trailing loads/stores do all their loads 1st, then do the stores
2931 L(bkP7QI):
2934 L(bkP7QH):
2937 L(bkP7QG):
2940 L(bkP7QF):
2943 L(bkP7QE):
2946 L(bkP7QD):
2949 L(bkP7QC):
2952 L(bkP7QB):
2955 L(bkP7QA):
2958 L(bkP7Q9):
2961 L(bkP7Q8):
2964 L(bkP7Q7):
2967 L(bkP7Q6):
2970 L(bkP7Q5):
2973 L(bkP7Q4):
2976 L(bkP7Q3):
2979 L(bkP7Q2):
2982 L(bkP7Q1):
2985 L(bkP7Q0): # trailing loads/stores do all their loads 1st, then do the stores
2995 L(bkPxQx): .int L(bkP0Q0)-L(bkPxQx)
2996 .int L(bkP1Q0)-L(bkPxQx)
2997 .int L(bkP2Q0)-L(bkPxQx)
2998 .int L(bkP3Q0)-L(bkPxQx)
2999 .int L(bkP4Q0)-L(bkPxQx)
3000 .int L(bkP5Q0)-L(bkPxQx)
3001 .int L(bkP6Q0)-L(bkPxQx)
3002 .int L(bkP7Q0)-L(bkPxQx)
3004 .int L(bkP0Q1)-L(bkPxQx)
3005 .int L(bkP1Q1)-L(bkPxQx)
3006 .int L(bkP2Q1)-L(bkPxQx)
3007 .int L(bkP3Q1)-L(bkPxQx)
3008 .int L(bkP4Q1)-L(bkPxQx)
3009 .int L(bkP5Q1)-L(bkPxQx)
3010 .int L(bkP6Q1)-L(bkPxQx)
3011 .int L(bkP7Q1)-L(bkPxQx)
3013 .int L(bkP0Q2)-L(bkPxQx)
3014 .int L(bkP1Q2)-L(bkPxQx)
3015 .int L(bkP2Q2)-L(bkPxQx)
3016 .int L(bkP3Q2)-L(bkPxQx)
3017 .int L(bkP4Q2)-L(bkPxQx)
3018 .int L(bkP5Q2)-L(bkPxQx)
3019 .int L(bkP6Q2)-L(bkPxQx)
3020 .int L(bkP7Q2)-L(bkPxQx)
3022 .int L(bkP0Q3)-L(bkPxQx)
3023 .int L(bkP1Q3)-L(bkPxQx)
3024 .int L(bkP2Q3)-L(bkPxQx)
3025 .int L(bkP3Q3)-L(bkPxQx)
3026 .int L(bkP4Q3)-L(bkPxQx)
3027 .int L(bkP5Q3)-L(bkPxQx)
3028 .int L(bkP6Q3)-L(bkPxQx)
3029 .int L(bkP7Q3)-L(bkPxQx)
3031 .int L(bkP0Q4)-L(bkPxQx)
3032 .int L(bkP1Q4)-L(bkPxQx)
3033 .int L(bkP2Q4)-L(bkPxQx)
3034 .int L(bkP3Q4)-L(bkPxQx)
3035 .int L(bkP4Q4)-L(bkPxQx)
3036 .int L(bkP5Q4)-L(bkPxQx)
3037 .int L(bkP6Q4)-L(bkPxQx)
3038 .int L(bkP7Q4)-L(bkPxQx)
3040 .int L(bkP0Q5)-L(bkPxQx)
3041 .int L(bkP1Q5)-L(bkPxQx)
3042 .int L(bkP2Q5)-L(bkPxQx)
3043 .int L(bkP3Q5)-L(bkPxQx)
3044 .int L(bkP4Q5)-L(bkPxQx)
3045 .int L(bkP5Q5)-L(bkPxQx)
3046 .int L(bkP6Q5)-L(bkPxQx)
3047 .int L(bkP7Q5)-L(bkPxQx)
3049 .int L(bkP0Q6)-L(bkPxQx)
3050 .int L(bkP1Q6)-L(bkPxQx)
3051 .int L(bkP2Q6)-L(bkPxQx)
3052 .int L(bkP3Q6)-L(bkPxQx)
3053 .int L(bkP4Q6)-L(bkPxQx)
3054 .int L(bkP5Q6)-L(bkPxQx)
3055 .int L(bkP6Q6)-L(bkPxQx)
3056 .int L(bkP7Q6)-L(bkPxQx)
3058 .int L(bkP0Q7)-L(bkPxQx)
3059 .int L(bkP1Q7)-L(bkPxQx)
3060 .int L(bkP2Q7)-L(bkPxQx)
3061 .int L(bkP3Q7)-L(bkPxQx)
3062 .int L(bkP4Q7)-L(bkPxQx)
3063 .int L(bkP5Q7)-L(bkPxQx)
3064 .int L(bkP6Q7)-L(bkPxQx)
3065 .int L(bkP7Q7)-L(bkPxQx)
3067 .int L(bkP0Q8)-L(bkPxQx)
3068 .int L(bkP1Q8)-L(bkPxQx)
3069 .int L(bkP2Q8)-L(bkPxQx)
3070 .int L(bkP3Q8)-L(bkPxQx)
3071 .int L(bkP4Q8)-L(bkPxQx)
3072 .int L(bkP5Q8)-L(bkPxQx)
3073 .int L(bkP6Q8)-L(bkPxQx)
3074 .int L(bkP7Q8)-L(bkPxQx)
3076 .int L(bkP0Q9)-L(bkPxQx)
3077 .int L(bkP1Q9)-L(bkPxQx)
3078 .int L(bkP2Q9)-L(bkPxQx)
3079 .int L(bkP3Q9)-L(bkPxQx)
3080 .int L(bkP4Q9)-L(bkPxQx)
3081 .int L(bkP5Q9)-L(bkPxQx)
3082 .int L(bkP6Q9)-L(bkPxQx)
3083 .int L(bkP7Q9)-L(bkPxQx)
3085 .int L(bkP0QA)-L(bkPxQx)
3086 .int L(bkP1QA)-L(bkPxQx)
3087 .int L(bkP2QA)-L(bkPxQx)
3088 .int L(bkP3QA)-L(bkPxQx)
3089 .int L(bkP4QA)-L(bkPxQx)
3090 .int L(bkP5QA)-L(bkPxQx)
3091 .int L(bkP6QA)-L(bkPxQx)
3092 .int L(bkP7QA)-L(bkPxQx)
3094 .int L(bkP0QB)-L(bkPxQx)
3095 .int L(bkP1QB)-L(bkPxQx)
3096 .int L(bkP2QB)-L(bkPxQx)
3097 .int L(bkP3QB)-L(bkPxQx)
3098 .int L(bkP4QB)-L(bkPxQx)
3099 .int L(bkP5QB)-L(bkPxQx)
3100 .int L(bkP6QB)-L(bkPxQx)
3101 .int L(bkP7QB)-L(bkPxQx)
3103 .int L(bkP0QC)-L(bkPxQx)
3104 .int L(bkP1QC)-L(bkPxQx)
3105 .int L(bkP2QC)-L(bkPxQx)
3106 .int L(bkP3QC)-L(bkPxQx)
3107 .int L(bkP4QC)-L(bkPxQx)
3108 .int L(bkP5QC)-L(bkPxQx)
3109 .int L(bkP6QC)-L(bkPxQx)
3110 .int L(bkP7QC)-L(bkPxQx)
3112 .int L(bkP0QD)-L(bkPxQx)
3113 .int L(bkP1QD)-L(bkPxQx)
3114 .int L(bkP2QD)-L(bkPxQx)
3115 .int L(bkP3QD)-L(bkPxQx)
3116 .int L(bkP4QD)-L(bkPxQx)
3117 .int L(bkP5QD)-L(bkPxQx)
3118 .int L(bkP6QD)-L(bkPxQx)
3119 .int L(bkP7QD)-L(bkPxQx)
3121 .int L(bkP0QE)-L(bkPxQx)
3122 .int L(bkP1QE)-L(bkPxQx)
3123 .int L(bkP2QE)-L(bkPxQx)
3124 .int L(bkP3QE)-L(bkPxQx)
3125 .int L(bkP4QE)-L(bkPxQx)
3126 .int L(bkP5QE)-L(bkPxQx)
3127 .int L(bkP6QE)-L(bkPxQx)
3128 .int L(bkP7QE)-L(bkPxQx)
3130 .int L(bkP0QF)-L(bkPxQx)
3131 .int L(bkP1QF)-L(bkPxQx)
3132 .int L(bkP2QF)-L(bkPxQx)
3133 .int L(bkP3QF)-L(bkPxQx)
3134 .int L(bkP4QF)-L(bkPxQx)
3135 .int L(bkP5QF)-L(bkPxQx)
3136 .int L(bkP6QF)-L(bkPxQx)
3137 .int L(bkP7QF)-L(bkPxQx)
3139 .int L(bkP0QG)-L(bkPxQx)
3140 .int L(bkP1QG)-L(bkPxQx)
3141 .int L(bkP2QG)-L(bkPxQx)
3142 .int L(bkP3QG)-L(bkPxQx)
3143 .int L(bkP4QG)-L(bkPxQx)
3144 .int L(bkP5QG)-L(bkPxQx)
3145 .int L(bkP6QG)-L(bkPxQx)
3146 .int L(bkP7QG)-L(bkPxQx)
3148 .int L(bkP0QH)-L(bkPxQx)
3149 .int L(bkP1QH)-L(bkPxQx)
3150 .int L(bkP2QH)-L(bkPxQx)
3151 .int L(bkP3QH)-L(bkPxQx)
3152 .int L(bkP4QH)-L(bkPxQx)
3153 .int L(bkP5QH)-L(bkPxQx)
3154 .int L(bkP6QH)-L(bkPxQx)
3155 .int L(bkP7QH)-L(bkPxQx)
3157 .int L(bkP0QI)-L(bkPxQx)
3158 .int L(bkP1QI)-L(bkPxQx)
3159 .int L(bkP2QI)-L(bkPxQx)
3160 .int L(bkP3QI)-L(bkPxQx)
3161 .int L(bkP4QI)-L(bkPxQx)
3162 .int L(bkP5QI)-L(bkPxQx)
3163 .int L(bkP6QI)-L(bkPxQx)
3164 .int L(bkP7QI)-L(bkPxQx)