1 /* $FreeBSD$ */
2 /* Do not modify. This file is auto-generated from sha1-mb-x86_64.pl. */
3 .text
4
5
6
7 .globl sha1_multi_block
8 .type sha1_multi_block,@function
9 .align 32
10 sha1_multi_block:
11 .cfi_startproc
12 movq OPENSSL_ia32cap_P+4(%rip),%rcx
13 btq $61,%rcx
14 jc _shaext_shortcut
15 testl $268435456,%ecx
16 jnz _avx_shortcut
17 movq %rsp,%rax
18 .cfi_def_cfa_register %rax
19 pushq %rbx
20 .cfi_offset %rbx,-16
21 pushq %rbp
22 .cfi_offset %rbx,-24
23 subq $288,%rsp
24 andq $-256,%rsp
25 movq %rax,272(%rsp)
26 .cfi_escape 0x0f,0x06,0x77,0x90,0x02,0x06,0x23,0x08
27 .Lbody:
28 leaq K_XX_XX(%rip),%rbp
29 leaq 256(%rsp),%rbx
30
31 .Loop_grande:
32 movl %edx,280(%rsp)
33 xorl %edx,%edx
34 movq 0(%rsi),%r8
35 movl 8(%rsi),%ecx
36 cmpl %edx,%ecx
37 cmovgl %ecx,%edx
38 testl %ecx,%ecx
39 movl %ecx,0(%rbx)
40 cmovleq %rbp,%r8
41 movq 16(%rsi),%r9
42 movl 24(%rsi),%ecx
43 cmpl %edx,%ecx
44 cmovgl %ecx,%edx
45 testl %ecx,%ecx
46 movl %ecx,4(%rbx)
47 cmovleq %rbp,%r9
48 movq 32(%rsi),%r10
49 movl 40(%rsi),%ecx
50 cmpl %edx,%ecx
51 cmovgl %ecx,%edx
52 testl %ecx,%ecx
53 movl %ecx,8(%rbx)
54 cmovleq %rbp,%r10
55 movq 48(%rsi),%r11
56 movl 56(%rsi),%ecx
57 cmpl %edx,%ecx
58 cmovgl %ecx,%edx
59 testl %ecx,%ecx
60 movl %ecx,12(%rbx)
61 cmovleq %rbp,%r11
62 testl %edx,%edx
63 jz .Ldone
64
65 movdqu 0(%rdi),%xmm10
66 leaq 128(%rsp),%rax
67 movdqu 32(%rdi),%xmm11
68 movdqu 64(%rdi),%xmm12
69 movdqu 96(%rdi),%xmm13
70 movdqu 128(%rdi),%xmm14
71 movdqa 96(%rbp),%xmm5
72 movdqa -32(%rbp),%xmm15
73 jmp .Loop
74
75 .align 32
76 .Loop:
77 movd (%r8),%xmm0
78 leaq 64(%r8),%r8
79 movd (%r9),%xmm2
80 leaq 64(%r9),%r9
81 movd (%r10),%xmm3
82 leaq 64(%r10),%r10
83 movd (%r11),%xmm4
84 leaq 64(%r11),%r11
85 punpckldq %xmm3,%xmm0
86 movd -60(%r8),%xmm1
87 punpckldq %xmm4,%xmm2
88 movd -60(%r9),%xmm9
89 punpckldq %xmm2,%xmm0
90 movd -60(%r10),%xmm8
91 .byte 102,15,56,0,197
92 movd -60(%r11),%xmm7
93 punpckldq %xmm8,%xmm1
94 movdqa %xmm10,%xmm8
95 paddd %xmm15,%xmm14
96 punpckldq %xmm7,%xmm9
97 movdqa %xmm11,%xmm7
98 movdqa %xmm11,%xmm6
99 pslld $5,%xmm8
100 pandn %xmm13,%xmm7
101 pand %xmm12,%xmm6
102 punpckldq %xmm9,%xmm1
103 movdqa %xmm10,%xmm9
104
105 movdqa %xmm0,0-128(%rax)
106 paddd %xmm0,%xmm14
107 movd -56(%r8),%xmm2
108 psrld $27,%xmm9
109 pxor %xmm7,%xmm6
110 movdqa %xmm11,%xmm7
111
112 por %xmm9,%xmm8
113 movd -56(%r9),%xmm9
114 pslld $30,%xmm7
115 paddd %xmm6,%xmm14
116
117 psrld $2,%xmm11
118 paddd %xmm8,%xmm14
119 .byte 102,15,56,0,205
120 movd -56(%r10),%xmm8
121 por %xmm7,%xmm11
122 movd -56(%r11),%xmm7
123 punpckldq %xmm8,%xmm2
124 movdqa %xmm14,%xmm8
125 paddd %xmm15,%xmm13
126 punpckldq %xmm7,%xmm9
127 movdqa %xmm10,%xmm7
128 movdqa %xmm10,%xmm6
129 pslld $5,%xmm8
130 pandn %xmm12,%xmm7
131 pand %xmm11,%xmm6
132 punpckldq %xmm9,%xmm2
133 movdqa %xmm14,%xmm9
134
135 movdqa %xmm1,16-128(%rax)
136 paddd %xmm1,%xmm13
137 movd -52(%r8),%xmm3
138 psrld $27,%xmm9
139 pxor %xmm7,%xmm6
140 movdqa %xmm10,%xmm7
141
142 por %xmm9,%xmm8
143 movd -52(%r9),%xmm9
144 pslld $30,%xmm7
145 paddd %xmm6,%xmm13
146
147 psrld $2,%xmm10
148 paddd %xmm8,%xmm13
149 .byte 102,15,56,0,213
150 movd -52(%r10),%xmm8
151 por %xmm7,%xmm10
152 movd -52(%r11),%xmm7
153 punpckldq %xmm8,%xmm3
154 movdqa %xmm13,%xmm8
155 paddd %xmm15,%xmm12
156 punpckldq %xmm7,%xmm9
157 movdqa %xmm14,%xmm7
158 movdqa %xmm14,%xmm6
159 pslld $5,%xmm8
160 pandn %xmm11,%xmm7
161 pand %xmm10,%xmm6
162 punpckldq %xmm9,%xmm3
163 movdqa %xmm13,%xmm9
164
165 movdqa %xmm2,32-128(%rax)
166 paddd %xmm2,%xmm12
167 movd -48(%r8),%xmm4
168 psrld $27,%xmm9
169 pxor %xmm7,%xmm6
170 movdqa %xmm14,%xmm7
171
172 por %xmm9,%xmm8
173 movd -48(%r9),%xmm9
174 pslld $30,%xmm7
175 paddd %xmm6,%xmm12
176
177 psrld $2,%xmm14
178 paddd %xmm8,%xmm12
179 .byte 102,15,56,0,221
180 movd -48(%r10),%xmm8
181 por %xmm7,%xmm14
182 movd -48(%r11),%xmm7
183 punpckldq %xmm8,%xmm4
184 movdqa %xmm12,%xmm8
185 paddd %xmm15,%xmm11
186 punpckldq %xmm7,%xmm9
187 movdqa %xmm13,%xmm7
188 movdqa %xmm13,%xmm6
189 pslld $5,%xmm8
190 pandn %xmm10,%xmm7
191 pand %xmm14,%xmm6
192 punpckldq %xmm9,%xmm4
193 movdqa %xmm12,%xmm9
194
195 movdqa %xmm3,48-128(%rax)
196 paddd %xmm3,%xmm11
197 movd -44(%r8),%xmm0
198 psrld $27,%xmm9
199 pxor %xmm7,%xmm6
200 movdqa %xmm13,%xmm7
201
202 por %xmm9,%xmm8
203 movd -44(%r9),%xmm9
204 pslld $30,%xmm7
205 paddd %xmm6,%xmm11
206
207 psrld $2,%xmm13
208 paddd %xmm8,%xmm11
209 .byte 102,15,56,0,229
210 movd -44(%r10),%xmm8
211 por %xmm7,%xmm13
212 movd -44(%r11),%xmm7
213 punpckldq %xmm8,%xmm0
214 movdqa %xmm11,%xmm8
215 paddd %xmm15,%xmm10
216 punpckldq %xmm7,%xmm9
217 movdqa %xmm12,%xmm7
218 movdqa %xmm12,%xmm6
219 pslld $5,%xmm8
220 pandn %xmm14,%xmm7
221 pand %xmm13,%xmm6
222 punpckldq %xmm9,%xmm0
223 movdqa %xmm11,%xmm9
224
225 movdqa %xmm4,64-128(%rax)
226 paddd %xmm4,%xmm10
227 movd -40(%r8),%xmm1
228 psrld $27,%xmm9
229 pxor %xmm7,%xmm6
230 movdqa %xmm12,%xmm7
231
232 por %xmm9,%xmm8
233 movd -40(%r9),%xmm9
234 pslld $30,%xmm7
235 paddd %xmm6,%xmm10
236
237 psrld $2,%xmm12
238 paddd %xmm8,%xmm10
239 .byte 102,15,56,0,197
240 movd -40(%r10),%xmm8
241 por %xmm7,%xmm12
242 movd -40(%r11),%xmm7
243 punpckldq %xmm8,%xmm1
244 movdqa %xmm10,%xmm8
245 paddd %xmm15,%xmm14
246 punpckldq %xmm7,%xmm9
247 movdqa %xmm11,%xmm7
248 movdqa %xmm11,%xmm6
249 pslld $5,%xmm8
250 pandn %xmm13,%xmm7
251 pand %xmm12,%xmm6
252 punpckldq %xmm9,%xmm1
253 movdqa %xmm10,%xmm9
254
255 movdqa %xmm0,80-128(%rax)
256 paddd %xmm0,%xmm14
257 movd -36(%r8),%xmm2
258 psrld $27,%xmm9
259 pxor %xmm7,%xmm6
260 movdqa %xmm11,%xmm7
261
262 por %xmm9,%xmm8
263 movd -36(%r9),%xmm9
264 pslld $30,%xmm7
265 paddd %xmm6,%xmm14
266
267 psrld $2,%xmm11
268 paddd %xmm8,%xmm14
269 .byte 102,15,56,0,205
270 movd -36(%r10),%xmm8
271 por %xmm7,%xmm11
272 movd -36(%r11),%xmm7
273 punpckldq %xmm8,%xmm2
274 movdqa %xmm14,%xmm8
275 paddd %xmm15,%xmm13
276 punpckldq %xmm7,%xmm9
277 movdqa %xmm10,%xmm7
278 movdqa %xmm10,%xmm6
279 pslld $5,%xmm8
280 pandn %xmm12,%xmm7
281 pand %xmm11,%xmm6
282 punpckldq %xmm9,%xmm2
283 movdqa %xmm14,%xmm9
284
285 movdqa %xmm1,96-128(%rax)
286 paddd %xmm1,%xmm13
287 movd -32(%r8),%xmm3
288 psrld $27,%xmm9
289 pxor %xmm7,%xmm6
290 movdqa %xmm10,%xmm7
291
292 por %xmm9,%xmm8
293 movd -32(%r9),%xmm9
294 pslld $30,%xmm7
295 paddd %xmm6,%xmm13
296
297 psrld $2,%xmm10
298 paddd %xmm8,%xmm13
299 .byte 102,15,56,0,213
300 movd -32(%r10),%xmm8
301 por %xmm7,%xmm10
302 movd -32(%r11),%xmm7
303 punpckldq %xmm8,%xmm3
304 movdqa %xmm13,%xmm8
305 paddd %xmm15,%xmm12
306 punpckldq %xmm7,%xmm9
307 movdqa %xmm14,%xmm7
308 movdqa %xmm14,%xmm6
309 pslld $5,%xmm8
310 pandn %xmm11,%xmm7
311 pand %xmm10,%xmm6
312 punpckldq %xmm9,%xmm3
313 movdqa %xmm13,%xmm9
314
315 movdqa %xmm2,112-128(%rax)
316 paddd %xmm2,%xmm12
317 movd -28(%r8),%xmm4
318 psrld $27,%xmm9
319 pxor %xmm7,%xmm6
320 movdqa %xmm14,%xmm7
321
322 por %xmm9,%xmm8
323 movd -28(%r9),%xmm9
324 pslld $30,%xmm7
325 paddd %xmm6,%xmm12
326
327 psrld $2,%xmm14
328 paddd %xmm8,%xmm12
329 .byte 102,15,56,0,221
330 movd -28(%r10),%xmm8
331 por %xmm7,%xmm14
332 movd -28(%r11),%xmm7
333 punpckldq %xmm8,%xmm4
334 movdqa %xmm12,%xmm8
335 paddd %xmm15,%xmm11
336 punpckldq %xmm7,%xmm9
337 movdqa %xmm13,%xmm7
338 movdqa %xmm13,%xmm6
339 pslld $5,%xmm8
340 pandn %xmm10,%xmm7
341 pand %xmm14,%xmm6
342 punpckldq %xmm9,%xmm4
343 movdqa %xmm12,%xmm9
344
345 movdqa %xmm3,128-128(%rax)
346 paddd %xmm3,%xmm11
347 movd -24(%r8),%xmm0
348 psrld $27,%xmm9
349 pxor %xmm7,%xmm6
350 movdqa %xmm13,%xmm7
351
352 por %xmm9,%xmm8
353 movd -24(%r9),%xmm9
354 pslld $30,%xmm7
355 paddd %xmm6,%xmm11
356
357 psrld $2,%xmm13
358 paddd %xmm8,%xmm11
359 .byte 102,15,56,0,229
360 movd -24(%r10),%xmm8
361 por %xmm7,%xmm13
362 movd -24(%r11),%xmm7
363 punpckldq %xmm8,%xmm0
364 movdqa %xmm11,%xmm8
365 paddd %xmm15,%xmm10
366 punpckldq %xmm7,%xmm9
367 movdqa %xmm12,%xmm7
368 movdqa %xmm12,%xmm6
369 pslld $5,%xmm8
370 pandn %xmm14,%xmm7
371 pand %xmm13,%xmm6
372 punpckldq %xmm9,%xmm0
373 movdqa %xmm11,%xmm9
374
375 movdqa %xmm4,144-128(%rax)
376 paddd %xmm4,%xmm10
377 movd -20(%r8),%xmm1
378 psrld $27,%xmm9
379 pxor %xmm7,%xmm6
380 movdqa %xmm12,%xmm7
381
382 por %xmm9,%xmm8
383 movd -20(%r9),%xmm9
384 pslld $30,%xmm7
385 paddd %xmm6,%xmm10
386
387 psrld $2,%xmm12
388 paddd %xmm8,%xmm10
389 .byte 102,15,56,0,197
390 movd -20(%r10),%xmm8
391 por %xmm7,%xmm12
392 movd -20(%r11),%xmm7
393 punpckldq %xmm8,%xmm1
394 movdqa %xmm10,%xmm8
395 paddd %xmm15,%xmm14
396 punpckldq %xmm7,%xmm9
397 movdqa %xmm11,%xmm7
398 movdqa %xmm11,%xmm6
399 pslld $5,%xmm8
400 pandn %xmm13,%xmm7
401 pand %xmm12,%xmm6
402 punpckldq %xmm9,%xmm1
403 movdqa %xmm10,%xmm9
404
405 movdqa %xmm0,160-128(%rax)
406 paddd %xmm0,%xmm14
407 movd -16(%r8),%xmm2
408 psrld $27,%xmm9
409 pxor %xmm7,%xmm6
410 movdqa %xmm11,%xmm7
411
412 por %xmm9,%xmm8
413 movd -16(%r9),%xmm9
414 pslld $30,%xmm7
415 paddd %xmm6,%xmm14
416
417 psrld $2,%xmm11
418 paddd %xmm8,%xmm14
419 .byte 102,15,56,0,205
420 movd -16(%r10),%xmm8
421 por %xmm7,%xmm11
422 movd -16(%r11),%xmm7
423 punpckldq %xmm8,%xmm2
424 movdqa %xmm14,%xmm8
425 paddd %xmm15,%xmm13
426 punpckldq %xmm7,%xmm9
427 movdqa %xmm10,%xmm7
428 movdqa %xmm10,%xmm6
429 pslld $5,%xmm8
430 pandn %xmm12,%xmm7
431 pand %xmm11,%xmm6
432 punpckldq %xmm9,%xmm2
433 movdqa %xmm14,%xmm9
434
435 movdqa %xmm1,176-128(%rax)
436 paddd %xmm1,%xmm13
437 movd -12(%r8),%xmm3
438 psrld $27,%xmm9
439 pxor %xmm7,%xmm6
440 movdqa %xmm10,%xmm7
441
442 por %xmm9,%xmm8
443 movd -12(%r9),%xmm9
444 pslld $30,%xmm7
445 paddd %xmm6,%xmm13
446
447 psrld $2,%xmm10
448 paddd %xmm8,%xmm13
449 .byte 102,15,56,0,213
450 movd -12(%r10),%xmm8
451 por %xmm7,%xmm10
452 movd -12(%r11),%xmm7
453 punpckldq %xmm8,%xmm3
454 movdqa %xmm13,%xmm8
455 paddd %xmm15,%xmm12
456 punpckldq %xmm7,%xmm9
457 movdqa %xmm14,%xmm7
458 movdqa %xmm14,%xmm6
459 pslld $5,%xmm8
460 pandn %xmm11,%xmm7
461 pand %xmm10,%xmm6
462 punpckldq %xmm9,%xmm3
463 movdqa %xmm13,%xmm9
464
465 movdqa %xmm2,192-128(%rax)
466 paddd %xmm2,%xmm12
467 movd -8(%r8),%xmm4
468 psrld $27,%xmm9
469 pxor %xmm7,%xmm6
470 movdqa %xmm14,%xmm7
471
472 por %xmm9,%xmm8
473 movd -8(%r9),%xmm9
474 pslld $30,%xmm7
475 paddd %xmm6,%xmm12
476
477 psrld $2,%xmm14
478 paddd %xmm8,%xmm12
479 .byte 102,15,56,0,221
480 movd -8(%r10),%xmm8
481 por %xmm7,%xmm14
482 movd -8(%r11),%xmm7
483 punpckldq %xmm8,%xmm4
484 movdqa %xmm12,%xmm8
485 paddd %xmm15,%xmm11
486 punpckldq %xmm7,%xmm9
487 movdqa %xmm13,%xmm7
488 movdqa %xmm13,%xmm6
489 pslld $5,%xmm8
490 pandn %xmm10,%xmm7
491 pand %xmm14,%xmm6
492 punpckldq %xmm9,%xmm4
493 movdqa %xmm12,%xmm9
494
495 movdqa %xmm3,208-128(%rax)
496 paddd %xmm3,%xmm11
497 movd -4(%r8),%xmm0
498 psrld $27,%xmm9
499 pxor %xmm7,%xmm6
500 movdqa %xmm13,%xmm7
501
502 por %xmm9,%xmm8
503 movd -4(%r9),%xmm9
504 pslld $30,%xmm7
505 paddd %xmm6,%xmm11
506
507 psrld $2,%xmm13
508 paddd %xmm8,%xmm11
509 .byte 102,15,56,0,229
510 movd -4(%r10),%xmm8
511 por %xmm7,%xmm13
512 movdqa 0-128(%rax),%xmm1
513 movd -4(%r11),%xmm7
514 punpckldq %xmm8,%xmm0
515 movdqa %xmm11,%xmm8
516 paddd %xmm15,%xmm10
517 punpckldq %xmm7,%xmm9
518 movdqa %xmm12,%xmm7
519 movdqa %xmm12,%xmm6
520 pslld $5,%xmm8
521 prefetcht0 63(%r8)
522 pandn %xmm14,%xmm7
523 pand %xmm13,%xmm6
524 punpckldq %xmm9,%xmm0
525 movdqa %xmm11,%xmm9
526
527 movdqa %xmm4,224-128(%rax)
528 paddd %xmm4,%xmm10
529 psrld $27,%xmm9
530 pxor %xmm7,%xmm6
531 movdqa %xmm12,%xmm7
532 prefetcht0 63(%r9)
533
534 por %xmm9,%xmm8
535 pslld $30,%xmm7
536 paddd %xmm6,%xmm10
537 prefetcht0 63(%r10)
538
539 psrld $2,%xmm12
540 paddd %xmm8,%xmm10
541 .byte 102,15,56,0,197
542 prefetcht0 63(%r11)
543 por %xmm7,%xmm12
544 movdqa 16-128(%rax),%xmm2
545 pxor %xmm3,%xmm1
546 movdqa 32-128(%rax),%xmm3
547
548 movdqa %xmm10,%xmm8
549 pxor 128-128(%rax),%xmm1
550 paddd %xmm15,%xmm14
551 movdqa %xmm11,%xmm7
552 pslld $5,%xmm8
553 pxor %xmm3,%xmm1
554 movdqa %xmm11,%xmm6
555 pandn %xmm13,%xmm7
556 movdqa %xmm1,%xmm5
557 pand %xmm12,%xmm6
558 movdqa %xmm10,%xmm9
559 psrld $31,%xmm5
560 paddd %xmm1,%xmm1
561
562 movdqa %xmm0,240-128(%rax)
563 paddd %xmm0,%xmm14
564 psrld $27,%xmm9
565 pxor %xmm7,%xmm6
566
567 movdqa %xmm11,%xmm7
568 por %xmm9,%xmm8
569 pslld $30,%xmm7
570 paddd %xmm6,%xmm14
571
572 psrld $2,%xmm11
573 paddd %xmm8,%xmm14
574 por %xmm5,%xmm1
575 por %xmm7,%xmm11
576 pxor %xmm4,%xmm2
577 movdqa 48-128(%rax),%xmm4
578
579 movdqa %xmm14,%xmm8
580 pxor 144-128(%rax),%xmm2
581 paddd %xmm15,%xmm13
582 movdqa %xmm10,%xmm7
583 pslld $5,%xmm8
584 pxor %xmm4,%xmm2
585 movdqa %xmm10,%xmm6
586 pandn %xmm12,%xmm7
587 movdqa %xmm2,%xmm5
588 pand %xmm11,%xmm6
589 movdqa %xmm14,%xmm9
590 psrld $31,%xmm5
591 paddd %xmm2,%xmm2
592
593 movdqa %xmm1,0-128(%rax)
594 paddd %xmm1,%xmm13
595 psrld $27,%xmm9
596 pxor %xmm7,%xmm6
597
598 movdqa %xmm10,%xmm7
599 por %xmm9,%xmm8
600 pslld $30,%xmm7
601 paddd %xmm6,%xmm13
602
603 psrld $2,%xmm10
604 paddd %xmm8,%xmm13
605 por %xmm5,%xmm2
606 por %xmm7,%xmm10
607 pxor %xmm0,%xmm3
608 movdqa 64-128(%rax),%xmm0
609
610 movdqa %xmm13,%xmm8
611 pxor 160-128(%rax),%xmm3
612 paddd %xmm15,%xmm12
613 movdqa %xmm14,%xmm7
614 pslld $5,%xmm8
615 pxor %xmm0,%xmm3
616 movdqa %xmm14,%xmm6
617 pandn %xmm11,%xmm7
618 movdqa %xmm3,%xmm5
619 pand %xmm10,%xmm6
620 movdqa %xmm13,%xmm9
621 psrld $31,%xmm5
622 paddd %xmm3,%xmm3
623
624 movdqa %xmm2,16-128(%rax)
625 paddd %xmm2,%xmm12
626 psrld $27,%xmm9
627 pxor %xmm7,%xmm6
628
629 movdqa %xmm14,%xmm7
630 por %xmm9,%xmm8
631 pslld $30,%xmm7
632 paddd %xmm6,%xmm12
633
634 psrld $2,%xmm14
635 paddd %xmm8,%xmm12
636 por %xmm5,%xmm3
637 por %xmm7,%xmm14
638 pxor %xmm1,%xmm4
639 movdqa 80-128(%rax),%xmm1
640
641 movdqa %xmm12,%xmm8
642 pxor 176-128(%rax),%xmm4
643 paddd %xmm15,%xmm11
644 movdqa %xmm13,%xmm7
645 pslld $5,%xmm8
646 pxor %xmm1,%xmm4
647 movdqa %xmm13,%xmm6
648 pandn %xmm10,%xmm7
649 movdqa %xmm4,%xmm5
650 pand %xmm14,%xmm6
651 movdqa %xmm12,%xmm9
652 psrld $31,%xmm5
653 paddd %xmm4,%xmm4
654
655 movdqa %xmm3,32-128(%rax)
656 paddd %xmm3,%xmm11
657 psrld $27,%xmm9
658 pxor %xmm7,%xmm6
659
660 movdqa %xmm13,%xmm7
661 por %xmm9,%xmm8
662 pslld $30,%xmm7
663 paddd %xmm6,%xmm11
664
665 psrld $2,%xmm13
666 paddd %xmm8,%xmm11
667 por %xmm5,%xmm4
668 por %xmm7,%xmm13
669 pxor %xmm2,%xmm0
670 movdqa 96-128(%rax),%xmm2
671
672 movdqa %xmm11,%xmm8
673 pxor 192-128(%rax),%xmm0
674 paddd %xmm15,%xmm10
675 movdqa %xmm12,%xmm7
676 pslld $5,%xmm8
677 pxor %xmm2,%xmm0
678 movdqa %xmm12,%xmm6
679 pandn %xmm14,%xmm7
680 movdqa %xmm0,%xmm5
681 pand %xmm13,%xmm6
682 movdqa %xmm11,%xmm9
683 psrld $31,%xmm5
684 paddd %xmm0,%xmm0
685
686 movdqa %xmm4,48-128(%rax)
687 paddd %xmm4,%xmm10
688 psrld $27,%xmm9
689 pxor %xmm7,%xmm6
690
691 movdqa %xmm12,%xmm7
692 por %xmm9,%xmm8
693 pslld $30,%xmm7
694 paddd %xmm6,%xmm10
695
696 psrld $2,%xmm12
697 paddd %xmm8,%xmm10
698 por %xmm5,%xmm0
699 por %xmm7,%xmm12
700 movdqa 0(%rbp),%xmm15
701 pxor %xmm3,%xmm1
702 movdqa 112-128(%rax),%xmm3
703
704 movdqa %xmm10,%xmm8
705 movdqa %xmm13,%xmm6
706 pxor 208-128(%rax),%xmm1
707 paddd %xmm15,%xmm14
708 pslld $5,%xmm8
709 pxor %xmm11,%xmm6
710
711 movdqa %xmm10,%xmm9
712 movdqa %xmm0,64-128(%rax)
713 paddd %xmm0,%xmm14
714 pxor %xmm3,%xmm1
715 psrld $27,%xmm9
716 pxor %xmm12,%xmm6
717 movdqa %xmm11,%xmm7
718
719 pslld $30,%xmm7
720 movdqa %xmm1,%xmm5
721 por %xmm9,%xmm8
722 psrld $31,%xmm5
723 paddd %xmm6,%xmm14
724 paddd %xmm1,%xmm1
725
726 psrld $2,%xmm11
727 paddd %xmm8,%xmm14
728 por %xmm5,%xmm1
729 por %xmm7,%xmm11
730 pxor %xmm4,%xmm2
731 movdqa 128-128(%rax),%xmm4
732
733 movdqa %xmm14,%xmm8
734 movdqa %xmm12,%xmm6
735 pxor 224-128(%rax),%xmm2
736 paddd %xmm15,%xmm13
737 pslld $5,%xmm8
738 pxor %xmm10,%xmm6
739
740 movdqa %xmm14,%xmm9
741 movdqa %xmm1,80-128(%rax)
742 paddd %xmm1,%xmm13
743 pxor %xmm4,%xmm2
744 psrld $27,%xmm9
745 pxor %xmm11,%xmm6
746 movdqa %xmm10,%xmm7
747
748 pslld $30,%xmm7
749 movdqa %xmm2,%xmm5
750 por %xmm9,%xmm8
751 psrld $31,%xmm5
752 paddd %xmm6,%xmm13
753 paddd %xmm2,%xmm2
754
755 psrld $2,%xmm10
756 paddd %xmm8,%xmm13
757 por %xmm5,%xmm2
758 por %xmm7,%xmm10
759 pxor %xmm0,%xmm3
760 movdqa 144-128(%rax),%xmm0
761
762 movdqa %xmm13,%xmm8
763 movdqa %xmm11,%xmm6
764 pxor 240-128(%rax),%xmm3
765 paddd %xmm15,%xmm12
766 pslld $5,%xmm8
767 pxor %xmm14,%xmm6
768
769 movdqa %xmm13,%xmm9
770 movdqa %xmm2,96-128(%rax)
771 paddd %xmm2,%xmm12
772 pxor %xmm0,%xmm3
773 psrld $27,%xmm9
774 pxor %xmm10,%xmm6
775 movdqa %xmm14,%xmm7
776
777 pslld $30,%xmm7
778 movdqa %xmm3,%xmm5
779 por %xmm9,%xmm8
780 psrld $31,%xmm5
781 paddd %xmm6,%xmm12
782 paddd %xmm3,%xmm3
783
784 psrld $2,%xmm14
785 paddd %xmm8,%xmm12
786 por %xmm5,%xmm3
787 por %xmm7,%xmm14
788 pxor %xmm1,%xmm4
789 movdqa 160-128(%rax),%xmm1
790
791 movdqa %xmm12,%xmm8
792 movdqa %xmm10,%xmm6
793 pxor 0-128(%rax),%xmm4
794 paddd %xmm15,%xmm11
795 pslld $5,%xmm8
796 pxor %xmm13,%xmm6
797
798 movdqa %xmm12,%xmm9
799 movdqa %xmm3,112-128(%rax)
800 paddd %xmm3,%xmm11
801 pxor %xmm1,%xmm4
802 psrld $27,%xmm9
803 pxor %xmm14,%xmm6
804 movdqa %xmm13,%xmm7
805
806 pslld $30,%xmm7
807 movdqa %xmm4,%xmm5
808 por %xmm9,%xmm8
809 psrld $31,%xmm5
810 paddd %xmm6,%xmm11
811 paddd %xmm4,%xmm4
812
813 psrld $2,%xmm13
814 paddd %xmm8,%xmm11
815 por %xmm5,%xmm4
816 por %xmm7,%xmm13
817 pxor %xmm2,%xmm0
818 movdqa 176-128(%rax),%xmm2
819
820 movdqa %xmm11,%xmm8
821 movdqa %xmm14,%xmm6
822 pxor 16-128(%rax),%xmm0
823 paddd %xmm15,%xmm10
824 pslld $5,%xmm8
825 pxor %xmm12,%xmm6
826
827 movdqa %xmm11,%xmm9
828 movdqa %xmm4,128-128(%rax)
829 paddd %xmm4,%xmm10
830 pxor %xmm2,%xmm0
831 psrld $27,%xmm9
832 pxor %xmm13,%xmm6
833 movdqa %xmm12,%xmm7
834
835 pslld $30,%xmm7
836 movdqa %xmm0,%xmm5
837 por %xmm9,%xmm8
838 psrld $31,%xmm5
839 paddd %xmm6,%xmm10
840 paddd %xmm0,%xmm0
841
842 psrld $2,%xmm12
843 paddd %xmm8,%xmm10
844 por %xmm5,%xmm0
845 por %xmm7,%xmm12
846 pxor %xmm3,%xmm1
847 movdqa 192-128(%rax),%xmm3
848
849 movdqa %xmm10,%xmm8
850 movdqa %xmm13,%xmm6
851 pxor 32-128(%rax),%xmm1
852 paddd %xmm15,%xmm14
853 pslld $5,%xmm8
854 pxor %xmm11,%xmm6
855
856 movdqa %xmm10,%xmm9
857 movdqa %xmm0,144-128(%rax)
858 paddd %xmm0,%xmm14
859 pxor %xmm3,%xmm1
860 psrld $27,%xmm9
861 pxor %xmm12,%xmm6
862 movdqa %xmm11,%xmm7
863
864 pslld $30,%xmm7
865 movdqa %xmm1,%xmm5
866 por %xmm9,%xmm8
867 psrld $31,%xmm5
868 paddd %xmm6,%xmm14
869 paddd %xmm1,%xmm1
870
871 psrld $2,%xmm11
872 paddd %xmm8,%xmm14
873 por %xmm5,%xmm1
874 por %xmm7,%xmm11
875 pxor %xmm4,%xmm2
876 movdqa 208-128(%rax),%xmm4
877
878 movdqa %xmm14,%xmm8
879 movdqa %xmm12,%xmm6
880 pxor 48-128(%rax),%xmm2
881 paddd %xmm15,%xmm13
882 pslld $5,%xmm8
883 pxor %xmm10,%xmm6
884
885 movdqa %xmm14,%xmm9
886 movdqa %xmm1,160-128(%rax)
887 paddd %xmm1,%xmm13
888 pxor %xmm4,%xmm2
889 psrld $27,%xmm9
890 pxor %xmm11,%xmm6
891 movdqa %xmm10,%xmm7
892
893 pslld $30,%xmm7
894 movdqa %xmm2,%xmm5
895 por %xmm9,%xmm8
896 psrld $31,%xmm5
897 paddd %xmm6,%xmm13
898 paddd %xmm2,%xmm2
899
900 psrld $2,%xmm10
901 paddd %xmm8,%xmm13
902 por %xmm5,%xmm2
903 por %xmm7,%xmm10
904 pxor %xmm0,%xmm3
905 movdqa 224-128(%rax),%xmm0
906
907 movdqa %xmm13,%xmm8
908 movdqa %xmm11,%xmm6
909 pxor 64-128(%rax),%xmm3
910 paddd %xmm15,%xmm12
911 pslld $5,%xmm8
912 pxor %xmm14,%xmm6
913
914 movdqa %xmm13,%xmm9
915 movdqa %xmm2,176-128(%rax)
916 paddd %xmm2,%xmm12
917 pxor %xmm0,%xmm3
918 psrld $27,%xmm9
919 pxor %xmm10,%xmm6
920 movdqa %xmm14,%xmm7
921
922 pslld $30,%xmm7
923 movdqa %xmm3,%xmm5
924 por %xmm9,%xmm8
925 psrld $31,%xmm5
926 paddd %xmm6,%xmm12
927 paddd %xmm3,%xmm3
928
929 psrld $2,%xmm14
930 paddd %xmm8,%xmm12
931 por %xmm5,%xmm3
932 por %xmm7,%xmm14
933 pxor %xmm1,%xmm4
934 movdqa 240-128(%rax),%xmm1
935
936 movdqa %xmm12,%xmm8
937 movdqa %xmm10,%xmm6
938 pxor 80-128(%rax),%xmm4
939 paddd %xmm15,%xmm11
940 pslld $5,%xmm8
941 pxor %xmm13,%xmm6
942
943 movdqa %xmm12,%xmm9
944 movdqa %xmm3,192-128(%rax)
945 paddd %xmm3,%xmm11
946 pxor %xmm1,%xmm4
947 psrld $27,%xmm9
948 pxor %xmm14,%xmm6
949 movdqa %xmm13,%xmm7
950
951 pslld $30,%xmm7
952 movdqa %xmm4,%xmm5
953 por %xmm9,%xmm8
954 psrld $31,%xmm5
955 paddd %xmm6,%xmm11
956 paddd %xmm4,%xmm4
957
958 psrld $2,%xmm13
959 paddd %xmm8,%xmm11
960 por %xmm5,%xmm4
961 por %xmm7,%xmm13
962 pxor %xmm2,%xmm0
963 movdqa 0-128(%rax),%xmm2
964
965 movdqa %xmm11,%xmm8
966 movdqa %xmm14,%xmm6
967 pxor 96-128(%rax),%xmm0
968 paddd %xmm15,%xmm10
969 pslld $5,%xmm8
970 pxor %xmm12,%xmm6
971
972 movdqa %xmm11,%xmm9
973 movdqa %xmm4,208-128(%rax)
974 paddd %xmm4,%xmm10
975 pxor %xmm2,%xmm0
976 psrld $27,%xmm9
977 pxor %xmm13,%xmm6
978 movdqa %xmm12,%xmm7
979
980 pslld $30,%xmm7
981 movdqa %xmm0,%xmm5
982 por %xmm9,%xmm8
983 psrld $31,%xmm5
984 paddd %xmm6,%xmm10
985 paddd %xmm0,%xmm0
986
987 psrld $2,%xmm12
988 paddd %xmm8,%xmm10
989 por %xmm5,%xmm0
990 por %xmm7,%xmm12
991 pxor %xmm3,%xmm1
992 movdqa 16-128(%rax),%xmm3
993
994 movdqa %xmm10,%xmm8
995 movdqa %xmm13,%xmm6
996 pxor 112-128(%rax),%xmm1
997 paddd %xmm15,%xmm14
998 pslld $5,%xmm8
999 pxor %xmm11,%xmm6
1000
1001 movdqa %xmm10,%xmm9
1002 movdqa %xmm0,224-128(%rax)
1003 paddd %xmm0,%xmm14
1004 pxor %xmm3,%xmm1
1005 psrld $27,%xmm9
1006 pxor %xmm12,%xmm6
1007 movdqa %xmm11,%xmm7
1008
1009 pslld $30,%xmm7
1010 movdqa %xmm1,%xmm5
1011 por %xmm9,%xmm8
1012 psrld $31,%xmm5
1013 paddd %xmm6,%xmm14
1014 paddd %xmm1,%xmm1
1015
1016 psrld $2,%xmm11
1017 paddd %xmm8,%xmm14
1018 por %xmm5,%xmm1
1019 por %xmm7,%xmm11
1020 pxor %xmm4,%xmm2
1021 movdqa 32-128(%rax),%xmm4
1022
1023 movdqa %xmm14,%xmm8
1024 movdqa %xmm12,%xmm6
1025 pxor 128-128(%rax),%xmm2
1026 paddd %xmm15,%xmm13
1027 pslld $5,%xmm8
1028 pxor %xmm10,%xmm6
1029
1030 movdqa %xmm14,%xmm9
1031 movdqa %xmm1,240-128(%rax)
1032 paddd %xmm1,%xmm13
1033 pxor %xmm4,%xmm2
1034 psrld $27,%xmm9
1035 pxor %xmm11,%xmm6
1036 movdqa %xmm10,%xmm7
1037
1038 pslld $30,%xmm7
1039 movdqa %xmm2,%xmm5
1040 por %xmm9,%xmm8
1041 psrld $31,%xmm5
1042 paddd %xmm6,%xmm13
1043 paddd %xmm2,%xmm2
1044
1045 psrld $2,%xmm10
1046 paddd %xmm8,%xmm13
1047 por %xmm5,%xmm2
1048 por %xmm7,%xmm10
1049 pxor %xmm0,%xmm3
1050 movdqa 48-128(%rax),%xmm0
1051
1052 movdqa %xmm13,%xmm8
1053 movdqa %xmm11,%xmm6
1054 pxor 144-128(%rax),%xmm3
1055 paddd %xmm15,%xmm12
1056 pslld $5,%xmm8
1057 pxor %xmm14,%xmm6
1058
1059 movdqa %xmm13,%xmm9
1060 movdqa %xmm2,0-128(%rax)
1061 paddd %xmm2,%xmm12
1062 pxor %xmm0,%xmm3
1063 psrld $27,%xmm9
1064 pxor %xmm10,%xmm6
1065 movdqa %xmm14,%xmm7
1066
1067 pslld $30,%xmm7
1068 movdqa %xmm3,%xmm5
1069 por %xmm9,%xmm8
1070 psrld $31,%xmm5
1071 paddd %xmm6,%xmm12
1072 paddd %xmm3,%xmm3
1073
1074 psrld $2,%xmm14
1075 paddd %xmm8,%xmm12
1076 por %xmm5,%xmm3
1077 por %xmm7,%xmm14
1078 pxor %xmm1,%xmm4
1079 movdqa 64-128(%rax),%xmm1
1080
1081 movdqa %xmm12,%xmm8
1082 movdqa %xmm10,%xmm6
1083 pxor 160-128(%rax),%xmm4
1084 paddd %xmm15,%xmm11
1085 pslld $5,%xmm8
1086 pxor %xmm13,%xmm6
1087
1088 movdqa %xmm12,%xmm9
1089 movdqa %xmm3,16-128(%rax)
1090 paddd %xmm3,%xmm11
1091 pxor %xmm1,%xmm4
1092 psrld $27,%xmm9
1093 pxor %xmm14,%xmm6
1094 movdqa %xmm13,%xmm7
1095
1096 pslld $30,%xmm7
1097 movdqa %xmm4,%xmm5
1098 por %xmm9,%xmm8
1099 psrld $31,%xmm5
1100 paddd %xmm6,%xmm11
1101 paddd %xmm4,%xmm4
1102
1103 psrld $2,%xmm13
1104 paddd %xmm8,%xmm11
1105 por %xmm5,%xmm4
1106 por %xmm7,%xmm13
1107 pxor %xmm2,%xmm0
1108 movdqa 80-128(%rax),%xmm2
1109
1110 movdqa %xmm11,%xmm8
1111 movdqa %xmm14,%xmm6
1112 pxor 176-128(%rax),%xmm0
1113 paddd %xmm15,%xmm10
1114 pslld $5,%xmm8
1115 pxor %xmm12,%xmm6
1116
1117 movdqa %xmm11,%xmm9
1118 movdqa %xmm4,32-128(%rax)
1119 paddd %xmm4,%xmm10
1120 pxor %xmm2,%xmm0
1121 psrld $27,%xmm9
1122 pxor %xmm13,%xmm6
1123 movdqa %xmm12,%xmm7
1124
1125 pslld $30,%xmm7
1126 movdqa %xmm0,%xmm5
1127 por %xmm9,%xmm8
1128 psrld $31,%xmm5
1129 paddd %xmm6,%xmm10
1130 paddd %xmm0,%xmm0
1131
1132 psrld $2,%xmm12
1133 paddd %xmm8,%xmm10
1134 por %xmm5,%xmm0
1135 por %xmm7,%xmm12
1136 pxor %xmm3,%xmm1
1137 movdqa 96-128(%rax),%xmm3
1138
1139 movdqa %xmm10,%xmm8
1140 movdqa %xmm13,%xmm6
1141 pxor 192-128(%rax),%xmm1
1142 paddd %xmm15,%xmm14
1143 pslld $5,%xmm8
1144 pxor %xmm11,%xmm6
1145
1146 movdqa %xmm10,%xmm9
1147 movdqa %xmm0,48-128(%rax)
1148 paddd %xmm0,%xmm14
1149 pxor %xmm3,%xmm1
1150 psrld $27,%xmm9
1151 pxor %xmm12,%xmm6
1152 movdqa %xmm11,%xmm7
1153
1154 pslld $30,%xmm7
1155 movdqa %xmm1,%xmm5
1156 por %xmm9,%xmm8
1157 psrld $31,%xmm5
1158 paddd %xmm6,%xmm14
1159 paddd %xmm1,%xmm1
1160
1161 psrld $2,%xmm11
1162 paddd %xmm8,%xmm14
1163 por %xmm5,%xmm1
1164 por %xmm7,%xmm11
1165 pxor %xmm4,%xmm2
1166 movdqa 112-128(%rax),%xmm4
1167
1168 movdqa %xmm14,%xmm8
1169 movdqa %xmm12,%xmm6
1170 pxor 208-128(%rax),%xmm2
1171 paddd %xmm15,%xmm13
1172 pslld $5,%xmm8
1173 pxor %xmm10,%xmm6
1174
1175 movdqa %xmm14,%xmm9
1176 movdqa %xmm1,64-128(%rax)
1177 paddd %xmm1,%xmm13
1178 pxor %xmm4,%xmm2
1179 psrld $27,%xmm9
1180 pxor %xmm11,%xmm6
1181 movdqa %xmm10,%xmm7
1182
1183 pslld $30,%xmm7
1184 movdqa %xmm2,%xmm5
1185 por %xmm9,%xmm8
1186 psrld $31,%xmm5
1187 paddd %xmm6,%xmm13
1188 paddd %xmm2,%xmm2
1189
1190 psrld $2,%xmm10
1191 paddd %xmm8,%xmm13
1192 por %xmm5,%xmm2
1193 por %xmm7,%xmm10
1194 pxor %xmm0,%xmm3
1195 movdqa 128-128(%rax),%xmm0
1196
1197 movdqa %xmm13,%xmm8
1198 movdqa %xmm11,%xmm6
1199 pxor 224-128(%rax),%xmm3
1200 paddd %xmm15,%xmm12
1201 pslld $5,%xmm8
1202 pxor %xmm14,%xmm6
1203
1204 movdqa %xmm13,%xmm9
1205 movdqa %xmm2,80-128(%rax)
1206 paddd %xmm2,%xmm12
1207 pxor %xmm0,%xmm3
1208 psrld $27,%xmm9
1209 pxor %xmm10,%xmm6
1210 movdqa %xmm14,%xmm7
1211
1212 pslld $30,%xmm7
1213 movdqa %xmm3,%xmm5
1214 por %xmm9,%xmm8
1215 psrld $31,%xmm5
1216 paddd %xmm6,%xmm12
1217 paddd %xmm3,%xmm3
1218
1219 psrld $2,%xmm14
1220 paddd %xmm8,%xmm12
1221 por %xmm5,%xmm3
1222 por %xmm7,%xmm14
1223 pxor %xmm1,%xmm4
1224 movdqa 144-128(%rax),%xmm1
1225
1226 movdqa %xmm12,%xmm8
1227 movdqa %xmm10,%xmm6
1228 pxor 240-128(%rax),%xmm4
1229 paddd %xmm15,%xmm11
1230 pslld $5,%xmm8
1231 pxor %xmm13,%xmm6
1232
1233 movdqa %xmm12,%xmm9
1234 movdqa %xmm3,96-128(%rax)
1235 paddd %xmm3,%xmm11
1236 pxor %xmm1,%xmm4
1237 psrld $27,%xmm9
1238 pxor %xmm14,%xmm6
1239 movdqa %xmm13,%xmm7
1240
1241 pslld $30,%xmm7
1242 movdqa %xmm4,%xmm5
1243 por %xmm9,%xmm8
1244 psrld $31,%xmm5
1245 paddd %xmm6,%xmm11
1246 paddd %xmm4,%xmm4
1247
1248 psrld $2,%xmm13
1249 paddd %xmm8,%xmm11
1250 por %xmm5,%xmm4
1251 por %xmm7,%xmm13
1252 pxor %xmm2,%xmm0
1253 movdqa 160-128(%rax),%xmm2
1254
1255 movdqa %xmm11,%xmm8
1256 movdqa %xmm14,%xmm6
1257 pxor 0-128(%rax),%xmm0
1258 paddd %xmm15,%xmm10
1259 pslld $5,%xmm8
1260 pxor %xmm12,%xmm6
1261
1262 movdqa %xmm11,%xmm9
1263 movdqa %xmm4,112-128(%rax)
1264 paddd %xmm4,%xmm10
1265 pxor %xmm2,%xmm0
1266 psrld $27,%xmm9
1267 pxor %xmm13,%xmm6
1268 movdqa %xmm12,%xmm7
1269
1270 pslld $30,%xmm7
1271 movdqa %xmm0,%xmm5
1272 por %xmm9,%xmm8
1273 psrld $31,%xmm5
1274 paddd %xmm6,%xmm10
1275 paddd %xmm0,%xmm0
1276
1277 psrld $2,%xmm12
1278 paddd %xmm8,%xmm10
1279 por %xmm5,%xmm0
1280 por %xmm7,%xmm12
1281 movdqa 32(%rbp),%xmm15
1282 pxor %xmm3,%xmm1
1283 movdqa 176-128(%rax),%xmm3
1284
1285 movdqa %xmm10,%xmm8
1286 movdqa %xmm13,%xmm7
1287 pxor 16-128(%rax),%xmm1
1288 pxor %xmm3,%xmm1
1289 paddd %xmm15,%xmm14
1290 pslld $5,%xmm8
1291 movdqa %xmm10,%xmm9
1292 pand %xmm12,%xmm7
1293
1294 movdqa %xmm13,%xmm6
1295 movdqa %xmm1,%xmm5
1296 psrld $27,%xmm9
1297 paddd %xmm7,%xmm14
1298 pxor %xmm12,%xmm6
1299
1300 movdqa %xmm0,128-128(%rax)
1301 paddd %xmm0,%xmm14
1302 por %xmm9,%xmm8
1303 psrld $31,%xmm5
1304 pand %xmm11,%xmm6
1305 movdqa %xmm11,%xmm7
1306
1307 pslld $30,%xmm7
1308 paddd %xmm1,%xmm1
1309 paddd %xmm6,%xmm14
1310
1311 psrld $2,%xmm11
1312 paddd %xmm8,%xmm14
1313 por %xmm5,%xmm1
1314 por %xmm7,%xmm11
1315 pxor %xmm4,%xmm2
1316 movdqa 192-128(%rax),%xmm4
1317
1318 movdqa %xmm14,%xmm8
1319 movdqa %xmm12,%xmm7
1320 pxor 32-128(%rax),%xmm2
1321 pxor %xmm4,%xmm2
1322 paddd %xmm15,%xmm13
1323 pslld $5,%xmm8
1324 movdqa %xmm14,%xmm9
1325 pand %xmm11,%xmm7
1326
1327 movdqa %xmm12,%xmm6
1328 movdqa %xmm2,%xmm5
1329 psrld $27,%xmm9
1330 paddd %xmm7,%xmm13
1331 pxor %xmm11,%xmm6
1332
1333 movdqa %xmm1,144-128(%rax)
1334 paddd %xmm1,%xmm13
1335 por %xmm9,%xmm8
1336 psrld $31,%xmm5
1337 pand %xmm10,%xmm6
1338 movdqa %xmm10,%xmm7
1339
1340 pslld $30,%xmm7
1341 paddd %xmm2,%xmm2
1342 paddd %xmm6,%xmm13
1343
1344 psrld $2,%xmm10
1345 paddd %xmm8,%xmm13
1346 por %xmm5,%xmm2
1347 por %xmm7,%xmm10
1348 pxor %xmm0,%xmm3
1349 movdqa 208-128(%rax),%xmm0
1350
1351 movdqa %xmm13,%xmm8
1352 movdqa %xmm11,%xmm7
1353 pxor 48-128(%rax),%xmm3
1354 pxor %xmm0,%xmm3
1355 paddd %xmm15,%xmm12
1356 pslld $5,%xmm8
1357 movdqa %xmm13,%xmm9
1358 pand %xmm10,%xmm7
1359
1360 movdqa %xmm11,%xmm6
1361 movdqa %xmm3,%xmm5
1362 psrld $27,%xmm9
1363 paddd %xmm7,%xmm12
1364 pxor %xmm10,%xmm6
1365
1366 movdqa %xmm2,160-128(%rax)
1367 paddd %xmm2,%xmm12
1368 por %xmm9,%xmm8
1369 psrld $31,%xmm5
1370 pand %xmm14,%xmm6
1371 movdqa %xmm14,%xmm7
1372
1373 pslld $30,%xmm7
1374 paddd %xmm3,%xmm3
1375 paddd %xmm6,%xmm12
1376
1377 psrld $2,%xmm14
1378 paddd %xmm8,%xmm12
1379 por %xmm5,%xmm3
1380 por %xmm7,%xmm14
1381 pxor %xmm1,%xmm4
1382 movdqa 224-128(%rax),%xmm1
1383
1384 movdqa %xmm12,%xmm8
1385 movdqa %xmm10,%xmm7
1386 pxor 64-128(%rax),%xmm4
1387 pxor %xmm1,%xmm4
1388 paddd %xmm15,%xmm11
1389 pslld $5,%xmm8
1390 movdqa %xmm12,%xmm9
1391 pand %xmm14,%xmm7
1392
1393 movdqa %xmm10,%xmm6
1394 movdqa %xmm4,%xmm5
1395 psrld $27,%xmm9
1396 paddd %xmm7,%xmm11
1397 pxor %xmm14,%xmm6
1398
1399 movdqa %xmm3,176-128(%rax)
1400 paddd %xmm3,%xmm11
1401 por %xmm9,%xmm8
1402 psrld $31,%xmm5
1403 pand %xmm13,%xmm6
1404 movdqa %xmm13,%xmm7
1405
1406 pslld $30,%xmm7
1407 paddd %xmm4,%xmm4
1408 paddd %xmm6,%xmm11
1409
1410 psrld $2,%xmm13
1411 paddd %xmm8,%xmm11
1412 por %xmm5,%xmm4
1413 por %xmm7,%xmm13
1414 pxor %xmm2,%xmm0
1415 movdqa 240-128(%rax),%xmm2
1416
1417 movdqa %xmm11,%xmm8
1418 movdqa %xmm14,%xmm7
1419 pxor 80-128(%rax),%xmm0
1420 pxor %xmm2,%xmm0
1421 paddd %xmm15,%xmm10
1422 pslld $5,%xmm8
1423 movdqa %xmm11,%xmm9
1424 pand %xmm13,%xmm7
1425
1426 movdqa %xmm14,%xmm6
1427 movdqa %xmm0,%xmm5
1428 psrld $27,%xmm9
1429 paddd %xmm7,%xmm10
1430 pxor %xmm13,%xmm6
1431
1432 movdqa %xmm4,192-128(%rax)
1433 paddd %xmm4,%xmm10
1434 por %xmm9,%xmm8
1435 psrld $31,%xmm5
1436 pand %xmm12,%xmm6
1437 movdqa %xmm12,%xmm7
1438
1439 pslld $30,%xmm7
1440 paddd %xmm0,%xmm0
1441 paddd %xmm6,%xmm10
1442
1443 psrld $2,%xmm12
1444 paddd %xmm8,%xmm10
1445 por %xmm5,%xmm0
1446 por %xmm7,%xmm12
1447 pxor %xmm3,%xmm1
1448 movdqa 0-128(%rax),%xmm3
1449
1450 movdqa %xmm10,%xmm8
1451 movdqa %xmm13,%xmm7
1452 pxor 96-128(%rax),%xmm1
1453 pxor %xmm3,%xmm1
1454 paddd %xmm15,%xmm14
1455 pslld $5,%xmm8
1456 movdqa %xmm10,%xmm9
1457 pand %xmm12,%xmm7
1458
1459 movdqa %xmm13,%xmm6
1460 movdqa %xmm1,%xmm5
1461 psrld $27,%xmm9
1462 paddd %xmm7,%xmm14
1463 pxor %xmm12,%xmm6
1464
1465 movdqa %xmm0,208-128(%rax)
1466 paddd %xmm0,%xmm14
1467 por %xmm9,%xmm8
1468 psrld $31,%xmm5
1469 pand %xmm11,%xmm6
1470 movdqa %xmm11,%xmm7
1471
1472 pslld $30,%xmm7
1473 paddd %xmm1,%xmm1
1474 paddd %xmm6,%xmm14
1475
1476 psrld $2,%xmm11
1477 paddd %xmm8,%xmm14
1478 por %xmm5,%xmm1
1479 por %xmm7,%xmm11
1480 pxor %xmm4,%xmm2
1481 movdqa 16-128(%rax),%xmm4
1482
1483 movdqa %xmm14,%xmm8
1484 movdqa %xmm12,%xmm7
1485 pxor 112-128(%rax),%xmm2
1486 pxor %xmm4,%xmm2
1487 paddd %xmm15,%xmm13
1488 pslld $5,%xmm8
1489 movdqa %xmm14,%xmm9
1490 pand %xmm11,%xmm7
1491
1492 movdqa %xmm12,%xmm6
1493 movdqa %xmm2,%xmm5
1494 psrld $27,%xmm9
1495 paddd %xmm7,%xmm13
1496 pxor %xmm11,%xmm6
1497
1498 movdqa %xmm1,224-128(%rax)
1499 paddd %xmm1,%xmm13
1500 por %xmm9,%xmm8
1501 psrld $31,%xmm5
1502 pand %xmm10,%xmm6
1503 movdqa %xmm10,%xmm7
1504
1505 pslld $30,%xmm7
1506 paddd %xmm2,%xmm2
1507 paddd %xmm6,%xmm13
1508
1509 psrld $2,%xmm10
1510 paddd %xmm8,%xmm13
1511 por %xmm5,%xmm2
1512 por %xmm7,%xmm10
1513 pxor %xmm0,%xmm3
1514 movdqa 32-128(%rax),%xmm0
1515
1516 movdqa %xmm13,%xmm8
1517 movdqa %xmm11,%xmm7
1518 pxor 128-128(%rax),%xmm3
1519 pxor %xmm0,%xmm3
1520 paddd %xmm15,%xmm12
1521 pslld $5,%xmm8
1522 movdqa %xmm13,%xmm9
1523 pand %xmm10,%xmm7
1524
1525 movdqa %xmm11,%xmm6
1526 movdqa %xmm3,%xmm5
1527 psrld $27,%xmm9
1528 paddd %xmm7,%xmm12
1529 pxor %xmm10,%xmm6
1530
1531 movdqa %xmm2,240-128(%rax)
1532 paddd %xmm2,%xmm12
1533 por %xmm9,%xmm8
1534 psrld $31,%xmm5
1535 pand %xmm14,%xmm6
1536 movdqa %xmm14,%xmm7
1537
1538 pslld $30,%xmm7
1539 paddd %xmm3,%xmm3
1540 paddd %xmm6,%xmm12
1541
1542 psrld $2,%xmm14
1543 paddd %xmm8,%xmm12
1544 por %xmm5,%xmm3
1545 por %xmm7,%xmm14
1546 pxor %xmm1,%xmm4
1547 movdqa 48-128(%rax),%xmm1
1548
1549 movdqa %xmm12,%xmm8
1550 movdqa %xmm10,%xmm7
1551 pxor 144-128(%rax),%xmm4
1552 pxor %xmm1,%xmm4
1553 paddd %xmm15,%xmm11
1554 pslld $5,%xmm8
1555 movdqa %xmm12,%xmm9
1556 pand %xmm14,%xmm7
1557
1558 movdqa %xmm10,%xmm6
1559 movdqa %xmm4,%xmm5
1560 psrld $27,%xmm9
1561 paddd %xmm7,%xmm11
1562 pxor %xmm14,%xmm6
1563
1564 movdqa %xmm3,0-128(%rax)
1565 paddd %xmm3,%xmm11
1566 por %xmm9,%xmm8
1567 psrld $31,%xmm5
1568 pand %xmm13,%xmm6
1569 movdqa %xmm13,%xmm7
1570
1571 pslld $30,%xmm7
1572 paddd %xmm4,%xmm4
1573 paddd %xmm6,%xmm11
1574
1575 psrld $2,%xmm13
1576 paddd %xmm8,%xmm11
1577 por %xmm5,%xmm4
1578 por %xmm7,%xmm13
1579 pxor %xmm2,%xmm0
1580 movdqa 64-128(%rax),%xmm2
1581
1582 movdqa %xmm11,%xmm8
1583 movdqa %xmm14,%xmm7
1584 pxor 160-128(%rax),%xmm0
1585 pxor %xmm2,%xmm0
1586 paddd %xmm15,%xmm10
1587 pslld $5,%xmm8
1588 movdqa %xmm11,%xmm9
1589 pand %xmm13,%xmm7
1590
1591 movdqa %xmm14,%xmm6
1592 movdqa %xmm0,%xmm5
1593 psrld $27,%xmm9
1594 paddd %xmm7,%xmm10
1595 pxor %xmm13,%xmm6
1596
1597 movdqa %xmm4,16-128(%rax)
1598 paddd %xmm4,%xmm10
1599 por %xmm9,%xmm8
1600 psrld $31,%xmm5
1601 pand %xmm12,%xmm6
1602 movdqa %xmm12,%xmm7
1603
1604 pslld $30,%xmm7
1605 paddd %xmm0,%xmm0
1606 paddd %xmm6,%xmm10
1607
1608 psrld $2,%xmm12
1609 paddd %xmm8,%xmm10
1610 por %xmm5,%xmm0
1611 por %xmm7,%xmm12
1612 pxor %xmm3,%xmm1
1613 movdqa 80-128(%rax),%xmm3
1614
1615 movdqa %xmm10,%xmm8
1616 movdqa %xmm13,%xmm7
1617 pxor 176-128(%rax),%xmm1
1618 pxor %xmm3,%xmm1
1619 paddd %xmm15,%xmm14
1620 pslld $5,%xmm8
1621 movdqa %xmm10,%xmm9
1622 pand %xmm12,%xmm7
1623
1624 movdqa %xmm13,%xmm6
1625 movdqa %xmm1,%xmm5
1626 psrld $27,%xmm9
1627 paddd %xmm7,%xmm14
1628 pxor %xmm12,%xmm6
1629
1630 movdqa %xmm0,32-128(%rax)
1631 paddd %xmm0,%xmm14
1632 por %xmm9,%xmm8
1633 psrld $31,%xmm5
1634 pand %xmm11,%xmm6
1635 movdqa %xmm11,%xmm7
1636
1637 pslld $30,%xmm7
1638 paddd %xmm1,%xmm1
1639 paddd %xmm6,%xmm14
1640
1641 psrld $2,%xmm11
1642 paddd %xmm8,%xmm14
1643 por %xmm5,%xmm1
1644 por %xmm7,%xmm11
1645 pxor %xmm4,%xmm2
1646 movdqa 96-128(%rax),%xmm4
1647
1648 movdqa %xmm14,%xmm8
1649 movdqa %xmm12,%xmm7
1650 pxor 192-128(%rax),%xmm2
1651 pxor %xmm4,%xmm2
1652 paddd %xmm15,%xmm13
1653 pslld $5,%xmm8
1654 movdqa %xmm14,%xmm9
1655 pand %xmm11,%xmm7
1656
1657 movdqa %xmm12,%xmm6
1658 movdqa %xmm2,%xmm5
1659 psrld $27,%xmm9
1660 paddd %xmm7,%xmm13
1661 pxor %xmm11,%xmm6
1662
1663 movdqa %xmm1,48-128(%rax)
1664 paddd %xmm1,%xmm13
1665 por %xmm9,%xmm8
1666 psrld $31,%xmm5
1667 pand %xmm10,%xmm6
1668 movdqa %xmm10,%xmm7
1669
1670 pslld $30,%xmm7
1671 paddd %xmm2,%xmm2
1672 paddd %xmm6,%xmm13
1673
1674 psrld $2,%xmm10
1675 paddd %xmm8,%xmm13
1676 por %xmm5,%xmm2
1677 por %xmm7,%xmm10
1678 pxor %xmm0,%xmm3
1679 movdqa 112-128(%rax),%xmm0
1680
1681 movdqa %xmm13,%xmm8
1682 movdqa %xmm11,%xmm7
1683 pxor 208-128(%rax),%xmm3
1684 pxor %xmm0,%xmm3
1685 paddd %xmm15,%xmm12
1686 pslld $5,%xmm8
1687 movdqa %xmm13,%xmm9
1688 pand %xmm10,%xmm7
1689
1690 movdqa %xmm11,%xmm6
1691 movdqa %xmm3,%xmm5
1692 psrld $27,%xmm9
1693 paddd %xmm7,%xmm12
1694 pxor %xmm10,%xmm6
1695
1696 movdqa %xmm2,64-128(%rax)
1697 paddd %xmm2,%xmm12
1698 por %xmm9,%xmm8
1699 psrld $31,%xmm5
1700 pand %xmm14,%xmm6
1701 movdqa %xmm14,%xmm7
1702
1703 pslld $30,%xmm7
1704 paddd %xmm3,%xmm3
1705 paddd %xmm6,%xmm12
1706
1707 psrld $2,%xmm14
1708 paddd %xmm8,%xmm12
1709 por %xmm5,%xmm3
1710 por %xmm7,%xmm14
1711 pxor %xmm1,%xmm4
1712 movdqa 128-128(%rax),%xmm1
1713
1714 movdqa %xmm12,%xmm8
1715 movdqa %xmm10,%xmm7
1716 pxor 224-128(%rax),%xmm4
1717 pxor %xmm1,%xmm4
1718 paddd %xmm15,%xmm11
1719 pslld $5,%xmm8
1720 movdqa %xmm12,%xmm9
1721 pand %xmm14,%xmm7
1722
1723 movdqa %xmm10,%xmm6
1724 movdqa %xmm4,%xmm5
1725 psrld $27,%xmm9
1726 paddd %xmm7,%xmm11
1727 pxor %xmm14,%xmm6
1728
1729 movdqa %xmm3,80-128(%rax)
1730 paddd %xmm3,%xmm11
1731 por %xmm9,%xmm8
1732 psrld $31,%xmm5
1733 pand %xmm13,%xmm6
1734 movdqa %xmm13,%xmm7
1735
1736 pslld $30,%xmm7
1737 paddd %xmm4,%xmm4
1738 paddd %xmm6,%xmm11
1739
1740 psrld $2,%xmm13
1741 paddd %xmm8,%xmm11
1742 por %xmm5,%xmm4
1743 por %xmm7,%xmm13
1744 pxor %xmm2,%xmm0
1745 movdqa 144-128(%rax),%xmm2
1746
1747 movdqa %xmm11,%xmm8
1748 movdqa %xmm14,%xmm7
1749 pxor 240-128(%rax),%xmm0
1750 pxor %xmm2,%xmm0
1751 paddd %xmm15,%xmm10
1752 pslld $5,%xmm8
1753 movdqa %xmm11,%xmm9
1754 pand %xmm13,%xmm7
1755
1756 movdqa %xmm14,%xmm6
1757 movdqa %xmm0,%xmm5
1758 psrld $27,%xmm9
1759 paddd %xmm7,%xmm10
1760 pxor %xmm13,%xmm6
1761
1762 movdqa %xmm4,96-128(%rax)
1763 paddd %xmm4,%xmm10
1764 por %xmm9,%xmm8
1765 psrld $31,%xmm5
1766 pand %xmm12,%xmm6
1767 movdqa %xmm12,%xmm7
1768
1769 pslld $30,%xmm7
1770 paddd %xmm0,%xmm0
1771 paddd %xmm6,%xmm10
1772
1773 psrld $2,%xmm12
1774 paddd %xmm8,%xmm10
1775 por %xmm5,%xmm0
1776 por %xmm7,%xmm12
1777 pxor %xmm3,%xmm1
1778 movdqa 160-128(%rax),%xmm3
1779
1780 movdqa %xmm10,%xmm8
1781 movdqa %xmm13,%xmm7
1782 pxor 0-128(%rax),%xmm1
1783 pxor %xmm3,%xmm1
1784 paddd %xmm15,%xmm14
1785 pslld $5,%xmm8
1786 movdqa %xmm10,%xmm9
1787 pand %xmm12,%xmm7
1788
1789 movdqa %xmm13,%xmm6
1790 movdqa %xmm1,%xmm5
1791 psrld $27,%xmm9
1792 paddd %xmm7,%xmm14
1793 pxor %xmm12,%xmm6
1794
1795 movdqa %xmm0,112-128(%rax)
1796 paddd %xmm0,%xmm14
1797 por %xmm9,%xmm8
1798 psrld $31,%xmm5
1799 pand %xmm11,%xmm6
1800 movdqa %xmm11,%xmm7
1801
1802 pslld $30,%xmm7
1803 paddd %xmm1,%xmm1
1804 paddd %xmm6,%xmm14
1805
1806 psrld $2,%xmm11
1807 paddd %xmm8,%xmm14
1808 por %xmm5,%xmm1
1809 por %xmm7,%xmm11
1810 pxor %xmm4,%xmm2
1811 movdqa 176-128(%rax),%xmm4
1812
1813 movdqa %xmm14,%xmm8
1814 movdqa %xmm12,%xmm7
1815 pxor 16-128(%rax),%xmm2
1816 pxor %xmm4,%xmm2
1817 paddd %xmm15,%xmm13
1818 pslld $5,%xmm8
1819 movdqa %xmm14,%xmm9
1820 pand %xmm11,%xmm7
1821
1822 movdqa %xmm12,%xmm6
1823 movdqa %xmm2,%xmm5
1824 psrld $27,%xmm9
1825 paddd %xmm7,%xmm13
1826 pxor %xmm11,%xmm6
1827
1828 movdqa %xmm1,128-128(%rax)
1829 paddd %xmm1,%xmm13
1830 por %xmm9,%xmm8
1831 psrld $31,%xmm5
1832 pand %xmm10,%xmm6
1833 movdqa %xmm10,%xmm7
1834
1835 pslld $30,%xmm7
1836 paddd %xmm2,%xmm2
1837 paddd %xmm6,%xmm13
1838
1839 psrld $2,%xmm10
1840 paddd %xmm8,%xmm13
1841 por %xmm5,%xmm2
1842 por %xmm7,%xmm10
1843 pxor %xmm0,%xmm3
1844 movdqa 192-128(%rax),%xmm0
1845
1846 movdqa %xmm13,%xmm8
1847 movdqa %xmm11,%xmm7
1848 pxor 32-128(%rax),%xmm3
1849 pxor %xmm0,%xmm3
1850 paddd %xmm15,%xmm12
1851 pslld $5,%xmm8
1852 movdqa %xmm13,%xmm9
1853 pand %xmm10,%xmm7
1854
1855 movdqa %xmm11,%xmm6
1856 movdqa %xmm3,%xmm5
1857 psrld $27,%xmm9
1858 paddd %xmm7,%xmm12
1859 pxor %xmm10,%xmm6
1860
1861 movdqa %xmm2,144-128(%rax)
1862 paddd %xmm2,%xmm12
1863 por %xmm9,%xmm8
1864 psrld $31,%xmm5
1865 pand %xmm14,%xmm6
1866 movdqa %xmm14,%xmm7
1867
1868 pslld $30,%xmm7
1869 paddd %xmm3,%xmm3
1870 paddd %xmm6,%xmm12
1871
1872 psrld $2,%xmm14
1873 paddd %xmm8,%xmm12
1874 por %xmm5,%xmm3
1875 por %xmm7,%xmm14
1876 pxor %xmm1,%xmm4
1877 movdqa 208-128(%rax),%xmm1
1878
1879 movdqa %xmm12,%xmm8
1880 movdqa %xmm10,%xmm7
1881 pxor 48-128(%rax),%xmm4
1882 pxor %xmm1,%xmm4
1883 paddd %xmm15,%xmm11
1884 pslld $5,%xmm8
1885 movdqa %xmm12,%xmm9
1886 pand %xmm14,%xmm7
1887
1888 movdqa %xmm10,%xmm6
1889 movdqa %xmm4,%xmm5
1890 psrld $27,%xmm9
1891 paddd %xmm7,%xmm11
1892 pxor %xmm14,%xmm6
1893
1894 movdqa %xmm3,160-128(%rax)
1895 paddd %xmm3,%xmm11
1896 por %xmm9,%xmm8
1897 psrld $31,%xmm5
1898 pand %xmm13,%xmm6
1899 movdqa %xmm13,%xmm7
1900
1901 pslld $30,%xmm7
1902 paddd %xmm4,%xmm4
1903 paddd %xmm6,%xmm11
1904
1905 psrld $2,%xmm13
1906 paddd %xmm8,%xmm11
1907 por %xmm5,%xmm4
1908 por %xmm7,%xmm13
1909 pxor %xmm2,%xmm0
1910 movdqa 224-128(%rax),%xmm2
1911
1912 movdqa %xmm11,%xmm8
1913 movdqa %xmm14,%xmm7
1914 pxor 64-128(%rax),%xmm0
1915 pxor %xmm2,%xmm0
1916 paddd %xmm15,%xmm10
1917 pslld $5,%xmm8
1918 movdqa %xmm11,%xmm9
1919 pand %xmm13,%xmm7
1920
1921 movdqa %xmm14,%xmm6
1922 movdqa %xmm0,%xmm5
1923 psrld $27,%xmm9
1924 paddd %xmm7,%xmm10
1925 pxor %xmm13,%xmm6
1926
1927 movdqa %xmm4,176-128(%rax)
1928 paddd %xmm4,%xmm10
1929 por %xmm9,%xmm8
1930 psrld $31,%xmm5
1931 pand %xmm12,%xmm6
1932 movdqa %xmm12,%xmm7
1933
1934 pslld $30,%xmm7
1935 paddd %xmm0,%xmm0
1936 paddd %xmm6,%xmm10
1937
1938 psrld $2,%xmm12
1939 paddd %xmm8,%xmm10
1940 por %xmm5,%xmm0
1941 por %xmm7,%xmm12
1942 movdqa 64(%rbp),%xmm15
1943 pxor %xmm3,%xmm1
1944 movdqa 240-128(%rax),%xmm3
1945
1946 movdqa %xmm10,%xmm8
1947 movdqa %xmm13,%xmm6
1948 pxor 80-128(%rax),%xmm1
1949 paddd %xmm15,%xmm14
1950 pslld $5,%xmm8
1951 pxor %xmm11,%xmm6
1952
1953 movdqa %xmm10,%xmm9
1954 movdqa %xmm0,192-128(%rax)
1955 paddd %xmm0,%xmm14
1956 pxor %xmm3,%xmm1
1957 psrld $27,%xmm9
1958 pxor %xmm12,%xmm6
1959 movdqa %xmm11,%xmm7
1960
1961 pslld $30,%xmm7
1962 movdqa %xmm1,%xmm5
1963 por %xmm9,%xmm8
1964 psrld $31,%xmm5
1965 paddd %xmm6,%xmm14
1966 paddd %xmm1,%xmm1
1967
1968 psrld $2,%xmm11
1969 paddd %xmm8,%xmm14
1970 por %xmm5,%xmm1
1971 por %xmm7,%xmm11
1972 pxor %xmm4,%xmm2
1973 movdqa 0-128(%rax),%xmm4
1974
1975 movdqa %xmm14,%xmm8
1976 movdqa %xmm12,%xmm6
1977 pxor 96-128(%rax),%xmm2
1978 paddd %xmm15,%xmm13
1979 pslld $5,%xmm8
1980 pxor %xmm10,%xmm6
1981
1982 movdqa %xmm14,%xmm9
1983 movdqa %xmm1,208-128(%rax)
1984 paddd %xmm1,%xmm13
1985 pxor %xmm4,%xmm2
1986 psrld $27,%xmm9
1987 pxor %xmm11,%xmm6
1988 movdqa %xmm10,%xmm7
1989
1990 pslld $30,%xmm7
1991 movdqa %xmm2,%xmm5
1992 por %xmm9,%xmm8
1993 psrld $31,%xmm5
1994 paddd %xmm6,%xmm13
1995 paddd %xmm2,%xmm2
1996
1997 psrld $2,%xmm10
1998 paddd %xmm8,%xmm13
1999 por %xmm5,%xmm2
2000 por %xmm7,%xmm10
2001 pxor %xmm0,%xmm3
2002 movdqa 16-128(%rax),%xmm0
2003
2004 movdqa %xmm13,%xmm8
2005 movdqa %xmm11,%xmm6
2006 pxor 112-128(%rax),%xmm3
2007 paddd %xmm15,%xmm12
2008 pslld $5,%xmm8
2009 pxor %xmm14,%xmm6
2010
2011 movdqa %xmm13,%xmm9
2012 movdqa %xmm2,224-128(%rax)
2013 paddd %xmm2,%xmm12
2014 pxor %xmm0,%xmm3
2015 psrld $27,%xmm9
2016 pxor %xmm10,%xmm6
2017 movdqa %xmm14,%xmm7
2018
2019 pslld $30,%xmm7
2020 movdqa %xmm3,%xmm5
2021 por %xmm9,%xmm8
2022 psrld $31,%xmm5
2023 paddd %xmm6,%xmm12
2024 paddd %xmm3,%xmm3
2025
2026 psrld $2,%xmm14
2027 paddd %xmm8,%xmm12
2028 por %xmm5,%xmm3
2029 por %xmm7,%xmm14
2030 pxor %xmm1,%xmm4
2031 movdqa 32-128(%rax),%xmm1
2032
2033 movdqa %xmm12,%xmm8
2034 movdqa %xmm10,%xmm6
2035 pxor 128-128(%rax),%xmm4
2036 paddd %xmm15,%xmm11
2037 pslld $5,%xmm8
2038 pxor %xmm13,%xmm6
2039
2040 movdqa %xmm12,%xmm9
2041 movdqa %xmm3,240-128(%rax)
2042 paddd %xmm3,%xmm11
2043 pxor %xmm1,%xmm4
2044 psrld $27,%xmm9
2045 pxor %xmm14,%xmm6
2046 movdqa %xmm13,%xmm7
2047
2048 pslld $30,%xmm7
2049 movdqa %xmm4,%xmm5
2050 por %xmm9,%xmm8
2051 psrld $31,%xmm5
2052 paddd %xmm6,%xmm11
2053 paddd %xmm4,%xmm4
2054
2055 psrld $2,%xmm13
2056 paddd %xmm8,%xmm11
2057 por %xmm5,%xmm4
2058 por %xmm7,%xmm13
2059 pxor %xmm2,%xmm0
2060 movdqa 48-128(%rax),%xmm2
2061
2062 movdqa %xmm11,%xmm8
2063 movdqa %xmm14,%xmm6
2064 pxor 144-128(%rax),%xmm0
2065 paddd %xmm15,%xmm10
2066 pslld $5,%xmm8
2067 pxor %xmm12,%xmm6
2068
2069 movdqa %xmm11,%xmm9
2070 movdqa %xmm4,0-128(%rax)
2071 paddd %xmm4,%xmm10
2072 pxor %xmm2,%xmm0
2073 psrld $27,%xmm9
2074 pxor %xmm13,%xmm6
2075 movdqa %xmm12,%xmm7
2076
2077 pslld $30,%xmm7
2078 movdqa %xmm0,%xmm5
2079 por %xmm9,%xmm8
2080 psrld $31,%xmm5
2081 paddd %xmm6,%xmm10
2082 paddd %xmm0,%xmm0
2083
2084 psrld $2,%xmm12
2085 paddd %xmm8,%xmm10
2086 por %xmm5,%xmm0
2087 por %xmm7,%xmm12
2088 pxor %xmm3,%xmm1
2089 movdqa 64-128(%rax),%xmm3
2090
2091 movdqa %xmm10,%xmm8
2092 movdqa %xmm13,%xmm6
2093 pxor 160-128(%rax),%xmm1
2094 paddd %xmm15,%xmm14
2095 pslld $5,%xmm8
2096 pxor %xmm11,%xmm6
2097
2098 movdqa %xmm10,%xmm9
2099 movdqa %xmm0,16-128(%rax)
2100 paddd %xmm0,%xmm14
2101 pxor %xmm3,%xmm1
2102 psrld $27,%xmm9
2103 pxor %xmm12,%xmm6
2104 movdqa %xmm11,%xmm7
2105
2106 pslld $30,%xmm7
2107 movdqa %xmm1,%xmm5
2108 por %xmm9,%xmm8
2109 psrld $31,%xmm5
2110 paddd %xmm6,%xmm14
2111 paddd %xmm1,%xmm1
2112
2113 psrld $2,%xmm11
2114 paddd %xmm8,%xmm14
2115 por %xmm5,%xmm1
2116 por %xmm7,%xmm11
2117 pxor %xmm4,%xmm2
2118 movdqa 80-128(%rax),%xmm4
2119
2120 movdqa %xmm14,%xmm8
2121 movdqa %xmm12,%xmm6
2122 pxor 176-128(%rax),%xmm2
2123 paddd %xmm15,%xmm13
2124 pslld $5,%xmm8
2125 pxor %xmm10,%xmm6
2126
2127 movdqa %xmm14,%xmm9
2128 movdqa %xmm1,32-128(%rax)
2129 paddd %xmm1,%xmm13
2130 pxor %xmm4,%xmm2
2131 psrld $27,%xmm9
2132 pxor %xmm11,%xmm6
2133 movdqa %xmm10,%xmm7
2134
2135 pslld $30,%xmm7
2136 movdqa %xmm2,%xmm5
2137 por %xmm9,%xmm8
2138 psrld $31,%xmm5
2139 paddd %xmm6,%xmm13
2140 paddd %xmm2,%xmm2
2141
2142 psrld $2,%xmm10
2143 paddd %xmm8,%xmm13
2144 por %xmm5,%xmm2
2145 por %xmm7,%xmm10
2146 pxor %xmm0,%xmm3
2147 movdqa 96-128(%rax),%xmm0
2148
2149 movdqa %xmm13,%xmm8
2150 movdqa %xmm11,%xmm6
2151 pxor 192-128(%rax),%xmm3
2152 paddd %xmm15,%xmm12
2153 pslld $5,%xmm8
2154 pxor %xmm14,%xmm6
2155
2156 movdqa %xmm13,%xmm9
2157 movdqa %xmm2,48-128(%rax)
2158 paddd %xmm2,%xmm12
2159 pxor %xmm0,%xmm3
2160 psrld $27,%xmm9
2161 pxor %xmm10,%xmm6
2162 movdqa %xmm14,%xmm7
2163
2164 pslld $30,%xmm7
2165 movdqa %xmm3,%xmm5
2166 por %xmm9,%xmm8
2167 psrld $31,%xmm5
2168 paddd %xmm6,%xmm12
2169 paddd %xmm3,%xmm3
2170
2171 psrld $2,%xmm14
2172 paddd %xmm8,%xmm12
2173 por %xmm5,%xmm3
2174 por %xmm7,%xmm14
2175 pxor %xmm1,%xmm4
2176 movdqa 112-128(%rax),%xmm1
2177
2178 movdqa %xmm12,%xmm8
2179 movdqa %xmm10,%xmm6
2180 pxor 208-128(%rax),%xmm4
2181 paddd %xmm15,%xmm11
2182 pslld $5,%xmm8
2183 pxor %xmm13,%xmm6
2184
2185 movdqa %xmm12,%xmm9
2186 movdqa %xmm3,64-128(%rax)
2187 paddd %xmm3,%xmm11
2188 pxor %xmm1,%xmm4
2189 psrld $27,%xmm9
2190 pxor %xmm14,%xmm6
2191 movdqa %xmm13,%xmm7
2192
2193 pslld $30,%xmm7
2194 movdqa %xmm4,%xmm5
2195 por %xmm9,%xmm8
2196 psrld $31,%xmm5
2197 paddd %xmm6,%xmm11
2198 paddd %xmm4,%xmm4
2199
2200 psrld $2,%xmm13
2201 paddd %xmm8,%xmm11
2202 por %xmm5,%xmm4
2203 por %xmm7,%xmm13
2204 pxor %xmm2,%xmm0
2205 movdqa 128-128(%rax),%xmm2
2206
2207 movdqa %xmm11,%xmm8
2208 movdqa %xmm14,%xmm6
2209 pxor 224-128(%rax),%xmm0
2210 paddd %xmm15,%xmm10
2211 pslld $5,%xmm8
2212 pxor %xmm12,%xmm6
2213
2214 movdqa %xmm11,%xmm9
2215 movdqa %xmm4,80-128(%rax)
2216 paddd %xmm4,%xmm10
2217 pxor %xmm2,%xmm0
2218 psrld $27,%xmm9
2219 pxor %xmm13,%xmm6
2220 movdqa %xmm12,%xmm7
2221
2222 pslld $30,%xmm7
2223 movdqa %xmm0,%xmm5
2224 por %xmm9,%xmm8
2225 psrld $31,%xmm5
2226 paddd %xmm6,%xmm10
2227 paddd %xmm0,%xmm0
2228
2229 psrld $2,%xmm12
2230 paddd %xmm8,%xmm10
2231 por %xmm5,%xmm0
2232 por %xmm7,%xmm12
2233 pxor %xmm3,%xmm1
2234 movdqa 144-128(%rax),%xmm3
2235
2236 movdqa %xmm10,%xmm8
2237 movdqa %xmm13,%xmm6
2238 pxor 240-128(%rax),%xmm1
2239 paddd %xmm15,%xmm14
2240 pslld $5,%xmm8
2241 pxor %xmm11,%xmm6
2242
2243 movdqa %xmm10,%xmm9
2244 movdqa %xmm0,96-128(%rax)
2245 paddd %xmm0,%xmm14
2246 pxor %xmm3,%xmm1
2247 psrld $27,%xmm9
2248 pxor %xmm12,%xmm6
2249 movdqa %xmm11,%xmm7
2250
2251 pslld $30,%xmm7
2252 movdqa %xmm1,%xmm5
2253 por %xmm9,%xmm8
2254 psrld $31,%xmm5
2255 paddd %xmm6,%xmm14
2256 paddd %xmm1,%xmm1
2257
2258 psrld $2,%xmm11
2259 paddd %xmm8,%xmm14
2260 por %xmm5,%xmm1
2261 por %xmm7,%xmm11
2262 pxor %xmm4,%xmm2
2263 movdqa 160-128(%rax),%xmm4
2264
2265 movdqa %xmm14,%xmm8
2266 movdqa %xmm12,%xmm6
2267 pxor 0-128(%rax),%xmm2
2268 paddd %xmm15,%xmm13
2269 pslld $5,%xmm8
2270 pxor %xmm10,%xmm6
2271
2272 movdqa %xmm14,%xmm9
2273 movdqa %xmm1,112-128(%rax)
2274 paddd %xmm1,%xmm13
2275 pxor %xmm4,%xmm2
2276 psrld $27,%xmm9
2277 pxor %xmm11,%xmm6
2278 movdqa %xmm10,%xmm7
2279
2280 pslld $30,%xmm7
2281 movdqa %xmm2,%xmm5
2282 por %xmm9,%xmm8
2283 psrld $31,%xmm5
2284 paddd %xmm6,%xmm13
2285 paddd %xmm2,%xmm2
2286
2287 psrld $2,%xmm10
2288 paddd %xmm8,%xmm13
2289 por %xmm5,%xmm2
2290 por %xmm7,%xmm10
2291 pxor %xmm0,%xmm3
2292 movdqa 176-128(%rax),%xmm0
2293
2294 movdqa %xmm13,%xmm8
2295 movdqa %xmm11,%xmm6
2296 pxor 16-128(%rax),%xmm3
2297 paddd %xmm15,%xmm12
2298 pslld $5,%xmm8
2299 pxor %xmm14,%xmm6
2300
2301 movdqa %xmm13,%xmm9
2302 paddd %xmm2,%xmm12
2303 pxor %xmm0,%xmm3
2304 psrld $27,%xmm9
2305 pxor %xmm10,%xmm6
2306 movdqa %xmm14,%xmm7
2307
2308 pslld $30,%xmm7
2309 movdqa %xmm3,%xmm5
2310 por %xmm9,%xmm8
2311 psrld $31,%xmm5
2312 paddd %xmm6,%xmm12
2313 paddd %xmm3,%xmm3
2314
2315 psrld $2,%xmm14
2316 paddd %xmm8,%xmm12
2317 por %xmm5,%xmm3
2318 por %xmm7,%xmm14
2319 pxor %xmm1,%xmm4
2320 movdqa 192-128(%rax),%xmm1
2321
2322 movdqa %xmm12,%xmm8
2323 movdqa %xmm10,%xmm6
2324 pxor 32-128(%rax),%xmm4
2325 paddd %xmm15,%xmm11
2326 pslld $5,%xmm8
2327 pxor %xmm13,%xmm6
2328
2329 movdqa %xmm12,%xmm9
2330 paddd %xmm3,%xmm11
2331 pxor %xmm1,%xmm4
2332 psrld $27,%xmm9
2333 pxor %xmm14,%xmm6
2334 movdqa %xmm13,%xmm7
2335
2336 pslld $30,%xmm7
2337 movdqa %xmm4,%xmm5
2338 por %xmm9,%xmm8
2339 psrld $31,%xmm5
2340 paddd %xmm6,%xmm11
2341 paddd %xmm4,%xmm4
2342
2343 psrld $2,%xmm13
2344 paddd %xmm8,%xmm11
2345 por %xmm5,%xmm4
2346 por %xmm7,%xmm13
2347 pxor %xmm2,%xmm0
2348 movdqa 208-128(%rax),%xmm2
2349
2350 movdqa %xmm11,%xmm8
2351 movdqa %xmm14,%xmm6
2352 pxor 48-128(%rax),%xmm0
2353 paddd %xmm15,%xmm10
2354 pslld $5,%xmm8
2355 pxor %xmm12,%xmm6
2356
2357 movdqa %xmm11,%xmm9
2358 paddd %xmm4,%xmm10
2359 pxor %xmm2,%xmm0
2360 psrld $27,%xmm9
2361 pxor %xmm13,%xmm6
2362 movdqa %xmm12,%xmm7
2363
2364 pslld $30,%xmm7
2365 movdqa %xmm0,%xmm5
2366 por %xmm9,%xmm8
2367 psrld $31,%xmm5
2368 paddd %xmm6,%xmm10
2369 paddd %xmm0,%xmm0
2370
2371 psrld $2,%xmm12
2372 paddd %xmm8,%xmm10
2373 por %xmm5,%xmm0
2374 por %xmm7,%xmm12
2375 pxor %xmm3,%xmm1
2376 movdqa 224-128(%rax),%xmm3
2377
2378 movdqa %xmm10,%xmm8
2379 movdqa %xmm13,%xmm6
2380 pxor 64-128(%rax),%xmm1
2381 paddd %xmm15,%xmm14
2382 pslld $5,%xmm8
2383 pxor %xmm11,%xmm6
2384
2385 movdqa %xmm10,%xmm9
2386 paddd %xmm0,%xmm14
2387 pxor %xmm3,%xmm1
2388 psrld $27,%xmm9
2389 pxor %xmm12,%xmm6
2390 movdqa %xmm11,%xmm7
2391
2392 pslld $30,%xmm7
2393 movdqa %xmm1,%xmm5
2394 por %xmm9,%xmm8
2395 psrld $31,%xmm5
2396 paddd %xmm6,%xmm14
2397 paddd %xmm1,%xmm1
2398
2399 psrld $2,%xmm11
2400 paddd %xmm8,%xmm14
2401 por %xmm5,%xmm1
2402 por %xmm7,%xmm11
2403 pxor %xmm4,%xmm2
2404 movdqa 240-128(%rax),%xmm4
2405
2406 movdqa %xmm14,%xmm8
2407 movdqa %xmm12,%xmm6
2408 pxor 80-128(%rax),%xmm2
2409 paddd %xmm15,%xmm13
2410 pslld $5,%xmm8
2411 pxor %xmm10,%xmm6
2412
2413 movdqa %xmm14,%xmm9
2414 paddd %xmm1,%xmm13
2415 pxor %xmm4,%xmm2
2416 psrld $27,%xmm9
2417 pxor %xmm11,%xmm6
2418 movdqa %xmm10,%xmm7
2419
2420 pslld $30,%xmm7
2421 movdqa %xmm2,%xmm5
2422 por %xmm9,%xmm8
2423 psrld $31,%xmm5
2424 paddd %xmm6,%xmm13
2425 paddd %xmm2,%xmm2
2426
2427 psrld $2,%xmm10
2428 paddd %xmm8,%xmm13
2429 por %xmm5,%xmm2
2430 por %xmm7,%xmm10
2431 pxor %xmm0,%xmm3
2432 movdqa 0-128(%rax),%xmm0
2433
2434 movdqa %xmm13,%xmm8
2435 movdqa %xmm11,%xmm6
2436 pxor 96-128(%rax),%xmm3
2437 paddd %xmm15,%xmm12
2438 pslld $5,%xmm8
2439 pxor %xmm14,%xmm6
2440
2441 movdqa %xmm13,%xmm9
2442 paddd %xmm2,%xmm12
2443 pxor %xmm0,%xmm3
2444 psrld $27,%xmm9
2445 pxor %xmm10,%xmm6
2446 movdqa %xmm14,%xmm7
2447
2448 pslld $30,%xmm7
2449 movdqa %xmm3,%xmm5
2450 por %xmm9,%xmm8
2451 psrld $31,%xmm5
2452 paddd %xmm6,%xmm12
2453 paddd %xmm3,%xmm3
2454
2455 psrld $2,%xmm14
2456 paddd %xmm8,%xmm12
2457 por %xmm5,%xmm3
2458 por %xmm7,%xmm14
2459 pxor %xmm1,%xmm4
2460 movdqa 16-128(%rax),%xmm1
2461
2462 movdqa %xmm12,%xmm8
2463 movdqa %xmm10,%xmm6
2464 pxor 112-128(%rax),%xmm4
2465 paddd %xmm15,%xmm11
2466 pslld $5,%xmm8
2467 pxor %xmm13,%xmm6
2468
2469 movdqa %xmm12,%xmm9
2470 paddd %xmm3,%xmm11
2471 pxor %xmm1,%xmm4
2472 psrld $27,%xmm9
2473 pxor %xmm14,%xmm6
2474 movdqa %xmm13,%xmm7
2475
2476 pslld $30,%xmm7
2477 movdqa %xmm4,%xmm5
2478 por %xmm9,%xmm8
2479 psrld $31,%xmm5
2480 paddd %xmm6,%xmm11
2481 paddd %xmm4,%xmm4
2482
2483 psrld $2,%xmm13
2484 paddd %xmm8,%xmm11
2485 por %xmm5,%xmm4
2486 por %xmm7,%xmm13
2487 movdqa %xmm11,%xmm8
2488 paddd %xmm15,%xmm10
2489 movdqa %xmm14,%xmm6
2490 pslld $5,%xmm8
2491 pxor %xmm12,%xmm6
2492
2493 movdqa %xmm11,%xmm9
2494 paddd %xmm4,%xmm10
2495 psrld $27,%xmm9
2496 movdqa %xmm12,%xmm7
2497 pxor %xmm13,%xmm6
2498
2499 pslld $30,%xmm7
2500 por %xmm9,%xmm8
2501 paddd %xmm6,%xmm10
2502
2503 psrld $2,%xmm12
2504 paddd %xmm8,%xmm10
2505 por %xmm7,%xmm12
2506 movdqa (%rbx),%xmm0
2507 movl $1,%ecx
2508 cmpl 0(%rbx),%ecx
2509 pxor %xmm8,%xmm8
2510 cmovgeq %rbp,%r8
2511 cmpl 4(%rbx),%ecx
2512 movdqa %xmm0,%xmm1
2513 cmovgeq %rbp,%r9
2514 cmpl 8(%rbx),%ecx
2515 pcmpgtd %xmm8,%xmm1
2516 cmovgeq %rbp,%r10
2517 cmpl 12(%rbx),%ecx
2518 paddd %xmm1,%xmm0
2519 cmovgeq %rbp,%r11
2520
2521 movdqu 0(%rdi),%xmm6
2522 pand %xmm1,%xmm10
2523 movdqu 32(%rdi),%xmm7
2524 pand %xmm1,%xmm11
2525 paddd %xmm6,%xmm10
2526 movdqu 64(%rdi),%xmm8
2527 pand %xmm1,%xmm12
2528 paddd %xmm7,%xmm11
2529 movdqu 96(%rdi),%xmm9
2530 pand %xmm1,%xmm13
2531 paddd %xmm8,%xmm12
2532 movdqu 128(%rdi),%xmm5
2533 pand %xmm1,%xmm14
2534 movdqu %xmm10,0(%rdi)
2535 paddd %xmm9,%xmm13
2536 movdqu %xmm11,32(%rdi)
2537 paddd %xmm5,%xmm14
2538 movdqu %xmm12,64(%rdi)
2539 movdqu %xmm13,96(%rdi)
2540 movdqu %xmm14,128(%rdi)
2541
2542 movdqa %xmm0,(%rbx)
2543 movdqa 96(%rbp),%xmm5
2544 movdqa -32(%rbp),%xmm15
2545 decl %edx
2546 jnz .Loop
2547
2548 movl 280(%rsp),%edx
2549 leaq 16(%rdi),%rdi
2550 leaq 64(%rsi),%rsi
2551 decl %edx
2552 jnz .Loop_grande
2553
2554 .Ldone:
2555 movq 272(%rsp),%rax
2556 .cfi_def_cfa %rax,8
2557 movq -16(%rax),%rbp
2558 .cfi_restore %rbp
2559 movq -8(%rax),%rbx
2560 .cfi_restore %rbx
2561 leaq (%rax),%rsp
2562 .cfi_def_cfa_register %rsp
2563 .Lepilogue:
2564 .byte 0xf3,0xc3
2565 .cfi_endproc
2566 .size sha1_multi_block,.-sha1_multi_block
2567 .type sha1_multi_block_shaext,@function
2568 .align 32
2569 sha1_multi_block_shaext:
2570 .cfi_startproc
2571 _shaext_shortcut:
2572 movq %rsp,%rax
2573 .cfi_def_cfa_register %rax
2574 pushq %rbx
2575 .cfi_offset %rbx,-16
2576 pushq %rbp
2577 .cfi_offset %rbp,-24
2578 subq $288,%rsp
2579 shll $1,%edx
2580 andq $-256,%rsp
2581 leaq 64(%rdi),%rdi
2582 movq %rax,272(%rsp)
2583 .Lbody_shaext:
2584 leaq 256(%rsp),%rbx
2585 movdqa K_XX_XX+128(%rip),%xmm3
2586
2587 .Loop_grande_shaext:
2588 movl %edx,280(%rsp)
2589 xorl %edx,%edx
2590 movq 0(%rsi),%r8
2591 movl 8(%rsi),%ecx
2592 cmpl %edx,%ecx
2593 cmovgl %ecx,%edx
2594 testl %ecx,%ecx
2595 movl %ecx,0(%rbx)
2596 cmovleq %rsp,%r8
2597 movq 16(%rsi),%r9
2598 movl 24(%rsi),%ecx
2599 cmpl %edx,%ecx
2600 cmovgl %ecx,%edx
2601 testl %ecx,%ecx
2602 movl %ecx,4(%rbx)
2603 cmovleq %rsp,%r9
2604 testl %edx,%edx
2605 jz .Ldone_shaext
2606
2607 movq 0-64(%rdi),%xmm0
2608 movq 32-64(%rdi),%xmm4
2609 movq 64-64(%rdi),%xmm5
2610 movq 96-64(%rdi),%xmm6
2611 movq 128-64(%rdi),%xmm7
2612
2613 punpckldq %xmm4,%xmm0
2614 punpckldq %xmm6,%xmm5
2615
2616 movdqa %xmm0,%xmm8
2617 punpcklqdq %xmm5,%xmm0
2618 punpckhqdq %xmm5,%xmm8
2619
2620 pshufd $63,%xmm7,%xmm1
2621 pshufd $127,%xmm7,%xmm9
2622 pshufd $27,%xmm0,%xmm0
2623 pshufd $27,%xmm8,%xmm8
2624 jmp .Loop_shaext
2625
2626 .align 32
2627 .Loop_shaext:
2628 movdqu 0(%r8),%xmm4
2629 movdqu 0(%r9),%xmm11
2630 movdqu 16(%r8),%xmm5
2631 movdqu 16(%r9),%xmm12
2632 movdqu 32(%r8),%xmm6
2633 .byte 102,15,56,0,227
2634 movdqu 32(%r9),%xmm13
2635 .byte 102,68,15,56,0,219
2636 movdqu 48(%r8),%xmm7
2637 leaq 64(%r8),%r8
2638 .byte 102,15,56,0,235
2639 movdqu 48(%r9),%xmm14
2640 leaq 64(%r9),%r9
2641 .byte 102,68,15,56,0,227
2642
2643 movdqa %xmm1,80(%rsp)
2644 paddd %xmm4,%xmm1
2645 movdqa %xmm9,112(%rsp)
2646 paddd %xmm11,%xmm9
2647 movdqa %xmm0,64(%rsp)
2648 movdqa %xmm0,%xmm2
2649 movdqa %xmm8,96(%rsp)
2650 movdqa %xmm8,%xmm10
2651 .byte 15,58,204,193,0
2652 .byte 15,56,200,213
2653 .byte 69,15,58,204,193,0
2654 .byte 69,15,56,200,212
2655 .byte 102,15,56,0,243
2656 prefetcht0 127(%r8)
2657 .byte 15,56,201,229
2658 .byte 102,68,15,56,0,235
2659 prefetcht0 127(%r9)
2660 .byte 69,15,56,201,220
2661
2662 .byte 102,15,56,0,251
2663 movdqa %xmm0,%xmm1
2664 .byte 102,68,15,56,0,243
2665 movdqa %xmm8,%xmm9
2666 .byte 15,58,204,194,0
2667 .byte 15,56,200,206
2668 .byte 69,15,58,204,194,0
2669 .byte 69,15,56,200,205
2670 pxor %xmm6,%xmm4
2671 .byte 15,56,201,238
2672 pxor %xmm13,%xmm11
2673 .byte 69,15,56,201,229
2674 movdqa %xmm0,%xmm2
2675 movdqa %xmm8,%xmm10
2676 .byte 15,58,204,193,0
2677 .byte 15,56,200,215
2678 .byte 69,15,58,204,193,0
2679 .byte 69,15,56,200,214
2680 .byte 15,56,202,231
2681 .byte 69,15,56,202,222
2682 pxor %xmm7,%xmm5
2683 .byte 15,56,201,247
2684 pxor %xmm14,%xmm12
2685 .byte 69,15,56,201,238
2686 movdqa %xmm0,%xmm1
2687 movdqa %xmm8,%xmm9
2688 .byte 15,58,204,194,0
2689 .byte 15,56,200,204
2690 .byte 69,15,58,204,194,0
2691 .byte 69,15,56,200,203
2692 .byte 15,56,202,236
2693 .byte 69,15,56,202,227
2694 pxor %xmm4,%xmm6
2695 .byte 15,56,201,252
2696 pxor %xmm11,%xmm13
2697 .byte 69,15,56,201,243
2698 movdqa %xmm0,%xmm2
2699 movdqa %xmm8,%xmm10
2700 .byte 15,58,204,193,0
2701 .byte 15,56,200,213
2702 .byte 69,15,58,204,193,0
2703 .byte 69,15,56,200,212
2704 .byte 15,56,202,245
2705 .byte 69,15,56,202,236
2706 pxor %xmm5,%xmm7
2707 .byte 15,56,201,229
2708 pxor %xmm12,%xmm14
2709 .byte 69,15,56,201,220
2710 movdqa %xmm0,%xmm1
2711 movdqa %xmm8,%xmm9
2712 .byte 15,58,204,194,1
2713 .byte 15,56,200,206
2714 .byte 69,15,58,204,194,1
2715 .byte 69,15,56,200,205
2716 .byte 15,56,202,254
2717 .byte 69,15,56,202,245
2718 pxor %xmm6,%xmm4
2719 .byte 15,56,201,238
2720 pxor %xmm13,%xmm11
2721 .byte 69,15,56,201,229
2722 movdqa %xmm0,%xmm2
2723 movdqa %xmm8,%xmm10
2724 .byte 15,58,204,193,1
2725 .byte 15,56,200,215
2726 .byte 69,15,58,204,193,1
2727 .byte 69,15,56,200,214
2728 .byte 15,56,202,231
2729 .byte 69,15,56,202,222
2730 pxor %xmm7,%xmm5
2731 .byte 15,56,201,247
2732 pxor %xmm14,%xmm12
2733 .byte 69,15,56,201,238
2734 movdqa %xmm0,%xmm1
2735 movdqa %xmm8,%xmm9
2736 .byte 15,58,204,194,1
2737 .byte 15,56,200,204
2738 .byte 69,15,58,204,194,1
2739 .byte 69,15,56,200,203
2740 .byte 15,56,202,236
2741 .byte 69,15,56,202,227
2742 pxor %xmm4,%xmm6
2743 .byte 15,56,201,252
2744 pxor %xmm11,%xmm13
2745 .byte 69,15,56,201,243
2746 movdqa %xmm0,%xmm2
2747 movdqa %xmm8,%xmm10
2748 .byte 15,58,204,193,1
2749 .byte 15,56,200,213
2750 .byte 69,15,58,204,193,1
2751 .byte 69,15,56,200,212
2752 .byte 15,56,202,245
2753 .byte 69,15,56,202,236
2754 pxor %xmm5,%xmm7
2755 .byte 15,56,201,229
2756 pxor %xmm12,%xmm14
2757 .byte 69,15,56,201,220
2758 movdqa %xmm0,%xmm1
2759 movdqa %xmm8,%xmm9
2760 .byte 15,58,204,194,1
2761 .byte 15,56,200,206
2762 .byte 69,15,58,204,194,1
2763 .byte 69,15,56,200,205
2764 .byte 15,56,202,254
2765 .byte 69,15,56,202,245
2766 pxor %xmm6,%xmm4
2767 .byte 15,56,201,238
2768 pxor %xmm13,%xmm11
2769 .byte 69,15,56,201,229
2770 movdqa %xmm0,%xmm2
2771 movdqa %xmm8,%xmm10
2772 .byte 15,58,204,193,2
2773 .byte 15,56,200,215
2774 .byte 69,15,58,204,193,2
2775 .byte 69,15,56,200,214
2776 .byte 15,56,202,231
2777 .byte 69,15,56,202,222
2778 pxor %xmm7,%xmm5
2779 .byte 15,56,201,247
2780 pxor %xmm14,%xmm12
2781 .byte 69,15,56,201,238
2782 movdqa %xmm0,%xmm1
2783 movdqa %xmm8,%xmm9
2784 .byte 15,58,204,194,2
2785 .byte 15,56,200,204
2786 .byte 69,15,58,204,194,2
2787 .byte 69,15,56,200,203
2788 .byte 15,56,202,236
2789 .byte 69,15,56,202,227
2790 pxor %xmm4,%xmm6
2791 .byte 15,56,201,252
2792 pxor %xmm11,%xmm13
2793 .byte 69,15,56,201,243
2794 movdqa %xmm0,%xmm2
2795 movdqa %xmm8,%xmm10
2796 .byte 15,58,204,193,2
2797 .byte 15,56,200,213
2798 .byte 69,15,58,204,193,2
2799 .byte 69,15,56,200,212
2800 .byte 15,56,202,245
2801 .byte 69,15,56,202,236
2802 pxor %xmm5,%xmm7
2803 .byte 15,56,201,229
2804 pxor %xmm12,%xmm14
2805 .byte 69,15,56,201,220
2806 movdqa %xmm0,%xmm1
2807 movdqa %xmm8,%xmm9
2808 .byte 15,58,204,194,2
2809 .byte 15,56,200,206
2810 .byte 69,15,58,204,194,2
2811 .byte 69,15,56,200,205
2812 .byte 15,56,202,254
2813 .byte 69,15,56,202,245
2814 pxor %xmm6,%xmm4
2815 .byte 15,56,201,238
2816 pxor %xmm13,%xmm11
2817 .byte 69,15,56,201,229
2818 movdqa %xmm0,%xmm2
2819 movdqa %xmm8,%xmm10
2820 .byte 15,58,204,193,2
2821 .byte 15,56,200,215
2822 .byte 69,15,58,204,193,2
2823 .byte 69,15,56,200,214
2824 .byte 15,56,202,231
2825 .byte 69,15,56,202,222
2826 pxor %xmm7,%xmm5
2827 .byte 15,56,201,247
2828 pxor %xmm14,%xmm12
2829 .byte 69,15,56,201,238
2830 movdqa %xmm0,%xmm1
2831 movdqa %xmm8,%xmm9
2832 .byte 15,58,204,194,3
2833 .byte 15,56,200,204
2834 .byte 69,15,58,204,194,3
2835 .byte 69,15,56,200,203
2836 .byte 15,56,202,236
2837 .byte 69,15,56,202,227
2838 pxor %xmm4,%xmm6
2839 .byte 15,56,201,252
2840 pxor %xmm11,%xmm13
2841 .byte 69,15,56,201,243
2842 movdqa %xmm0,%xmm2
2843 movdqa %xmm8,%xmm10
2844 .byte 15,58,204,193,3
2845 .byte 15,56,200,213
2846 .byte 69,15,58,204,193,3
2847 .byte 69,15,56,200,212
2848 .byte 15,56,202,245
2849 .byte 69,15,56,202,236
2850 pxor %xmm5,%xmm7
2851 pxor %xmm12,%xmm14
2852
2853 movl $1,%ecx
2854 pxor %xmm4,%xmm4
2855 cmpl 0(%rbx),%ecx
2856 cmovgeq %rsp,%r8
2857
2858 movdqa %xmm0,%xmm1
2859 movdqa %xmm8,%xmm9
2860 .byte 15,58,204,194,3
2861 .byte 15,56,200,206
2862 .byte 69,15,58,204,194,3
2863 .byte 69,15,56,200,205
2864 .byte 15,56,202,254
2865 .byte 69,15,56,202,245
2866
2867 cmpl 4(%rbx),%ecx
2868 cmovgeq %rsp,%r9
2869 movq (%rbx),%xmm6
2870
2871 movdqa %xmm0,%xmm2
2872 movdqa %xmm8,%xmm10
2873 .byte 15,58,204,193,3
2874 .byte 15,56,200,215
2875 .byte 69,15,58,204,193,3
2876 .byte 69,15,56,200,214
2877
2878 pshufd $0x00,%xmm6,%xmm11
2879 pshufd $0x55,%xmm6,%xmm12
2880 movdqa %xmm6,%xmm7
2881 pcmpgtd %xmm4,%xmm11
2882 pcmpgtd %xmm4,%xmm12
2883
2884 movdqa %xmm0,%xmm1
2885 movdqa %xmm8,%xmm9
2886 .byte 15,58,204,194,3
2887 .byte 15,56,200,204
2888 .byte 69,15,58,204,194,3
2889 .byte 68,15,56,200,204
2890
2891 pcmpgtd %xmm4,%xmm7
2892 pand %xmm11,%xmm0
2893 pand %xmm11,%xmm1
2894 pand %xmm12,%xmm8
2895 pand %xmm12,%xmm9
2896 paddd %xmm7,%xmm6
2897
2898 paddd 64(%rsp),%xmm0
2899 paddd 80(%rsp),%xmm1
2900 paddd 96(%rsp),%xmm8
2901 paddd 112(%rsp),%xmm9
2902
2903 movq %xmm6,(%rbx)
2904 decl %edx
2905 jnz .Loop_shaext
2906
2907 movl 280(%rsp),%edx
2908
2909 pshufd $27,%xmm0,%xmm0
2910 pshufd $27,%xmm8,%xmm8
2911
2912 movdqa %xmm0,%xmm6
2913 punpckldq %xmm8,%xmm0
2914 punpckhdq %xmm8,%xmm6
2915 punpckhdq %xmm9,%xmm1
2916 movq %xmm0,0-64(%rdi)
2917 psrldq $8,%xmm0
2918 movq %xmm6,64-64(%rdi)
2919 psrldq $8,%xmm6
2920 movq %xmm0,32-64(%rdi)
2921 psrldq $8,%xmm1
2922 movq %xmm6,96-64(%rdi)
2923 movq %xmm1,128-64(%rdi)
2924
2925 leaq 8(%rdi),%rdi
2926 leaq 32(%rsi),%rsi
2927 decl %edx
2928 jnz .Loop_grande_shaext
2929
2930 .Ldone_shaext:
2931
2932 movq -16(%rax),%rbp
2933 .cfi_restore %rbp
2934 movq -8(%rax),%rbx
2935 .cfi_restore %rbx
2936 leaq (%rax),%rsp
2937 .cfi_def_cfa_register %rsp
2938 .Lepilogue_shaext:
2939 .byte 0xf3,0xc3
2940 .cfi_endproc
2941 .size sha1_multi_block_shaext,.-sha1_multi_block_shaext
2942 .type sha1_multi_block_avx,@function
2943 .align 32
2944 sha1_multi_block_avx:
2945 .cfi_startproc
2946 _avx_shortcut:
2947 shrq $32,%rcx
2948 cmpl $2,%edx
2949 jb .Lavx
2950 testl $32,%ecx
2951 jnz _avx2_shortcut
2952 jmp .Lavx
2953 .align 32
2954 .Lavx:
2955 movq %rsp,%rax
2956 .cfi_def_cfa_register %rax
2957 pushq %rbx
2958 .cfi_offset %rbx,-16
2959 pushq %rbp
2960 .cfi_offset %rbp,-24
2961 subq $288,%rsp
2962 andq $-256,%rsp
2963 movq %rax,272(%rsp)
2964 .cfi_escape 0x0f,0x06,0x77,0x90,0x02,0x06,0x23,0x08
2965 .Lbody_avx:
2966 leaq K_XX_XX(%rip),%rbp
2967 leaq 256(%rsp),%rbx
2968
2969 vzeroupper
2970 .Loop_grande_avx:
2971 movl %edx,280(%rsp)
2972 xorl %edx,%edx
2973 movq 0(%rsi),%r8
2974 movl 8(%rsi),%ecx
2975 cmpl %edx,%ecx
2976 cmovgl %ecx,%edx
2977 testl %ecx,%ecx
2978 movl %ecx,0(%rbx)
2979 cmovleq %rbp,%r8
2980 movq 16(%rsi),%r9
2981 movl 24(%rsi),%ecx
2982 cmpl %edx,%ecx
2983 cmovgl %ecx,%edx
2984 testl %ecx,%ecx
2985 movl %ecx,4(%rbx)
2986 cmovleq %rbp,%r9
2987 movq 32(%rsi),%r10
2988 movl 40(%rsi),%ecx
2989 cmpl %edx,%ecx
2990 cmovgl %ecx,%edx
2991 testl %ecx,%ecx
2992 movl %ecx,8(%rbx)
2993 cmovleq %rbp,%r10
2994 movq 48(%rsi),%r11
2995 movl 56(%rsi),%ecx
2996 cmpl %edx,%ecx
2997 cmovgl %ecx,%edx
2998 testl %ecx,%ecx
2999 movl %ecx,12(%rbx)
3000 cmovleq %rbp,%r11
3001 testl %edx,%edx
3002 jz .Ldone_avx
3003
3004 vmovdqu 0(%rdi),%xmm10
3005 leaq 128(%rsp),%rax
3006 vmovdqu 32(%rdi),%xmm11
3007 vmovdqu 64(%rdi),%xmm12
3008 vmovdqu 96(%rdi),%xmm13
3009 vmovdqu 128(%rdi),%xmm14
3010 vmovdqu 96(%rbp),%xmm5
3011 jmp .Loop_avx
3012
3013 .align 32
3014 .Loop_avx:
3015 vmovdqa -32(%rbp),%xmm15
3016 vmovd (%r8),%xmm0
3017 leaq 64(%r8),%r8
3018 vmovd (%r9),%xmm2
3019 leaq 64(%r9),%r9
3020 vpinsrd $1,(%r10),%xmm0,%xmm0
3021 leaq 64(%r10),%r10
3022 vpinsrd $1,(%r11),%xmm2,%xmm2
3023 leaq 64(%r11),%r11
3024 vmovd -60(%r8),%xmm1
3025 vpunpckldq %xmm2,%xmm0,%xmm0
3026 vmovd -60(%r9),%xmm9
3027 vpshufb %xmm5,%xmm0,%xmm0
3028 vpinsrd $1,-60(%r10),%xmm1,%xmm1
3029 vpinsrd $1,-60(%r11),%xmm9,%xmm9
3030 vpaddd %xmm15,%xmm14,%xmm14
3031 vpslld $5,%xmm10,%xmm8
3032 vpandn %xmm13,%xmm11,%xmm7
3033 vpand %xmm12,%xmm11,%xmm6
3034
3035 vmovdqa %xmm0,0-128(%rax)
3036 vpaddd %xmm0,%xmm14,%xmm14
3037 vpunpckldq %xmm9,%xmm1,%xmm1
3038 vpsrld $27,%xmm10,%xmm9
3039 vpxor %xmm7,%xmm6,%xmm6
3040 vmovd -56(%r8),%xmm2
3041
3042 vpslld $30,%xmm11,%xmm7
3043 vpor %xmm9,%xmm8,%xmm8
3044 vmovd -56(%r9),%xmm9
3045 vpaddd %xmm6,%xmm14,%xmm14
3046
3047 vpsrld $2,%xmm11,%xmm11
3048 vpaddd %xmm8,%xmm14,%xmm14
3049 vpshufb %xmm5,%xmm1,%xmm1
3050 vpor %xmm7,%xmm11,%xmm11
3051 vpinsrd $1,-56(%r10),%xmm2,%xmm2
3052 vpinsrd $1,-56(%r11),%xmm9,%xmm9
3053 vpaddd %xmm15,%xmm13,%xmm13
3054 vpslld $5,%xmm14,%xmm8
3055 vpandn %xmm12,%xmm10,%xmm7
3056 vpand %xmm11,%xmm10,%xmm6
3057
3058 vmovdqa %xmm1,16-128(%rax)
3059 vpaddd %xmm1,%xmm13,%xmm13
3060 vpunpckldq %xmm9,%xmm2,%xmm2
3061 vpsrld $27,%xmm14,%xmm9
3062 vpxor %xmm7,%xmm6,%xmm6
3063 vmovd -52(%r8),%xmm3
3064
3065 vpslld $30,%xmm10,%xmm7
3066 vpor %xmm9,%xmm8,%xmm8
3067 vmovd -52(%r9),%xmm9
3068 vpaddd %xmm6,%xmm13,%xmm13
3069
3070 vpsrld $2,%xmm10,%xmm10
3071 vpaddd %xmm8,%xmm13,%xmm13
3072 vpshufb %xmm5,%xmm2,%xmm2
3073 vpor %xmm7,%xmm10,%xmm10
3074 vpinsrd $1,-52(%r10),%xmm3,%xmm3
3075 vpinsrd $1,-52(%r11),%xmm9,%xmm9
3076 vpaddd %xmm15,%xmm12,%xmm12
3077 vpslld $5,%xmm13,%xmm8
3078 vpandn %xmm11,%xmm14,%xmm7
3079 vpand %xmm10,%xmm14,%xmm6
3080
3081 vmovdqa %xmm2,32-128(%rax)
3082 vpaddd %xmm2,%xmm12,%xmm12
3083 vpunpckldq %xmm9,%xmm3,%xmm3
3084 vpsrld $27,%xmm13,%xmm9
3085 vpxor %xmm7,%xmm6,%xmm6
3086 vmovd -48(%r8),%xmm4
3087
3088 vpslld $30,%xmm14,%xmm7
3089 vpor %xmm9,%xmm8,%xmm8
3090 vmovd -48(%r9),%xmm9
3091 vpaddd %xmm6,%xmm12,%xmm12
3092
3093 vpsrld $2,%xmm14,%xmm14
3094 vpaddd %xmm8,%xmm12,%xmm12
3095 vpshufb %xmm5,%xmm3,%xmm3
3096 vpor %xmm7,%xmm14,%xmm14
3097 vpinsrd $1,-48(%r10),%xmm4,%xmm4
3098 vpinsrd $1,-48(%r11),%xmm9,%xmm9
3099 vpaddd %xmm15,%xmm11,%xmm11
3100 vpslld $5,%xmm12,%xmm8
3101 vpandn %xmm10,%xmm13,%xmm7
3102 vpand %xmm14,%xmm13,%xmm6
3103
3104 vmovdqa %xmm3,48-128(%rax)
3105 vpaddd %xmm3,%xmm11,%xmm11
3106 vpunpckldq %xmm9,%xmm4,%xmm4
3107 vpsrld $27,%xmm12,%xmm9
3108 vpxor %xmm7,%xmm6,%xmm6
3109 vmovd -44(%r8),%xmm0
3110
3111 vpslld $30,%xmm13,%xmm7
3112 vpor %xmm9,%xmm8,%xmm8
3113 vmovd -44(%r9),%xmm9
3114 vpaddd %xmm6,%xmm11,%xmm11
3115
3116 vpsrld $2,%xmm13,%xmm13
3117 vpaddd %xmm8,%xmm11,%xmm11
3118 vpshufb %xmm5,%xmm4,%xmm4
3119 vpor %xmm7,%xmm13,%xmm13
3120 vpinsrd $1,-44(%r10),%xmm0,%xmm0
3121 vpinsrd $1,-44(%r11),%xmm9,%xmm9
3122 vpaddd %xmm15,%xmm10,%xmm10
3123 vpslld $5,%xmm11,%xmm8
3124 vpandn %xmm14,%xmm12,%xmm7
3125 vpand %xmm13,%xmm12,%xmm6
3126
3127 vmovdqa %xmm4,64-128(%rax)
3128 vpaddd %xmm4,%xmm10,%xmm10
3129 vpunpckldq %xmm9,%xmm0,%xmm0
3130 vpsrld $27,%xmm11,%xmm9
3131 vpxor %xmm7,%xmm6,%xmm6
3132 vmovd -40(%r8),%xmm1
3133
3134 vpslld $30,%xmm12,%xmm7
3135 vpor %xmm9,%xmm8,%xmm8
3136 vmovd -40(%r9),%xmm9
3137 vpaddd %xmm6,%xmm10,%xmm10
3138
3139 vpsrld $2,%xmm12,%xmm12
3140 vpaddd %xmm8,%xmm10,%xmm10
3141 vpshufb %xmm5,%xmm0,%xmm0
3142 vpor %xmm7,%xmm12,%xmm12
3143 vpinsrd $1,-40(%r10),%xmm1,%xmm1
3144 vpinsrd $1,-40(%r11),%xmm9,%xmm9
3145 vpaddd %xmm15,%xmm14,%xmm14
3146 vpslld $5,%xmm10,%xmm8
3147 vpandn %xmm13,%xmm11,%xmm7
3148 vpand %xmm12,%xmm11,%xmm6
3149
3150 vmovdqa %xmm0,80-128(%rax)
3151 vpaddd %xmm0,%xmm14,%xmm14
3152 vpunpckldq %xmm9,%xmm1,%xmm1
3153 vpsrld $27,%xmm10,%xmm9
3154 vpxor %xmm7,%xmm6,%xmm6
3155 vmovd -36(%r8),%xmm2
3156
3157 vpslld $30,%xmm11,%xmm7
3158 vpor %xmm9,%xmm8,%xmm8
3159 vmovd -36(%r9),%xmm9
3160 vpaddd %xmm6,%xmm14,%xmm14
3161
3162 vpsrld $2,%xmm11,%xmm11
3163 vpaddd %xmm8,%xmm14,%xmm14
3164 vpshufb %xmm5,%xmm1,%xmm1
3165 vpor %xmm7,%xmm11,%xmm11
3166 vpinsrd $1,-36(%r10),%xmm2,%xmm2
3167 vpinsrd $1,-36(%r11),%xmm9,%xmm9
3168 vpaddd %xmm15,%xmm13,%xmm13
3169 vpslld $5,%xmm14,%xmm8
3170 vpandn %xmm12,%xmm10,%xmm7
3171 vpand %xmm11,%xmm10,%xmm6
3172
3173 vmovdqa %xmm1,96-128(%rax)
3174 vpaddd %xmm1,%xmm13,%xmm13
3175 vpunpckldq %xmm9,%xmm2,%xmm2
3176 vpsrld $27,%xmm14,%xmm9
3177 vpxor %xmm7,%xmm6,%xmm6
3178 vmovd -32(%r8),%xmm3
3179
3180 vpslld $30,%xmm10,%xmm7
3181 vpor %xmm9,%xmm8,%xmm8
3182 vmovd -32(%r9),%xmm9
3183 vpaddd %xmm6,%xmm13,%xmm13
3184
3185 vpsrld $2,%xmm10,%xmm10
3186 vpaddd %xmm8,%xmm13,%xmm13
3187 vpshufb %xmm5,%xmm2,%xmm2
3188 vpor %xmm7,%xmm10,%xmm10
3189 vpinsrd $1,-32(%r10),%xmm3,%xmm3
3190 vpinsrd $1,-32(%r11),%xmm9,%xmm9
3191 vpaddd %xmm15,%xmm12,%xmm12
3192 vpslld $5,%xmm13,%xmm8
3193 vpandn %xmm11,%xmm14,%xmm7
3194 vpand %xmm10,%xmm14,%xmm6
3195
3196 vmovdqa %xmm2,112-128(%rax)
3197 vpaddd %xmm2,%xmm12,%xmm12
3198 vpunpckldq %xmm9,%xmm3,%xmm3
3199 vpsrld $27,%xmm13,%xmm9
3200 vpxor %xmm7,%xmm6,%xmm6
3201 vmovd -28(%r8),%xmm4
3202
3203 vpslld $30,%xmm14,%xmm7
3204 vpor %xmm9,%xmm8,%xmm8
3205 vmovd -28(%r9),%xmm9
3206 vpaddd %xmm6,%xmm12,%xmm12
3207
3208 vpsrld $2,%xmm14,%xmm14
3209 vpaddd %xmm8,%xmm12,%xmm12
3210 vpshufb %xmm5,%xmm3,%xmm3
3211 vpor %xmm7,%xmm14,%xmm14
3212 vpinsrd $1,-28(%r10),%xmm4,%xmm4
3213 vpinsrd $1,-28(%r11),%xmm9,%xmm9
3214 vpaddd %xmm15,%xmm11,%xmm11
3215 vpslld $5,%xmm12,%xmm8
3216 vpandn %xmm10,%xmm13,%xmm7
3217 vpand %xmm14,%xmm13,%xmm6
3218
3219 vmovdqa %xmm3,128-128(%rax)
3220 vpaddd %xmm3,%xmm11,%xmm11
3221 vpunpckldq %xmm9,%xmm4,%xmm4
3222 vpsrld $27,%xmm12,%xmm9
3223 vpxor %xmm7,%xmm6,%xmm6
3224 vmovd -24(%r8),%xmm0
3225
3226 vpslld $30,%xmm13,%xmm7
3227 vpor %xmm9,%xmm8,%xmm8
3228 vmovd -24(%r9),%xmm9
3229 vpaddd %xmm6,%xmm11,%xmm11
3230
3231 vpsrld $2,%xmm13,%xmm13
3232 vpaddd %xmm8,%xmm11,%xmm11
3233 vpshufb %xmm5,%xmm4,%xmm4
3234 vpor %xmm7,%xmm13,%xmm13
3235 vpinsrd $1,-24(%r10),%xmm0,%xmm0
3236 vpinsrd $1,-24(%r11),%xmm9,%xmm9
3237 vpaddd %xmm15,%xmm10,%xmm10
3238 vpslld $5,%xmm11,%xmm8
3239 vpandn %xmm14,%xmm12,%xmm7
3240 vpand %xmm13,%xmm12,%xmm6
3241
3242 vmovdqa %xmm4,144-128(%rax)
3243 vpaddd %xmm4,%xmm10,%xmm10
3244 vpunpckldq %xmm9,%xmm0,%xmm0
3245 vpsrld $27,%xmm11,%xmm9
3246 vpxor %xmm7,%xmm6,%xmm6
3247 vmovd -20(%r8),%xmm1
3248
3249 vpslld $30,%xmm12,%xmm7
3250 vpor %xmm9,%xmm8,%xmm8
3251 vmovd -20(%r9),%xmm9
3252 vpaddd %xmm6,%xmm10,%xmm10
3253
3254 vpsrld $2,%xmm12,%xmm12
3255 vpaddd %xmm8,%xmm10,%xmm10
3256 vpshufb %xmm5,%xmm0,%xmm0
3257 vpor %xmm7,%xmm12,%xmm12
3258 vpinsrd $1,-20(%r10),%xmm1,%xmm1
3259 vpinsrd $1,-20(%r11),%xmm9,%xmm9
3260 vpaddd %xmm15,%xmm14,%xmm14
3261 vpslld $5,%xmm10,%xmm8
3262 vpandn %xmm13,%xmm11,%xmm7
3263 vpand %xmm12,%xmm11,%xmm6
3264
3265 vmovdqa %xmm0,160-128(%rax)
3266 vpaddd %xmm0,%xmm14,%xmm14
3267 vpunpckldq %xmm9,%xmm1,%xmm1
3268 vpsrld $27,%xmm10,%xmm9
3269 vpxor %xmm7,%xmm6,%xmm6
3270 vmovd -16(%r8),%xmm2
3271
3272 vpslld $30,%xmm11,%xmm7
3273 vpor %xmm9,%xmm8,%xmm8
3274 vmovd -16(%r9),%xmm9
3275 vpaddd %xmm6,%xmm14,%xmm14
3276
3277 vpsrld $2,%xmm11,%xmm11
3278 vpaddd %xmm8,%xmm14,%xmm14
3279 vpshufb %xmm5,%xmm1,%xmm1
3280 vpor %xmm7,%xmm11,%xmm11
3281 vpinsrd $1,-16(%r10),%xmm2,%xmm2
3282 vpinsrd $1,-16(%r11),%xmm9,%xmm9
3283 vpaddd %xmm15,%xmm13,%xmm13
3284 vpslld $5,%xmm14,%xmm8
3285 vpandn %xmm12,%xmm10,%xmm7
3286 vpand %xmm11,%xmm10,%xmm6
3287
3288 vmovdqa %xmm1,176-128(%rax)
3289 vpaddd %xmm1,%xmm13,%xmm13
3290 vpunpckldq %xmm9,%xmm2,%xmm2
3291 vpsrld $27,%xmm14,%xmm9
3292 vpxor %xmm7,%xmm6,%xmm6
3293 vmovd -12(%r8),%xmm3
3294
3295 vpslld $30,%xmm10,%xmm7
3296 vpor %xmm9,%xmm8,%xmm8
3297 vmovd -12(%r9),%xmm9
3298 vpaddd %xmm6,%xmm13,%xmm13
3299
3300 vpsrld $2,%xmm10,%xmm10
3301 vpaddd %xmm8,%xmm13,%xmm13
3302 vpshufb %xmm5,%xmm2,%xmm2
3303 vpor %xmm7,%xmm10,%xmm10
3304 vpinsrd $1,-12(%r10),%xmm3,%xmm3
3305 vpinsrd $1,-12(%r11),%xmm9,%xmm9
3306 vpaddd %xmm15,%xmm12,%xmm12
3307 vpslld $5,%xmm13,%xmm8
3308 vpandn %xmm11,%xmm14,%xmm7
3309 vpand %xmm10,%xmm14,%xmm6
3310
3311 vmovdqa %xmm2,192-128(%rax)
3312 vpaddd %xmm2,%xmm12,%xmm12
3313 vpunpckldq %xmm9,%xmm3,%xmm3
3314 vpsrld $27,%xmm13,%xmm9
3315 vpxor %xmm7,%xmm6,%xmm6
3316 vmovd -8(%r8),%xmm4
3317
3318 vpslld $30,%xmm14,%xmm7
3319 vpor %xmm9,%xmm8,%xmm8
3320 vmovd -8(%r9),%xmm9
3321 vpaddd %xmm6,%xmm12,%xmm12
3322
3323 vpsrld $2,%xmm14,%xmm14
3324 vpaddd %xmm8,%xmm12,%xmm12
3325 vpshufb %xmm5,%xmm3,%xmm3
3326 vpor %xmm7,%xmm14,%xmm14
3327 vpinsrd $1,-8(%r10),%xmm4,%xmm4
3328 vpinsrd $1,-8(%r11),%xmm9,%xmm9
3329 vpaddd %xmm15,%xmm11,%xmm11
3330 vpslld $5,%xmm12,%xmm8
3331 vpandn %xmm10,%xmm13,%xmm7
3332 vpand %xmm14,%xmm13,%xmm6
3333
3334 vmovdqa %xmm3,208-128(%rax)
3335 vpaddd %xmm3,%xmm11,%xmm11
3336 vpunpckldq %xmm9,%xmm4,%xmm4
3337 vpsrld $27,%xmm12,%xmm9
3338 vpxor %xmm7,%xmm6,%xmm6
3339 vmovd -4(%r8),%xmm0
3340
3341 vpslld $30,%xmm13,%xmm7
3342 vpor %xmm9,%xmm8,%xmm8
3343 vmovd -4(%r9),%xmm9
3344 vpaddd %xmm6,%xmm11,%xmm11
3345
3346 vpsrld $2,%xmm13,%xmm13
3347 vpaddd %xmm8,%xmm11,%xmm11
3348 vpshufb %xmm5,%xmm4,%xmm4
3349 vpor %xmm7,%xmm13,%xmm13
3350 vmovdqa 0-128(%rax),%xmm1
3351 vpinsrd $1,-4(%r10),%xmm0,%xmm0
3352 vpinsrd $1,-4(%r11),%xmm9,%xmm9
3353 vpaddd %xmm15,%xmm10,%xmm10
3354 prefetcht0 63(%r8)
3355 vpslld $5,%xmm11,%xmm8
3356 vpandn %xmm14,%xmm12,%xmm7
3357 vpand %xmm13,%xmm12,%xmm6
3358
3359 vmovdqa %xmm4,224-128(%rax)
3360 vpaddd %xmm4,%xmm10,%xmm10
3361 vpunpckldq %xmm9,%xmm0,%xmm0
3362 vpsrld $27,%xmm11,%xmm9
3363 prefetcht0 63(%r9)
3364 vpxor %xmm7,%xmm6,%xmm6
3365
3366 vpslld $30,%xmm12,%xmm7
3367 vpor %xmm9,%xmm8,%xmm8
3368 prefetcht0 63(%r10)
3369 vpaddd %xmm6,%xmm10,%xmm10
3370
3371 vpsrld $2,%xmm12,%xmm12
3372 vpaddd %xmm8,%xmm10,%xmm10
3373 prefetcht0 63(%r11)
3374 vpshufb %xmm5,%xmm0,%xmm0
3375 vpor %xmm7,%xmm12,%xmm12
3376 vmovdqa 16-128(%rax),%xmm2
3377 vpxor %xmm3,%xmm1,%xmm1
3378 vmovdqa 32-128(%rax),%xmm3
3379
3380 vpaddd %xmm15,%xmm14,%xmm14
3381 vpslld $5,%xmm10,%xmm8
3382 vpandn %xmm13,%xmm11,%xmm7
3383
3384 vpand %xmm12,%xmm11,%xmm6
3385
3386 vmovdqa %xmm0,240-128(%rax)
3387 vpaddd %xmm0,%xmm14,%xmm14
3388 vpxor 128-128(%rax),%xmm1,%xmm1
3389 vpsrld $27,%xmm10,%xmm9
3390 vpxor %xmm7,%xmm6,%xmm6
3391 vpxor %xmm3,%xmm1,%xmm1
3392
3393
3394 vpslld $30,%xmm11,%xmm7
3395 vpor %xmm9,%xmm8,%xmm8
3396 vpaddd %xmm6,%xmm14,%xmm14
3397
3398 vpsrld $31,%xmm1,%xmm5
3399 vpaddd %xmm1,%xmm1,%xmm1
3400
3401 vpsrld $2,%xmm11,%xmm11
3402
3403 vpaddd %xmm8,%xmm14,%xmm14
3404 vpor %xmm5,%xmm1,%xmm1
3405 vpor %xmm7,%xmm11,%xmm11
3406 vpxor %xmm4,%xmm2,%xmm2
3407 vmovdqa 48-128(%rax),%xmm4
3408
3409 vpaddd %xmm15,%xmm13,%xmm13
3410 vpslld $5,%xmm14,%xmm8
3411 vpandn %xmm12,%xmm10,%xmm7
3412
3413 vpand %xmm11,%xmm10,%xmm6
3414
3415 vmovdqa %xmm1,0-128(%rax)
3416 vpaddd %xmm1,%xmm13,%xmm13
3417 vpxor 144-128(%rax),%xmm2,%xmm2
3418 vpsrld $27,%xmm14,%xmm9
3419 vpxor %xmm7,%xmm6,%xmm6
3420 vpxor %xmm4,%xmm2,%xmm2
3421
3422
3423 vpslld $30,%xmm10,%xmm7
3424 vpor %xmm9,%xmm8,%xmm8
3425 vpaddd %xmm6,%xmm13,%xmm13
3426
3427 vpsrld $31,%xmm2,%xmm5
3428 vpaddd %xmm2,%xmm2,%xmm2
3429
3430 vpsrld $2,%xmm10,%xmm10
3431
3432 vpaddd %xmm8,%xmm13,%xmm13
3433 vpor %xmm5,%xmm2,%xmm2
3434 vpor %xmm7,%xmm10,%xmm10
3435 vpxor %xmm0,%xmm3,%xmm3
3436 vmovdqa 64-128(%rax),%xmm0
3437
3438 vpaddd %xmm15,%xmm12,%xmm12
3439 vpslld $5,%xmm13,%xmm8
3440 vpandn %xmm11,%xmm14,%xmm7
3441
3442 vpand %xmm10,%xmm14,%xmm6
3443
3444 vmovdqa %xmm2,16-128(%rax)
3445 vpaddd %xmm2,%xmm12,%xmm12
3446 vpxor 160-128(%rax),%xmm3,%xmm3
3447 vpsrld $27,%xmm13,%xmm9
3448 vpxor %xmm7,%xmm6,%xmm6
3449 vpxor %xmm0,%xmm3,%xmm3
3450
3451
3452 vpslld $30,%xmm14,%xmm7
3453 vpor %xmm9,%xmm8,%xmm8
3454 vpaddd %xmm6,%xmm12,%xmm12
3455
3456 vpsrld $31,%xmm3,%xmm5
3457 vpaddd %xmm3,%xmm3,%xmm3
3458
3459 vpsrld $2,%xmm14,%xmm14
3460
3461 vpaddd %xmm8,%xmm12,%xmm12
3462 vpor %xmm5,%xmm3,%xmm3
3463 vpor %xmm7,%xmm14,%xmm14
3464 vpxor %xmm1,%xmm4,%xmm4
3465 vmovdqa 80-128(%rax),%xmm1
3466
3467 vpaddd %xmm15,%xmm11,%xmm11
3468 vpslld $5,%xmm12,%xmm8
3469 vpandn %xmm10,%xmm13,%xmm7
3470
3471 vpand %xmm14,%xmm13,%xmm6
3472
3473 vmovdqa %xmm3,32-128(%rax)
3474 vpaddd %xmm3,%xmm11,%xmm11
3475 vpxor 176-128(%rax),%xmm4,%xmm4
3476 vpsrld $27,%xmm12,%xmm9
3477 vpxor %xmm7,%xmm6,%xmm6
3478 vpxor %xmm1,%xmm4,%xmm4
3479
3480
3481 vpslld $30,%xmm13,%xmm7
3482 vpor %xmm9,%xmm8,%xmm8
3483 vpaddd %xmm6,%xmm11,%xmm11
3484
3485 vpsrld $31,%xmm4,%xmm5
3486 vpaddd %xmm4,%xmm4,%xmm4
3487
3488 vpsrld $2,%xmm13,%xmm13
3489
3490 vpaddd %xmm8,%xmm11,%xmm11
3491 vpor %xmm5,%xmm4,%xmm4
3492 vpor %xmm7,%xmm13,%xmm13
3493 vpxor %xmm2,%xmm0,%xmm0
3494 vmovdqa 96-128(%rax),%xmm2
3495
3496 vpaddd %xmm15,%xmm10,%xmm10
3497 vpslld $5,%xmm11,%xmm8
3498 vpandn %xmm14,%xmm12,%xmm7
3499
3500 vpand %xmm13,%xmm12,%xmm6
3501
3502 vmovdqa %xmm4,48-128(%rax)
3503 vpaddd %xmm4,%xmm10,%xmm10
3504 vpxor 192-128(%rax),%xmm0,%xmm0
3505 vpsrld $27,%xmm11,%xmm9
3506 vpxor %xmm7,%xmm6,%xmm6
3507 vpxor %xmm2,%xmm0,%xmm0
3508
3509
3510 vpslld $30,%xmm12,%xmm7
3511 vpor %xmm9,%xmm8,%xmm8
3512 vpaddd %xmm6,%xmm10,%xmm10
3513
3514 vpsrld $31,%xmm0,%xmm5
3515 vpaddd %xmm0,%xmm0,%xmm0
3516
3517 vpsrld $2,%xmm12,%xmm12
3518
3519 vpaddd %xmm8,%xmm10,%xmm10
3520 vpor %xmm5,%xmm0,%xmm0
3521 vpor %xmm7,%xmm12,%xmm12
3522 vmovdqa 0(%rbp),%xmm15
3523 vpxor %xmm3,%xmm1,%xmm1
3524 vmovdqa 112-128(%rax),%xmm3
3525
3526 vpslld $5,%xmm10,%xmm8
3527 vpaddd %xmm15,%xmm14,%xmm14
3528 vpxor %xmm11,%xmm13,%xmm6
3529 vmovdqa %xmm0,64-128(%rax)
3530 vpaddd %xmm0,%xmm14,%xmm14
3531 vpxor 208-128(%rax),%xmm1,%xmm1
3532 vpsrld $27,%xmm10,%xmm9
3533 vpxor %xmm12,%xmm6,%xmm6
3534 vpxor %xmm3,%xmm1,%xmm1
3535
3536 vpslld $30,%xmm11,%xmm7
3537 vpor %xmm9,%xmm8,%xmm8
3538 vpaddd %xmm6,%xmm14,%xmm14
3539 vpsrld $31,%xmm1,%xmm5
3540 vpaddd %xmm1,%xmm1,%xmm1
3541
3542 vpsrld $2,%xmm11,%xmm11
3543 vpaddd %xmm8,%xmm14,%xmm14
3544 vpor %xmm5,%xmm1,%xmm1
3545 vpor %xmm7,%xmm11,%xmm11
3546 vpxor %xmm4,%xmm2,%xmm2
3547 vmovdqa 128-128(%rax),%xmm4
3548
3549 vpslld $5,%xmm14,%xmm8
3550 vpaddd %xmm15,%xmm13,%xmm13
3551 vpxor %xmm10,%xmm12,%xmm6
3552 vmovdqa %xmm1,80-128(%rax)
3553 vpaddd %xmm1,%xmm13,%xmm13
3554 vpxor 224-128(%rax),%xmm2,%xmm2
3555 vpsrld $27,%xmm14,%xmm9
3556 vpxor %xmm11,%xmm6,%xmm6
3557 vpxor %xmm4,%xmm2,%xmm2
3558
3559 vpslld $30,%xmm10,%xmm7
3560 vpor %xmm9,%xmm8,%xmm8
3561 vpaddd %xmm6,%xmm13,%xmm13
3562 vpsrld $31,%xmm2,%xmm5
3563 vpaddd %xmm2,%xmm2,%xmm2
3564
3565 vpsrld $2,%xmm10,%xmm10
3566 vpaddd %xmm8,%xmm13,%xmm13
3567 vpor %xmm5,%xmm2,%xmm2
3568 vpor %xmm7,%xmm10,%xmm10
3569 vpxor %xmm0,%xmm3,%xmm3
3570 vmovdqa 144-128(%rax),%xmm0
3571
3572 vpslld $5,%xmm13,%xmm8
3573 vpaddd %xmm15,%xmm12,%xmm12
3574 vpxor %xmm14,%xmm11,%xmm6
3575 vmovdqa %xmm2,96-128(%rax)
3576 vpaddd %xmm2,%xmm12,%xmm12
3577 vpxor 240-128(%rax),%xmm3,%xmm3
3578 vpsrld $27,%xmm13,%xmm9
3579 vpxor %xmm10,%xmm6,%xmm6
3580 vpxor %xmm0,%xmm3,%xmm3
3581
3582 vpslld $30,%xmm14,%xmm7
3583 vpor %xmm9,%xmm8,%xmm8
3584 vpaddd %xmm6,%xmm12,%xmm12
3585 vpsrld $31,%xmm3,%xmm5
3586 vpaddd %xmm3,%xmm3,%xmm3
3587
3588 vpsrld $2,%xmm14,%xmm14
3589 vpaddd %xmm8,%xmm12,%xmm12
3590 vpor %xmm5,%xmm3,%xmm3
3591 vpor %xmm7,%xmm14,%xmm14
3592 vpxor %xmm1,%xmm4,%xmm4
3593 vmovdqa 160-128(%rax),%xmm1
3594
3595 vpslld $5,%xmm12,%xmm8
3596 vpaddd %xmm15,%xmm11,%xmm11
3597 vpxor %xmm13,%xmm10,%xmm6
3598 vmovdqa %xmm3,112-128(%rax)
3599 vpaddd %xmm3,%xmm11,%xmm11
3600 vpxor 0-128(%rax),%xmm4,%xmm4
3601 vpsrld $27,%xmm12,%xmm9
3602 vpxor %xmm14,%xmm6,%xmm6
3603 vpxor %xmm1,%xmm4,%xmm4
3604
3605 vpslld $30,%xmm13,%xmm7
3606 vpor %xmm9,%xmm8,%xmm8
3607 vpaddd %xmm6,%xmm11,%xmm11
3608 vpsrld $31,%xmm4,%xmm5
3609 vpaddd %xmm4,%xmm4,%xmm4
3610
3611 vpsrld $2,%xmm13,%xmm13
3612 vpaddd %xmm8,%xmm11,%xmm11
3613 vpor %xmm5,%xmm4,%xmm4
3614 vpor %xmm7,%xmm13,%xmm13
3615 vpxor %xmm2,%xmm0,%xmm0
3616 vmovdqa 176-128(%rax),%xmm2
3617
3618 vpslld $5,%xmm11,%xmm8
3619 vpaddd %xmm15,%xmm10,%xmm10
3620 vpxor %xmm12,%xmm14,%xmm6
3621 vmovdqa %xmm4,128-128(%rax)
3622 vpaddd %xmm4,%xmm10,%xmm10
3623 vpxor 16-128(%rax),%xmm0,%xmm0
3624 vpsrld $27,%xmm11,%xmm9
3625 vpxor %xmm13,%xmm6,%xmm6
3626 vpxor %xmm2,%xmm0,%xmm0
3627
3628 vpslld $30,%xmm12,%xmm7
3629 vpor %xmm9,%xmm8,%xmm8
3630 vpaddd %xmm6,%xmm10,%xmm10
3631 vpsrld $31,%xmm0,%xmm5
3632 vpaddd %xmm0,%xmm0,%xmm0
3633
3634 vpsrld $2,%xmm12,%xmm12
3635 vpaddd %xmm8,%xmm10,%xmm10
3636 vpor %xmm5,%xmm0,%xmm0
3637 vpor %xmm7,%xmm12,%xmm12
3638 vpxor %xmm3,%xmm1,%xmm1
3639 vmovdqa 192-128(%rax),%xmm3
3640
3641 vpslld $5,%xmm10,%xmm8
3642 vpaddd %xmm15,%xmm14,%xmm14
3643 vpxor %xmm11,%xmm13,%xmm6
3644 vmovdqa %xmm0,144-128(%rax)
3645 vpaddd %xmm0,%xmm14,%xmm14
3646 vpxor 32-128(%rax),%xmm1,%xmm1
3647 vpsrld $27,%xmm10,%xmm9
3648 vpxor %xmm12,%xmm6,%xmm6
3649 vpxor %xmm3,%xmm1,%xmm1
3650
3651 vpslld $30,%xmm11,%xmm7
3652 vpor %xmm9,%xmm8,%xmm8
3653 vpaddd %xmm6,%xmm14,%xmm14
3654 vpsrld $31,%xmm1,%xmm5
3655 vpaddd %xmm1,%xmm1,%xmm1
3656
3657 vpsrld $2,%xmm11,%xmm11
3658 vpaddd %xmm8,%xmm14,%xmm14
3659 vpor %xmm5,%xmm1,%xmm1
3660 vpor %xmm7,%xmm11,%xmm11
3661 vpxor %xmm4,%xmm2,%xmm2
3662 vmovdqa 208-128(%rax),%xmm4
3663
3664 vpslld $5,%xmm14,%xmm8
3665 vpaddd %xmm15,%xmm13,%xmm13
3666 vpxor %xmm10,%xmm12,%xmm6
3667 vmovdqa %xmm1,160-128(%rax)
3668 vpaddd %xmm1,%xmm13,%xmm13
3669 vpxor 48-128(%rax),%xmm2,%xmm2
3670 vpsrld $27,%xmm14,%xmm9
3671 vpxor %xmm11,%xmm6,%xmm6
3672 vpxor %xmm4,%xmm2,%xmm2
3673
3674 vpslld $30,%xmm10,%xmm7
3675 vpor %xmm9,%xmm8,%xmm8
3676 vpaddd %xmm6,%xmm13,%xmm13
3677 vpsrld $31,%xmm2,%xmm5
3678 vpaddd %xmm2,%xmm2,%xmm2
3679
3680 vpsrld $2,%xmm10,%xmm10
3681 vpaddd %xmm8,%xmm13,%xmm13
3682 vpor %xmm5,%xmm2,%xmm2
3683 vpor %xmm7,%xmm10,%xmm10
3684 vpxor %xmm0,%xmm3,%xmm3
3685 vmovdqa 224-128(%rax),%xmm0
3686
3687 vpslld $5,%xmm13,%xmm8
3688 vpaddd %xmm15,%xmm12,%xmm12
3689 vpxor %xmm14,%xmm11,%xmm6
3690 vmovdqa %xmm2,176-128(%rax)
3691 vpaddd %xmm2,%xmm12,%xmm12
3692 vpxor 64-128(%rax),%xmm3,%xmm3
3693 vpsrld $27,%xmm13,%xmm9
3694 vpxor %xmm10,%xmm6,%xmm6
3695 vpxor %xmm0,%xmm3,%xmm3
3696
3697 vpslld $30,%xmm14,%xmm7
3698 vpor %xmm9,%xmm8,%xmm8
3699 vpaddd %xmm6,%xmm12,%xmm12
3700 vpsrld $31,%xmm3,%xmm5
3701 vpaddd %xmm3,%xmm3,%xmm3
3702
3703 vpsrld $2,%xmm14,%xmm14
3704 vpaddd %xmm8,%xmm12,%xmm12
3705 vpor %xmm5,%xmm3,%xmm3
3706 vpor %xmm7,%xmm14,%xmm14
3707 vpxor %xmm1,%xmm4,%xmm4
3708 vmovdqa 240-128(%rax),%xmm1
3709
3710 vpslld $5,%xmm12,%xmm8
3711 vpaddd %xmm15,%xmm11,%xmm11
3712 vpxor %xmm13,%xmm10,%xmm6
3713 vmovdqa %xmm3,192-128(%rax)
3714 vpaddd %xmm3,%xmm11,%xmm11
3715 vpxor 80-128(%rax),%xmm4,%xmm4
3716 vpsrld $27,%xmm12,%xmm9
3717 vpxor %xmm14,%xmm6,%xmm6
3718 vpxor %xmm1,%xmm4,%xmm4
3719
3720 vpslld $30,%xmm13,%xmm7
3721 vpor %xmm9,%xmm8,%xmm8
3722 vpaddd %xmm6,%xmm11,%xmm11
3723 vpsrld $31,%xmm4,%xmm5
3724 vpaddd %xmm4,%xmm4,%xmm4
3725
3726 vpsrld $2,%xmm13,%xmm13
3727 vpaddd %xmm8,%xmm11,%xmm11
3728 vpor %xmm5,%xmm4,%xmm4
3729 vpor %xmm7,%xmm13,%xmm13
3730 vpxor %xmm2,%xmm0,%xmm0
3731 vmovdqa 0-128(%rax),%xmm2
3732
3733 vpslld $5,%xmm11,%xmm8
3734 vpaddd %xmm15,%xmm10,%xmm10
3735 vpxor %xmm12,%xmm14,%xmm6
3736 vmovdqa %xmm4,208-128(%rax)
3737 vpaddd %xmm4,%xmm10,%xmm10
3738 vpxor 96-128(%rax),%xmm0,%xmm0
3739 vpsrld $27,%xmm11,%xmm9
3740 vpxor %xmm13,%xmm6,%xmm6
3741 vpxor %xmm2,%xmm0,%xmm0
3742
3743 vpslld $30,%xmm12,%xmm7
3744 vpor %xmm9,%xmm8,%xmm8
3745 vpaddd %xmm6,%xmm10,%xmm10
3746 vpsrld $31,%xmm0,%xmm5
3747 vpaddd %xmm0,%xmm0,%xmm0
3748
3749 vpsrld $2,%xmm12,%xmm12
3750 vpaddd %xmm8,%xmm10,%xmm10
3751 vpor %xmm5,%xmm0,%xmm0
3752 vpor %xmm7,%xmm12,%xmm12
3753 vpxor %xmm3,%xmm1,%xmm1
3754 vmovdqa 16-128(%rax),%xmm3
3755
3756 vpslld $5,%xmm10,%xmm8
3757 vpaddd %xmm15,%xmm14,%xmm14
3758 vpxor %xmm11,%xmm13,%xmm6
3759 vmovdqa %xmm0,224-128(%rax)
3760 vpaddd %xmm0,%xmm14,%xmm14
3761 vpxor 112-128(%rax),%xmm1,%xmm1
3762 vpsrld $27,%xmm10,%xmm9
3763 vpxor %xmm12,%xmm6,%xmm6
3764 vpxor %xmm3,%xmm1,%xmm1
3765
3766 vpslld $30,%xmm11,%xmm7
3767 vpor %xmm9,%xmm8,%xmm8
3768 vpaddd %xmm6,%xmm14,%xmm14
3769 vpsrld $31,%xmm1,%xmm5
3770 vpaddd %xmm1,%xmm1,%xmm1
3771
3772 vpsrld $2,%xmm11,%xmm11
3773 vpaddd %xmm8,%xmm14,%xmm14
3774 vpor %xmm5,%xmm1,%xmm1
3775 vpor %xmm7,%xmm11,%xmm11
3776 vpxor %xmm4,%xmm2,%xmm2
3777 vmovdqa 32-128(%rax),%xmm4
3778
3779 vpslld $5,%xmm14,%xmm8
3780 vpaddd %xmm15,%xmm13,%xmm13
3781 vpxor %xmm10,%xmm12,%xmm6
3782 vmovdqa %xmm1,240-128(%rax)
3783 vpaddd %xmm1,%xmm13,%xmm13
3784 vpxor 128-128(%rax),%xmm2,%xmm2
3785 vpsrld $27,%xmm14,%xmm9
3786 vpxor %xmm11,%xmm6,%xmm6
3787 vpxor %xmm4,%xmm2,%xmm2
3788
3789 vpslld $30,%xmm10,%xmm7
3790 vpor %xmm9,%xmm8,%xmm8
3791 vpaddd %xmm6,%xmm13,%xmm13
3792 vpsrld $31,%xmm2,%xmm5
3793 vpaddd %xmm2,%xmm2,%xmm2
3794
3795 vpsrld $2,%xmm10,%xmm10
3796 vpaddd %xmm8,%xmm13,%xmm13
3797 vpor %xmm5,%xmm2,%xmm2
3798 vpor %xmm7,%xmm10,%xmm10
3799 vpxor %xmm0,%xmm3,%xmm3
3800 vmovdqa 48-128(%rax),%xmm0
3801
3802 vpslld $5,%xmm13,%xmm8
3803 vpaddd %xmm15,%xmm12,%xmm12
3804 vpxor %xmm14,%xmm11,%xmm6
3805 vmovdqa %xmm2,0-128(%rax)
3806 vpaddd %xmm2,%xmm12,%xmm12
3807 vpxor 144-128(%rax),%xmm3,%xmm3
3808 vpsrld $27,%xmm13,%xmm9
3809 vpxor %xmm10,%xmm6,%xmm6
3810 vpxor %xmm0,%xmm3,%xmm3
3811
3812 vpslld $30,%xmm14,%xmm7
3813 vpor %xmm9,%xmm8,%xmm8
3814 vpaddd %xmm6,%xmm12,%xmm12
3815 vpsrld $31,%xmm3,%xmm5
3816 vpaddd %xmm3,%xmm3,%xmm3
3817
3818 vpsrld $2,%xmm14,%xmm14
3819 vpaddd %xmm8,%xmm12,%xmm12
3820 vpor %xmm5,%xmm3,%xmm3
3821 vpor %xmm7,%xmm14,%xmm14
3822 vpxor %xmm1,%xmm4,%xmm4
3823 vmovdqa 64-128(%rax),%xmm1
3824
3825 vpslld $5,%xmm12,%xmm8
3826 vpaddd %xmm15,%xmm11,%xmm11
3827 vpxor %xmm13,%xmm10,%xmm6
3828 vmovdqa %xmm3,16-128(%rax)
3829 vpaddd %xmm3,%xmm11,%xmm11
3830 vpxor 160-128(%rax),%xmm4,%xmm4
3831 vpsrld $27,%xmm12,%xmm9
3832 vpxor %xmm14,%xmm6,%xmm6
3833 vpxor %xmm1,%xmm4,%xmm4
3834
3835 vpslld $30,%xmm13,%xmm7
3836 vpor %xmm9,%xmm8,%xmm8
3837 vpaddd %xmm6,%xmm11,%xmm11
3838 vpsrld $31,%xmm4,%xmm5
3839 vpaddd %xmm4,%xmm4,%xmm4
3840
3841 vpsrld $2,%xmm13,%xmm13
3842 vpaddd %xmm8,%xmm11,%xmm11
3843 vpor %xmm5,%xmm4,%xmm4
3844 vpor %xmm7,%xmm13,%xmm13
3845 vpxor %xmm2,%xmm0,%xmm0
3846 vmovdqa 80-128(%rax),%xmm2
3847
3848 vpslld $5,%xmm11,%xmm8
3849 vpaddd %xmm15,%xmm10,%xmm10
3850 vpxor %xmm12,%xmm14,%xmm6
3851 vmovdqa %xmm4,32-128(%rax)
3852 vpaddd %xmm4,%xmm10,%xmm10
3853 vpxor 176-128(%rax),%xmm0,%xmm0
3854 vpsrld $27,%xmm11,%xmm9
3855 vpxor %xmm13,%xmm6,%xmm6
3856 vpxor %xmm2,%xmm0,%xmm0
3857
3858 vpslld $30,%xmm12,%xmm7
3859 vpor %xmm9,%xmm8,%xmm8
3860 vpaddd %xmm6,%xmm10,%xmm10
3861 vpsrld $31,%xmm0,%xmm5
3862 vpaddd %xmm0,%xmm0,%xmm0
3863
3864 vpsrld $2,%xmm12,%xmm12
3865 vpaddd %xmm8,%xmm10,%xmm10
3866 vpor %xmm5,%xmm0,%xmm0
3867 vpor %xmm7,%xmm12,%xmm12
3868 vpxor %xmm3,%xmm1,%xmm1
3869 vmovdqa 96-128(%rax),%xmm3
3870
3871 vpslld $5,%xmm10,%xmm8
3872 vpaddd %xmm15,%xmm14,%xmm14
3873 vpxor %xmm11,%xmm13,%xmm6
3874 vmovdqa %xmm0,48-128(%rax)
3875 vpaddd %xmm0,%xmm14,%xmm14
3876 vpxor 192-128(%rax),%xmm1,%xmm1
3877 vpsrld $27,%xmm10,%xmm9
3878 vpxor %xmm12,%xmm6,%xmm6
3879 vpxor %xmm3,%xmm1,%xmm1
3880
3881 vpslld $30,%xmm11,%xmm7
3882 vpor %xmm9,%xmm8,%xmm8
3883 vpaddd %xmm6,%xmm14,%xmm14
3884 vpsrld $31,%xmm1,%xmm5
3885 vpaddd %xmm1,%xmm1,%xmm1
3886
3887 vpsrld $2,%xmm11,%xmm11
3888 vpaddd %xmm8,%xmm14,%xmm14
3889 vpor %xmm5,%xmm1,%xmm1
3890 vpor %xmm7,%xmm11,%xmm11
3891 vpxor %xmm4,%xmm2,%xmm2
3892 vmovdqa 112-128(%rax),%xmm4
3893
3894 vpslld $5,%xmm14,%xmm8
3895 vpaddd %xmm15,%xmm13,%xmm13
3896 vpxor %xmm10,%xmm12,%xmm6
3897 vmovdqa %xmm1,64-128(%rax)
3898 vpaddd %xmm1,%xmm13,%xmm13
3899 vpxor 208-128(%rax),%xmm2,%xmm2
3900 vpsrld $27,%xmm14,%xmm9
3901 vpxor %xmm11,%xmm6,%xmm6
3902 vpxor %xmm4,%xmm2,%xmm2
3903
3904 vpslld $30,%xmm10,%xmm7
3905 vpor %xmm9,%xmm8,%xmm8
3906 vpaddd %xmm6,%xmm13,%xmm13
3907 vpsrld $31,%xmm2,%xmm5
3908 vpaddd %xmm2,%xmm2,%xmm2
3909
3910 vpsrld $2,%xmm10,%xmm10
3911 vpaddd %xmm8,%xmm13,%xmm13
3912 vpor %xmm5,%xmm2,%xmm2
3913 vpor %xmm7,%xmm10,%xmm10
3914 vpxor %xmm0,%xmm3,%xmm3
3915 vmovdqa 128-128(%rax),%xmm0
3916
3917 vpslld $5,%xmm13,%xmm8
3918 vpaddd %xmm15,%xmm12,%xmm12
3919 vpxor %xmm14,%xmm11,%xmm6
3920 vmovdqa %xmm2,80-128(%rax)
3921 vpaddd %xmm2,%xmm12,%xmm12
3922 vpxor 224-128(%rax),%xmm3,%xmm3
3923 vpsrld $27,%xmm13,%xmm9
3924 vpxor %xmm10,%xmm6,%xmm6
3925 vpxor %xmm0,%xmm3,%xmm3
3926
3927 vpslld $30,%xmm14,%xmm7
3928 vpor %xmm9,%xmm8,%xmm8
3929 vpaddd %xmm6,%xmm12,%xmm12
3930 vpsrld $31,%xmm3,%xmm5
3931 vpaddd %xmm3,%xmm3,%xmm3
3932
3933 vpsrld $2,%xmm14,%xmm14
3934 vpaddd %xmm8,%xmm12,%xmm12
3935 vpor %xmm5,%xmm3,%xmm3
3936 vpor %xmm7,%xmm14,%xmm14
3937 vpxor %xmm1,%xmm4,%xmm4
3938 vmovdqa 144-128(%rax),%xmm1
3939
3940 vpslld $5,%xmm12,%xmm8
3941 vpaddd %xmm15,%xmm11,%xmm11
3942 vpxor %xmm13,%xmm10,%xmm6
3943 vmovdqa %xmm3,96-128(%rax)
3944 vpaddd %xmm3,%xmm11,%xmm11
3945 vpxor 240-128(%rax),%xmm4,%xmm4
3946 vpsrld $27,%xmm12,%xmm9
3947 vpxor %xmm14,%xmm6,%xmm6
3948 vpxor %xmm1,%xmm4,%xmm4
3949
3950 vpslld $30,%xmm13,%xmm7
3951 vpor %xmm9,%xmm8,%xmm8
3952 vpaddd %xmm6,%xmm11,%xmm11
3953 vpsrld $31,%xmm4,%xmm5
3954 vpaddd %xmm4,%xmm4,%xmm4
3955
3956 vpsrld $2,%xmm13,%xmm13
3957 vpaddd %xmm8,%xmm11,%xmm11
3958 vpor %xmm5,%xmm4,%xmm4
3959 vpor %xmm7,%xmm13,%xmm13
3960 vpxor %xmm2,%xmm0,%xmm0
3961 vmovdqa 160-128(%rax),%xmm2
3962
3963 vpslld $5,%xmm11,%xmm8
3964 vpaddd %xmm15,%xmm10,%xmm10
3965 vpxor %xmm12,%xmm14,%xmm6
3966 vmovdqa %xmm4,112-128(%rax)
3967 vpaddd %xmm4,%xmm10,%xmm10
3968 vpxor 0-128(%rax),%xmm0,%xmm0
3969 vpsrld $27,%xmm11,%xmm9
3970 vpxor %xmm13,%xmm6,%xmm6
3971 vpxor %xmm2,%xmm0,%xmm0
3972
3973 vpslld $30,%xmm12,%xmm7
3974 vpor %xmm9,%xmm8,%xmm8
3975 vpaddd %xmm6,%xmm10,%xmm10
3976 vpsrld $31,%xmm0,%xmm5
3977 vpaddd %xmm0,%xmm0,%xmm0
3978
3979 vpsrld $2,%xmm12,%xmm12
3980 vpaddd %xmm8,%xmm10,%xmm10
3981 vpor %xmm5,%xmm0,%xmm0
3982 vpor %xmm7,%xmm12,%xmm12
3983 vmovdqa 32(%rbp),%xmm15
3984 vpxor %xmm3,%xmm1,%xmm1
3985 vmovdqa 176-128(%rax),%xmm3
3986
3987 vpaddd %xmm15,%xmm14,%xmm14
3988 vpslld $5,%xmm10,%xmm8
3989 vpand %xmm12,%xmm13,%xmm7
3990 vpxor 16-128(%rax),%xmm1,%xmm1
3991
3992 vpaddd %xmm7,%xmm14,%xmm14
3993 vpsrld $27,%xmm10,%xmm9
3994 vpxor %xmm12,%xmm13,%xmm6
3995 vpxor %xmm3,%xmm1,%xmm1
3996
3997 vmovdqu %xmm0,128-128(%rax)
3998 vpaddd %xmm0,%xmm14,%xmm14
3999 vpor %xmm9,%xmm8,%xmm8
4000 vpsrld $31,%xmm1,%xmm5
4001 vpand %xmm11,%xmm6,%xmm6
4002 vpaddd %xmm1,%xmm1,%xmm1
4003
4004 vpslld $30,%xmm11,%xmm7
4005 vpaddd %xmm6,%xmm14,%xmm14
4006
4007 vpsrld $2,%xmm11,%xmm11
4008 vpaddd %xmm8,%xmm14,%xmm14
4009 vpor %xmm5,%xmm1,%xmm1
4010 vpor %xmm7,%xmm11,%xmm11
4011 vpxor %xmm4,%xmm2,%xmm2
4012 vmovdqa 192-128(%rax),%xmm4
4013
4014 vpaddd %xmm15,%xmm13,%xmm13
4015 vpslld $5,%xmm14,%xmm8
4016 vpand %xmm11,%xmm12,%xmm7
4017 vpxor 32-128(%rax),%xmm2,%xmm2
4018
4019 vpaddd %xmm7,%xmm13,%xmm13
4020 vpsrld $27,%xmm14,%xmm9
4021 vpxor %xmm11,%xmm12,%xmm6
4022 vpxor %xmm4,%xmm2,%xmm2
4023
4024 vmovdqu %xmm1,144-128(%rax)
4025 vpaddd %xmm1,%xmm13,%xmm13
4026 vpor %xmm9,%xmm8,%xmm8
4027 vpsrld $31,%xmm2,%xmm5
4028 vpand %xmm10,%xmm6,%xmm6
4029 vpaddd %xmm2,%xmm2,%xmm2
4030
4031 vpslld $30,%xmm10,%xmm7
4032 vpaddd %xmm6,%xmm13,%xmm13
4033
4034 vpsrld $2,%xmm10,%xmm10
4035 vpaddd %xmm8,%xmm13,%xmm13
4036 vpor %xmm5,%xmm2,%xmm2
4037 vpor %xmm7,%xmm10,%xmm10
4038 vpxor %xmm0,%xmm3,%xmm3
4039 vmovdqa 208-128(%rax),%xmm0
4040
4041 vpaddd %xmm15,%xmm12,%xmm12
4042 vpslld $5,%xmm13,%xmm8
4043 vpand %xmm10,%xmm11,%xmm7
4044 vpxor 48-128(%rax),%xmm3,%xmm3
4045
4046 vpaddd %xmm7,%xmm12,%xmm12
4047 vpsrld $27,%xmm13,%xmm9
4048 vpxor %xmm10,%xmm11,%xmm6
4049 vpxor %xmm0,%xmm3,%xmm3
4050
4051 vmovdqu %xmm2,160-128(%rax)
4052 vpaddd %xmm2,%xmm12,%xmm12
4053 vpor %xmm9,%xmm8,%xmm8
4054 vpsrld $31,%xmm3,%xmm5
4055 vpand %xmm14,%xmm6,%xmm6
4056 vpaddd %xmm3,%xmm3,%xmm3
4057
4058 vpslld $30,%xmm14,%xmm7
4059 vpaddd %xmm6,%xmm12,%xmm12
4060
4061 vpsrld $2,%xmm14,%xmm14
4062 vpaddd %xmm8,%xmm12,%xmm12
4063 vpor %xmm5,%xmm3,%xmm3
4064 vpor %xmm7,%xmm14,%xmm14
4065 vpxor %xmm1,%xmm4,%xmm4
4066 vmovdqa 224-128(%rax),%xmm1
4067
4068 vpaddd %xmm15,%xmm11,%xmm11
4069 vpslld $5,%xmm12,%xmm8
4070 vpand %xmm14,%xmm10,%xmm7
4071 vpxor 64-128(%rax),%xmm4,%xmm4
4072
4073 vpaddd %xmm7,%xmm11,%xmm11
4074 vpsrld $27,%xmm12,%xmm9
4075 vpxor %xmm14,%xmm10,%xmm6
4076 vpxor %xmm1,%xmm4,%xmm4
4077
4078 vmovdqu %xmm3,176-128(%rax)
4079 vpaddd %xmm3,%xmm11,%xmm11
4080 vpor %xmm9,%xmm8,%xmm8
4081 vpsrld $31,%xmm4,%xmm5
4082 vpand %xmm13,%xmm6,%xmm6
4083 vpaddd %xmm4,%xmm4,%xmm4
4084
4085 vpslld $30,%xmm13,%xmm7
4086 vpaddd %xmm6,%xmm11,%xmm11
4087
4088 vpsrld $2,%xmm13,%xmm13
4089 vpaddd %xmm8,%xmm11,%xmm11
4090 vpor %xmm5,%xmm4,%xmm4
4091 vpor %xmm7,%xmm13,%xmm13
4092 vpxor %xmm2,%xmm0,%xmm0
4093 vmovdqa 240-128(%rax),%xmm2
4094
4095 vpaddd %xmm15,%xmm10,%xmm10
4096 vpslld $5,%xmm11,%xmm8
4097 vpand %xmm13,%xmm14,%xmm7
4098 vpxor 80-128(%rax),%xmm0,%xmm0
4099
4100 vpaddd %xmm7,%xmm10,%xmm10
4101 vpsrld $27,%xmm11,%xmm9
4102 vpxor %xmm13,%xmm14,%xmm6
4103 vpxor %xmm2,%xmm0,%xmm0
4104
4105 vmovdqu %xmm4,192-128(%rax)
4106 vpaddd %xmm4,%xmm10,%xmm10
4107 vpor %xmm9,%xmm8,%xmm8
4108 vpsrld $31,%xmm0,%xmm5
4109 vpand %xmm12,%xmm6,%xmm6
4110 vpaddd %xmm0,%xmm0,%xmm0
4111
4112 vpslld $30,%xmm12,%xmm7
4113 vpaddd %xmm6,%xmm10,%xmm10
4114
4115 vpsrld $2,%xmm12,%xmm12
4116 vpaddd %xmm8,%xmm10,%xmm10
4117 vpor %xmm5,%xmm0,%xmm0
4118 vpor %xmm7,%xmm12,%xmm12
4119 vpxor %xmm3,%xmm1,%xmm1
4120 vmovdqa 0-128(%rax),%xmm3
4121
4122 vpaddd %xmm15,%xmm14,%xmm14
4123 vpslld $5,%xmm10,%xmm8
4124 vpand %xmm12,%xmm13,%xmm7
4125 vpxor 96-128(%rax),%xmm1,%xmm1
4126
4127 vpaddd %xmm7,%xmm14,%xmm14
4128 vpsrld $27,%xmm10,%xmm9
4129 vpxor %xmm12,%xmm13,%xmm6
4130 vpxor %xmm3,%xmm1,%xmm1
4131
4132 vmovdqu %xmm0,208-128(%rax)
4133 vpaddd %xmm0,%xmm14,%xmm14
4134 vpor %xmm9,%xmm8,%xmm8
4135 vpsrld $31,%xmm1,%xmm5
4136 vpand %xmm11,%xmm6,%xmm6
4137 vpaddd %xmm1,%xmm1,%xmm1
4138
4139 vpslld $30,%xmm11,%xmm7
4140 vpaddd %xmm6,%xmm14,%xmm14
4141
4142 vpsrld $2,%xmm11,%xmm11
4143 vpaddd %xmm8,%xmm14,%xmm14
4144 vpor %xmm5,%xmm1,%xmm1
4145 vpor %xmm7,%xmm11,%xmm11
4146 vpxor %xmm4,%xmm2,%xmm2
4147 vmovdqa 16-128(%rax),%xmm4
4148
4149 vpaddd %xmm15,%xmm13,%xmm13
4150 vpslld $5,%xmm14,%xmm8
4151 vpand %xmm11,%xmm12,%xmm7
4152 vpxor 112-128(%rax),%xmm2,%xmm2
4153
4154 vpaddd %xmm7,%xmm13,%xmm13
4155 vpsrld $27,%xmm14,%xmm9
4156 vpxor %xmm11,%xmm12,%xmm6
4157 vpxor %xmm4,%xmm2,%xmm2
4158
4159 vmovdqu %xmm1,224-128(%rax)
4160 vpaddd %xmm1,%xmm13,%xmm13
4161 vpor %xmm9,%xmm8,%xmm8
4162 vpsrld $31,%xmm2,%xmm5
4163 vpand %xmm10,%xmm6,%xmm6
4164 vpaddd %xmm2,%xmm2,%xmm2
4165
4166 vpslld $30,%xmm10,%xmm7
4167 vpaddd %xmm6,%xmm13,%xmm13
4168
4169 vpsrld $2,%xmm10,%xmm10
4170 vpaddd %xmm8,%xmm13,%xmm13
4171 vpor %xmm5,%xmm2,%xmm2
4172 vpor %xmm7,%xmm10,%xmm10
4173 vpxor %xmm0,%xmm3,%xmm3
4174 vmovdqa 32-128(%rax),%xmm0
4175
4176 vpaddd %xmm15,%xmm12,%xmm12
4177 vpslld $5,%xmm13,%xmm8
4178 vpand %xmm10,%xmm11,%xmm7
4179 vpxor 128-128(%rax),%xmm3,%xmm3
4180
4181 vpaddd %xmm7,%xmm12,%xmm12
4182 vpsrld $27,%xmm13,%xmm9
4183 vpxor %xmm10,%xmm11,%xmm6
4184 vpxor %xmm0,%xmm3,%xmm3
4185
4186 vmovdqu %xmm2,240-128(%rax)
4187 vpaddd %xmm2,%xmm12,%xmm12
4188 vpor %xmm9,%xmm8,%xmm8
4189 vpsrld $31,%xmm3,%xmm5
4190 vpand %xmm14,%xmm6,%xmm6
4191 vpaddd %xmm3,%xmm3,%xmm3
4192
4193 vpslld $30,%xmm14,%xmm7
4194 vpaddd %xmm6,%xmm12,%xmm12
4195
4196 vpsrld $2,%xmm14,%xmm14
4197 vpaddd %xmm8,%xmm12,%xmm12
4198 vpor %xmm5,%xmm3,%xmm3
4199 vpor %xmm7,%xmm14,%xmm14
4200 vpxor %xmm1,%xmm4,%xmm4
4201 vmovdqa 48-128(%rax),%xmm1
4202
4203 vpaddd %xmm15,%xmm11,%xmm11
4204 vpslld $5,%xmm12,%xmm8
4205 vpand %xmm14,%xmm10,%xmm7
4206 vpxor 144-128(%rax),%xmm4,%xmm4
4207
4208 vpaddd %xmm7,%xmm11,%xmm11
4209 vpsrld $27,%xmm12,%xmm9
4210 vpxor %xmm14,%xmm10,%xmm6
4211 vpxor %xmm1,%xmm4,%xmm4
4212
4213 vmovdqu %xmm3,0-128(%rax)
4214 vpaddd %xmm3,%xmm11,%xmm11
4215 vpor %xmm9,%xmm8,%xmm8
4216 vpsrld $31,%xmm4,%xmm5
4217 vpand %xmm13,%xmm6,%xmm6
4218 vpaddd %xmm4,%xmm4,%xmm4
4219
4220 vpslld $30,%xmm13,%xmm7
4221 vpaddd %xmm6,%xmm11,%xmm11
4222
4223 vpsrld $2,%xmm13,%xmm13
4224 vpaddd %xmm8,%xmm11,%xmm11
4225 vpor %xmm5,%xmm4,%xmm4
4226 vpor %xmm7,%xmm13,%xmm13
4227 vpxor %xmm2,%xmm0,%xmm0
4228 vmovdqa 64-128(%rax),%xmm2
4229
4230 vpaddd %xmm15,%xmm10,%xmm10
4231 vpslld $5,%xmm11,%xmm8
4232 vpand %xmm13,%xmm14,%xmm7
4233 vpxor 160-128(%rax),%xmm0,%xmm0
4234
4235 vpaddd %xmm7,%xmm10,%xmm10
4236 vpsrld $27,%xmm11,%xmm9
4237 vpxor %xmm13,%xmm14,%xmm6
4238 vpxor %xmm2,%xmm0,%xmm0
4239
4240 vmovdqu %xmm4,16-128(%rax)
4241 vpaddd %xmm4,%xmm10,%xmm10
4242 vpor %xmm9,%xmm8,%xmm8
4243 vpsrld $31,%xmm0,%xmm5
4244 vpand %xmm12,%xmm6,%xmm6
4245 vpaddd %xmm0,%xmm0,%xmm0
4246
4247 vpslld $30,%xmm12,%xmm7
4248 vpaddd %xmm6,%xmm10,%xmm10
4249
4250 vpsrld $2,%xmm12,%xmm12
4251 vpaddd %xmm8,%xmm10,%xmm10
4252 vpor %xmm5,%xmm0,%xmm0
4253 vpor %xmm7,%xmm12,%xmm12
4254 vpxor %xmm3,%xmm1,%xmm1
4255 vmovdqa 80-128(%rax),%xmm3
4256
4257 vpaddd %xmm15,%xmm14,%xmm14
4258 vpslld $5,%xmm10,%xmm8
4259 vpand %xmm12,%xmm13,%xmm7
4260 vpxor 176-128(%rax),%xmm1,%xmm1
4261
4262 vpaddd %xmm7,%xmm14,%xmm14
4263 vpsrld $27,%xmm10,%xmm9
4264 vpxor %xmm12,%xmm13,%xmm6
4265 vpxor %xmm3,%xmm1,%xmm1
4266
4267 vmovdqu %xmm0,32-128(%rax)
4268 vpaddd %xmm0,%xmm14,%xmm14
4269 vpor %xmm9,%xmm8,%xmm8
4270 vpsrld $31,%xmm1,%xmm5
4271 vpand %xmm11,%xmm6,%xmm6
4272 vpaddd %xmm1,%xmm1,%xmm1
4273
4274 vpslld $30,%xmm11,%xmm7
4275 vpaddd %xmm6,%xmm14,%xmm14
4276
4277 vpsrld $2,%xmm11,%xmm11
4278 vpaddd %xmm8,%xmm14,%xmm14
4279 vpor %xmm5,%xmm1,%xmm1
4280 vpor %xmm7,%xmm11,%xmm11
4281 vpxor %xmm4,%xmm2,%xmm2
4282 vmovdqa 96-128(%rax),%xmm4
4283
4284 vpaddd %xmm15,%xmm13,%xmm13
4285 vpslld $5,%xmm14,%xmm8
4286 vpand %xmm11,%xmm12,%xmm7
4287 vpxor 192-128(%rax),%xmm2,%xmm2
4288
4289 vpaddd %xmm7,%xmm13,%xmm13
4290 vpsrld $27,%xmm14,%xmm9
4291 vpxor %xmm11,%xmm12,%xmm6
4292 vpxor %xmm4,%xmm2,%xmm2
4293
4294 vmovdqu %xmm1,48-128(%rax)
4295 vpaddd %xmm1,%xmm13,%xmm13
4296 vpor %xmm9,%xmm8,%xmm8
4297 vpsrld $31,%xmm2,%xmm5
4298 vpand %xmm10,%xmm6,%xmm6
4299 vpaddd %xmm2,%xmm2,%xmm2
4300
4301 vpslld $30,%xmm10,%xmm7
4302 vpaddd %xmm6,%xmm13,%xmm13
4303
4304 vpsrld $2,%xmm10,%xmm10
4305 vpaddd %xmm8,%xmm13,%xmm13
4306 vpor %xmm5,%xmm2,%xmm2
4307 vpor %xmm7,%xmm10,%xmm10
4308 vpxor %xmm0,%xmm3,%xmm3
4309 vmovdqa 112-128(%rax),%xmm0
4310
4311 vpaddd %xmm15,%xmm12,%xmm12
4312 vpslld $5,%xmm13,%xmm8
4313 vpand %xmm10,%xmm11,%xmm7
4314 vpxor 208-128(%rax),%xmm3,%xmm3
4315
4316 vpaddd %xmm7,%xmm12,%xmm12
4317 vpsrld $27,%xmm13,%xmm9
4318 vpxor %xmm10,%xmm11,%xmm6
4319 vpxor %xmm0,%xmm3,%xmm3
4320
4321 vmovdqu %xmm2,64-128(%rax)
4322 vpaddd %xmm2,%xmm12,%xmm12
4323 vpor %xmm9,%xmm8,%xmm8
4324 vpsrld $31,%xmm3,%xmm5
4325 vpand %xmm14,%xmm6,%xmm6
4326 vpaddd %xmm3,%xmm3,%xmm3
4327
4328 vpslld $30,%xmm14,%xmm7
4329 vpaddd %xmm6,%xmm12,%xmm12
4330
4331 vpsrld $2,%xmm14,%xmm14
4332 vpaddd %xmm8,%xmm12,%xmm12
4333 vpor %xmm5,%xmm3,%xmm3
4334 vpor %xmm7,%xmm14,%xmm14
4335 vpxor %xmm1,%xmm4,%xmm4
4336 vmovdqa 128-128(%rax),%xmm1
4337
4338 vpaddd %xmm15,%xmm11,%xmm11
4339 vpslld $5,%xmm12,%xmm8
4340 vpand %xmm14,%xmm10,%xmm7
4341 vpxor 224-128(%rax),%xmm4,%xmm4
4342
4343 vpaddd %xmm7,%xmm11,%xmm11
4344 vpsrld $27,%xmm12,%xmm9
4345 vpxor %xmm14,%xmm10,%xmm6
4346 vpxor %xmm1,%xmm4,%xmm4
4347
4348 vmovdqu %xmm3,80-128(%rax)
4349 vpaddd %xmm3,%xmm11,%xmm11
4350 vpor %xmm9,%xmm8,%xmm8
4351 vpsrld $31,%xmm4,%xmm5
4352 vpand %xmm13,%xmm6,%xmm6
4353 vpaddd %xmm4,%xmm4,%xmm4
4354
4355 vpslld $30,%xmm13,%xmm7
4356 vpaddd %xmm6,%xmm11,%xmm11
4357
4358 vpsrld $2,%xmm13,%xmm13
4359 vpaddd %xmm8,%xmm11,%xmm11
4360 vpor %xmm5,%xmm4,%xmm4
4361 vpor %xmm7,%xmm13,%xmm13
4362 vpxor %xmm2,%xmm0,%xmm0
4363 vmovdqa 144-128(%rax),%xmm2
4364
4365 vpaddd %xmm15,%xmm10,%xmm10
4366 vpslld $5,%xmm11,%xmm8
4367 vpand %xmm13,%xmm14,%xmm7
4368 vpxor 240-128(%rax),%xmm0,%xmm0
4369
4370 vpaddd %xmm7,%xmm10,%xmm10
4371 vpsrld $27,%xmm11,%xmm9
4372 vpxor %xmm13,%xmm14,%xmm6
4373 vpxor %xmm2,%xmm0,%xmm0
4374
4375 vmovdqu %xmm4,96-128(%rax)
4376 vpaddd %xmm4,%xmm10,%xmm10
4377 vpor %xmm9,%xmm8,%xmm8
4378 vpsrld $31,%xmm0,%xmm5
4379 vpand %xmm12,%xmm6,%xmm6
4380 vpaddd %xmm0,%xmm0,%xmm0
4381
4382 vpslld $30,%xmm12,%xmm7
4383 vpaddd %xmm6,%xmm10,%xmm10
4384
4385 vpsrld $2,%xmm12,%xmm12
4386 vpaddd %xmm8,%xmm10,%xmm10
4387 vpor %xmm5,%xmm0,%xmm0
4388 vpor %xmm7,%xmm12,%xmm12
4389 vpxor %xmm3,%xmm1,%xmm1
4390 vmovdqa 160-128(%rax),%xmm3
4391
4392 vpaddd %xmm15,%xmm14,%xmm14
4393 vpslld $5,%xmm10,%xmm8
4394 vpand %xmm12,%xmm13,%xmm7
4395 vpxor 0-128(%rax),%xmm1,%xmm1
4396
4397 vpaddd %xmm7,%xmm14,%xmm14
4398 vpsrld $27,%xmm10,%xmm9
4399 vpxor %xmm12,%xmm13,%xmm6
4400 vpxor %xmm3,%xmm1,%xmm1
4401
4402 vmovdqu %xmm0,112-128(%rax)
4403 vpaddd %xmm0,%xmm14,%xmm14
4404 vpor %xmm9,%xmm8,%xmm8
4405 vpsrld $31,%xmm1,%xmm5
4406 vpand %xmm11,%xmm6,%xmm6
4407 vpaddd %xmm1,%xmm1,%xmm1
4408
4409 vpslld $30,%xmm11,%xmm7
4410 vpaddd %xmm6,%xmm14,%xmm14
4411
4412 vpsrld $2,%xmm11,%xmm11
4413 vpaddd %xmm8,%xmm14,%xmm14
4414 vpor %xmm5,%xmm1,%xmm1
4415 vpor %xmm7,%xmm11,%xmm11
4416 vpxor %xmm4,%xmm2,%xmm2
4417 vmovdqa 176-128(%rax),%xmm4
4418
4419 vpaddd %xmm15,%xmm13,%xmm13
4420 vpslld $5,%xmm14,%xmm8
4421 vpand %xmm11,%xmm12,%xmm7
4422 vpxor 16-128(%rax),%xmm2,%xmm2
4423
4424 vpaddd %xmm7,%xmm13,%xmm13
4425 vpsrld $27,%xmm14,%xmm9
4426 vpxor %xmm11,%xmm12,%xmm6
4427 vpxor %xmm4,%xmm2,%xmm2
4428
4429 vmovdqu %xmm1,128-128(%rax)
4430 vpaddd %xmm1,%xmm13,%xmm13
4431 vpor %xmm9,%xmm8,%xmm8
4432 vpsrld $31,%xmm2,%xmm5
4433 vpand %xmm10,%xmm6,%xmm6
4434 vpaddd %xmm2,%xmm2,%xmm2
4435
4436 vpslld $30,%xmm10,%xmm7
4437 vpaddd %xmm6,%xmm13,%xmm13
4438
4439 vpsrld $2,%xmm10,%xmm10
4440 vpaddd %xmm8,%xmm13,%xmm13
4441 vpor %xmm5,%xmm2,%xmm2
4442 vpor %xmm7,%xmm10,%xmm10
4443 vpxor %xmm0,%xmm3,%xmm3
4444 vmovdqa 192-128(%rax),%xmm0
4445
4446 vpaddd %xmm15,%xmm12,%xmm12
4447 vpslld $5,%xmm13,%xmm8
4448 vpand %xmm10,%xmm11,%xmm7
4449 vpxor 32-128(%rax),%xmm3,%xmm3
4450
4451 vpaddd %xmm7,%xmm12,%xmm12
4452 vpsrld $27,%xmm13,%xmm9
4453 vpxor %xmm10,%xmm11,%xmm6
4454 vpxor %xmm0,%xmm3,%xmm3
4455
4456 vmovdqu %xmm2,144-128(%rax)
4457 vpaddd %xmm2,%xmm12,%xmm12
4458 vpor %xmm9,%xmm8,%xmm8
4459 vpsrld $31,%xmm3,%xmm5
4460 vpand %xmm14,%xmm6,%xmm6
4461 vpaddd %xmm3,%xmm3,%xmm3
4462
4463 vpslld $30,%xmm14,%xmm7
4464 vpaddd %xmm6,%xmm12,%xmm12
4465
4466 vpsrld $2,%xmm14,%xmm14
4467 vpaddd %xmm8,%xmm12,%xmm12
4468 vpor %xmm5,%xmm3,%xmm3
4469 vpor %xmm7,%xmm14,%xmm14
4470 vpxor %xmm1,%xmm4,%xmm4
4471 vmovdqa 208-128(%rax),%xmm1
4472
4473 vpaddd %xmm15,%xmm11,%xmm11
4474 vpslld $5,%xmm12,%xmm8
4475 vpand %xmm14,%xmm10,%xmm7
4476 vpxor 48-128(%rax),%xmm4,%xmm4
4477
4478 vpaddd %xmm7,%xmm11,%xmm11
4479 vpsrld $27,%xmm12,%xmm9
4480 vpxor %xmm14,%xmm10,%xmm6
4481 vpxor %xmm1,%xmm4,%xmm4
4482
4483 vmovdqu %xmm3,160-128(%rax)
4484 vpaddd %xmm3,%xmm11,%xmm11
4485 vpor %xmm9,%xmm8,%xmm8
4486 vpsrld $31,%xmm4,%xmm5
4487 vpand %xmm13,%xmm6,%xmm6
4488 vpaddd %xmm4,%xmm4,%xmm4
4489
4490 vpslld $30,%xmm13,%xmm7
4491 vpaddd %xmm6,%xmm11,%xmm11
4492
4493 vpsrld $2,%xmm13,%xmm13
4494 vpaddd %xmm8,%xmm11,%xmm11
4495 vpor %xmm5,%xmm4,%xmm4
4496 vpor %xmm7,%xmm13,%xmm13
4497 vpxor %xmm2,%xmm0,%xmm0
4498 vmovdqa 224-128(%rax),%xmm2
4499
4500 vpaddd %xmm15,%xmm10,%xmm10
4501 vpslld $5,%xmm11,%xmm8
4502 vpand %xmm13,%xmm14,%xmm7
4503 vpxor 64-128(%rax),%xmm0,%xmm0
4504
4505 vpaddd %xmm7,%xmm10,%xmm10
4506 vpsrld $27,%xmm11,%xmm9
4507 vpxor %xmm13,%xmm14,%xmm6
4508 vpxor %xmm2,%xmm0,%xmm0
4509
4510 vmovdqu %xmm4,176-128(%rax)
4511 vpaddd %xmm4,%xmm10,%xmm10
4512 vpor %xmm9,%xmm8,%xmm8
4513 vpsrld $31,%xmm0,%xmm5
4514 vpand %xmm12,%xmm6,%xmm6
4515 vpaddd %xmm0,%xmm0,%xmm0
4516
4517 vpslld $30,%xmm12,%xmm7
4518 vpaddd %xmm6,%xmm10,%xmm10
4519
4520 vpsrld $2,%xmm12,%xmm12
4521 vpaddd %xmm8,%xmm10,%xmm10
4522 vpor %xmm5,%xmm0,%xmm0
4523 vpor %xmm7,%xmm12,%xmm12
4524 vmovdqa 64(%rbp),%xmm15
4525 vpxor %xmm3,%xmm1,%xmm1
4526 vmovdqa 240-128(%rax),%xmm3
4527
4528 vpslld $5,%xmm10,%xmm8
4529 vpaddd %xmm15,%xmm14,%xmm14
4530 vpxor %xmm11,%xmm13,%xmm6
4531 vmovdqa %xmm0,192-128(%rax)
4532 vpaddd %xmm0,%xmm14,%xmm14
4533 vpxor 80-128(%rax),%xmm1,%xmm1
4534 vpsrld $27,%xmm10,%xmm9
4535 vpxor %xmm12,%xmm6,%xmm6
4536 vpxor %xmm3,%xmm1,%xmm1
4537
4538 vpslld $30,%xmm11,%xmm7
4539 vpor %xmm9,%xmm8,%xmm8
4540 vpaddd %xmm6,%xmm14,%xmm14
4541 vpsrld $31,%xmm1,%xmm5
4542 vpaddd %xmm1,%xmm1,%xmm1
4543
4544 vpsrld $2,%xmm11,%xmm11
4545 vpaddd %xmm8,%xmm14,%xmm14
4546 vpor %xmm5,%xmm1,%xmm1
4547 vpor %xmm7,%xmm11,%xmm11
4548 vpxor %xmm4,%xmm2,%xmm2
4549 vmovdqa 0-128(%rax),%xmm4
4550
4551 vpslld $5,%xmm14,%xmm8
4552 vpaddd %xmm15,%xmm13,%xmm13
4553 vpxor %xmm10,%xmm12,%xmm6
4554 vmovdqa %xmm1,208-128(%rax)
4555 vpaddd %xmm1,%xmm13,%xmm13
4556 vpxor 96-128(%rax),%xmm2,%xmm2
4557 vpsrld $27,%xmm14,%xmm9
4558 vpxor %xmm11,%xmm6,%xmm6
4559 vpxor %xmm4,%xmm2,%xmm2
4560
4561 vpslld $30,%xmm10,%xmm7
4562 vpor %xmm9,%xmm8,%xmm8
4563 vpaddd %xmm6,%xmm13,%xmm13
4564 vpsrld $31,%xmm2,%xmm5
4565 vpaddd %xmm2,%xmm2,%xmm2
4566
4567 vpsrld $2,%xmm10,%xmm10
4568 vpaddd %xmm8,%xmm13,%xmm13
4569 vpor %xmm5,%xmm2,%xmm2
4570 vpor %xmm7,%xmm10,%xmm10
4571 vpxor %xmm0,%xmm3,%xmm3
4572 vmovdqa 16-128(%rax),%xmm0
4573
4574 vpslld $5,%xmm13,%xmm8
4575 vpaddd %xmm15,%xmm12,%xmm12
4576 vpxor %xmm14,%xmm11,%xmm6
4577 vmovdqa %xmm2,224-128(%rax)
4578 vpaddd %xmm2,%xmm12,%xmm12
4579 vpxor 112-128(%rax),%xmm3,%xmm3
4580 vpsrld $27,%xmm13,%xmm9
4581 vpxor %xmm10,%xmm6,%xmm6
4582 vpxor %xmm0,%xmm3,%xmm3
4583
4584 vpslld $30,%xmm14,%xmm7
4585 vpor %xmm9,%xmm8,%xmm8
4586 vpaddd %xmm6,%xmm12,%xmm12
4587 vpsrld $31,%xmm3,%xmm5
4588 vpaddd %xmm3,%xmm3,%xmm3
4589
4590 vpsrld $2,%xmm14,%xmm14
4591 vpaddd %xmm8,%xmm12,%xmm12
4592 vpor %xmm5,%xmm3,%xmm3
4593 vpor %xmm7,%xmm14,%xmm14
4594 vpxor %xmm1,%xmm4,%xmm4
4595 vmovdqa 32-128(%rax),%xmm1
4596
4597 vpslld $5,%xmm12,%xmm8
4598 vpaddd %xmm15,%xmm11,%xmm11
4599 vpxor %xmm13,%xmm10,%xmm6
4600 vmovdqa %xmm3,240-128(%rax)
4601 vpaddd %xmm3,%xmm11,%xmm11
4602 vpxor 128-128(%rax),%xmm4,%xmm4
4603 vpsrld $27,%xmm12,%xmm9
4604 vpxor %xmm14,%xmm6,%xmm6
4605 vpxor %xmm1,%xmm4,%xmm4
4606
4607 vpslld $30,%xmm13,%xmm7
4608 vpor %xmm9,%xmm8,%xmm8
4609 vpaddd %xmm6,%xmm11,%xmm11
4610 vpsrld $31,%xmm4,%xmm5
4611 vpaddd %xmm4,%xmm4,%xmm4
4612
4613 vpsrld $2,%xmm13,%xmm13
4614 vpaddd %xmm8,%xmm11,%xmm11
4615 vpor %xmm5,%xmm4,%xmm4
4616 vpor %xmm7,%xmm13,%xmm13
4617 vpxor %xmm2,%xmm0,%xmm0
4618 vmovdqa 48-128(%rax),%xmm2
4619
4620 vpslld $5,%xmm11,%xmm8
4621 vpaddd %xmm15,%xmm10,%xmm10
4622 vpxor %xmm12,%xmm14,%xmm6
4623 vmovdqa %xmm4,0-128(%rax)
4624 vpaddd %xmm4,%xmm10,%xmm10
4625 vpxor 144-128(%rax),%xmm0,%xmm0
4626 vpsrld $27,%xmm11,%xmm9
4627 vpxor %xmm13,%xmm6,%xmm6
4628 vpxor %xmm2,%xmm0,%xmm0
4629
4630 vpslld $30,%xmm12,%xmm7
4631 vpor %xmm9,%xmm8,%xmm8
4632 vpaddd %xmm6,%xmm10,%xmm10
4633 vpsrld $31,%xmm0,%xmm5
4634 vpaddd %xmm0,%xmm0,%xmm0
4635
4636 vpsrld $2,%xmm12,%xmm12
4637 vpaddd %xmm8,%xmm10,%xmm10
4638 vpor %xmm5,%xmm0,%xmm0
4639 vpor %xmm7,%xmm12,%xmm12
4640 vpxor %xmm3,%xmm1,%xmm1
4641 vmovdqa 64-128(%rax),%xmm3
4642
4643 vpslld $5,%xmm10,%xmm8
4644 vpaddd %xmm15,%xmm14,%xmm14
4645 vpxor %xmm11,%xmm13,%xmm6
4646 vmovdqa %xmm0,16-128(%rax)
4647 vpaddd %xmm0,%xmm14,%xmm14
4648 vpxor 160-128(%rax),%xmm1,%xmm1
4649 vpsrld $27,%xmm10,%xmm9
4650 vpxor %xmm12,%xmm6,%xmm6
4651 vpxor %xmm3,%xmm1,%xmm1
4652
4653 vpslld $30,%xmm11,%xmm7
4654 vpor %xmm9,%xmm8,%xmm8
4655 vpaddd %xmm6,%xmm14,%xmm14
4656 vpsrld $31,%xmm1,%xmm5
4657 vpaddd %xmm1,%xmm1,%xmm1
4658
4659 vpsrld $2,%xmm11,%xmm11
4660 vpaddd %xmm8,%xmm14,%xmm14
4661 vpor %xmm5,%xmm1,%xmm1
4662 vpor %xmm7,%xmm11,%xmm11
4663 vpxor %xmm4,%xmm2,%xmm2
4664 vmovdqa 80-128(%rax),%xmm4
4665
4666 vpslld $5,%xmm14,%xmm8
4667 vpaddd %xmm15,%xmm13,%xmm13
4668 vpxor %xmm10,%xmm12,%xmm6
4669 vmovdqa %xmm1,32-128(%rax)
4670 vpaddd %xmm1,%xmm13,%xmm13
4671 vpxor 176-128(%rax),%xmm2,%xmm2
4672 vpsrld $27,%xmm14,%xmm9
4673 vpxor %xmm11,%xmm6,%xmm6
4674 vpxor %xmm4,%xmm2,%xmm2
4675
4676 vpslld $30,%xmm10,%xmm7
4677 vpor %xmm9,%xmm8,%xmm8
4678 vpaddd %xmm6,%xmm13,%xmm13
4679 vpsrld $31,%xmm2,%xmm5
4680 vpaddd %xmm2,%xmm2,%xmm2
4681
4682 vpsrld $2,%xmm10,%xmm10
4683 vpaddd %xmm8,%xmm13,%xmm13
4684 vpor %xmm5,%xmm2,%xmm2
4685 vpor %xmm7,%xmm10,%xmm10
4686 vpxor %xmm0,%xmm3,%xmm3
4687 vmovdqa 96-128(%rax),%xmm0
4688
4689 vpslld $5,%xmm13,%xmm8
4690 vpaddd %xmm15,%xmm12,%xmm12
4691 vpxor %xmm14,%xmm11,%xmm6
4692 vmovdqa %xmm2,48-128(%rax)
4693 vpaddd %xmm2,%xmm12,%xmm12
4694 vpxor 192-128(%rax),%xmm3,%xmm3
4695 vpsrld $27,%xmm13,%xmm9
4696 vpxor %xmm10,%xmm6,%xmm6
4697 vpxor %xmm0,%xmm3,%xmm3
4698
4699 vpslld $30,%xmm14,%xmm7
4700 vpor %xmm9,%xmm8,%xmm8
4701 vpaddd %xmm6,%xmm12,%xmm12
4702 vpsrld $31,%xmm3,%xmm5
4703 vpaddd %xmm3,%xmm3,%xmm3
4704
4705 vpsrld $2,%xmm14,%xmm14
4706 vpaddd %xmm8,%xmm12,%xmm12
4707 vpor %xmm5,%xmm3,%xmm3
4708 vpor %xmm7,%xmm14,%xmm14
4709 vpxor %xmm1,%xmm4,%xmm4
4710 vmovdqa 112-128(%rax),%xmm1
4711
4712 vpslld $5,%xmm12,%xmm8
4713 vpaddd %xmm15,%xmm11,%xmm11
4714 vpxor %xmm13,%xmm10,%xmm6
4715 vmovdqa %xmm3,64-128(%rax)
4716 vpaddd %xmm3,%xmm11,%xmm11
4717 vpxor 208-128(%rax),%xmm4,%xmm4
4718 vpsrld $27,%xmm12,%xmm9
4719 vpxor %xmm14,%xmm6,%xmm6
4720 vpxor %xmm1,%xmm4,%xmm4
4721
4722 vpslld $30,%xmm13,%xmm7
4723 vpor %xmm9,%xmm8,%xmm8
4724 vpaddd %xmm6,%xmm11,%xmm11
4725 vpsrld $31,%xmm4,%xmm5
4726 vpaddd %xmm4,%xmm4,%xmm4
4727
4728 vpsrld $2,%xmm13,%xmm13
4729 vpaddd %xmm8,%xmm11,%xmm11
4730 vpor %xmm5,%xmm4,%xmm4
4731 vpor %xmm7,%xmm13,%xmm13
4732 vpxor %xmm2,%xmm0,%xmm0
4733 vmovdqa 128-128(%rax),%xmm2
4734
4735 vpslld $5,%xmm11,%xmm8
4736 vpaddd %xmm15,%xmm10,%xmm10
4737 vpxor %xmm12,%xmm14,%xmm6
4738 vmovdqa %xmm4,80-128(%rax)
4739 vpaddd %xmm4,%xmm10,%xmm10
4740 vpxor 224-128(%rax),%xmm0,%xmm0
4741 vpsrld $27,%xmm11,%xmm9
4742 vpxor %xmm13,%xmm6,%xmm6
4743 vpxor %xmm2,%xmm0,%xmm0
4744
4745 vpslld $30,%xmm12,%xmm7
4746 vpor %xmm9,%xmm8,%xmm8
4747 vpaddd %xmm6,%xmm10,%xmm10
4748 vpsrld $31,%xmm0,%xmm5
4749 vpaddd %xmm0,%xmm0,%xmm0
4750
4751 vpsrld $2,%xmm12,%xmm12
4752 vpaddd %xmm8,%xmm10,%xmm10
4753 vpor %xmm5,%xmm0,%xmm0
4754 vpor %xmm7,%xmm12,%xmm12
4755 vpxor %xmm3,%xmm1,%xmm1
4756 vmovdqa 144-128(%rax),%xmm3
4757
4758 vpslld $5,%xmm10,%xmm8
4759 vpaddd %xmm15,%xmm14,%xmm14
4760 vpxor %xmm11,%xmm13,%xmm6
4761 vmovdqa %xmm0,96-128(%rax)
4762 vpaddd %xmm0,%xmm14,%xmm14
4763 vpxor 240-128(%rax),%xmm1,%xmm1
4764 vpsrld $27,%xmm10,%xmm9
4765 vpxor %xmm12,%xmm6,%xmm6
4766 vpxor %xmm3,%xmm1,%xmm1
4767
4768 vpslld $30,%xmm11,%xmm7
4769 vpor %xmm9,%xmm8,%xmm8
4770 vpaddd %xmm6,%xmm14,%xmm14
4771 vpsrld $31,%xmm1,%xmm5
4772 vpaddd %xmm1,%xmm1,%xmm1
4773
4774 vpsrld $2,%xmm11,%xmm11
4775 vpaddd %xmm8,%xmm14,%xmm14
4776 vpor %xmm5,%xmm1,%xmm1
4777 vpor %xmm7,%xmm11,%xmm11
4778 vpxor %xmm4,%xmm2,%xmm2
4779 vmovdqa 160-128(%rax),%xmm4
4780
4781 vpslld $5,%xmm14,%xmm8
4782 vpaddd %xmm15,%xmm13,%xmm13
4783 vpxor %xmm10,%xmm12,%xmm6
4784 vmovdqa %xmm1,112-128(%rax)
4785 vpaddd %xmm1,%xmm13,%xmm13
4786 vpxor 0-128(%rax),%xmm2,%xmm2
4787 vpsrld $27,%xmm14,%xmm9
4788 vpxor %xmm11,%xmm6,%xmm6
4789 vpxor %xmm4,%xmm2,%xmm2
4790
4791 vpslld $30,%xmm10,%xmm7
4792 vpor %xmm9,%xmm8,%xmm8
4793 vpaddd %xmm6,%xmm13,%xmm13
4794 vpsrld $31,%xmm2,%xmm5
4795 vpaddd %xmm2,%xmm2,%xmm2
4796
4797 vpsrld $2,%xmm10,%xmm10
4798 vpaddd %xmm8,%xmm13,%xmm13
4799 vpor %xmm5,%xmm2,%xmm2
4800 vpor %xmm7,%xmm10,%xmm10
4801 vpxor %xmm0,%xmm3,%xmm3
4802 vmovdqa 176-128(%rax),%xmm0
4803
4804 vpslld $5,%xmm13,%xmm8
4805 vpaddd %xmm15,%xmm12,%xmm12
4806 vpxor %xmm14,%xmm11,%xmm6
4807 vpaddd %xmm2,%xmm12,%xmm12
4808 vpxor 16-128(%rax),%xmm3,%xmm3
4809 vpsrld $27,%xmm13,%xmm9
4810 vpxor %xmm10,%xmm6,%xmm6
4811 vpxor %xmm0,%xmm3,%xmm3
4812
4813 vpslld $30,%xmm14,%xmm7
4814 vpor %xmm9,%xmm8,%xmm8
4815 vpaddd %xmm6,%xmm12,%xmm12
4816 vpsrld $31,%xmm3,%xmm5
4817 vpaddd %xmm3,%xmm3,%xmm3
4818
4819 vpsrld $2,%xmm14,%xmm14
4820 vpaddd %xmm8,%xmm12,%xmm12
4821 vpor %xmm5,%xmm3,%xmm3
4822 vpor %xmm7,%xmm14,%xmm14
4823 vpxor %xmm1,%xmm4,%xmm4
4824 vmovdqa 192-128(%rax),%xmm1
4825
4826 vpslld $5,%xmm12,%xmm8
4827 vpaddd %xmm15,%xmm11,%xmm11
4828 vpxor %xmm13,%xmm10,%xmm6
4829 vpaddd %xmm3,%xmm11,%xmm11
4830 vpxor 32-128(%rax),%xmm4,%xmm4
4831 vpsrld $27,%xmm12,%xmm9
4832 vpxor %xmm14,%xmm6,%xmm6
4833 vpxor %xmm1,%xmm4,%xmm4
4834
4835 vpslld $30,%xmm13,%xmm7
4836 vpor %xmm9,%xmm8,%xmm8
4837 vpaddd %xmm6,%xmm11,%xmm11
4838 vpsrld $31,%xmm4,%xmm5
4839 vpaddd %xmm4,%xmm4,%xmm4
4840
4841 vpsrld $2,%xmm13,%xmm13
4842 vpaddd %xmm8,%xmm11,%xmm11
4843 vpor %xmm5,%xmm4,%xmm4
4844 vpor %xmm7,%xmm13,%xmm13
4845 vpxor %xmm2,%xmm0,%xmm0
4846 vmovdqa 208-128(%rax),%xmm2
4847
4848 vpslld $5,%xmm11,%xmm8
4849 vpaddd %xmm15,%xmm10,%xmm10
4850 vpxor %xmm12,%xmm14,%xmm6
4851 vpaddd %xmm4,%xmm10,%xmm10
4852 vpxor 48-128(%rax),%xmm0,%xmm0
4853 vpsrld $27,%xmm11,%xmm9
4854 vpxor %xmm13,%xmm6,%xmm6
4855 vpxor %xmm2,%xmm0,%xmm0
4856
4857 vpslld $30,%xmm12,%xmm7
4858 vpor %xmm9,%xmm8,%xmm8
4859 vpaddd %xmm6,%xmm10,%xmm10
4860 vpsrld $31,%xmm0,%xmm5
4861 vpaddd %xmm0,%xmm0,%xmm0
4862
4863 vpsrld $2,%xmm12,%xmm12
4864 vpaddd %xmm8,%xmm10,%xmm10
4865 vpor %xmm5,%xmm0,%xmm0
4866 vpor %xmm7,%xmm12,%xmm12
4867 vpxor %xmm3,%xmm1,%xmm1
4868 vmovdqa 224-128(%rax),%xmm3
4869
4870 vpslld $5,%xmm10,%xmm8
4871 vpaddd %xmm15,%xmm14,%xmm14
4872 vpxor %xmm11,%xmm13,%xmm6
4873 vpaddd %xmm0,%xmm14,%xmm14
4874 vpxor 64-128(%rax),%xmm1,%xmm1
4875 vpsrld $27,%xmm10,%xmm9
4876 vpxor %xmm12,%xmm6,%xmm6
4877 vpxor %xmm3,%xmm1,%xmm1
4878
4879 vpslld $30,%xmm11,%xmm7
4880 vpor %xmm9,%xmm8,%xmm8
4881 vpaddd %xmm6,%xmm14,%xmm14
4882 vpsrld $31,%xmm1,%xmm5
4883 vpaddd %xmm1,%xmm1,%xmm1
4884
4885 vpsrld $2,%xmm11,%xmm11
4886 vpaddd %xmm8,%xmm14,%xmm14
4887 vpor %xmm5,%xmm1,%xmm1
4888 vpor %xmm7,%xmm11,%xmm11
4889 vpxor %xmm4,%xmm2,%xmm2
4890 vmovdqa 240-128(%rax),%xmm4
4891
4892 vpslld $5,%xmm14,%xmm8
4893 vpaddd %xmm15,%xmm13,%xmm13
4894 vpxor %xmm10,%xmm12,%xmm6
4895 vpaddd %xmm1,%xmm13,%xmm13
4896 vpxor 80-128(%rax),%xmm2,%xmm2
4897 vpsrld $27,%xmm14,%xmm9
4898 vpxor %xmm11,%xmm6,%xmm6
4899 vpxor %xmm4,%xmm2,%xmm2
4900
4901 vpslld $30,%xmm10,%xmm7
4902 vpor %xmm9,%xmm8,%xmm8
4903 vpaddd %xmm6,%xmm13,%xmm13
4904 vpsrld $31,%xmm2,%xmm5
4905 vpaddd %xmm2,%xmm2,%xmm2
4906
4907 vpsrld $2,%xmm10,%xmm10
4908 vpaddd %xmm8,%xmm13,%xmm13
4909 vpor %xmm5,%xmm2,%xmm2
4910 vpor %xmm7,%xmm10,%xmm10
4911 vpxor %xmm0,%xmm3,%xmm3
4912 vmovdqa 0-128(%rax),%xmm0
4913
4914 vpslld $5,%xmm13,%xmm8
4915 vpaddd %xmm15,%xmm12,%xmm12
4916 vpxor %xmm14,%xmm11,%xmm6
4917 vpaddd %xmm2,%xmm12,%xmm12
4918 vpxor 96-128(%rax),%xmm3,%xmm3
4919 vpsrld $27,%xmm13,%xmm9
4920 vpxor %xmm10,%xmm6,%xmm6
4921 vpxor %xmm0,%xmm3,%xmm3
4922
4923 vpslld $30,%xmm14,%xmm7
4924 vpor %xmm9,%xmm8,%xmm8
4925 vpaddd %xmm6,%xmm12,%xmm12
4926 vpsrld $31,%xmm3,%xmm5
4927 vpaddd %xmm3,%xmm3,%xmm3
4928
4929 vpsrld $2,%xmm14,%xmm14
4930 vpaddd %xmm8,%xmm12,%xmm12
4931 vpor %xmm5,%xmm3,%xmm3
4932 vpor %xmm7,%xmm14,%xmm14
4933 vpxor %xmm1,%xmm4,%xmm4
4934 vmovdqa 16-128(%rax),%xmm1
4935
4936 vpslld $5,%xmm12,%xmm8
4937 vpaddd %xmm15,%xmm11,%xmm11
4938 vpxor %xmm13,%xmm10,%xmm6
4939 vpaddd %xmm3,%xmm11,%xmm11
4940 vpxor 112-128(%rax),%xmm4,%xmm4
4941 vpsrld $27,%xmm12,%xmm9
4942 vpxor %xmm14,%xmm6,%xmm6
4943 vpxor %xmm1,%xmm4,%xmm4
4944
4945 vpslld $30,%xmm13,%xmm7
4946 vpor %xmm9,%xmm8,%xmm8
4947 vpaddd %xmm6,%xmm11,%xmm11
4948 vpsrld $31,%xmm4,%xmm5
4949 vpaddd %xmm4,%xmm4,%xmm4
4950
4951 vpsrld $2,%xmm13,%xmm13
4952 vpaddd %xmm8,%xmm11,%xmm11
4953 vpor %xmm5,%xmm4,%xmm4
4954 vpor %xmm7,%xmm13,%xmm13
4955 vpslld $5,%xmm11,%xmm8
4956 vpaddd %xmm15,%xmm10,%xmm10
4957 vpxor %xmm12,%xmm14,%xmm6
4958
4959 vpsrld $27,%xmm11,%xmm9
4960 vpaddd %xmm4,%xmm10,%xmm10
4961 vpxor %xmm13,%xmm6,%xmm6
4962
4963 vpslld $30,%xmm12,%xmm7
4964 vpor %xmm9,%xmm8,%xmm8
4965 vpaddd %xmm6,%xmm10,%xmm10
4966
4967 vpsrld $2,%xmm12,%xmm12
4968 vpaddd %xmm8,%xmm10,%xmm10
4969 vpor %xmm7,%xmm12,%xmm12
4970 movl $1,%ecx
4971 cmpl 0(%rbx),%ecx
4972 cmovgeq %rbp,%r8
4973 cmpl 4(%rbx),%ecx
4974 cmovgeq %rbp,%r9
4975 cmpl 8(%rbx),%ecx
4976 cmovgeq %rbp,%r10
4977 cmpl 12(%rbx),%ecx
4978 cmovgeq %rbp,%r11
4979 vmovdqu (%rbx),%xmm6
4980 vpxor %xmm8,%xmm8,%xmm8
4981 vmovdqa %xmm6,%xmm7
4982 vpcmpgtd %xmm8,%xmm7,%xmm7
4983 vpaddd %xmm7,%xmm6,%xmm6
4984
4985 vpand %xmm7,%xmm10,%xmm10
4986 vpand %xmm7,%xmm11,%xmm11
4987 vpaddd 0(%rdi),%xmm10,%xmm10
4988 vpand %xmm7,%xmm12,%xmm12
4989 vpaddd 32(%rdi),%xmm11,%xmm11
4990 vpand %xmm7,%xmm13,%xmm13
4991 vpaddd 64(%rdi),%xmm12,%xmm12
4992 vpand %xmm7,%xmm14,%xmm14
4993 vpaddd 96(%rdi),%xmm13,%xmm13
4994 vpaddd 128(%rdi),%xmm14,%xmm14
4995 vmovdqu %xmm10,0(%rdi)
4996 vmovdqu %xmm11,32(%rdi)
4997 vmovdqu %xmm12,64(%rdi)
4998 vmovdqu %xmm13,96(%rdi)
4999 vmovdqu %xmm14,128(%rdi)
5000
5001 vmovdqu %xmm6,(%rbx)
5002 vmovdqu 96(%rbp),%xmm5
5003 decl %edx
5004 jnz .Loop_avx
5005
5006 movl 280(%rsp),%edx
5007 leaq 16(%rdi),%rdi
5008 leaq 64(%rsi),%rsi
5009 decl %edx
5010 jnz .Loop_grande_avx
5011
5012 .Ldone_avx:
5013 movq 272(%rsp),%rax
5014 .cfi_def_cfa %rax,8
5015 vzeroupper
5016 movq -16(%rax),%rbp
5017 .cfi_restore %rbp
5018 movq -8(%rax),%rbx
5019 .cfi_restore %rbx
5020 leaq (%rax),%rsp
5021 .cfi_def_cfa_register %rsp
5022 .Lepilogue_avx:
5023 .byte 0xf3,0xc3
5024 .cfi_endproc
5025 .size sha1_multi_block_avx,.-sha1_multi_block_avx
5026 .type sha1_multi_block_avx2,@function
5027 .align 32
5028 sha1_multi_block_avx2:
5029 .cfi_startproc
5030 _avx2_shortcut:
5031 movq %rsp,%rax
5032 .cfi_def_cfa_register %rax
5033 pushq %rbx
5034 .cfi_offset %rbx,-16
5035 pushq %rbp
5036 .cfi_offset %rbp,-24
5037 pushq %r12
5038 .cfi_offset %r12,-32
5039 pushq %r13
5040 .cfi_offset %r13,-40
5041 pushq %r14
5042 .cfi_offset %r14,-48
5043 pushq %r15
5044 .cfi_offset %r15,-56
5045 subq $576,%rsp
5046 andq $-256,%rsp
5047 movq %rax,544(%rsp)
5048 .cfi_escape 0x0f,0x06,0x77,0xa0,0x04,0x06,0x23,0x08
5049 .Lbody_avx2:
5050 leaq K_XX_XX(%rip),%rbp
5051 shrl $1,%edx
5052
5053 vzeroupper
5054 .Loop_grande_avx2:
5055 movl %edx,552(%rsp)
5056 xorl %edx,%edx
5057 leaq 512(%rsp),%rbx
5058 movq 0(%rsi),%r12
5059 movl 8(%rsi),%ecx
5060 cmpl %edx,%ecx
5061 cmovgl %ecx,%edx
5062 testl %ecx,%ecx
5063 movl %ecx,0(%rbx)
5064 cmovleq %rbp,%r12
5065 movq 16(%rsi),%r13
5066 movl 24(%rsi),%ecx
5067 cmpl %edx,%ecx
5068 cmovgl %ecx,%edx
5069 testl %ecx,%ecx
5070 movl %ecx,4(%rbx)
5071 cmovleq %rbp,%r13
5072 movq 32(%rsi),%r14
5073 movl 40(%rsi),%ecx
5074 cmpl %edx,%ecx
5075 cmovgl %ecx,%edx
5076 testl %ecx,%ecx
5077 movl %ecx,8(%rbx)
5078 cmovleq %rbp,%r14
5079 movq 48(%rsi),%r15
5080 movl 56(%rsi),%ecx
5081 cmpl %edx,%ecx
5082 cmovgl %ecx,%edx
5083 testl %ecx,%ecx
5084 movl %ecx,12(%rbx)
5085 cmovleq %rbp,%r15
5086 movq 64(%rsi),%r8
5087 movl 72(%rsi),%ecx
5088 cmpl %edx,%ecx
5089 cmovgl %ecx,%edx
5090 testl %ecx,%ecx
5091 movl %ecx,16(%rbx)
5092 cmovleq %rbp,%r8
5093 movq 80(%rsi),%r9
5094 movl 88(%rsi),%ecx
5095 cmpl %edx,%ecx
5096 cmovgl %ecx,%edx
5097 testl %ecx,%ecx
5098 movl %ecx,20(%rbx)
5099 cmovleq %rbp,%r9
5100 movq 96(%rsi),%r10
5101 movl 104(%rsi),%ecx
5102 cmpl %edx,%ecx
5103 cmovgl %ecx,%edx
5104 testl %ecx,%ecx
5105 movl %ecx,24(%rbx)
5106 cmovleq %rbp,%r10
5107 movq 112(%rsi),%r11
5108 movl 120(%rsi),%ecx
5109 cmpl %edx,%ecx
5110 cmovgl %ecx,%edx
5111 testl %ecx,%ecx
5112 movl %ecx,28(%rbx)
5113 cmovleq %rbp,%r11
5114 vmovdqu 0(%rdi),%ymm0
5115 leaq 128(%rsp),%rax
5116 vmovdqu 32(%rdi),%ymm1
5117 leaq 256+128(%rsp),%rbx
5118 vmovdqu 64(%rdi),%ymm2
5119 vmovdqu 96(%rdi),%ymm3
5120 vmovdqu 128(%rdi),%ymm4
5121 vmovdqu 96(%rbp),%ymm9
5122 jmp .Loop_avx2
5123
5124 .align 32
5125 .Loop_avx2:
5126 vmovdqa -32(%rbp),%ymm15
5127 vmovd (%r12),%xmm10
5128 leaq 64(%r12),%r12
5129 vmovd (%r8),%xmm12
5130 leaq 64(%r8),%r8
5131 vmovd (%r13),%xmm7
5132 leaq 64(%r13),%r13
5133 vmovd (%r9),%xmm6
5134 leaq 64(%r9),%r9
5135 vpinsrd $1,(%r14),%xmm10,%xmm10
5136 leaq 64(%r14),%r14
5137 vpinsrd $1,(%r10),%xmm12,%xmm12
5138 leaq 64(%r10),%r10
5139 vpinsrd $1,(%r15),%xmm7,%xmm7
5140 leaq 64(%r15),%r15
5141 vpunpckldq %ymm7,%ymm10,%ymm10
5142 vpinsrd $1,(%r11),%xmm6,%xmm6
5143 leaq 64(%r11),%r11
5144 vpunpckldq %ymm6,%ymm12,%ymm12
5145 vmovd -60(%r12),%xmm11
5146 vinserti128 $1,%xmm12,%ymm10,%ymm10
5147 vmovd -60(%r8),%xmm8
5148 vpshufb %ymm9,%ymm10,%ymm10
5149 vmovd -60(%r13),%xmm7
5150 vmovd -60(%r9),%xmm6
5151 vpinsrd $1,-60(%r14),%xmm11,%xmm11
5152 vpinsrd $1,-60(%r10),%xmm8,%xmm8
5153 vpinsrd $1,-60(%r15),%xmm7,%xmm7
5154 vpunpckldq %ymm7,%ymm11,%ymm11
5155 vpinsrd $1,-60(%r11),%xmm6,%xmm6
5156 vpunpckldq %ymm6,%ymm8,%ymm8
5157 vpaddd %ymm15,%ymm4,%ymm4
5158 vpslld $5,%ymm0,%ymm7
5159 vpandn %ymm3,%ymm1,%ymm6
5160 vpand %ymm2,%ymm1,%ymm5
5161
5162 vmovdqa %ymm10,0-128(%rax)
5163 vpaddd %ymm10,%ymm4,%ymm4
5164 vinserti128 $1,%xmm8,%ymm11,%ymm11
5165 vpsrld $27,%ymm0,%ymm8
5166 vpxor %ymm6,%ymm5,%ymm5
5167 vmovd -56(%r12),%xmm12
5168
5169 vpslld $30,%ymm1,%ymm6
5170 vpor %ymm8,%ymm7,%ymm7
5171 vmovd -56(%r8),%xmm8
5172 vpaddd %ymm5,%ymm4,%ymm4
5173
5174 vpsrld $2,%ymm1,%ymm1
5175 vpaddd %ymm7,%ymm4,%ymm4
5176 vpshufb %ymm9,%ymm11,%ymm11
5177 vpor %ymm6,%ymm1,%ymm1
5178 vmovd -56(%r13),%xmm7
5179 vmovd -56(%r9),%xmm6
5180 vpinsrd $1,-56(%r14),%xmm12,%xmm12
5181 vpinsrd $1,-56(%r10),%xmm8,%xmm8
5182 vpinsrd $1,-56(%r15),%xmm7,%xmm7
5183 vpunpckldq %ymm7,%ymm12,%ymm12
5184 vpinsrd $1,-56(%r11),%xmm6,%xmm6
5185 vpunpckldq %ymm6,%ymm8,%ymm8
5186 vpaddd %ymm15,%ymm3,%ymm3
5187 vpslld $5,%ymm4,%ymm7
5188 vpandn %ymm2,%ymm0,%ymm6
5189 vpand %ymm1,%ymm0,%ymm5
5190
5191 vmovdqa %ymm11,32-128(%rax)
5192 vpaddd %ymm11,%ymm3,%ymm3
5193 vinserti128 $1,%xmm8,%ymm12,%ymm12
5194 vpsrld $27,%ymm4,%ymm8
5195 vpxor %ymm6,%ymm5,%ymm5
5196 vmovd -52(%r12),%xmm13
5197
5198 vpslld $30,%ymm0,%ymm6
5199 vpor %ymm8,%ymm7,%ymm7
5200 vmovd -52(%r8),%xmm8
5201 vpaddd %ymm5,%ymm3,%ymm3
5202
5203 vpsrld $2,%ymm0,%ymm0
5204 vpaddd %ymm7,%ymm3,%ymm3
5205 vpshufb %ymm9,%ymm12,%ymm12
5206 vpor %ymm6,%ymm0,%ymm0
5207 vmovd -52(%r13),%xmm7
5208 vmovd -52(%r9),%xmm6
5209 vpinsrd $1,-52(%r14),%xmm13,%xmm13
5210 vpinsrd $1,-52(%r10),%xmm8,%xmm8
5211 vpinsrd $1,-52(%r15),%xmm7,%xmm7
5212 vpunpckldq %ymm7,%ymm13,%ymm13
5213 vpinsrd $1,-52(%r11),%xmm6,%xmm6
5214 vpunpckldq %ymm6,%ymm8,%ymm8
5215 vpaddd %ymm15,%ymm2,%ymm2
5216 vpslld $5,%ymm3,%ymm7
5217 vpandn %ymm1,%ymm4,%ymm6
5218 vpand %ymm0,%ymm4,%ymm5
5219
5220 vmovdqa %ymm12,64-128(%rax)
5221 vpaddd %ymm12,%ymm2,%ymm2
5222 vinserti128 $1,%xmm8,%ymm13,%ymm13
5223 vpsrld $27,%ymm3,%ymm8
5224 vpxor %ymm6,%ymm5,%ymm5
5225 vmovd -48(%r12),%xmm14
5226
5227 vpslld $30,%ymm4,%ymm6
5228 vpor %ymm8,%ymm7,%ymm7
5229 vmovd -48(%r8),%xmm8
5230 vpaddd %ymm5,%ymm2,%ymm2
5231
5232 vpsrld $2,%ymm4,%ymm4
5233 vpaddd %ymm7,%ymm2,%ymm2
5234 vpshufb %ymm9,%ymm13,%ymm13
5235 vpor %ymm6,%ymm4,%ymm4
5236 vmovd -48(%r13),%xmm7
5237 vmovd -48(%r9),%xmm6
5238 vpinsrd $1,-48(%r14),%xmm14,%xmm14
5239 vpinsrd $1,-48(%r10),%xmm8,%xmm8
5240 vpinsrd $1,-48(%r15),%xmm7,%xmm7
5241 vpunpckldq %ymm7,%ymm14,%ymm14
5242 vpinsrd $1,-48(%r11),%xmm6,%xmm6
5243 vpunpckldq %ymm6,%ymm8,%ymm8
5244 vpaddd %ymm15,%ymm1,%ymm1
5245 vpslld $5,%ymm2,%ymm7
5246 vpandn %ymm0,%ymm3,%ymm6
5247 vpand %ymm4,%ymm3,%ymm5
5248
5249 vmovdqa %ymm13,96-128(%rax)
5250 vpaddd %ymm13,%ymm1,%ymm1
5251 vinserti128 $1,%xmm8,%ymm14,%ymm14
5252 vpsrld $27,%ymm2,%ymm8
5253 vpxor %ymm6,%ymm5,%ymm5
5254 vmovd -44(%r12),%xmm10
5255
5256 vpslld $30,%ymm3,%ymm6
5257 vpor %ymm8,%ymm7,%ymm7
5258 vmovd -44(%r8),%xmm8
5259 vpaddd %ymm5,%ymm1,%ymm1
5260
5261 vpsrld $2,%ymm3,%ymm3
5262 vpaddd %ymm7,%ymm1,%ymm1
5263 vpshufb %ymm9,%ymm14,%ymm14
5264 vpor %ymm6,%ymm3,%ymm3
5265 vmovd -44(%r13),%xmm7
5266 vmovd -44(%r9),%xmm6
5267 vpinsrd $1,-44(%r14),%xmm10,%xmm10
5268 vpinsrd $1,-44(%r10),%xmm8,%xmm8
5269 vpinsrd $1,-44(%r15),%xmm7,%xmm7
5270 vpunpckldq %ymm7,%ymm10,%ymm10
5271 vpinsrd $1,-44(%r11),%xmm6,%xmm6
5272 vpunpckldq %ymm6,%ymm8,%ymm8
5273 vpaddd %ymm15,%ymm0,%ymm0
5274 vpslld $5,%ymm1,%ymm7
5275 vpandn %ymm4,%ymm2,%ymm6
5276 vpand %ymm3,%ymm2,%ymm5
5277
5278 vmovdqa %ymm14,128-128(%rax)
5279 vpaddd %ymm14,%ymm0,%ymm0
5280 vinserti128 $1,%xmm8,%ymm10,%ymm10
5281 vpsrld $27,%ymm1,%ymm8
5282 vpxor %ymm6,%ymm5,%ymm5
5283 vmovd -40(%r12),%xmm11
5284
5285 vpslld $30,%ymm2,%ymm6
5286 vpor %ymm8,%ymm7,%ymm7
5287 vmovd -40(%r8),%xmm8
5288 vpaddd %ymm5,%ymm0,%ymm0
5289
5290 vpsrld $2,%ymm2,%ymm2
5291 vpaddd %ymm7,%ymm0,%ymm0
5292 vpshufb %ymm9,%ymm10,%ymm10
5293 vpor %ymm6,%ymm2,%ymm2
5294 vmovd -40(%r13),%xmm7
5295 vmovd -40(%r9),%xmm6
5296 vpinsrd $1,-40(%r14),%xmm11,%xmm11
5297 vpinsrd $1,-40(%r10),%xmm8,%xmm8
5298 vpinsrd $1,-40(%r15),%xmm7,%xmm7
5299 vpunpckldq %ymm7,%ymm11,%ymm11
5300 vpinsrd $1,-40(%r11),%xmm6,%xmm6
5301 vpunpckldq %ymm6,%ymm8,%ymm8
5302 vpaddd %ymm15,%ymm4,%ymm4
5303 vpslld $5,%ymm0,%ymm7
5304 vpandn %ymm3,%ymm1,%ymm6
5305 vpand %ymm2,%ymm1,%ymm5
5306
5307 vmovdqa %ymm10,160-128(%rax)
5308 vpaddd %ymm10,%ymm4,%ymm4
5309 vinserti128 $1,%xmm8,%ymm11,%ymm11
5310 vpsrld $27,%ymm0,%ymm8
5311 vpxor %ymm6,%ymm5,%ymm5
5312 vmovd -36(%r12),%xmm12
5313
5314 vpslld $30,%ymm1,%ymm6
5315 vpor %ymm8,%ymm7,%ymm7
5316 vmovd -36(%r8),%xmm8
5317 vpaddd %ymm5,%ymm4,%ymm4
5318
5319 vpsrld $2,%ymm1,%ymm1
5320 vpaddd %ymm7,%ymm4,%ymm4
5321 vpshufb %ymm9,%ymm11,%ymm11
5322 vpor %ymm6,%ymm1,%ymm1
5323 vmovd -36(%r13),%xmm7
5324 vmovd -36(%r9),%xmm6
5325 vpinsrd $1,-36(%r14),%xmm12,%xmm12
5326 vpinsrd $1,-36(%r10),%xmm8,%xmm8
5327 vpinsrd $1,-36(%r15),%xmm7,%xmm7
5328 vpunpckldq %ymm7,%ymm12,%ymm12
5329 vpinsrd $1,-36(%r11),%xmm6,%xmm6
5330 vpunpckldq %ymm6,%ymm8,%ymm8
5331 vpaddd %ymm15,%ymm3,%ymm3
5332 vpslld $5,%ymm4,%ymm7
5333 vpandn %ymm2,%ymm0,%ymm6
5334 vpand %ymm1,%ymm0,%ymm5
5335
5336 vmovdqa %ymm11,192-128(%rax)
5337 vpaddd %ymm11,%ymm3,%ymm3
5338 vinserti128 $1,%xmm8,%ymm12,%ymm12
5339 vpsrld $27,%ymm4,%ymm8
5340 vpxor %ymm6,%ymm5,%ymm5
5341 vmovd -32(%r12),%xmm13
5342
5343 vpslld $30,%ymm0,%ymm6
5344 vpor %ymm8,%ymm7,%ymm7
5345 vmovd -32(%r8),%xmm8
5346 vpaddd %ymm5,%ymm3,%ymm3
5347
5348 vpsrld $2,%ymm0,%ymm0
5349 vpaddd %ymm7,%ymm3,%ymm3
5350 vpshufb %ymm9,%ymm12,%ymm12
5351 vpor %ymm6,%ymm0,%ymm0
5352 vmovd -32(%r13),%xmm7
5353 vmovd -32(%r9),%xmm6
5354 vpinsrd $1,-32(%r14),%xmm13,%xmm13
5355 vpinsrd $1,-32(%r10),%xmm8,%xmm8
5356 vpinsrd $1,-32(%r15),%xmm7,%xmm7
5357 vpunpckldq %ymm7,%ymm13,%ymm13
5358 vpinsrd $1,-32(%r11),%xmm6,%xmm6
5359 vpunpckldq %ymm6,%ymm8,%ymm8
5360 vpaddd %ymm15,%ymm2,%ymm2
5361 vpslld $5,%ymm3,%ymm7
5362 vpandn %ymm1,%ymm4,%ymm6
5363 vpand %ymm0,%ymm4,%ymm5
5364
5365 vmovdqa %ymm12,224-128(%rax)
5366 vpaddd %ymm12,%ymm2,%ymm2
5367 vinserti128 $1,%xmm8,%ymm13,%ymm13
5368 vpsrld $27,%ymm3,%ymm8
5369 vpxor %ymm6,%ymm5,%ymm5
5370 vmovd -28(%r12),%xmm14
5371
5372 vpslld $30,%ymm4,%ymm6
5373 vpor %ymm8,%ymm7,%ymm7
5374 vmovd -28(%r8),%xmm8
5375 vpaddd %ymm5,%ymm2,%ymm2
5376
5377 vpsrld $2,%ymm4,%ymm4
5378 vpaddd %ymm7,%ymm2,%ymm2
5379 vpshufb %ymm9,%ymm13,%ymm13
5380 vpor %ymm6,%ymm4,%ymm4
5381 vmovd -28(%r13),%xmm7
5382 vmovd -28(%r9),%xmm6
5383 vpinsrd $1,-28(%r14),%xmm14,%xmm14
5384 vpinsrd $1,-28(%r10),%xmm8,%xmm8
5385 vpinsrd $1,-28(%r15),%xmm7,%xmm7
5386 vpunpckldq %ymm7,%ymm14,%ymm14
5387 vpinsrd $1,-28(%r11),%xmm6,%xmm6
5388 vpunpckldq %ymm6,%ymm8,%ymm8
5389 vpaddd %ymm15,%ymm1,%ymm1
5390 vpslld $5,%ymm2,%ymm7
5391 vpandn %ymm0,%ymm3,%ymm6
5392 vpand %ymm4,%ymm3,%ymm5
5393
5394 vmovdqa %ymm13,256-256-128(%rbx)
5395 vpaddd %ymm13,%ymm1,%ymm1
5396 vinserti128 $1,%xmm8,%ymm14,%ymm14
5397 vpsrld $27,%ymm2,%ymm8
5398 vpxor %ymm6,%ymm5,%ymm5
5399 vmovd -24(%r12),%xmm10
5400
5401 vpslld $30,%ymm3,%ymm6
5402 vpor %ymm8,%ymm7,%ymm7
5403 vmovd -24(%r8),%xmm8
5404 vpaddd %ymm5,%ymm1,%ymm1
5405
5406 vpsrld $2,%ymm3,%ymm3
5407 vpaddd %ymm7,%ymm1,%ymm1
5408 vpshufb %ymm9,%ymm14,%ymm14
5409 vpor %ymm6,%ymm3,%ymm3
5410 vmovd -24(%r13),%xmm7
5411 vmovd -24(%r9),%xmm6
5412 vpinsrd $1,-24(%r14),%xmm10,%xmm10
5413 vpinsrd $1,-24(%r10),%xmm8,%xmm8
5414 vpinsrd $1,-24(%r15),%xmm7,%xmm7
5415 vpunpckldq %ymm7,%ymm10,%ymm10
5416 vpinsrd $1,-24(%r11),%xmm6,%xmm6
5417 vpunpckldq %ymm6,%ymm8,%ymm8
5418 vpaddd %ymm15,%ymm0,%ymm0
5419 vpslld $5,%ymm1,%ymm7
5420 vpandn %ymm4,%ymm2,%ymm6
5421 vpand %ymm3,%ymm2,%ymm5
5422
5423 vmovdqa %ymm14,288-256-128(%rbx)
5424 vpaddd %ymm14,%ymm0,%ymm0
5425 vinserti128 $1,%xmm8,%ymm10,%ymm10
5426 vpsrld $27,%ymm1,%ymm8
5427 vpxor %ymm6,%ymm5,%ymm5
5428 vmovd -20(%r12),%xmm11
5429
5430 vpslld $30,%ymm2,%ymm6
5431 vpor %ymm8,%ymm7,%ymm7
5432 vmovd -20(%r8),%xmm8
5433 vpaddd %ymm5,%ymm0,%ymm0
5434
5435 vpsrld $2,%ymm2,%ymm2
5436 vpaddd %ymm7,%ymm0,%ymm0
5437 vpshufb %ymm9,%ymm10,%ymm10
5438 vpor %ymm6,%ymm2,%ymm2
5439 vmovd -20(%r13),%xmm7
5440 vmovd -20(%r9),%xmm6
5441 vpinsrd $1,-20(%r14),%xmm11,%xmm11
5442 vpinsrd $1,-20(%r10),%xmm8,%xmm8
5443 vpinsrd $1,-20(%r15),%xmm7,%xmm7
5444 vpunpckldq %ymm7,%ymm11,%ymm11
5445 vpinsrd $1,-20(%r11),%xmm6,%xmm6
5446 vpunpckldq %ymm6,%ymm8,%ymm8
5447 vpaddd %ymm15,%ymm4,%ymm4
5448 vpslld $5,%ymm0,%ymm7
5449 vpandn %ymm3,%ymm1,%ymm6
5450 vpand %ymm2,%ymm1,%ymm5
5451
5452 vmovdqa %ymm10,320-256-128(%rbx)
5453 vpaddd %ymm10,%ymm4,%ymm4
5454 vinserti128 $1,%xmm8,%ymm11,%ymm11
5455 vpsrld $27,%ymm0,%ymm8
5456 vpxor %ymm6,%ymm5,%ymm5
5457 vmovd -16(%r12),%xmm12
5458
5459 vpslld $30,%ymm1,%ymm6
5460 vpor %ymm8,%ymm7,%ymm7
5461 vmovd -16(%r8),%xmm8
5462 vpaddd %ymm5,%ymm4,%ymm4
5463
5464 vpsrld $2,%ymm1,%ymm1
5465 vpaddd %ymm7,%ymm4,%ymm4
5466 vpshufb %ymm9,%ymm11,%ymm11
5467 vpor %ymm6,%ymm1,%ymm1
5468 vmovd -16(%r13),%xmm7
5469 vmovd -16(%r9),%xmm6
5470 vpinsrd $1,-16(%r14),%xmm12,%xmm12
5471 vpinsrd $1,-16(%r10),%xmm8,%xmm8
5472 vpinsrd $1,-16(%r15),%xmm7,%xmm7
5473 vpunpckldq %ymm7,%ymm12,%ymm12
5474 vpinsrd $1,-16(%r11),%xmm6,%xmm6
5475 vpunpckldq %ymm6,%ymm8,%ymm8
5476 vpaddd %ymm15,%ymm3,%ymm3
5477 vpslld $5,%ymm4,%ymm7
5478 vpandn %ymm2,%ymm0,%ymm6
5479 vpand %ymm1,%ymm0,%ymm5
5480
5481 vmovdqa %ymm11,352-256-128(%rbx)
5482 vpaddd %ymm11,%ymm3,%ymm3
5483 vinserti128 $1,%xmm8,%ymm12,%ymm12
5484 vpsrld $27,%ymm4,%ymm8
5485 vpxor %ymm6,%ymm5,%ymm5
5486 vmovd -12(%r12),%xmm13
5487
5488 vpslld $30,%ymm0,%ymm6
5489 vpor %ymm8,%ymm7,%ymm7
5490 vmovd -12(%r8),%xmm8
5491 vpaddd %ymm5,%ymm3,%ymm3
5492
5493 vpsrld $2,%ymm0,%ymm0
5494 vpaddd %ymm7,%ymm3,%ymm3
5495 vpshufb %ymm9,%ymm12,%ymm12
5496 vpor %ymm6,%ymm0,%ymm0
5497 vmovd -12(%r13),%xmm7
5498 vmovd -12(%r9),%xmm6
5499 vpinsrd $1,-12(%r14),%xmm13,%xmm13
5500 vpinsrd $1,-12(%r10),%xmm8,%xmm8
5501 vpinsrd $1,-12(%r15),%xmm7,%xmm7
5502 vpunpckldq %ymm7,%ymm13,%ymm13
5503 vpinsrd $1,-12(%r11),%xmm6,%xmm6
5504 vpunpckldq %ymm6,%ymm8,%ymm8
5505 vpaddd %ymm15,%ymm2,%ymm2
5506 vpslld $5,%ymm3,%ymm7
5507 vpandn %ymm1,%ymm4,%ymm6
5508 vpand %ymm0,%ymm4,%ymm5
5509
5510 vmovdqa %ymm12,384-256-128(%rbx)
5511 vpaddd %ymm12,%ymm2,%ymm2
5512 vinserti128 $1,%xmm8,%ymm13,%ymm13
5513 vpsrld $27,%ymm3,%ymm8
5514 vpxor %ymm6,%ymm5,%ymm5
5515 vmovd -8(%r12),%xmm14
5516
5517 vpslld $30,%ymm4,%ymm6
5518 vpor %ymm8,%ymm7,%ymm7
5519 vmovd -8(%r8),%xmm8
5520 vpaddd %ymm5,%ymm2,%ymm2
5521
5522 vpsrld $2,%ymm4,%ymm4
5523 vpaddd %ymm7,%ymm2,%ymm2
5524 vpshufb %ymm9,%ymm13,%ymm13
5525 vpor %ymm6,%ymm4,%ymm4
5526 vmovd -8(%r13),%xmm7
5527 vmovd -8(%r9),%xmm6
5528 vpinsrd $1,-8(%r14),%xmm14,%xmm14
5529 vpinsrd $1,-8(%r10),%xmm8,%xmm8
5530 vpinsrd $1,-8(%r15),%xmm7,%xmm7
5531 vpunpckldq %ymm7,%ymm14,%ymm14
5532 vpinsrd $1,-8(%r11),%xmm6,%xmm6
5533 vpunpckldq %ymm6,%ymm8,%ymm8
5534 vpaddd %ymm15,%ymm1,%ymm1
5535 vpslld $5,%ymm2,%ymm7
5536 vpandn %ymm0,%ymm3,%ymm6
5537 vpand %ymm4,%ymm3,%ymm5
5538
5539 vmovdqa %ymm13,416-256-128(%rbx)
5540 vpaddd %ymm13,%ymm1,%ymm1
5541 vinserti128 $1,%xmm8,%ymm14,%ymm14
5542 vpsrld $27,%ymm2,%ymm8
5543 vpxor %ymm6,%ymm5,%ymm5
5544 vmovd -4(%r12),%xmm10
5545
5546 vpslld $30,%ymm3,%ymm6
5547 vpor %ymm8,%ymm7,%ymm7
5548 vmovd -4(%r8),%xmm8
5549 vpaddd %ymm5,%ymm1,%ymm1
5550
5551 vpsrld $2,%ymm3,%ymm3
5552 vpaddd %ymm7,%ymm1,%ymm1
5553 vpshufb %ymm9,%ymm14,%ymm14
5554 vpor %ymm6,%ymm3,%ymm3
5555 vmovdqa 0-128(%rax),%ymm11
5556 vmovd -4(%r13),%xmm7
5557 vmovd -4(%r9),%xmm6
5558 vpinsrd $1,-4(%r14),%xmm10,%xmm10
5559 vpinsrd $1,-4(%r10),%xmm8,%xmm8
5560 vpinsrd $1,-4(%r15),%xmm7,%xmm7
5561 vpunpckldq %ymm7,%ymm10,%ymm10
5562 vpinsrd $1,-4(%r11),%xmm6,%xmm6
5563 vpunpckldq %ymm6,%ymm8,%ymm8
5564 vpaddd %ymm15,%ymm0,%ymm0
5565 prefetcht0 63(%r12)
5566 vpslld $5,%ymm1,%ymm7
5567 vpandn %ymm4,%ymm2,%ymm6
5568 vpand %ymm3,%ymm2,%ymm5
5569
5570 vmovdqa %ymm14,448-256-128(%rbx)
5571 vpaddd %ymm14,%ymm0,%ymm0
5572 vinserti128 $1,%xmm8,%ymm10,%ymm10
5573 vpsrld $27,%ymm1,%ymm8
5574 prefetcht0 63(%r13)
5575 vpxor %ymm6,%ymm5,%ymm5
5576
5577 vpslld $30,%ymm2,%ymm6
5578 vpor %ymm8,%ymm7,%ymm7
5579 prefetcht0 63(%r14)
5580 vpaddd %ymm5,%ymm0,%ymm0
5581
5582 vpsrld $2,%ymm2,%ymm2
5583 vpaddd %ymm7,%ymm0,%ymm0
5584 prefetcht0 63(%r15)
5585 vpshufb %ymm9,%ymm10,%ymm10
5586 vpor %ymm6,%ymm2,%ymm2
5587 vmovdqa 32-128(%rax),%ymm12
5588 vpxor %ymm13,%ymm11,%ymm11
5589 vmovdqa 64-128(%rax),%ymm13
5590
5591 vpaddd %ymm15,%ymm4,%ymm4
5592 vpslld $5,%ymm0,%ymm7
5593 vpandn %ymm3,%ymm1,%ymm6
5594 prefetcht0 63(%r8)
5595 vpand %ymm2,%ymm1,%ymm5
5596
5597 vmovdqa %ymm10,480-256-128(%rbx)
5598 vpaddd %ymm10,%ymm4,%ymm4
5599 vpxor 256-256-128(%rbx),%ymm11,%ymm11
5600 vpsrld $27,%ymm0,%ymm8
5601 vpxor %ymm6,%ymm5,%ymm5
5602 vpxor %ymm13,%ymm11,%ymm11
5603 prefetcht0 63(%r9)
5604
5605 vpslld $30,%ymm1,%ymm6
5606 vpor %ymm8,%ymm7,%ymm7
5607 vpaddd %ymm5,%ymm4,%ymm4
5608 prefetcht0 63(%r10)
5609 vpsrld $31,%ymm11,%ymm9
5610 vpaddd %ymm11,%ymm11,%ymm11
5611
5612 vpsrld $2,%ymm1,%ymm1
5613 prefetcht0 63(%r11)
5614 vpaddd %ymm7,%ymm4,%ymm4
5615 vpor %ymm9,%ymm11,%ymm11
5616 vpor %ymm6,%ymm1,%ymm1
5617 vpxor %ymm14,%ymm12,%ymm12
5618 vmovdqa 96-128(%rax),%ymm14
5619
5620 vpaddd %ymm15,%ymm3,%ymm3
5621 vpslld $5,%ymm4,%ymm7
5622 vpandn %ymm2,%ymm0,%ymm6
5623
5624 vpand %ymm1,%ymm0,%ymm5
5625
5626 vmovdqa %ymm11,0-128(%rax)
5627 vpaddd %ymm11,%ymm3,%ymm3
5628 vpxor 288-256-128(%rbx),%ymm12,%ymm12
5629 vpsrld $27,%ymm4,%ymm8
5630 vpxor %ymm6,%ymm5,%ymm5
5631 vpxor %ymm14,%ymm12,%ymm12
5632
5633
5634 vpslld $30,%ymm0,%ymm6
5635 vpor %ymm8,%ymm7,%ymm7
5636 vpaddd %ymm5,%ymm3,%ymm3
5637
5638 vpsrld $31,%ymm12,%ymm9
5639 vpaddd %ymm12,%ymm12,%ymm12
5640
5641 vpsrld $2,%ymm0,%ymm0
5642
5643 vpaddd %ymm7,%ymm3,%ymm3
5644 vpor %ymm9,%ymm12,%ymm12
5645 vpor %ymm6,%ymm0,%ymm0
5646 vpxor %ymm10,%ymm13,%ymm13
5647 vmovdqa 128-128(%rax),%ymm10
5648
5649 vpaddd %ymm15,%ymm2,%ymm2
5650 vpslld $5,%ymm3,%ymm7
5651 vpandn %ymm1,%ymm4,%ymm6
5652
5653 vpand %ymm0,%ymm4,%ymm5
5654
5655 vmovdqa %ymm12,32-128(%rax)
5656 vpaddd %ymm12,%ymm2,%ymm2
5657 vpxor 320-256-128(%rbx),%ymm13,%ymm13
5658 vpsrld $27,%ymm3,%ymm8
5659 vpxor %ymm6,%ymm5,%ymm5
5660 vpxor %ymm10,%ymm13,%ymm13
5661
5662
5663 vpslld $30,%ymm4,%ymm6
5664 vpor %ymm8,%ymm7,%ymm7
5665 vpaddd %ymm5,%ymm2,%ymm2
5666
5667 vpsrld $31,%ymm13,%ymm9
5668 vpaddd %ymm13,%ymm13,%ymm13
5669
5670 vpsrld $2,%ymm4,%ymm4
5671
5672 vpaddd %ymm7,%ymm2,%ymm2
5673 vpor %ymm9,%ymm13,%ymm13
5674 vpor %ymm6,%ymm4,%ymm4
5675 vpxor %ymm11,%ymm14,%ymm14
5676 vmovdqa 160-128(%rax),%ymm11
5677
5678 vpaddd %ymm15,%ymm1,%ymm1
5679 vpslld $5,%ymm2,%ymm7
5680 vpandn %ymm0,%ymm3,%ymm6
5681
5682 vpand %ymm4,%ymm3,%ymm5
5683
5684 vmovdqa %ymm13,64-128(%rax)
5685 vpaddd %ymm13,%ymm1,%ymm1
5686 vpxor 352-256-128(%rbx),%ymm14,%ymm14
5687 vpsrld $27,%ymm2,%ymm8
5688 vpxor %ymm6,%ymm5,%ymm5
5689 vpxor %ymm11,%ymm14,%ymm14
5690
5691
5692 vpslld $30,%ymm3,%ymm6
5693 vpor %ymm8,%ymm7,%ymm7
5694 vpaddd %ymm5,%ymm1,%ymm1
5695
5696 vpsrld $31,%ymm14,%ymm9
5697 vpaddd %ymm14,%ymm14,%ymm14
5698
5699 vpsrld $2,%ymm3,%ymm3
5700
5701 vpaddd %ymm7,%ymm1,%ymm1
5702 vpor %ymm9,%ymm14,%ymm14
5703 vpor %ymm6,%ymm3,%ymm3
5704 vpxor %ymm12,%ymm10,%ymm10
5705 vmovdqa 192-128(%rax),%ymm12
5706
5707 vpaddd %ymm15,%ymm0,%ymm0
5708 vpslld $5,%ymm1,%ymm7
5709 vpandn %ymm4,%ymm2,%ymm6
5710
5711 vpand %ymm3,%ymm2,%ymm5
5712
5713 vmovdqa %ymm14,96-128(%rax)
5714 vpaddd %ymm14,%ymm0,%ymm0
5715 vpxor 384-256-128(%rbx),%ymm10,%ymm10
5716 vpsrld $27,%ymm1,%ymm8
5717 vpxor %ymm6,%ymm5,%ymm5
5718 vpxor %ymm12,%ymm10,%ymm10
5719
5720
5721 vpslld $30,%ymm2,%ymm6
5722 vpor %ymm8,%ymm7,%ymm7
5723 vpaddd %ymm5,%ymm0,%ymm0
5724
5725 vpsrld $31,%ymm10,%ymm9
5726 vpaddd %ymm10,%ymm10,%ymm10
5727
5728 vpsrld $2,%ymm2,%ymm2
5729
5730 vpaddd %ymm7,%ymm0,%ymm0
5731 vpor %ymm9,%ymm10,%ymm10
5732 vpor %ymm6,%ymm2,%ymm2
5733 vmovdqa 0(%rbp),%ymm15
5734 vpxor %ymm13,%ymm11,%ymm11
5735 vmovdqa 224-128(%rax),%ymm13
5736
5737 vpslld $5,%ymm0,%ymm7
5738 vpaddd %ymm15,%ymm4,%ymm4
5739 vpxor %ymm1,%ymm3,%ymm5
5740 vmovdqa %ymm10,128-128(%rax)
5741 vpaddd %ymm10,%ymm4,%ymm4
5742 vpxor 416-256-128(%rbx),%ymm11,%ymm11
5743 vpsrld $27,%ymm0,%ymm8
5744 vpxor %ymm2,%ymm5,%ymm5
5745 vpxor %ymm13,%ymm11,%ymm11
5746
5747 vpslld $30,%ymm1,%ymm6
5748 vpor %ymm8,%ymm7,%ymm7
5749 vpaddd %ymm5,%ymm4,%ymm4
5750 vpsrld $31,%ymm11,%ymm9
5751 vpaddd %ymm11,%ymm11,%ymm11
5752
5753 vpsrld $2,%ymm1,%ymm1
5754 vpaddd %ymm7,%ymm4,%ymm4
5755 vpor %ymm9,%ymm11,%ymm11
5756 vpor %ymm6,%ymm1,%ymm1
5757 vpxor %ymm14,%ymm12,%ymm12
5758 vmovdqa 256-256-128(%rbx),%ymm14
5759
5760 vpslld $5,%ymm4,%ymm7
5761 vpaddd %ymm15,%ymm3,%ymm3
5762 vpxor %ymm0,%ymm2,%ymm5
5763 vmovdqa %ymm11,160-128(%rax)
5764 vpaddd %ymm11,%ymm3,%ymm3
5765 vpxor 448-256-128(%rbx),%ymm12,%ymm12
5766 vpsrld $27,%ymm4,%ymm8
5767 vpxor %ymm1,%ymm5,%ymm5
5768 vpxor %ymm14,%ymm12,%ymm12
5769
5770 vpslld $30,%ymm0,%ymm6
5771 vpor %ymm8,%ymm7,%ymm7
5772 vpaddd %ymm5,%ymm3,%ymm3
5773 vpsrld $31,%ymm12,%ymm9
5774 vpaddd %ymm12,%ymm12,%ymm12
5775
5776 vpsrld $2,%ymm0,%ymm0
5777 vpaddd %ymm7,%ymm3,%ymm3
5778 vpor %ymm9,%ymm12,%ymm12
5779 vpor %ymm6,%ymm0,%ymm0
5780 vpxor %ymm10,%ymm13,%ymm13
5781 vmovdqa 288-256-128(%rbx),%ymm10
5782
5783 vpslld $5,%ymm3,%ymm7
5784 vpaddd %ymm15,%ymm2,%ymm2
5785 vpxor %ymm4,%ymm1,%ymm5
5786 vmovdqa %ymm12,192-128(%rax)
5787 vpaddd %ymm12,%ymm2,%ymm2
5788 vpxor 480-256-128(%rbx),%ymm13,%ymm13
5789 vpsrld $27,%ymm3,%ymm8
5790 vpxor %ymm0,%ymm5,%ymm5
5791 vpxor %ymm10,%ymm13,%ymm13
5792
5793 vpslld $30,%ymm4,%ymm6
5794 vpor %ymm8,%ymm7,%ymm7
5795 vpaddd %ymm5,%ymm2,%ymm2
5796 vpsrld $31,%ymm13,%ymm9
5797 vpaddd %ymm13,%ymm13,%ymm13
5798
5799 vpsrld $2,%ymm4,%ymm4
5800 vpaddd %ymm7,%ymm2,%ymm2
5801 vpor %ymm9,%ymm13,%ymm13
5802 vpor %ymm6,%ymm4,%ymm4
5803 vpxor %ymm11,%ymm14,%ymm14
5804 vmovdqa 320-256-128(%rbx),%ymm11
5805
5806 vpslld $5,%ymm2,%ymm7
5807 vpaddd %ymm15,%ymm1,%ymm1
5808 vpxor %ymm3,%ymm0,%ymm5
5809 vmovdqa %ymm13,224-128(%rax)
5810 vpaddd %ymm13,%ymm1,%ymm1
5811 vpxor 0-128(%rax),%ymm14,%ymm14
5812 vpsrld $27,%ymm2,%ymm8
5813 vpxor %ymm4,%ymm5,%ymm5
5814 vpxor %ymm11,%ymm14,%ymm14
5815
5816 vpslld $30,%ymm3,%ymm6
5817 vpor %ymm8,%ymm7,%ymm7
5818 vpaddd %ymm5,%ymm1,%ymm1
5819 vpsrld $31,%ymm14,%ymm9
5820 vpaddd %ymm14,%ymm14,%ymm14
5821
5822 vpsrld $2,%ymm3,%ymm3
5823 vpaddd %ymm7,%ymm1,%ymm1
5824 vpor %ymm9,%ymm14,%ymm14
5825 vpor %ymm6,%ymm3,%ymm3
5826 vpxor %ymm12,%ymm10,%ymm10
5827 vmovdqa 352-256-128(%rbx),%ymm12
5828
5829 vpslld $5,%ymm1,%ymm7
5830 vpaddd %ymm15,%ymm0,%ymm0
5831 vpxor %ymm2,%ymm4,%ymm5
5832 vmovdqa %ymm14,256-256-128(%rbx)
5833 vpaddd %ymm14,%ymm0,%ymm0
5834 vpxor 32-128(%rax),%ymm10,%ymm10
5835 vpsrld $27,%ymm1,%ymm8
5836 vpxor %ymm3,%ymm5,%ymm5
5837 vpxor %ymm12,%ymm10,%ymm10
5838
5839 vpslld $30,%ymm2,%ymm6
5840 vpor %ymm8,%ymm7,%ymm7
5841 vpaddd %ymm5,%ymm0,%ymm0
5842 vpsrld $31,%ymm10,%ymm9
5843 vpaddd %ymm10,%ymm10,%ymm10
5844
5845 vpsrld $2,%ymm2,%ymm2
5846 vpaddd %ymm7,%ymm0,%ymm0
5847 vpor %ymm9,%ymm10,%ymm10
5848 vpor %ymm6,%ymm2,%ymm2
5849 vpxor %ymm13,%ymm11,%ymm11
5850 vmovdqa 384-256-128(%rbx),%ymm13
5851
5852 vpslld $5,%ymm0,%ymm7
5853 vpaddd %ymm15,%ymm4,%ymm4
5854 vpxor %ymm1,%ymm3,%ymm5
5855 vmovdqa %ymm10,288-256-128(%rbx)
5856 vpaddd %ymm10,%ymm4,%ymm4
5857 vpxor 64-128(%rax),%ymm11,%ymm11
5858 vpsrld $27,%ymm0,%ymm8
5859 vpxor %ymm2,%ymm5,%ymm5
5860 vpxor %ymm13,%ymm11,%ymm11
5861
5862 vpslld $30,%ymm1,%ymm6
5863 vpor %ymm8,%ymm7,%ymm7
5864 vpaddd %ymm5,%ymm4,%ymm4
5865 vpsrld $31,%ymm11,%ymm9
5866 vpaddd %ymm11,%ymm11,%ymm11
5867
5868 vpsrld $2,%ymm1,%ymm1
5869 vpaddd %ymm7,%ymm4,%ymm4
5870 vpor %ymm9,%ymm11,%ymm11
5871 vpor %ymm6,%ymm1,%ymm1
5872 vpxor %ymm14,%ymm12,%ymm12
5873 vmovdqa 416-256-128(%rbx),%ymm14
5874
5875 vpslld $5,%ymm4,%ymm7
5876 vpaddd %ymm15,%ymm3,%ymm3
5877 vpxor %ymm0,%ymm2,%ymm5
5878 vmovdqa %ymm11,320-256-128(%rbx)
5879 vpaddd %ymm11,%ymm3,%ymm3
5880 vpxor 96-128(%rax),%ymm12,%ymm12
5881 vpsrld $27,%ymm4,%ymm8
5882 vpxor %ymm1,%ymm5,%ymm5
5883 vpxor %ymm14,%ymm12,%ymm12
5884
5885 vpslld $30,%ymm0,%ymm6
5886 vpor %ymm8,%ymm7,%ymm7
5887 vpaddd %ymm5,%ymm3,%ymm3
5888 vpsrld $31,%ymm12,%ymm9
5889 vpaddd %ymm12,%ymm12,%ymm12
5890
5891 vpsrld $2,%ymm0,%ymm0
5892 vpaddd %ymm7,%ymm3,%ymm3
5893 vpor %ymm9,%ymm12,%ymm12
5894 vpor %ymm6,%ymm0,%ymm0
5895 vpxor %ymm10,%ymm13,%ymm13
5896 vmovdqa 448-256-128(%rbx),%ymm10
5897
5898 vpslld $5,%ymm3,%ymm7
5899 vpaddd %ymm15,%ymm2,%ymm2
5900 vpxor %ymm4,%ymm1,%ymm5
5901 vmovdqa %ymm12,352-256-128(%rbx)
5902 vpaddd %ymm12,%ymm2,%ymm2
5903 vpxor 128-128(%rax),%ymm13,%ymm13
5904 vpsrld $27,%ymm3,%ymm8
5905 vpxor %ymm0,%ymm5,%ymm5
5906 vpxor %ymm10,%ymm13,%ymm13
5907
5908 vpslld $30,%ymm4,%ymm6
5909 vpor %ymm8,%ymm7,%ymm7
5910 vpaddd %ymm5,%ymm2,%ymm2
5911 vpsrld $31,%ymm13,%ymm9
5912 vpaddd %ymm13,%ymm13,%ymm13
5913
5914 vpsrld $2,%ymm4,%ymm4
5915 vpaddd %ymm7,%ymm2,%ymm2
5916 vpor %ymm9,%ymm13,%ymm13
5917 vpor %ymm6,%ymm4,%ymm4
5918 vpxor %ymm11,%ymm14,%ymm14
5919 vmovdqa 480-256-128(%rbx),%ymm11
5920
5921 vpslld $5,%ymm2,%ymm7
5922 vpaddd %ymm15,%ymm1,%ymm1
5923 vpxor %ymm3,%ymm0,%ymm5
5924 vmovdqa %ymm13,384-256-128(%rbx)
5925 vpaddd %ymm13,%ymm1,%ymm1
5926 vpxor 160-128(%rax),%ymm14,%ymm14
5927 vpsrld $27,%ymm2,%ymm8
5928 vpxor %ymm4,%ymm5,%ymm5
5929 vpxor %ymm11,%ymm14,%ymm14
5930
5931 vpslld $30,%ymm3,%ymm6
5932 vpor %ymm8,%ymm7,%ymm7
5933 vpaddd %ymm5,%ymm1,%ymm1
5934 vpsrld $31,%ymm14,%ymm9
5935 vpaddd %ymm14,%ymm14,%ymm14
5936
5937 vpsrld $2,%ymm3,%ymm3
5938 vpaddd %ymm7,%ymm1,%ymm1
5939 vpor %ymm9,%ymm14,%ymm14
5940 vpor %ymm6,%ymm3,%ymm3
5941 vpxor %ymm12,%ymm10,%ymm10
5942 vmovdqa 0-128(%rax),%ymm12
5943
5944 vpslld $5,%ymm1,%ymm7
5945 vpaddd %ymm15,%ymm0,%ymm0
5946 vpxor %ymm2,%ymm4,%ymm5
5947 vmovdqa %ymm14,416-256-128(%rbx)
5948 vpaddd %ymm14,%ymm0,%ymm0
5949 vpxor 192-128(%rax),%ymm10,%ymm10
5950 vpsrld $27,%ymm1,%ymm8
5951 vpxor %ymm3,%ymm5,%ymm5
5952 vpxor %ymm12,%ymm10,%ymm10
5953
5954 vpslld $30,%ymm2,%ymm6
5955 vpor %ymm8,%ymm7,%ymm7
5956 vpaddd %ymm5,%ymm0,%ymm0
5957 vpsrld $31,%ymm10,%ymm9
5958 vpaddd %ymm10,%ymm10,%ymm10
5959
5960 vpsrld $2,%ymm2,%ymm2
5961 vpaddd %ymm7,%ymm0,%ymm0
5962 vpor %ymm9,%ymm10,%ymm10
5963 vpor %ymm6,%ymm2,%ymm2
5964 vpxor %ymm13,%ymm11,%ymm11
5965 vmovdqa 32-128(%rax),%ymm13
5966
5967 vpslld $5,%ymm0,%ymm7
5968 vpaddd %ymm15,%ymm4,%ymm4
5969 vpxor %ymm1,%ymm3,%ymm5
5970 vmovdqa %ymm10,448-256-128(%rbx)
5971 vpaddd %ymm10,%ymm4,%ymm4
5972 vpxor 224-128(%rax),%ymm11,%ymm11
5973 vpsrld $27,%ymm0,%ymm8
5974 vpxor %ymm2,%ymm5,%ymm5
5975 vpxor %ymm13,%ymm11,%ymm11
5976
5977 vpslld $30,%ymm1,%ymm6
5978 vpor %ymm8,%ymm7,%ymm7
5979 vpaddd %ymm5,%ymm4,%ymm4
5980 vpsrld $31,%ymm11,%ymm9
5981 vpaddd %ymm11,%ymm11,%ymm11
5982
5983 vpsrld $2,%ymm1,%ymm1
5984 vpaddd %ymm7,%ymm4,%ymm4
5985 vpor %ymm9,%ymm11,%ymm11
5986 vpor %ymm6,%ymm1,%ymm1
5987 vpxor %ymm14,%ymm12,%ymm12
5988 vmovdqa 64-128(%rax),%ymm14
5989
5990 vpslld $5,%ymm4,%ymm7
5991 vpaddd %ymm15,%ymm3,%ymm3
5992 vpxor %ymm0,%ymm2,%ymm5
5993 vmovdqa %ymm11,480-256-128(%rbx)
5994 vpaddd %ymm11,%ymm3,%ymm3
5995 vpxor 256-256-128(%rbx),%ymm12,%ymm12
5996 vpsrld $27,%ymm4,%ymm8
5997 vpxor %ymm1,%ymm5,%ymm5
5998 vpxor %ymm14,%ymm12,%ymm12
5999
6000 vpslld $30,%ymm0,%ymm6
6001 vpor %ymm8,%ymm7,%ymm7
6002 vpaddd %ymm5,%ymm3,%ymm3
6003 vpsrld $31,%ymm12,%ymm9
6004 vpaddd %ymm12,%ymm12,%ymm12
6005
6006 vpsrld $2,%ymm0,%ymm0
6007 vpaddd %ymm7,%ymm3,%ymm3
6008 vpor %ymm9,%ymm12,%ymm12
6009 vpor %ymm6,%ymm0,%ymm0
6010 vpxor %ymm10,%ymm13,%ymm13
6011 vmovdqa 96-128(%rax),%ymm10
6012
6013 vpslld $5,%ymm3,%ymm7
6014 vpaddd %ymm15,%ymm2,%ymm2
6015 vpxor %ymm4,%ymm1,%ymm5
6016 vmovdqa %ymm12,0-128(%rax)
6017 vpaddd %ymm12,%ymm2,%ymm2
6018 vpxor 288-256-128(%rbx),%ymm13,%ymm13
6019 vpsrld $27,%ymm3,%ymm8
6020 vpxor %ymm0,%ymm5,%ymm5
6021 vpxor %ymm10,%ymm13,%ymm13
6022
6023 vpslld $30,%ymm4,%ymm6
6024 vpor %ymm8,%ymm7,%ymm7
6025 vpaddd %ymm5,%ymm2,%ymm2
6026 vpsrld $31,%ymm13,%ymm9
6027 vpaddd %ymm13,%ymm13,%ymm13
6028
6029 vpsrld $2,%ymm4,%ymm4
6030 vpaddd %ymm7,%ymm2,%ymm2
6031 vpor %ymm9,%ymm13,%ymm13
6032 vpor %ymm6,%ymm4,%ymm4
6033 vpxor %ymm11,%ymm14,%ymm14
6034 vmovdqa 128-128(%rax),%ymm11
6035
6036 vpslld $5,%ymm2,%ymm7
6037 vpaddd %ymm15,%ymm1,%ymm1
6038 vpxor %ymm3,%ymm0,%ymm5
6039 vmovdqa %ymm13,32-128(%rax)
6040 vpaddd %ymm13,%ymm1,%ymm1
6041 vpxor 320-256-128(%rbx),%ymm14,%ymm14
6042 vpsrld $27,%ymm2,%ymm8
6043 vpxor %ymm4,%ymm5,%ymm5
6044 vpxor %ymm11,%ymm14,%ymm14
6045
6046 vpslld $30,%ymm3,%ymm6
6047 vpor %ymm8,%ymm7,%ymm7
6048 vpaddd %ymm5,%ymm1,%ymm1
6049 vpsrld $31,%ymm14,%ymm9
6050 vpaddd %ymm14,%ymm14,%ymm14
6051
6052 vpsrld $2,%ymm3,%ymm3
6053 vpaddd %ymm7,%ymm1,%ymm1
6054 vpor %ymm9,%ymm14,%ymm14
6055 vpor %ymm6,%ymm3,%ymm3
6056 vpxor %ymm12,%ymm10,%ymm10
6057 vmovdqa 160-128(%rax),%ymm12
6058
6059 vpslld $5,%ymm1,%ymm7
6060 vpaddd %ymm15,%ymm0,%ymm0
6061 vpxor %ymm2,%ymm4,%ymm5
6062 vmovdqa %ymm14,64-128(%rax)
6063 vpaddd %ymm14,%ymm0,%ymm0
6064 vpxor 352-256-128(%rbx),%ymm10,%ymm10
6065 vpsrld $27,%ymm1,%ymm8
6066 vpxor %ymm3,%ymm5,%ymm5
6067 vpxor %ymm12,%ymm10,%ymm10
6068
6069 vpslld $30,%ymm2,%ymm6
6070 vpor %ymm8,%ymm7,%ymm7
6071 vpaddd %ymm5,%ymm0,%ymm0
6072 vpsrld $31,%ymm10,%ymm9
6073 vpaddd %ymm10,%ymm10,%ymm10
6074
6075 vpsrld $2,%ymm2,%ymm2
6076 vpaddd %ymm7,%ymm0,%ymm0
6077 vpor %ymm9,%ymm10,%ymm10
6078 vpor %ymm6,%ymm2,%ymm2
6079 vpxor %ymm13,%ymm11,%ymm11
6080 vmovdqa 192-128(%rax),%ymm13
6081
6082 vpslld $5,%ymm0,%ymm7
6083 vpaddd %ymm15,%ymm4,%ymm4
6084 vpxor %ymm1,%ymm3,%ymm5
6085 vmovdqa %ymm10,96-128(%rax)
6086 vpaddd %ymm10,%ymm4,%ymm4
6087 vpxor 384-256-128(%rbx),%ymm11,%ymm11
6088 vpsrld $27,%ymm0,%ymm8
6089 vpxor %ymm2,%ymm5,%ymm5
6090 vpxor %ymm13,%ymm11,%ymm11
6091
6092 vpslld $30,%ymm1,%ymm6
6093 vpor %ymm8,%ymm7,%ymm7
6094 vpaddd %ymm5,%ymm4,%ymm4
6095 vpsrld $31,%ymm11,%ymm9
6096 vpaddd %ymm11,%ymm11,%ymm11
6097
6098 vpsrld $2,%ymm1,%ymm1
6099 vpaddd %ymm7,%ymm4,%ymm4
6100 vpor %ymm9,%ymm11,%ymm11
6101 vpor %ymm6,%ymm1,%ymm1
6102 vpxor %ymm14,%ymm12,%ymm12
6103 vmovdqa 224-128(%rax),%ymm14
6104
6105 vpslld $5,%ymm4,%ymm7
6106 vpaddd %ymm15,%ymm3,%ymm3
6107 vpxor %ymm0,%ymm2,%ymm5
6108 vmovdqa %ymm11,128-128(%rax)
6109 vpaddd %ymm11,%ymm3,%ymm3
6110 vpxor 416-256-128(%rbx),%ymm12,%ymm12
6111 vpsrld $27,%ymm4,%ymm8
6112 vpxor %ymm1,%ymm5,%ymm5
6113 vpxor %ymm14,%ymm12,%ymm12
6114
6115 vpslld $30,%ymm0,%ymm6
6116 vpor %ymm8,%ymm7,%ymm7
6117 vpaddd %ymm5,%ymm3,%ymm3
6118 vpsrld $31,%ymm12,%ymm9
6119 vpaddd %ymm12,%ymm12,%ymm12
6120
6121 vpsrld $2,%ymm0,%ymm0
6122 vpaddd %ymm7,%ymm3,%ymm3
6123 vpor %ymm9,%ymm12,%ymm12
6124 vpor %ymm6,%ymm0,%ymm0
6125 vpxor %ymm10,%ymm13,%ymm13
6126 vmovdqa 256-256-128(%rbx),%ymm10
6127
6128 vpslld $5,%ymm3,%ymm7
6129 vpaddd %ymm15,%ymm2,%ymm2
6130 vpxor %ymm4,%ymm1,%ymm5
6131 vmovdqa %ymm12,160-128(%rax)
6132 vpaddd %ymm12,%ymm2,%ymm2
6133 vpxor 448-256-128(%rbx),%ymm13,%ymm13
6134 vpsrld $27,%ymm3,%ymm8
6135 vpxor %ymm0,%ymm5,%ymm5
6136 vpxor %ymm10,%ymm13,%ymm13
6137
6138 vpslld $30,%ymm4,%ymm6
6139 vpor %ymm8,%ymm7,%ymm7
6140 vpaddd %ymm5,%ymm2,%ymm2
6141 vpsrld $31,%ymm13,%ymm9
6142 vpaddd %ymm13,%ymm13,%ymm13
6143
6144 vpsrld $2,%ymm4,%ymm4
6145 vpaddd %ymm7,%ymm2,%ymm2
6146 vpor %ymm9,%ymm13,%ymm13
6147 vpor %ymm6,%ymm4,%ymm4
6148 vpxor %ymm11,%ymm14,%ymm14
6149 vmovdqa 288-256-128(%rbx),%ymm11
6150
6151 vpslld $5,%ymm2,%ymm7
6152 vpaddd %ymm15,%ymm1,%ymm1
6153 vpxor %ymm3,%ymm0,%ymm5
6154 vmovdqa %ymm13,192-128(%rax)
6155 vpaddd %ymm13,%ymm1,%ymm1
6156 vpxor 480-256-128(%rbx),%ymm14,%ymm14
6157 vpsrld $27,%ymm2,%ymm8
6158 vpxor %ymm4,%ymm5,%ymm5
6159 vpxor %ymm11,%ymm14,%ymm14
6160
6161 vpslld $30,%ymm3,%ymm6
6162 vpor %ymm8,%ymm7,%ymm7
6163 vpaddd %ymm5,%ymm1,%ymm1
6164 vpsrld $31,%ymm14,%ymm9
6165 vpaddd %ymm14,%ymm14,%ymm14
6166
6167 vpsrld $2,%ymm3,%ymm3
6168 vpaddd %ymm7,%ymm1,%ymm1
6169 vpor %ymm9,%ymm14,%ymm14
6170 vpor %ymm6,%ymm3,%ymm3
6171 vpxor %ymm12,%ymm10,%ymm10
6172 vmovdqa 320-256-128(%rbx),%ymm12
6173
6174 vpslld $5,%ymm1,%ymm7
6175 vpaddd %ymm15,%ymm0,%ymm0
6176 vpxor %ymm2,%ymm4,%ymm5
6177 vmovdqa %ymm14,224-128(%rax)
6178 vpaddd %ymm14,%ymm0,%ymm0
6179 vpxor 0-128(%rax),%ymm10,%ymm10
6180 vpsrld $27,%ymm1,%ymm8
6181 vpxor %ymm3,%ymm5,%ymm5
6182 vpxor %ymm12,%ymm10,%ymm10
6183
6184 vpslld $30,%ymm2,%ymm6
6185 vpor %ymm8,%ymm7,%ymm7
6186 vpaddd %ymm5,%ymm0,%ymm0
6187 vpsrld $31,%ymm10,%ymm9
6188 vpaddd %ymm10,%ymm10,%ymm10
6189
6190 vpsrld $2,%ymm2,%ymm2
6191 vpaddd %ymm7,%ymm0,%ymm0
6192 vpor %ymm9,%ymm10,%ymm10
6193 vpor %ymm6,%ymm2,%ymm2
6194 vmovdqa 32(%rbp),%ymm15
6195 vpxor %ymm13,%ymm11,%ymm11
6196 vmovdqa 352-256-128(%rbx),%ymm13
6197
6198 vpaddd %ymm15,%ymm4,%ymm4
6199 vpslld $5,%ymm0,%ymm7
6200 vpand %ymm2,%ymm3,%ymm6
6201 vpxor 32-128(%rax),%ymm11,%ymm11
6202
6203 vpaddd %ymm6,%ymm4,%ymm4
6204 vpsrld $27,%ymm0,%ymm8
6205 vpxor %ymm2,%ymm3,%ymm5
6206 vpxor %ymm13,%ymm11,%ymm11
6207
6208 vmovdqu %ymm10,256-256-128(%rbx)
6209 vpaddd %ymm10,%ymm4,%ymm4
6210 vpor %ymm8,%ymm7,%ymm7
6211 vpsrld $31,%ymm11,%ymm9
6212 vpand %ymm1,%ymm5,%ymm5
6213 vpaddd %ymm11,%ymm11,%ymm11
6214
6215 vpslld $30,%ymm1,%ymm6
6216 vpaddd %ymm5,%ymm4,%ymm4
6217
6218 vpsrld $2,%ymm1,%ymm1
6219 vpaddd %ymm7,%ymm4,%ymm4
6220 vpor %ymm9,%ymm11,%ymm11
6221 vpor %ymm6,%ymm1,%ymm1
6222 vpxor %ymm14,%ymm12,%ymm12
6223 vmovdqa 384-256-128(%rbx),%ymm14
6224
6225 vpaddd %ymm15,%ymm3,%ymm3
6226 vpslld $5,%ymm4,%ymm7
6227 vpand %ymm1,%ymm2,%ymm6
6228 vpxor 64-128(%rax),%ymm12,%ymm12
6229
6230 vpaddd %ymm6,%ymm3,%ymm3
6231 vpsrld $27,%ymm4,%ymm8
6232 vpxor %ymm1,%ymm2,%ymm5
6233 vpxor %ymm14,%ymm12,%ymm12
6234
6235 vmovdqu %ymm11,288-256-128(%rbx)
6236 vpaddd %ymm11,%ymm3,%ymm3
6237 vpor %ymm8,%ymm7,%ymm7
6238 vpsrld $31,%ymm12,%ymm9
6239 vpand %ymm0,%ymm5,%ymm5
6240 vpaddd %ymm12,%ymm12,%ymm12
6241
6242 vpslld $30,%ymm0,%ymm6
6243 vpaddd %ymm5,%ymm3,%ymm3
6244
6245 vpsrld $2,%ymm0,%ymm0
6246 vpaddd %ymm7,%ymm3,%ymm3
6247 vpor %ymm9,%ymm12,%ymm12
6248 vpor %ymm6,%ymm0,%ymm0
6249 vpxor %ymm10,%ymm13,%ymm13
6250 vmovdqa 416-256-128(%rbx),%ymm10
6251
6252 vpaddd %ymm15,%ymm2,%ymm2
6253 vpslld $5,%ymm3,%ymm7
6254 vpand %ymm0,%ymm1,%ymm6
6255 vpxor 96-128(%rax),%ymm13,%ymm13
6256
6257 vpaddd %ymm6,%ymm2,%ymm2
6258 vpsrld $27,%ymm3,%ymm8
6259 vpxor %ymm0,%ymm1,%ymm5
6260 vpxor %ymm10,%ymm13,%ymm13
6261
6262 vmovdqu %ymm12,320-256-128(%rbx)
6263 vpaddd %ymm12,%ymm2,%ymm2
6264 vpor %ymm8,%ymm7,%ymm7
6265 vpsrld $31,%ymm13,%ymm9
6266 vpand %ymm4,%ymm5,%ymm5
6267 vpaddd %ymm13,%ymm13,%ymm13
6268
6269 vpslld $30,%ymm4,%ymm6
6270 vpaddd %ymm5,%ymm2,%ymm2
6271
6272 vpsrld $2,%ymm4,%ymm4
6273 vpaddd %ymm7,%ymm2,%ymm2
6274 vpor %ymm9,%ymm13,%ymm13
6275 vpor %ymm6,%ymm4,%ymm4
6276 vpxor %ymm11,%ymm14,%ymm14
6277 vmovdqa 448-256-128(%rbx),%ymm11
6278
6279 vpaddd %ymm15,%ymm1,%ymm1
6280 vpslld $5,%ymm2,%ymm7
6281 vpand %ymm4,%ymm0,%ymm6
6282 vpxor 128-128(%rax),%ymm14,%ymm14
6283
6284 vpaddd %ymm6,%ymm1,%ymm1
6285 vpsrld $27,%ymm2,%ymm8
6286 vpxor %ymm4,%ymm0,%ymm5
6287 vpxor %ymm11,%ymm14,%ymm14
6288
6289 vmovdqu %ymm13,352-256-128(%rbx)
6290 vpaddd %ymm13,%ymm1,%ymm1
6291 vpor %ymm8,%ymm7,%ymm7
6292 vpsrld $31,%ymm14,%ymm9
6293 vpand %ymm3,%ymm5,%ymm5
6294 vpaddd %ymm14,%ymm14,%ymm14
6295
6296 vpslld $30,%ymm3,%ymm6
6297 vpaddd %ymm5,%ymm1,%ymm1
6298
6299 vpsrld $2,%ymm3,%ymm3
6300 vpaddd %ymm7,%ymm1,%ymm1
6301 vpor %ymm9,%ymm14,%ymm14
6302 vpor %ymm6,%ymm3,%ymm3
6303 vpxor %ymm12,%ymm10,%ymm10
6304 vmovdqa 480-256-128(%rbx),%ymm12
6305
6306 vpaddd %ymm15,%ymm0,%ymm0
6307 vpslld $5,%ymm1,%ymm7
6308 vpand %ymm3,%ymm4,%ymm6
6309 vpxor 160-128(%rax),%ymm10,%ymm10
6310
6311 vpaddd %ymm6,%ymm0,%ymm0
6312 vpsrld $27,%ymm1,%ymm8
6313 vpxor %ymm3,%ymm4,%ymm5
6314 vpxor %ymm12,%ymm10,%ymm10
6315
6316 vmovdqu %ymm14,384-256-128(%rbx)
6317 vpaddd %ymm14,%ymm0,%ymm0
6318 vpor %ymm8,%ymm7,%ymm7
6319 vpsrld $31,%ymm10,%ymm9
6320 vpand %ymm2,%ymm5,%ymm5
6321 vpaddd %ymm10,%ymm10,%ymm10
6322
6323 vpslld $30,%ymm2,%ymm6
6324 vpaddd %ymm5,%ymm0,%ymm0
6325
6326 vpsrld $2,%ymm2,%ymm2
6327 vpaddd %ymm7,%ymm0,%ymm0
6328 vpor %ymm9,%ymm10,%ymm10
6329 vpor %ymm6,%ymm2,%ymm2
6330 vpxor %ymm13,%ymm11,%ymm11
6331 vmovdqa 0-128(%rax),%ymm13
6332
6333 vpaddd %ymm15,%ymm4,%ymm4
6334 vpslld $5,%ymm0,%ymm7
6335 vpand %ymm2,%ymm3,%ymm6
6336 vpxor 192-128(%rax),%ymm11,%ymm11
6337
6338 vpaddd %ymm6,%ymm4,%ymm4
6339 vpsrld $27,%ymm0,%ymm8
6340 vpxor %ymm2,%ymm3,%ymm5
6341 vpxor %ymm13,%ymm11,%ymm11
6342
6343 vmovdqu %ymm10,416-256-128(%rbx)
6344 vpaddd %ymm10,%ymm4,%ymm4
6345 vpor %ymm8,%ymm7,%ymm7
6346 vpsrld $31,%ymm11,%ymm9
6347 vpand %ymm1,%ymm5,%ymm5
6348 vpaddd %ymm11,%ymm11,%ymm11
6349
6350 vpslld $30,%ymm1,%ymm6
6351 vpaddd %ymm5,%ymm4,%ymm4
6352
6353 vpsrld $2,%ymm1,%ymm1
6354 vpaddd %ymm7,%ymm4,%ymm4
6355 vpor %ymm9,%ymm11,%ymm11
6356 vpor %ymm6,%ymm1,%ymm1
6357 vpxor %ymm14,%ymm12,%ymm12
6358 vmovdqa 32-128(%rax),%ymm14
6359
6360 vpaddd %ymm15,%ymm3,%ymm3
6361 vpslld $5,%ymm4,%ymm7
6362 vpand %ymm1,%ymm2,%ymm6
6363 vpxor 224-128(%rax),%ymm12,%ymm12
6364
6365 vpaddd %ymm6,%ymm3,%ymm3
6366 vpsrld $27,%ymm4,%ymm8
6367 vpxor %ymm1,%ymm2,%ymm5
6368 vpxor %ymm14,%ymm12,%ymm12
6369
6370 vmovdqu %ymm11,448-256-128(%rbx)
6371 vpaddd %ymm11,%ymm3,%ymm3
6372 vpor %ymm8,%ymm7,%ymm7
6373 vpsrld $31,%ymm12,%ymm9
6374 vpand %ymm0,%ymm5,%ymm5
6375 vpaddd %ymm12,%ymm12,%ymm12
6376
6377 vpslld $30,%ymm0,%ymm6
6378 vpaddd %ymm5,%ymm3,%ymm3
6379
6380 vpsrld $2,%ymm0,%ymm0
6381 vpaddd %ymm7,%ymm3,%ymm3
6382 vpor %ymm9,%ymm12,%ymm12
6383 vpor %ymm6,%ymm0,%ymm0
6384 vpxor %ymm10,%ymm13,%ymm13
6385 vmovdqa 64-128(%rax),%ymm10
6386
6387 vpaddd %ymm15,%ymm2,%ymm2
6388 vpslld $5,%ymm3,%ymm7
6389 vpand %ymm0,%ymm1,%ymm6
6390 vpxor 256-256-128(%rbx),%ymm13,%ymm13
6391
6392 vpaddd %ymm6,%ymm2,%ymm2
6393 vpsrld $27,%ymm3,%ymm8
6394 vpxor %ymm0,%ymm1,%ymm5
6395 vpxor %ymm10,%ymm13,%ymm13
6396
6397 vmovdqu %ymm12,480-256-128(%rbx)
6398 vpaddd %ymm12,%ymm2,%ymm2
6399 vpor %ymm8,%ymm7,%ymm7
6400 vpsrld $31,%ymm13,%ymm9
6401 vpand %ymm4,%ymm5,%ymm5
6402 vpaddd %ymm13,%ymm13,%ymm13
6403
6404 vpslld $30,%ymm4,%ymm6
6405 vpaddd %ymm5,%ymm2,%ymm2
6406
6407 vpsrld $2,%ymm4,%ymm4
6408 vpaddd %ymm7,%ymm2,%ymm2
6409 vpor %ymm9,%ymm13,%ymm13
6410 vpor %ymm6,%ymm4,%ymm4
6411 vpxor %ymm11,%ymm14,%ymm14
6412 vmovdqa 96-128(%rax),%ymm11
6413
6414 vpaddd %ymm15,%ymm1,%ymm1
6415 vpslld $5,%ymm2,%ymm7
6416 vpand %ymm4,%ymm0,%ymm6
6417 vpxor 288-256-128(%rbx),%ymm14,%ymm14
6418
6419 vpaddd %ymm6,%ymm1,%ymm1
6420 vpsrld $27,%ymm2,%ymm8
6421 vpxor %ymm4,%ymm0,%ymm5
6422 vpxor %ymm11,%ymm14,%ymm14
6423
6424 vmovdqu %ymm13,0-128(%rax)
6425 vpaddd %ymm13,%ymm1,%ymm1
6426 vpor %ymm8,%ymm7,%ymm7
6427 vpsrld $31,%ymm14,%ymm9
6428 vpand %ymm3,%ymm5,%ymm5
6429 vpaddd %ymm14,%ymm14,%ymm14
6430
6431 vpslld $30,%ymm3,%ymm6
6432 vpaddd %ymm5,%ymm1,%ymm1
6433
6434 vpsrld $2,%ymm3,%ymm3
6435 vpaddd %ymm7,%ymm1,%ymm1
6436 vpor %ymm9,%ymm14,%ymm14
6437 vpor %ymm6,%ymm3,%ymm3
6438 vpxor %ymm12,%ymm10,%ymm10
6439 vmovdqa 128-128(%rax),%ymm12
6440
6441 vpaddd %ymm15,%ymm0,%ymm0
6442 vpslld $5,%ymm1,%ymm7
6443 vpand %ymm3,%ymm4,%ymm6
6444 vpxor 320-256-128(%rbx),%ymm10,%ymm10
6445
6446 vpaddd %ymm6,%ymm0,%ymm0
6447 vpsrld $27,%ymm1,%ymm8
6448 vpxor %ymm3,%ymm4,%ymm5
6449 vpxor %ymm12,%ymm10,%ymm10
6450
6451 vmovdqu %ymm14,32-128(%rax)
6452 vpaddd %ymm14,%ymm0,%ymm0
6453 vpor %ymm8,%ymm7,%ymm7
6454 vpsrld $31,%ymm10,%ymm9
6455 vpand %ymm2,%ymm5,%ymm5
6456 vpaddd %ymm10,%ymm10,%ymm10
6457
6458 vpslld $30,%ymm2,%ymm6
6459 vpaddd %ymm5,%ymm0,%ymm0
6460
6461 vpsrld $2,%ymm2,%ymm2
6462 vpaddd %ymm7,%ymm0,%ymm0
6463 vpor %ymm9,%ymm10,%ymm10
6464 vpor %ymm6,%ymm2,%ymm2
6465 vpxor %ymm13,%ymm11,%ymm11
6466 vmovdqa 160-128(%rax),%ymm13
6467
6468 vpaddd %ymm15,%ymm4,%ymm4
6469 vpslld $5,%ymm0,%ymm7
6470 vpand %ymm2,%ymm3,%ymm6
6471 vpxor 352-256-128(%rbx),%ymm11,%ymm11
6472
6473 vpaddd %ymm6,%ymm4,%ymm4
6474 vpsrld $27,%ymm0,%ymm8
6475 vpxor %ymm2,%ymm3,%ymm5
6476 vpxor %ymm13,%ymm11,%ymm11
6477
6478 vmovdqu %ymm10,64-128(%rax)
6479 vpaddd %ymm10,%ymm4,%ymm4
6480 vpor %ymm8,%ymm7,%ymm7
6481 vpsrld $31,%ymm11,%ymm9
6482 vpand %ymm1,%ymm5,%ymm5
6483 vpaddd %ymm11,%ymm11,%ymm11
6484
6485 vpslld $30,%ymm1,%ymm6
6486 vpaddd %ymm5,%ymm4,%ymm4
6487
6488 vpsrld $2,%ymm1,%ymm1
6489 vpaddd %ymm7,%ymm4,%ymm4
6490 vpor %ymm9,%ymm11,%ymm11
6491 vpor %ymm6,%ymm1,%ymm1
6492 vpxor %ymm14,%ymm12,%ymm12
6493 vmovdqa 192-128(%rax),%ymm14
6494
6495 vpaddd %ymm15,%ymm3,%ymm3
6496 vpslld $5,%ymm4,%ymm7
6497 vpand %ymm1,%ymm2,%ymm6
6498 vpxor 384-256-128(%rbx),%ymm12,%ymm12
6499
6500 vpaddd %ymm6,%ymm3,%ymm3
6501 vpsrld $27,%ymm4,%ymm8
6502 vpxor %ymm1,%ymm2,%ymm5
6503 vpxor %ymm14,%ymm12,%ymm12
6504
6505 vmovdqu %ymm11,96-128(%rax)
6506 vpaddd %ymm11,%ymm3,%ymm3
6507 vpor %ymm8,%ymm7,%ymm7
6508 vpsrld $31,%ymm12,%ymm9
6509 vpand %ymm0,%ymm5,%ymm5
6510 vpaddd %ymm12,%ymm12,%ymm12
6511
6512 vpslld $30,%ymm0,%ymm6
6513 vpaddd %ymm5,%ymm3,%ymm3
6514
6515 vpsrld $2,%ymm0,%ymm0
6516 vpaddd %ymm7,%ymm3,%ymm3
6517 vpor %ymm9,%ymm12,%ymm12
6518 vpor %ymm6,%ymm0,%ymm0
6519 vpxor %ymm10,%ymm13,%ymm13
6520 vmovdqa 224-128(%rax),%ymm10
6521
6522 vpaddd %ymm15,%ymm2,%ymm2
6523 vpslld $5,%ymm3,%ymm7
6524 vpand %ymm0,%ymm1,%ymm6
6525 vpxor 416-256-128(%rbx),%ymm13,%ymm13
6526
6527 vpaddd %ymm6,%ymm2,%ymm2
6528 vpsrld $27,%ymm3,%ymm8
6529 vpxor %ymm0,%ymm1,%ymm5
6530 vpxor %ymm10,%ymm13,%ymm13
6531
6532 vmovdqu %ymm12,128-128(%rax)
6533 vpaddd %ymm12,%ymm2,%ymm2
6534 vpor %ymm8,%ymm7,%ymm7
6535 vpsrld $31,%ymm13,%ymm9
6536 vpand %ymm4,%ymm5,%ymm5
6537 vpaddd %ymm13,%ymm13,%ymm13
6538
6539 vpslld $30,%ymm4,%ymm6
6540 vpaddd %ymm5,%ymm2,%ymm2
6541
6542 vpsrld $2,%ymm4,%ymm4
6543 vpaddd %ymm7,%ymm2,%ymm2
6544 vpor %ymm9,%ymm13,%ymm13
6545 vpor %ymm6,%ymm4,%ymm4
6546 vpxor %ymm11,%ymm14,%ymm14
6547 vmovdqa 256-256-128(%rbx),%ymm11
6548
6549 vpaddd %ymm15,%ymm1,%ymm1
6550 vpslld $5,%ymm2,%ymm7
6551 vpand %ymm4,%ymm0,%ymm6
6552 vpxor 448-256-128(%rbx),%ymm14,%ymm14
6553
6554 vpaddd %ymm6,%ymm1,%ymm1
6555 vpsrld $27,%ymm2,%ymm8
6556 vpxor %ymm4,%ymm0,%ymm5
6557 vpxor %ymm11,%ymm14,%ymm14
6558
6559 vmovdqu %ymm13,160-128(%rax)
6560 vpaddd %ymm13,%ymm1,%ymm1
6561 vpor %ymm8,%ymm7,%ymm7
6562 vpsrld $31,%ymm14,%ymm9
6563 vpand %ymm3,%ymm5,%ymm5
6564 vpaddd %ymm14,%ymm14,%ymm14
6565
6566 vpslld $30,%ymm3,%ymm6
6567 vpaddd %ymm5,%ymm1,%ymm1
6568
6569 vpsrld $2,%ymm3,%ymm3
6570 vpaddd %ymm7,%ymm1,%ymm1
6571 vpor %ymm9,%ymm14,%ymm14
6572 vpor %ymm6,%ymm3,%ymm3
6573 vpxor %ymm12,%ymm10,%ymm10
6574 vmovdqa 288-256-128(%rbx),%ymm12
6575
6576 vpaddd %ymm15,%ymm0,%ymm0
6577 vpslld $5,%ymm1,%ymm7
6578 vpand %ymm3,%ymm4,%ymm6
6579 vpxor 480-256-128(%rbx),%ymm10,%ymm10
6580
6581 vpaddd %ymm6,%ymm0,%ymm0
6582 vpsrld $27,%ymm1,%ymm8
6583 vpxor %ymm3,%ymm4,%ymm5
6584 vpxor %ymm12,%ymm10,%ymm10
6585
6586 vmovdqu %ymm14,192-128(%rax)
6587 vpaddd %ymm14,%ymm0,%ymm0
6588 vpor %ymm8,%ymm7,%ymm7
6589 vpsrld $31,%ymm10,%ymm9
6590 vpand %ymm2,%ymm5,%ymm5
6591 vpaddd %ymm10,%ymm10,%ymm10
6592
6593 vpslld $30,%ymm2,%ymm6
6594 vpaddd %ymm5,%ymm0,%ymm0
6595
6596 vpsrld $2,%ymm2,%ymm2
6597 vpaddd %ymm7,%ymm0,%ymm0
6598 vpor %ymm9,%ymm10,%ymm10
6599 vpor %ymm6,%ymm2,%ymm2
6600 vpxor %ymm13,%ymm11,%ymm11
6601 vmovdqa 320-256-128(%rbx),%ymm13
6602
6603 vpaddd %ymm15,%ymm4,%ymm4
6604 vpslld $5,%ymm0,%ymm7
6605 vpand %ymm2,%ymm3,%ymm6
6606 vpxor 0-128(%rax),%ymm11,%ymm11
6607
6608 vpaddd %ymm6,%ymm4,%ymm4
6609 vpsrld $27,%ymm0,%ymm8
6610 vpxor %ymm2,%ymm3,%ymm5
6611 vpxor %ymm13,%ymm11,%ymm11
6612
6613 vmovdqu %ymm10,224-128(%rax)
6614 vpaddd %ymm10,%ymm4,%ymm4
6615 vpor %ymm8,%ymm7,%ymm7
6616 vpsrld $31,%ymm11,%ymm9
6617 vpand %ymm1,%ymm5,%ymm5
6618 vpaddd %ymm11,%ymm11,%ymm11
6619
6620 vpslld $30,%ymm1,%ymm6
6621 vpaddd %ymm5,%ymm4,%ymm4
6622
6623 vpsrld $2,%ymm1,%ymm1
6624 vpaddd %ymm7,%ymm4,%ymm4
6625 vpor %ymm9,%ymm11,%ymm11
6626 vpor %ymm6,%ymm1,%ymm1
6627 vpxor %ymm14,%ymm12,%ymm12
6628 vmovdqa 352-256-128(%rbx),%ymm14
6629
6630 vpaddd %ymm15,%ymm3,%ymm3
6631 vpslld $5,%ymm4,%ymm7
6632 vpand %ymm1,%ymm2,%ymm6
6633 vpxor 32-128(%rax),%ymm12,%ymm12
6634
6635 vpaddd %ymm6,%ymm3,%ymm3
6636 vpsrld $27,%ymm4,%ymm8
6637 vpxor %ymm1,%ymm2,%ymm5
6638 vpxor %ymm14,%ymm12,%ymm12
6639
6640 vmovdqu %ymm11,256-256-128(%rbx)
6641 vpaddd %ymm11,%ymm3,%ymm3
6642 vpor %ymm8,%ymm7,%ymm7
6643 vpsrld $31,%ymm12,%ymm9
6644 vpand %ymm0,%ymm5,%ymm5
6645 vpaddd %ymm12,%ymm12,%ymm12
6646
6647 vpslld $30,%ymm0,%ymm6
6648 vpaddd %ymm5,%ymm3,%ymm3
6649
6650 vpsrld $2,%ymm0,%ymm0
6651 vpaddd %ymm7,%ymm3,%ymm3
6652 vpor %ymm9,%ymm12,%ymm12
6653 vpor %ymm6,%ymm0,%ymm0
6654 vpxor %ymm10,%ymm13,%ymm13
6655 vmovdqa 384-256-128(%rbx),%ymm10
6656
6657 vpaddd %ymm15,%ymm2,%ymm2
6658 vpslld $5,%ymm3,%ymm7
6659 vpand %ymm0,%ymm1,%ymm6
6660 vpxor 64-128(%rax),%ymm13,%ymm13
6661
6662 vpaddd %ymm6,%ymm2,%ymm2
6663 vpsrld $27,%ymm3,%ymm8
6664 vpxor %ymm0,%ymm1,%ymm5
6665 vpxor %ymm10,%ymm13,%ymm13
6666
6667 vmovdqu %ymm12,288-256-128(%rbx)
6668 vpaddd %ymm12,%ymm2,%ymm2
6669 vpor %ymm8,%ymm7,%ymm7
6670 vpsrld $31,%ymm13,%ymm9
6671 vpand %ymm4,%ymm5,%ymm5
6672 vpaddd %ymm13,%ymm13,%ymm13
6673
6674 vpslld $30,%ymm4,%ymm6
6675 vpaddd %ymm5,%ymm2,%ymm2
6676
6677 vpsrld $2,%ymm4,%ymm4
6678 vpaddd %ymm7,%ymm2,%ymm2
6679 vpor %ymm9,%ymm13,%ymm13
6680 vpor %ymm6,%ymm4,%ymm4
6681 vpxor %ymm11,%ymm14,%ymm14
6682 vmovdqa 416-256-128(%rbx),%ymm11
6683
6684 vpaddd %ymm15,%ymm1,%ymm1
6685 vpslld $5,%ymm2,%ymm7
6686 vpand %ymm4,%ymm0,%ymm6
6687 vpxor 96-128(%rax),%ymm14,%ymm14
6688
6689 vpaddd %ymm6,%ymm1,%ymm1
6690 vpsrld $27,%ymm2,%ymm8
6691 vpxor %ymm4,%ymm0,%ymm5
6692 vpxor %ymm11,%ymm14,%ymm14
6693
6694 vmovdqu %ymm13,320-256-128(%rbx)
6695 vpaddd %ymm13,%ymm1,%ymm1
6696 vpor %ymm8,%ymm7,%ymm7
6697 vpsrld $31,%ymm14,%ymm9
6698 vpand %ymm3,%ymm5,%ymm5
6699 vpaddd %ymm14,%ymm14,%ymm14
6700
6701 vpslld $30,%ymm3,%ymm6
6702 vpaddd %ymm5,%ymm1,%ymm1
6703
6704 vpsrld $2,%ymm3,%ymm3
6705 vpaddd %ymm7,%ymm1,%ymm1
6706 vpor %ymm9,%ymm14,%ymm14
6707 vpor %ymm6,%ymm3,%ymm3
6708 vpxor %ymm12,%ymm10,%ymm10
6709 vmovdqa 448-256-128(%rbx),%ymm12
6710
6711 vpaddd %ymm15,%ymm0,%ymm0
6712 vpslld $5,%ymm1,%ymm7
6713 vpand %ymm3,%ymm4,%ymm6
6714 vpxor 128-128(%rax),%ymm10,%ymm10
6715
6716 vpaddd %ymm6,%ymm0,%ymm0
6717 vpsrld $27,%ymm1,%ymm8
6718 vpxor %ymm3,%ymm4,%ymm5
6719 vpxor %ymm12,%ymm10,%ymm10
6720
6721 vmovdqu %ymm14,352-256-128(%rbx)
6722 vpaddd %ymm14,%ymm0,%ymm0
6723 vpor %ymm8,%ymm7,%ymm7
6724 vpsrld $31,%ymm10,%ymm9
6725 vpand %ymm2,%ymm5,%ymm5
6726 vpaddd %ymm10,%ymm10,%ymm10
6727
6728 vpslld $30,%ymm2,%ymm6
6729 vpaddd %ymm5,%ymm0,%ymm0
6730
6731 vpsrld $2,%ymm2,%ymm2
6732 vpaddd %ymm7,%ymm0,%ymm0
6733 vpor %ymm9,%ymm10,%ymm10
6734 vpor %ymm6,%ymm2,%ymm2
6735 vmovdqa 64(%rbp),%ymm15
6736 vpxor %ymm13,%ymm11,%ymm11
6737 vmovdqa 480-256-128(%rbx),%ymm13
6738
6739 vpslld $5,%ymm0,%ymm7
6740 vpaddd %ymm15,%ymm4,%ymm4
6741 vpxor %ymm1,%ymm3,%ymm5
6742 vmovdqa %ymm10,384-256-128(%rbx)
6743 vpaddd %ymm10,%ymm4,%ymm4
6744 vpxor 160-128(%rax),%ymm11,%ymm11
6745 vpsrld $27,%ymm0,%ymm8
6746 vpxor %ymm2,%ymm5,%ymm5
6747 vpxor %ymm13,%ymm11,%ymm11
6748
6749 vpslld $30,%ymm1,%ymm6
6750 vpor %ymm8,%ymm7,%ymm7
6751 vpaddd %ymm5,%ymm4,%ymm4
6752 vpsrld $31,%ymm11,%ymm9
6753 vpaddd %ymm11,%ymm11,%ymm11
6754
6755 vpsrld $2,%ymm1,%ymm1
6756 vpaddd %ymm7,%ymm4,%ymm4
6757 vpor %ymm9,%ymm11,%ymm11
6758 vpor %ymm6,%ymm1,%ymm1
6759 vpxor %ymm14,%ymm12,%ymm12
6760 vmovdqa 0-128(%rax),%ymm14
6761
6762 vpslld $5,%ymm4,%ymm7
6763 vpaddd %ymm15,%ymm3,%ymm3
6764 vpxor %ymm0,%ymm2,%ymm5
6765 vmovdqa %ymm11,416-256-128(%rbx)
6766 vpaddd %ymm11,%ymm3,%ymm3
6767 vpxor 192-128(%rax),%ymm12,%ymm12
6768 vpsrld $27,%ymm4,%ymm8
6769 vpxor %ymm1,%ymm5,%ymm5
6770 vpxor %ymm14,%ymm12,%ymm12
6771
6772 vpslld $30,%ymm0,%ymm6
6773 vpor %ymm8,%ymm7,%ymm7
6774 vpaddd %ymm5,%ymm3,%ymm3
6775 vpsrld $31,%ymm12,%ymm9
6776 vpaddd %ymm12,%ymm12,%ymm12
6777
6778 vpsrld $2,%ymm0,%ymm0
6779 vpaddd %ymm7,%ymm3,%ymm3
6780 vpor %ymm9,%ymm12,%ymm12
6781 vpor %ymm6,%ymm0,%ymm0
6782 vpxor %ymm10,%ymm13,%ymm13
6783 vmovdqa 32-128(%rax),%ymm10
6784
6785 vpslld $5,%ymm3,%ymm7
6786 vpaddd %ymm15,%ymm2,%ymm2
6787 vpxor %ymm4,%ymm1,%ymm5
6788 vmovdqa %ymm12,448-256-128(%rbx)
6789 vpaddd %ymm12,%ymm2,%ymm2
6790 vpxor 224-128(%rax),%ymm13,%ymm13
6791 vpsrld $27,%ymm3,%ymm8
6792 vpxor %ymm0,%ymm5,%ymm5
6793 vpxor %ymm10,%ymm13,%ymm13
6794
6795 vpslld $30,%ymm4,%ymm6
6796 vpor %ymm8,%ymm7,%ymm7
6797 vpaddd %ymm5,%ymm2,%ymm2
6798 vpsrld $31,%ymm13,%ymm9
6799 vpaddd %ymm13,%ymm13,%ymm13
6800
6801 vpsrld $2,%ymm4,%ymm4
6802 vpaddd %ymm7,%ymm2,%ymm2
6803 vpor %ymm9,%ymm13,%ymm13
6804 vpor %ymm6,%ymm4,%ymm4
6805 vpxor %ymm11,%ymm14,%ymm14
6806 vmovdqa 64-128(%rax),%ymm11
6807
6808 vpslld $5,%ymm2,%ymm7
6809 vpaddd %ymm15,%ymm1,%ymm1
6810 vpxor %ymm3,%ymm0,%ymm5
6811 vmovdqa %ymm13,480-256-128(%rbx)
6812 vpaddd %ymm13,%ymm1,%ymm1
6813 vpxor 256-256-128(%rbx),%ymm14,%ymm14
6814 vpsrld $27,%ymm2,%ymm8
6815 vpxor %ymm4,%ymm5,%ymm5
6816 vpxor %ymm11,%ymm14,%ymm14
6817
6818 vpslld $30,%ymm3,%ymm6
6819 vpor %ymm8,%ymm7,%ymm7
6820 vpaddd %ymm5,%ymm1,%ymm1
6821 vpsrld $31,%ymm14,%ymm9
6822 vpaddd %ymm14,%ymm14,%ymm14
6823
6824 vpsrld $2,%ymm3,%ymm3
6825 vpaddd %ymm7,%ymm1,%ymm1
6826 vpor %ymm9,%ymm14,%ymm14
6827 vpor %ymm6,%ymm3,%ymm3
6828 vpxor %ymm12,%ymm10,%ymm10
6829 vmovdqa 96-128(%rax),%ymm12
6830
6831 vpslld $5,%ymm1,%ymm7
6832 vpaddd %ymm15,%ymm0,%ymm0
6833 vpxor %ymm2,%ymm4,%ymm5
6834 vmovdqa %ymm14,0-128(%rax)
6835 vpaddd %ymm14,%ymm0,%ymm0
6836 vpxor 288-256-128(%rbx),%ymm10,%ymm10
6837 vpsrld $27,%ymm1,%ymm8
6838 vpxor %ymm3,%ymm5,%ymm5
6839 vpxor %ymm12,%ymm10,%ymm10
6840
6841 vpslld $30,%ymm2,%ymm6
6842 vpor %ymm8,%ymm7,%ymm7
6843 vpaddd %ymm5,%ymm0,%ymm0
6844 vpsrld $31,%ymm10,%ymm9
6845 vpaddd %ymm10,%ymm10,%ymm10
6846
6847 vpsrld $2,%ymm2,%ymm2
6848 vpaddd %ymm7,%ymm0,%ymm0
6849 vpor %ymm9,%ymm10,%ymm10
6850 vpor %ymm6,%ymm2,%ymm2
6851 vpxor %ymm13,%ymm11,%ymm11
6852 vmovdqa 128-128(%rax),%ymm13
6853
6854 vpslld $5,%ymm0,%ymm7
6855 vpaddd %ymm15,%ymm4,%ymm4
6856 vpxor %ymm1,%ymm3,%ymm5
6857 vmovdqa %ymm10,32-128(%rax)
6858 vpaddd %ymm10,%ymm4,%ymm4
6859 vpxor 320-256-128(%rbx),%ymm11,%ymm11
6860 vpsrld $27,%ymm0,%ymm8
6861 vpxor %ymm2,%ymm5,%ymm5
6862 vpxor %ymm13,%ymm11,%ymm11
6863
6864 vpslld $30,%ymm1,%ymm6
6865 vpor %ymm8,%ymm7,%ymm7
6866 vpaddd %ymm5,%ymm4,%ymm4
6867 vpsrld $31,%ymm11,%ymm9
6868 vpaddd %ymm11,%ymm11,%ymm11
6869
6870 vpsrld $2,%ymm1,%ymm1
6871 vpaddd %ymm7,%ymm4,%ymm4
6872 vpor %ymm9,%ymm11,%ymm11
6873 vpor %ymm6,%ymm1,%ymm1
6874 vpxor %ymm14,%ymm12,%ymm12
6875 vmovdqa 160-128(%rax),%ymm14
6876
6877 vpslld $5,%ymm4,%ymm7
6878 vpaddd %ymm15,%ymm3,%ymm3
6879 vpxor %ymm0,%ymm2,%ymm5
6880 vmovdqa %ymm11,64-128(%rax)
6881 vpaddd %ymm11,%ymm3,%ymm3
6882 vpxor 352-256-128(%rbx),%ymm12,%ymm12
6883 vpsrld $27,%ymm4,%ymm8
6884 vpxor %ymm1,%ymm5,%ymm5
6885 vpxor %ymm14,%ymm12,%ymm12
6886
6887 vpslld $30,%ymm0,%ymm6
6888 vpor %ymm8,%ymm7,%ymm7
6889 vpaddd %ymm5,%ymm3,%ymm3
6890 vpsrld $31,%ymm12,%ymm9
6891 vpaddd %ymm12,%ymm12,%ymm12
6892
6893 vpsrld $2,%ymm0,%ymm0
6894 vpaddd %ymm7,%ymm3,%ymm3
6895 vpor %ymm9,%ymm12,%ymm12
6896 vpor %ymm6,%ymm0,%ymm0
6897 vpxor %ymm10,%ymm13,%ymm13
6898 vmovdqa 192-128(%rax),%ymm10
6899
6900 vpslld $5,%ymm3,%ymm7
6901 vpaddd %ymm15,%ymm2,%ymm2
6902 vpxor %ymm4,%ymm1,%ymm5
6903 vmovdqa %ymm12,96-128(%rax)
6904 vpaddd %ymm12,%ymm2,%ymm2
6905 vpxor 384-256-128(%rbx),%ymm13,%ymm13
6906 vpsrld $27,%ymm3,%ymm8
6907 vpxor %ymm0,%ymm5,%ymm5
6908 vpxor %ymm10,%ymm13,%ymm13
6909
6910 vpslld $30,%ymm4,%ymm6
6911 vpor %ymm8,%ymm7,%ymm7
6912 vpaddd %ymm5,%ymm2,%ymm2
6913 vpsrld $31,%ymm13,%ymm9
6914 vpaddd %ymm13,%ymm13,%ymm13
6915
6916 vpsrld $2,%ymm4,%ymm4
6917 vpaddd %ymm7,%ymm2,%ymm2
6918 vpor %ymm9,%ymm13,%ymm13
6919 vpor %ymm6,%ymm4,%ymm4
6920 vpxor %ymm11,%ymm14,%ymm14
6921 vmovdqa 224-128(%rax),%ymm11
6922
6923 vpslld $5,%ymm2,%ymm7
6924 vpaddd %ymm15,%ymm1,%ymm1
6925 vpxor %ymm3,%ymm0,%ymm5
6926 vmovdqa %ymm13,128-128(%rax)
6927 vpaddd %ymm13,%ymm1,%ymm1
6928 vpxor 416-256-128(%rbx),%ymm14,%ymm14
6929 vpsrld $27,%ymm2,%ymm8
6930 vpxor %ymm4,%ymm5,%ymm5
6931 vpxor %ymm11,%ymm14,%ymm14
6932
6933 vpslld $30,%ymm3,%ymm6
6934 vpor %ymm8,%ymm7,%ymm7
6935 vpaddd %ymm5,%ymm1,%ymm1
6936 vpsrld $31,%ymm14,%ymm9
6937 vpaddd %ymm14,%ymm14,%ymm14
6938
6939 vpsrld $2,%ymm3,%ymm3
6940 vpaddd %ymm7,%ymm1,%ymm1
6941 vpor %ymm9,%ymm14,%ymm14
6942 vpor %ymm6,%ymm3,%ymm3
6943 vpxor %ymm12,%ymm10,%ymm10
6944 vmovdqa 256-256-128(%rbx),%ymm12
6945
6946 vpslld $5,%ymm1,%ymm7
6947 vpaddd %ymm15,%ymm0,%ymm0
6948 vpxor %ymm2,%ymm4,%ymm5
6949 vmovdqa %ymm14,160-128(%rax)
6950 vpaddd %ymm14,%ymm0,%ymm0
6951 vpxor 448-256-128(%rbx),%ymm10,%ymm10
6952 vpsrld $27,%ymm1,%ymm8
6953 vpxor %ymm3,%ymm5,%ymm5
6954 vpxor %ymm12,%ymm10,%ymm10
6955
6956 vpslld $30,%ymm2,%ymm6
6957 vpor %ymm8,%ymm7,%ymm7
6958 vpaddd %ymm5,%ymm0,%ymm0
6959 vpsrld $31,%ymm10,%ymm9
6960 vpaddd %ymm10,%ymm10,%ymm10
6961
6962 vpsrld $2,%ymm2,%ymm2
6963 vpaddd %ymm7,%ymm0,%ymm0
6964 vpor %ymm9,%ymm10,%ymm10
6965 vpor %ymm6,%ymm2,%ymm2
6966 vpxor %ymm13,%ymm11,%ymm11
6967 vmovdqa 288-256-128(%rbx),%ymm13
6968
6969 vpslld $5,%ymm0,%ymm7
6970 vpaddd %ymm15,%ymm4,%ymm4
6971 vpxor %ymm1,%ymm3,%ymm5
6972 vmovdqa %ymm10,192-128(%rax)
6973 vpaddd %ymm10,%ymm4,%ymm4
6974 vpxor 480-256-128(%rbx),%ymm11,%ymm11
6975 vpsrld $27,%ymm0,%ymm8
6976 vpxor %ymm2,%ymm5,%ymm5
6977 vpxor %ymm13,%ymm11,%ymm11
6978
6979 vpslld $30,%ymm1,%ymm6
6980 vpor %ymm8,%ymm7,%ymm7
6981 vpaddd %ymm5,%ymm4,%ymm4
6982 vpsrld $31,%ymm11,%ymm9
6983 vpaddd %ymm11,%ymm11,%ymm11
6984
6985 vpsrld $2,%ymm1,%ymm1
6986 vpaddd %ymm7,%ymm4,%ymm4
6987 vpor %ymm9,%ymm11,%ymm11
6988 vpor %ymm6,%ymm1,%ymm1
6989 vpxor %ymm14,%ymm12,%ymm12
6990 vmovdqa 320-256-128(%rbx),%ymm14
6991
6992 vpslld $5,%ymm4,%ymm7
6993 vpaddd %ymm15,%ymm3,%ymm3
6994 vpxor %ymm0,%ymm2,%ymm5
6995 vmovdqa %ymm11,224-128(%rax)
6996 vpaddd %ymm11,%ymm3,%ymm3
6997 vpxor 0-128(%rax),%ymm12,%ymm12
6998 vpsrld $27,%ymm4,%ymm8
6999 vpxor %ymm1,%ymm5,%ymm5
7000 vpxor %ymm14,%ymm12,%ymm12
7001
7002 vpslld $30,%ymm0,%ymm6
7003 vpor %ymm8,%ymm7,%ymm7
7004 vpaddd %ymm5,%ymm3,%ymm3
7005 vpsrld $31,%ymm12,%ymm9
7006 vpaddd %ymm12,%ymm12,%ymm12
7007
7008 vpsrld $2,%ymm0,%ymm0
7009 vpaddd %ymm7,%ymm3,%ymm3
7010 vpor %ymm9,%ymm12,%ymm12
7011 vpor %ymm6,%ymm0,%ymm0
7012 vpxor %ymm10,%ymm13,%ymm13
7013 vmovdqa 352-256-128(%rbx),%ymm10
7014
7015 vpslld $5,%ymm3,%ymm7
7016 vpaddd %ymm15,%ymm2,%ymm2
7017 vpxor %ymm4,%ymm1,%ymm5
7018 vpaddd %ymm12,%ymm2,%ymm2
7019 vpxor 32-128(%rax),%ymm13,%ymm13
7020 vpsrld $27,%ymm3,%ymm8
7021 vpxor %ymm0,%ymm5,%ymm5
7022 vpxor %ymm10,%ymm13,%ymm13
7023
7024 vpslld $30,%ymm4,%ymm6
7025 vpor %ymm8,%ymm7,%ymm7
7026 vpaddd %ymm5,%ymm2,%ymm2
7027 vpsrld $31,%ymm13,%ymm9
7028 vpaddd %ymm13,%ymm13,%ymm13
7029
7030 vpsrld $2,%ymm4,%ymm4
7031 vpaddd %ymm7,%ymm2,%ymm2
7032 vpor %ymm9,%ymm13,%ymm13
7033 vpor %ymm6,%ymm4,%ymm4
7034 vpxor %ymm11,%ymm14,%ymm14
7035 vmovdqa 384-256-128(%rbx),%ymm11
7036
7037 vpslld $5,%ymm2,%ymm7
7038 vpaddd %ymm15,%ymm1,%ymm1
7039 vpxor %ymm3,%ymm0,%ymm5
7040 vpaddd %ymm13,%ymm1,%ymm1
7041 vpxor 64-128(%rax),%ymm14,%ymm14
7042 vpsrld $27,%ymm2,%ymm8
7043 vpxor %ymm4,%ymm5,%ymm5
7044 vpxor %ymm11,%ymm14,%ymm14
7045
7046 vpslld $30,%ymm3,%ymm6
7047 vpor %ymm8,%ymm7,%ymm7
7048 vpaddd %ymm5,%ymm1,%ymm1
7049 vpsrld $31,%ymm14,%ymm9
7050 vpaddd %ymm14,%ymm14,%ymm14
7051
7052 vpsrld $2,%ymm3,%ymm3
7053 vpaddd %ymm7,%ymm1,%ymm1
7054 vpor %ymm9,%ymm14,%ymm14
7055 vpor %ymm6,%ymm3,%ymm3
7056 vpxor %ymm12,%ymm10,%ymm10
7057 vmovdqa 416-256-128(%rbx),%ymm12
7058
7059 vpslld $5,%ymm1,%ymm7
7060 vpaddd %ymm15,%ymm0,%ymm0
7061 vpxor %ymm2,%ymm4,%ymm5
7062 vpaddd %ymm14,%ymm0,%ymm0
7063 vpxor 96-128(%rax),%ymm10,%ymm10
7064 vpsrld $27,%ymm1,%ymm8
7065 vpxor %ymm3,%ymm5,%ymm5
7066 vpxor %ymm12,%ymm10,%ymm10
7067
7068 vpslld $30,%ymm2,%ymm6
7069 vpor %ymm8,%ymm7,%ymm7
7070 vpaddd %ymm5,%ymm0,%ymm0
7071 vpsrld $31,%ymm10,%ymm9
7072 vpaddd %ymm10,%ymm10,%ymm10
7073
7074 vpsrld $2,%ymm2,%ymm2
7075 vpaddd %ymm7,%ymm0,%ymm0
7076 vpor %ymm9,%ymm10,%ymm10
7077 vpor %ymm6,%ymm2,%ymm2
7078 vpxor %ymm13,%ymm11,%ymm11
7079 vmovdqa 448-256-128(%rbx),%ymm13
7080
7081 vpslld $5,%ymm0,%ymm7
7082 vpaddd %ymm15,%ymm4,%ymm4
7083 vpxor %ymm1,%ymm3,%ymm5
7084 vpaddd %ymm10,%ymm4,%ymm4
7085 vpxor 128-128(%rax),%ymm11,%ymm11
7086 vpsrld $27,%ymm0,%ymm8
7087 vpxor %ymm2,%ymm5,%ymm5
7088 vpxor %ymm13,%ymm11,%ymm11
7089
7090 vpslld $30,%ymm1,%ymm6
7091 vpor %ymm8,%ymm7,%ymm7
7092 vpaddd %ymm5,%ymm4,%ymm4
7093 vpsrld $31,%ymm11,%ymm9
7094 vpaddd %ymm11,%ymm11,%ymm11
7095
7096 vpsrld $2,%ymm1,%ymm1
7097 vpaddd %ymm7,%ymm4,%ymm4
7098 vpor %ymm9,%ymm11,%ymm11
7099 vpor %ymm6,%ymm1,%ymm1
7100 vpxor %ymm14,%ymm12,%ymm12
7101 vmovdqa 480-256-128(%rbx),%ymm14
7102
7103 vpslld $5,%ymm4,%ymm7
7104 vpaddd %ymm15,%ymm3,%ymm3
7105 vpxor %ymm0,%ymm2,%ymm5
7106 vpaddd %ymm11,%ymm3,%ymm3
7107 vpxor 160-128(%rax),%ymm12,%ymm12
7108 vpsrld $27,%ymm4,%ymm8
7109 vpxor %ymm1,%ymm5,%ymm5
7110 vpxor %ymm14,%ymm12,%ymm12
7111
7112 vpslld $30,%ymm0,%ymm6
7113 vpor %ymm8,%ymm7,%ymm7
7114 vpaddd %ymm5,%ymm3,%ymm3
7115 vpsrld $31,%ymm12,%ymm9
7116 vpaddd %ymm12,%ymm12,%ymm12
7117
7118 vpsrld $2,%ymm0,%ymm0
7119 vpaddd %ymm7,%ymm3,%ymm3
7120 vpor %ymm9,%ymm12,%ymm12
7121 vpor %ymm6,%ymm0,%ymm0
7122 vpxor %ymm10,%ymm13,%ymm13
7123 vmovdqa 0-128(%rax),%ymm10
7124
7125 vpslld $5,%ymm3,%ymm7
7126 vpaddd %ymm15,%ymm2,%ymm2
7127 vpxor %ymm4,%ymm1,%ymm5
7128 vpaddd %ymm12,%ymm2,%ymm2
7129 vpxor 192-128(%rax),%ymm13,%ymm13
7130 vpsrld $27,%ymm3,%ymm8
7131 vpxor %ymm0,%ymm5,%ymm5
7132 vpxor %ymm10,%ymm13,%ymm13
7133
7134 vpslld $30,%ymm4,%ymm6
7135 vpor %ymm8,%ymm7,%ymm7
7136 vpaddd %ymm5,%ymm2,%ymm2
7137 vpsrld $31,%ymm13,%ymm9
7138 vpaddd %ymm13,%ymm13,%ymm13
7139
7140 vpsrld $2,%ymm4,%ymm4
7141 vpaddd %ymm7,%ymm2,%ymm2
7142 vpor %ymm9,%ymm13,%ymm13
7143 vpor %ymm6,%ymm4,%ymm4
7144 vpxor %ymm11,%ymm14,%ymm14
7145 vmovdqa 32-128(%rax),%ymm11
7146
7147 vpslld $5,%ymm2,%ymm7
7148 vpaddd %ymm15,%ymm1,%ymm1
7149 vpxor %ymm3,%ymm0,%ymm5
7150 vpaddd %ymm13,%ymm1,%ymm1
7151 vpxor 224-128(%rax),%ymm14,%ymm14
7152 vpsrld $27,%ymm2,%ymm8
7153 vpxor %ymm4,%ymm5,%ymm5
7154 vpxor %ymm11,%ymm14,%ymm14
7155
7156 vpslld $30,%ymm3,%ymm6
7157 vpor %ymm8,%ymm7,%ymm7
7158 vpaddd %ymm5,%ymm1,%ymm1
7159 vpsrld $31,%ymm14,%ymm9
7160 vpaddd %ymm14,%ymm14,%ymm14
7161
7162 vpsrld $2,%ymm3,%ymm3
7163 vpaddd %ymm7,%ymm1,%ymm1
7164 vpor %ymm9,%ymm14,%ymm14
7165 vpor %ymm6,%ymm3,%ymm3
7166 vpslld $5,%ymm1,%ymm7
7167 vpaddd %ymm15,%ymm0,%ymm0
7168 vpxor %ymm2,%ymm4,%ymm5
7169
7170 vpsrld $27,%ymm1,%ymm8
7171 vpaddd %ymm14,%ymm0,%ymm0
7172 vpxor %ymm3,%ymm5,%ymm5
7173
7174 vpslld $30,%ymm2,%ymm6
7175 vpor %ymm8,%ymm7,%ymm7
7176 vpaddd %ymm5,%ymm0,%ymm0
7177
7178 vpsrld $2,%ymm2,%ymm2
7179 vpaddd %ymm7,%ymm0,%ymm0
7180 vpor %ymm6,%ymm2,%ymm2
7181 movl $1,%ecx
7182 leaq 512(%rsp),%rbx
7183 cmpl 0(%rbx),%ecx
7184 cmovgeq %rbp,%r12
7185 cmpl 4(%rbx),%ecx
7186 cmovgeq %rbp,%r13
7187 cmpl 8(%rbx),%ecx
7188 cmovgeq %rbp,%r14
7189 cmpl 12(%rbx),%ecx
7190 cmovgeq %rbp,%r15
7191 cmpl 16(%rbx),%ecx
7192 cmovgeq %rbp,%r8
7193 cmpl 20(%rbx),%ecx
7194 cmovgeq %rbp,%r9
7195 cmpl 24(%rbx),%ecx
7196 cmovgeq %rbp,%r10
7197 cmpl 28(%rbx),%ecx
7198 cmovgeq %rbp,%r11
7199 vmovdqu (%rbx),%ymm5
7200 vpxor %ymm7,%ymm7,%ymm7
7201 vmovdqa %ymm5,%ymm6
7202 vpcmpgtd %ymm7,%ymm6,%ymm6
7203 vpaddd %ymm6,%ymm5,%ymm5
7204
7205 vpand %ymm6,%ymm0,%ymm0
7206 vpand %ymm6,%ymm1,%ymm1
7207 vpaddd 0(%rdi),%ymm0,%ymm0
7208 vpand %ymm6,%ymm2,%ymm2
7209 vpaddd 32(%rdi),%ymm1,%ymm1
7210 vpand %ymm6,%ymm3,%ymm3
7211 vpaddd 64(%rdi),%ymm2,%ymm2
7212 vpand %ymm6,%ymm4,%ymm4
7213 vpaddd 96(%rdi),%ymm3,%ymm3
7214 vpaddd 128(%rdi),%ymm4,%ymm4
7215 vmovdqu %ymm0,0(%rdi)
7216 vmovdqu %ymm1,32(%rdi)
7217 vmovdqu %ymm2,64(%rdi)
7218 vmovdqu %ymm3,96(%rdi)
7219 vmovdqu %ymm4,128(%rdi)
7220
7221 vmovdqu %ymm5,(%rbx)
7222 leaq 256+128(%rsp),%rbx
7223 vmovdqu 96(%rbp),%ymm9
7224 decl %edx
7225 jnz .Loop_avx2
7226
7227
7228
7229
7230
7231
7232
7233 .Ldone_avx2:
7234 movq 544(%rsp),%rax
7235 .cfi_def_cfa %rax,8
7236 vzeroupper
7237 movq -48(%rax),%r15
7238 .cfi_restore %r15
7239 movq -40(%rax),%r14
7240 .cfi_restore %r14
7241 movq -32(%rax),%r13
7242 .cfi_restore %r13
7243 movq -24(%rax),%r12
7244 .cfi_restore %r12
7245 movq -16(%rax),%rbp
7246 .cfi_restore %rbp
7247 movq -8(%rax),%rbx
7248 .cfi_restore %rbx
7249 leaq (%rax),%rsp
7250 .cfi_def_cfa_register %rsp
7251 .Lepilogue_avx2:
7252 .byte 0xf3,0xc3
7253 .cfi_endproc
7254 .size sha1_multi_block_avx2,.-sha1_multi_block_avx2
7255
7256 .align 256
7257 .long 0x5a827999,0x5a827999,0x5a827999,0x5a827999
7258 .long 0x5a827999,0x5a827999,0x5a827999,0x5a827999
7259 K_XX_XX:
7260 .long 0x6ed9eba1,0x6ed9eba1,0x6ed9eba1,0x6ed9eba1
7261 .long 0x6ed9eba1,0x6ed9eba1,0x6ed9eba1,0x6ed9eba1
7262 .long 0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc
7263 .long 0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc,0x8f1bbcdc
7264 .long 0xca62c1d6,0xca62c1d6,0xca62c1d6,0xca62c1d6
7265 .long 0xca62c1d6,0xca62c1d6,0xca62c1d6,0xca62c1d6
7266 .long 0x00010203,0x04050607,0x08090a0b,0x0c0d0e0f
7267 .long 0x00010203,0x04050607,0x08090a0b,0x0c0d0e0f
7268 .byte 0xf,0xe,0xd,0xc,0xb,0xa,0x9,0x8,0x7,0x6,0x5,0x4,0x3,0x2,0x1,0x0
7269 .byte 83,72,65,49,32,109,117,108,116,105,45,98,108,111,99,107,32,116,114,97,110,115,102,111,114,109,32,102,111,114,32,120,56,54,95,54,52,44,32,67,82,89,80,84,79,71,65,77,83,32,98,121,32,60,97,112,112,114,111,64,111,112,101,110,115,115,108,46,111,114,103,62,0
Cache object: 390d6c789cdaa63f0f6e96ec6e0abd58
|