1 /* $FreeBSD$ */
2 /* Do not modify. This file is auto-generated from sha256-mb-x86_64.pl. */
3 .text
4
5
6
7 .globl sha256_multi_block
8 .type sha256_multi_block,@function
9 .align 32
10 sha256_multi_block:
11 .cfi_startproc
12 movq OPENSSL_ia32cap_P+4(%rip),%rcx
13 btq $61,%rcx
14 jc _shaext_shortcut
15 testl $268435456,%ecx
16 jnz _avx_shortcut
17 movq %rsp,%rax
18 .cfi_def_cfa_register %rax
19 pushq %rbx
20 .cfi_offset %rbx,-16
21 pushq %rbp
22 .cfi_offset %rbp,-24
23 subq $288,%rsp
24 andq $-256,%rsp
25 movq %rax,272(%rsp)
26 .cfi_escape 0x0f,0x06,0x77,0x90,0x02,0x06,0x23,0x08
27 .Lbody:
28 leaq K256+128(%rip),%rbp
29 leaq 256(%rsp),%rbx
30 leaq 128(%rdi),%rdi
31
32 .Loop_grande:
33 movl %edx,280(%rsp)
34 xorl %edx,%edx
35 movq 0(%rsi),%r8
36 movl 8(%rsi),%ecx
37 cmpl %edx,%ecx
38 cmovgl %ecx,%edx
39 testl %ecx,%ecx
40 movl %ecx,0(%rbx)
41 cmovleq %rbp,%r8
42 movq 16(%rsi),%r9
43 movl 24(%rsi),%ecx
44 cmpl %edx,%ecx
45 cmovgl %ecx,%edx
46 testl %ecx,%ecx
47 movl %ecx,4(%rbx)
48 cmovleq %rbp,%r9
49 movq 32(%rsi),%r10
50 movl 40(%rsi),%ecx
51 cmpl %edx,%ecx
52 cmovgl %ecx,%edx
53 testl %ecx,%ecx
54 movl %ecx,8(%rbx)
55 cmovleq %rbp,%r10
56 movq 48(%rsi),%r11
57 movl 56(%rsi),%ecx
58 cmpl %edx,%ecx
59 cmovgl %ecx,%edx
60 testl %ecx,%ecx
61 movl %ecx,12(%rbx)
62 cmovleq %rbp,%r11
63 testl %edx,%edx
64 jz .Ldone
65
66 movdqu 0-128(%rdi),%xmm8
67 leaq 128(%rsp),%rax
68 movdqu 32-128(%rdi),%xmm9
69 movdqu 64-128(%rdi),%xmm10
70 movdqu 96-128(%rdi),%xmm11
71 movdqu 128-128(%rdi),%xmm12
72 movdqu 160-128(%rdi),%xmm13
73 movdqu 192-128(%rdi),%xmm14
74 movdqu 224-128(%rdi),%xmm15
75 movdqu .Lpbswap(%rip),%xmm6
76 jmp .Loop
77
78 .align 32
79 .Loop:
80 movdqa %xmm10,%xmm4
81 pxor %xmm9,%xmm4
82 movd 0(%r8),%xmm5
83 movd 0(%r9),%xmm0
84 movd 0(%r10),%xmm1
85 movd 0(%r11),%xmm2
86 punpckldq %xmm1,%xmm5
87 punpckldq %xmm2,%xmm0
88 punpckldq %xmm0,%xmm5
89 movdqa %xmm12,%xmm7
90 .byte 102,15,56,0,238
91 movdqa %xmm12,%xmm2
92
93 psrld $6,%xmm7
94 movdqa %xmm12,%xmm1
95 pslld $7,%xmm2
96 movdqa %xmm5,0-128(%rax)
97 paddd %xmm15,%xmm5
98
99 psrld $11,%xmm1
100 pxor %xmm2,%xmm7
101 pslld $21-7,%xmm2
102 paddd -128(%rbp),%xmm5
103 pxor %xmm1,%xmm7
104
105 psrld $25-11,%xmm1
106 movdqa %xmm12,%xmm0
107
108 pxor %xmm2,%xmm7
109 movdqa %xmm12,%xmm3
110 pslld $26-21,%xmm2
111 pandn %xmm14,%xmm0
112 pand %xmm13,%xmm3
113 pxor %xmm1,%xmm7
114
115
116 movdqa %xmm8,%xmm1
117 pxor %xmm2,%xmm7
118 movdqa %xmm8,%xmm2
119 psrld $2,%xmm1
120 paddd %xmm7,%xmm5
121 pxor %xmm3,%xmm0
122 movdqa %xmm9,%xmm3
123 movdqa %xmm8,%xmm7
124 pslld $10,%xmm2
125 pxor %xmm8,%xmm3
126
127
128 psrld $13,%xmm7
129 pxor %xmm2,%xmm1
130 paddd %xmm0,%xmm5
131 pslld $19-10,%xmm2
132 pand %xmm3,%xmm4
133 pxor %xmm7,%xmm1
134
135
136 psrld $22-13,%xmm7
137 pxor %xmm2,%xmm1
138 movdqa %xmm9,%xmm15
139 pslld $30-19,%xmm2
140 pxor %xmm1,%xmm7
141 pxor %xmm4,%xmm15
142 paddd %xmm5,%xmm11
143 pxor %xmm2,%xmm7
144
145 paddd %xmm5,%xmm15
146 paddd %xmm7,%xmm15
147 movd 4(%r8),%xmm5
148 movd 4(%r9),%xmm0
149 movd 4(%r10),%xmm1
150 movd 4(%r11),%xmm2
151 punpckldq %xmm1,%xmm5
152 punpckldq %xmm2,%xmm0
153 punpckldq %xmm0,%xmm5
154 movdqa %xmm11,%xmm7
155
156 movdqa %xmm11,%xmm2
157 .byte 102,15,56,0,238
158 psrld $6,%xmm7
159 movdqa %xmm11,%xmm1
160 pslld $7,%xmm2
161 movdqa %xmm5,16-128(%rax)
162 paddd %xmm14,%xmm5
163
164 psrld $11,%xmm1
165 pxor %xmm2,%xmm7
166 pslld $21-7,%xmm2
167 paddd -96(%rbp),%xmm5
168 pxor %xmm1,%xmm7
169
170 psrld $25-11,%xmm1
171 movdqa %xmm11,%xmm0
172
173 pxor %xmm2,%xmm7
174 movdqa %xmm11,%xmm4
175 pslld $26-21,%xmm2
176 pandn %xmm13,%xmm0
177 pand %xmm12,%xmm4
178 pxor %xmm1,%xmm7
179
180
181 movdqa %xmm15,%xmm1
182 pxor %xmm2,%xmm7
183 movdqa %xmm15,%xmm2
184 psrld $2,%xmm1
185 paddd %xmm7,%xmm5
186 pxor %xmm4,%xmm0
187 movdqa %xmm8,%xmm4
188 movdqa %xmm15,%xmm7
189 pslld $10,%xmm2
190 pxor %xmm15,%xmm4
191
192
193 psrld $13,%xmm7
194 pxor %xmm2,%xmm1
195 paddd %xmm0,%xmm5
196 pslld $19-10,%xmm2
197 pand %xmm4,%xmm3
198 pxor %xmm7,%xmm1
199
200
201 psrld $22-13,%xmm7
202 pxor %xmm2,%xmm1
203 movdqa %xmm8,%xmm14
204 pslld $30-19,%xmm2
205 pxor %xmm1,%xmm7
206 pxor %xmm3,%xmm14
207 paddd %xmm5,%xmm10
208 pxor %xmm2,%xmm7
209
210 paddd %xmm5,%xmm14
211 paddd %xmm7,%xmm14
212 movd 8(%r8),%xmm5
213 movd 8(%r9),%xmm0
214 movd 8(%r10),%xmm1
215 movd 8(%r11),%xmm2
216 punpckldq %xmm1,%xmm5
217 punpckldq %xmm2,%xmm0
218 punpckldq %xmm0,%xmm5
219 movdqa %xmm10,%xmm7
220 .byte 102,15,56,0,238
221 movdqa %xmm10,%xmm2
222
223 psrld $6,%xmm7
224 movdqa %xmm10,%xmm1
225 pslld $7,%xmm2
226 movdqa %xmm5,32-128(%rax)
227 paddd %xmm13,%xmm5
228
229 psrld $11,%xmm1
230 pxor %xmm2,%xmm7
231 pslld $21-7,%xmm2
232 paddd -64(%rbp),%xmm5
233 pxor %xmm1,%xmm7
234
235 psrld $25-11,%xmm1
236 movdqa %xmm10,%xmm0
237
238 pxor %xmm2,%xmm7
239 movdqa %xmm10,%xmm3
240 pslld $26-21,%xmm2
241 pandn %xmm12,%xmm0
242 pand %xmm11,%xmm3
243 pxor %xmm1,%xmm7
244
245
246 movdqa %xmm14,%xmm1
247 pxor %xmm2,%xmm7
248 movdqa %xmm14,%xmm2
249 psrld $2,%xmm1
250 paddd %xmm7,%xmm5
251 pxor %xmm3,%xmm0
252 movdqa %xmm15,%xmm3
253 movdqa %xmm14,%xmm7
254 pslld $10,%xmm2
255 pxor %xmm14,%xmm3
256
257
258 psrld $13,%xmm7
259 pxor %xmm2,%xmm1
260 paddd %xmm0,%xmm5
261 pslld $19-10,%xmm2
262 pand %xmm3,%xmm4
263 pxor %xmm7,%xmm1
264
265
266 psrld $22-13,%xmm7
267 pxor %xmm2,%xmm1
268 movdqa %xmm15,%xmm13
269 pslld $30-19,%xmm2
270 pxor %xmm1,%xmm7
271 pxor %xmm4,%xmm13
272 paddd %xmm5,%xmm9
273 pxor %xmm2,%xmm7
274
275 paddd %xmm5,%xmm13
276 paddd %xmm7,%xmm13
277 movd 12(%r8),%xmm5
278 movd 12(%r9),%xmm0
279 movd 12(%r10),%xmm1
280 movd 12(%r11),%xmm2
281 punpckldq %xmm1,%xmm5
282 punpckldq %xmm2,%xmm0
283 punpckldq %xmm0,%xmm5
284 movdqa %xmm9,%xmm7
285
286 movdqa %xmm9,%xmm2
287 .byte 102,15,56,0,238
288 psrld $6,%xmm7
289 movdqa %xmm9,%xmm1
290 pslld $7,%xmm2
291 movdqa %xmm5,48-128(%rax)
292 paddd %xmm12,%xmm5
293
294 psrld $11,%xmm1
295 pxor %xmm2,%xmm7
296 pslld $21-7,%xmm2
297 paddd -32(%rbp),%xmm5
298 pxor %xmm1,%xmm7
299
300 psrld $25-11,%xmm1
301 movdqa %xmm9,%xmm0
302
303 pxor %xmm2,%xmm7
304 movdqa %xmm9,%xmm4
305 pslld $26-21,%xmm2
306 pandn %xmm11,%xmm0
307 pand %xmm10,%xmm4
308 pxor %xmm1,%xmm7
309
310
311 movdqa %xmm13,%xmm1
312 pxor %xmm2,%xmm7
313 movdqa %xmm13,%xmm2
314 psrld $2,%xmm1
315 paddd %xmm7,%xmm5
316 pxor %xmm4,%xmm0
317 movdqa %xmm14,%xmm4
318 movdqa %xmm13,%xmm7
319 pslld $10,%xmm2
320 pxor %xmm13,%xmm4
321
322
323 psrld $13,%xmm7
324 pxor %xmm2,%xmm1
325 paddd %xmm0,%xmm5
326 pslld $19-10,%xmm2
327 pand %xmm4,%xmm3
328 pxor %xmm7,%xmm1
329
330
331 psrld $22-13,%xmm7
332 pxor %xmm2,%xmm1
333 movdqa %xmm14,%xmm12
334 pslld $30-19,%xmm2
335 pxor %xmm1,%xmm7
336 pxor %xmm3,%xmm12
337 paddd %xmm5,%xmm8
338 pxor %xmm2,%xmm7
339
340 paddd %xmm5,%xmm12
341 paddd %xmm7,%xmm12
342 movd 16(%r8),%xmm5
343 movd 16(%r9),%xmm0
344 movd 16(%r10),%xmm1
345 movd 16(%r11),%xmm2
346 punpckldq %xmm1,%xmm5
347 punpckldq %xmm2,%xmm0
348 punpckldq %xmm0,%xmm5
349 movdqa %xmm8,%xmm7
350 .byte 102,15,56,0,238
351 movdqa %xmm8,%xmm2
352
353 psrld $6,%xmm7
354 movdqa %xmm8,%xmm1
355 pslld $7,%xmm2
356 movdqa %xmm5,64-128(%rax)
357 paddd %xmm11,%xmm5
358
359 psrld $11,%xmm1
360 pxor %xmm2,%xmm7
361 pslld $21-7,%xmm2
362 paddd 0(%rbp),%xmm5
363 pxor %xmm1,%xmm7
364
365 psrld $25-11,%xmm1
366 movdqa %xmm8,%xmm0
367
368 pxor %xmm2,%xmm7
369 movdqa %xmm8,%xmm3
370 pslld $26-21,%xmm2
371 pandn %xmm10,%xmm0
372 pand %xmm9,%xmm3
373 pxor %xmm1,%xmm7
374
375
376 movdqa %xmm12,%xmm1
377 pxor %xmm2,%xmm7
378 movdqa %xmm12,%xmm2
379 psrld $2,%xmm1
380 paddd %xmm7,%xmm5
381 pxor %xmm3,%xmm0
382 movdqa %xmm13,%xmm3
383 movdqa %xmm12,%xmm7
384 pslld $10,%xmm2
385 pxor %xmm12,%xmm3
386
387
388 psrld $13,%xmm7
389 pxor %xmm2,%xmm1
390 paddd %xmm0,%xmm5
391 pslld $19-10,%xmm2
392 pand %xmm3,%xmm4
393 pxor %xmm7,%xmm1
394
395
396 psrld $22-13,%xmm7
397 pxor %xmm2,%xmm1
398 movdqa %xmm13,%xmm11
399 pslld $30-19,%xmm2
400 pxor %xmm1,%xmm7
401 pxor %xmm4,%xmm11
402 paddd %xmm5,%xmm15
403 pxor %xmm2,%xmm7
404
405 paddd %xmm5,%xmm11
406 paddd %xmm7,%xmm11
407 movd 20(%r8),%xmm5
408 movd 20(%r9),%xmm0
409 movd 20(%r10),%xmm1
410 movd 20(%r11),%xmm2
411 punpckldq %xmm1,%xmm5
412 punpckldq %xmm2,%xmm0
413 punpckldq %xmm0,%xmm5
414 movdqa %xmm15,%xmm7
415
416 movdqa %xmm15,%xmm2
417 .byte 102,15,56,0,238
418 psrld $6,%xmm7
419 movdqa %xmm15,%xmm1
420 pslld $7,%xmm2
421 movdqa %xmm5,80-128(%rax)
422 paddd %xmm10,%xmm5
423
424 psrld $11,%xmm1
425 pxor %xmm2,%xmm7
426 pslld $21-7,%xmm2
427 paddd 32(%rbp),%xmm5
428 pxor %xmm1,%xmm7
429
430 psrld $25-11,%xmm1
431 movdqa %xmm15,%xmm0
432
433 pxor %xmm2,%xmm7
434 movdqa %xmm15,%xmm4
435 pslld $26-21,%xmm2
436 pandn %xmm9,%xmm0
437 pand %xmm8,%xmm4
438 pxor %xmm1,%xmm7
439
440
441 movdqa %xmm11,%xmm1
442 pxor %xmm2,%xmm7
443 movdqa %xmm11,%xmm2
444 psrld $2,%xmm1
445 paddd %xmm7,%xmm5
446 pxor %xmm4,%xmm0
447 movdqa %xmm12,%xmm4
448 movdqa %xmm11,%xmm7
449 pslld $10,%xmm2
450 pxor %xmm11,%xmm4
451
452
453 psrld $13,%xmm7
454 pxor %xmm2,%xmm1
455 paddd %xmm0,%xmm5
456 pslld $19-10,%xmm2
457 pand %xmm4,%xmm3
458 pxor %xmm7,%xmm1
459
460
461 psrld $22-13,%xmm7
462 pxor %xmm2,%xmm1
463 movdqa %xmm12,%xmm10
464 pslld $30-19,%xmm2
465 pxor %xmm1,%xmm7
466 pxor %xmm3,%xmm10
467 paddd %xmm5,%xmm14
468 pxor %xmm2,%xmm7
469
470 paddd %xmm5,%xmm10
471 paddd %xmm7,%xmm10
472 movd 24(%r8),%xmm5
473 movd 24(%r9),%xmm0
474 movd 24(%r10),%xmm1
475 movd 24(%r11),%xmm2
476 punpckldq %xmm1,%xmm5
477 punpckldq %xmm2,%xmm0
478 punpckldq %xmm0,%xmm5
479 movdqa %xmm14,%xmm7
480 .byte 102,15,56,0,238
481 movdqa %xmm14,%xmm2
482
483 psrld $6,%xmm7
484 movdqa %xmm14,%xmm1
485 pslld $7,%xmm2
486 movdqa %xmm5,96-128(%rax)
487 paddd %xmm9,%xmm5
488
489 psrld $11,%xmm1
490 pxor %xmm2,%xmm7
491 pslld $21-7,%xmm2
492 paddd 64(%rbp),%xmm5
493 pxor %xmm1,%xmm7
494
495 psrld $25-11,%xmm1
496 movdqa %xmm14,%xmm0
497
498 pxor %xmm2,%xmm7
499 movdqa %xmm14,%xmm3
500 pslld $26-21,%xmm2
501 pandn %xmm8,%xmm0
502 pand %xmm15,%xmm3
503 pxor %xmm1,%xmm7
504
505
506 movdqa %xmm10,%xmm1
507 pxor %xmm2,%xmm7
508 movdqa %xmm10,%xmm2
509 psrld $2,%xmm1
510 paddd %xmm7,%xmm5
511 pxor %xmm3,%xmm0
512 movdqa %xmm11,%xmm3
513 movdqa %xmm10,%xmm7
514 pslld $10,%xmm2
515 pxor %xmm10,%xmm3
516
517
518 psrld $13,%xmm7
519 pxor %xmm2,%xmm1
520 paddd %xmm0,%xmm5
521 pslld $19-10,%xmm2
522 pand %xmm3,%xmm4
523 pxor %xmm7,%xmm1
524
525
526 psrld $22-13,%xmm7
527 pxor %xmm2,%xmm1
528 movdqa %xmm11,%xmm9
529 pslld $30-19,%xmm2
530 pxor %xmm1,%xmm7
531 pxor %xmm4,%xmm9
532 paddd %xmm5,%xmm13
533 pxor %xmm2,%xmm7
534
535 paddd %xmm5,%xmm9
536 paddd %xmm7,%xmm9
537 movd 28(%r8),%xmm5
538 movd 28(%r9),%xmm0
539 movd 28(%r10),%xmm1
540 movd 28(%r11),%xmm2
541 punpckldq %xmm1,%xmm5
542 punpckldq %xmm2,%xmm0
543 punpckldq %xmm0,%xmm5
544 movdqa %xmm13,%xmm7
545
546 movdqa %xmm13,%xmm2
547 .byte 102,15,56,0,238
548 psrld $6,%xmm7
549 movdqa %xmm13,%xmm1
550 pslld $7,%xmm2
551 movdqa %xmm5,112-128(%rax)
552 paddd %xmm8,%xmm5
553
554 psrld $11,%xmm1
555 pxor %xmm2,%xmm7
556 pslld $21-7,%xmm2
557 paddd 96(%rbp),%xmm5
558 pxor %xmm1,%xmm7
559
560 psrld $25-11,%xmm1
561 movdqa %xmm13,%xmm0
562
563 pxor %xmm2,%xmm7
564 movdqa %xmm13,%xmm4
565 pslld $26-21,%xmm2
566 pandn %xmm15,%xmm0
567 pand %xmm14,%xmm4
568 pxor %xmm1,%xmm7
569
570
571 movdqa %xmm9,%xmm1
572 pxor %xmm2,%xmm7
573 movdqa %xmm9,%xmm2
574 psrld $2,%xmm1
575 paddd %xmm7,%xmm5
576 pxor %xmm4,%xmm0
577 movdqa %xmm10,%xmm4
578 movdqa %xmm9,%xmm7
579 pslld $10,%xmm2
580 pxor %xmm9,%xmm4
581
582
583 psrld $13,%xmm7
584 pxor %xmm2,%xmm1
585 paddd %xmm0,%xmm5
586 pslld $19-10,%xmm2
587 pand %xmm4,%xmm3
588 pxor %xmm7,%xmm1
589
590
591 psrld $22-13,%xmm7
592 pxor %xmm2,%xmm1
593 movdqa %xmm10,%xmm8
594 pslld $30-19,%xmm2
595 pxor %xmm1,%xmm7
596 pxor %xmm3,%xmm8
597 paddd %xmm5,%xmm12
598 pxor %xmm2,%xmm7
599
600 paddd %xmm5,%xmm8
601 paddd %xmm7,%xmm8
602 leaq 256(%rbp),%rbp
603 movd 32(%r8),%xmm5
604 movd 32(%r9),%xmm0
605 movd 32(%r10),%xmm1
606 movd 32(%r11),%xmm2
607 punpckldq %xmm1,%xmm5
608 punpckldq %xmm2,%xmm0
609 punpckldq %xmm0,%xmm5
610 movdqa %xmm12,%xmm7
611 .byte 102,15,56,0,238
612 movdqa %xmm12,%xmm2
613
614 psrld $6,%xmm7
615 movdqa %xmm12,%xmm1
616 pslld $7,%xmm2
617 movdqa %xmm5,128-128(%rax)
618 paddd %xmm15,%xmm5
619
620 psrld $11,%xmm1
621 pxor %xmm2,%xmm7
622 pslld $21-7,%xmm2
623 paddd -128(%rbp),%xmm5
624 pxor %xmm1,%xmm7
625
626 psrld $25-11,%xmm1
627 movdqa %xmm12,%xmm0
628
629 pxor %xmm2,%xmm7
630 movdqa %xmm12,%xmm3
631 pslld $26-21,%xmm2
632 pandn %xmm14,%xmm0
633 pand %xmm13,%xmm3
634 pxor %xmm1,%xmm7
635
636
637 movdqa %xmm8,%xmm1
638 pxor %xmm2,%xmm7
639 movdqa %xmm8,%xmm2
640 psrld $2,%xmm1
641 paddd %xmm7,%xmm5
642 pxor %xmm3,%xmm0
643 movdqa %xmm9,%xmm3
644 movdqa %xmm8,%xmm7
645 pslld $10,%xmm2
646 pxor %xmm8,%xmm3
647
648
649 psrld $13,%xmm7
650 pxor %xmm2,%xmm1
651 paddd %xmm0,%xmm5
652 pslld $19-10,%xmm2
653 pand %xmm3,%xmm4
654 pxor %xmm7,%xmm1
655
656
657 psrld $22-13,%xmm7
658 pxor %xmm2,%xmm1
659 movdqa %xmm9,%xmm15
660 pslld $30-19,%xmm2
661 pxor %xmm1,%xmm7
662 pxor %xmm4,%xmm15
663 paddd %xmm5,%xmm11
664 pxor %xmm2,%xmm7
665
666 paddd %xmm5,%xmm15
667 paddd %xmm7,%xmm15
668 movd 36(%r8),%xmm5
669 movd 36(%r9),%xmm0
670 movd 36(%r10),%xmm1
671 movd 36(%r11),%xmm2
672 punpckldq %xmm1,%xmm5
673 punpckldq %xmm2,%xmm0
674 punpckldq %xmm0,%xmm5
675 movdqa %xmm11,%xmm7
676
677 movdqa %xmm11,%xmm2
678 .byte 102,15,56,0,238
679 psrld $6,%xmm7
680 movdqa %xmm11,%xmm1
681 pslld $7,%xmm2
682 movdqa %xmm5,144-128(%rax)
683 paddd %xmm14,%xmm5
684
685 psrld $11,%xmm1
686 pxor %xmm2,%xmm7
687 pslld $21-7,%xmm2
688 paddd -96(%rbp),%xmm5
689 pxor %xmm1,%xmm7
690
691 psrld $25-11,%xmm1
692 movdqa %xmm11,%xmm0
693
694 pxor %xmm2,%xmm7
695 movdqa %xmm11,%xmm4
696 pslld $26-21,%xmm2
697 pandn %xmm13,%xmm0
698 pand %xmm12,%xmm4
699 pxor %xmm1,%xmm7
700
701
702 movdqa %xmm15,%xmm1
703 pxor %xmm2,%xmm7
704 movdqa %xmm15,%xmm2
705 psrld $2,%xmm1
706 paddd %xmm7,%xmm5
707 pxor %xmm4,%xmm0
708 movdqa %xmm8,%xmm4
709 movdqa %xmm15,%xmm7
710 pslld $10,%xmm2
711 pxor %xmm15,%xmm4
712
713
714 psrld $13,%xmm7
715 pxor %xmm2,%xmm1
716 paddd %xmm0,%xmm5
717 pslld $19-10,%xmm2
718 pand %xmm4,%xmm3
719 pxor %xmm7,%xmm1
720
721
722 psrld $22-13,%xmm7
723 pxor %xmm2,%xmm1
724 movdqa %xmm8,%xmm14
725 pslld $30-19,%xmm2
726 pxor %xmm1,%xmm7
727 pxor %xmm3,%xmm14
728 paddd %xmm5,%xmm10
729 pxor %xmm2,%xmm7
730
731 paddd %xmm5,%xmm14
732 paddd %xmm7,%xmm14
733 movd 40(%r8),%xmm5
734 movd 40(%r9),%xmm0
735 movd 40(%r10),%xmm1
736 movd 40(%r11),%xmm2
737 punpckldq %xmm1,%xmm5
738 punpckldq %xmm2,%xmm0
739 punpckldq %xmm0,%xmm5
740 movdqa %xmm10,%xmm7
741 .byte 102,15,56,0,238
742 movdqa %xmm10,%xmm2
743
744 psrld $6,%xmm7
745 movdqa %xmm10,%xmm1
746 pslld $7,%xmm2
747 movdqa %xmm5,160-128(%rax)
748 paddd %xmm13,%xmm5
749
750 psrld $11,%xmm1
751 pxor %xmm2,%xmm7
752 pslld $21-7,%xmm2
753 paddd -64(%rbp),%xmm5
754 pxor %xmm1,%xmm7
755
756 psrld $25-11,%xmm1
757 movdqa %xmm10,%xmm0
758
759 pxor %xmm2,%xmm7
760 movdqa %xmm10,%xmm3
761 pslld $26-21,%xmm2
762 pandn %xmm12,%xmm0
763 pand %xmm11,%xmm3
764 pxor %xmm1,%xmm7
765
766
767 movdqa %xmm14,%xmm1
768 pxor %xmm2,%xmm7
769 movdqa %xmm14,%xmm2
770 psrld $2,%xmm1
771 paddd %xmm7,%xmm5
772 pxor %xmm3,%xmm0
773 movdqa %xmm15,%xmm3
774 movdqa %xmm14,%xmm7
775 pslld $10,%xmm2
776 pxor %xmm14,%xmm3
777
778
779 psrld $13,%xmm7
780 pxor %xmm2,%xmm1
781 paddd %xmm0,%xmm5
782 pslld $19-10,%xmm2
783 pand %xmm3,%xmm4
784 pxor %xmm7,%xmm1
785
786
787 psrld $22-13,%xmm7
788 pxor %xmm2,%xmm1
789 movdqa %xmm15,%xmm13
790 pslld $30-19,%xmm2
791 pxor %xmm1,%xmm7
792 pxor %xmm4,%xmm13
793 paddd %xmm5,%xmm9
794 pxor %xmm2,%xmm7
795
796 paddd %xmm5,%xmm13
797 paddd %xmm7,%xmm13
798 movd 44(%r8),%xmm5
799 movd 44(%r9),%xmm0
800 movd 44(%r10),%xmm1
801 movd 44(%r11),%xmm2
802 punpckldq %xmm1,%xmm5
803 punpckldq %xmm2,%xmm0
804 punpckldq %xmm0,%xmm5
805 movdqa %xmm9,%xmm7
806
807 movdqa %xmm9,%xmm2
808 .byte 102,15,56,0,238
809 psrld $6,%xmm7
810 movdqa %xmm9,%xmm1
811 pslld $7,%xmm2
812 movdqa %xmm5,176-128(%rax)
813 paddd %xmm12,%xmm5
814
815 psrld $11,%xmm1
816 pxor %xmm2,%xmm7
817 pslld $21-7,%xmm2
818 paddd -32(%rbp),%xmm5
819 pxor %xmm1,%xmm7
820
821 psrld $25-11,%xmm1
822 movdqa %xmm9,%xmm0
823
824 pxor %xmm2,%xmm7
825 movdqa %xmm9,%xmm4
826 pslld $26-21,%xmm2
827 pandn %xmm11,%xmm0
828 pand %xmm10,%xmm4
829 pxor %xmm1,%xmm7
830
831
832 movdqa %xmm13,%xmm1
833 pxor %xmm2,%xmm7
834 movdqa %xmm13,%xmm2
835 psrld $2,%xmm1
836 paddd %xmm7,%xmm5
837 pxor %xmm4,%xmm0
838 movdqa %xmm14,%xmm4
839 movdqa %xmm13,%xmm7
840 pslld $10,%xmm2
841 pxor %xmm13,%xmm4
842
843
844 psrld $13,%xmm7
845 pxor %xmm2,%xmm1
846 paddd %xmm0,%xmm5
847 pslld $19-10,%xmm2
848 pand %xmm4,%xmm3
849 pxor %xmm7,%xmm1
850
851
852 psrld $22-13,%xmm7
853 pxor %xmm2,%xmm1
854 movdqa %xmm14,%xmm12
855 pslld $30-19,%xmm2
856 pxor %xmm1,%xmm7
857 pxor %xmm3,%xmm12
858 paddd %xmm5,%xmm8
859 pxor %xmm2,%xmm7
860
861 paddd %xmm5,%xmm12
862 paddd %xmm7,%xmm12
863 movd 48(%r8),%xmm5
864 movd 48(%r9),%xmm0
865 movd 48(%r10),%xmm1
866 movd 48(%r11),%xmm2
867 punpckldq %xmm1,%xmm5
868 punpckldq %xmm2,%xmm0
869 punpckldq %xmm0,%xmm5
870 movdqa %xmm8,%xmm7
871 .byte 102,15,56,0,238
872 movdqa %xmm8,%xmm2
873
874 psrld $6,%xmm7
875 movdqa %xmm8,%xmm1
876 pslld $7,%xmm2
877 movdqa %xmm5,192-128(%rax)
878 paddd %xmm11,%xmm5
879
880 psrld $11,%xmm1
881 pxor %xmm2,%xmm7
882 pslld $21-7,%xmm2
883 paddd 0(%rbp),%xmm5
884 pxor %xmm1,%xmm7
885
886 psrld $25-11,%xmm1
887 movdqa %xmm8,%xmm0
888
889 pxor %xmm2,%xmm7
890 movdqa %xmm8,%xmm3
891 pslld $26-21,%xmm2
892 pandn %xmm10,%xmm0
893 pand %xmm9,%xmm3
894 pxor %xmm1,%xmm7
895
896
897 movdqa %xmm12,%xmm1
898 pxor %xmm2,%xmm7
899 movdqa %xmm12,%xmm2
900 psrld $2,%xmm1
901 paddd %xmm7,%xmm5
902 pxor %xmm3,%xmm0
903 movdqa %xmm13,%xmm3
904 movdqa %xmm12,%xmm7
905 pslld $10,%xmm2
906 pxor %xmm12,%xmm3
907
908
909 psrld $13,%xmm7
910 pxor %xmm2,%xmm1
911 paddd %xmm0,%xmm5
912 pslld $19-10,%xmm2
913 pand %xmm3,%xmm4
914 pxor %xmm7,%xmm1
915
916
917 psrld $22-13,%xmm7
918 pxor %xmm2,%xmm1
919 movdqa %xmm13,%xmm11
920 pslld $30-19,%xmm2
921 pxor %xmm1,%xmm7
922 pxor %xmm4,%xmm11
923 paddd %xmm5,%xmm15
924 pxor %xmm2,%xmm7
925
926 paddd %xmm5,%xmm11
927 paddd %xmm7,%xmm11
928 movd 52(%r8),%xmm5
929 movd 52(%r9),%xmm0
930 movd 52(%r10),%xmm1
931 movd 52(%r11),%xmm2
932 punpckldq %xmm1,%xmm5
933 punpckldq %xmm2,%xmm0
934 punpckldq %xmm0,%xmm5
935 movdqa %xmm15,%xmm7
936
937 movdqa %xmm15,%xmm2
938 .byte 102,15,56,0,238
939 psrld $6,%xmm7
940 movdqa %xmm15,%xmm1
941 pslld $7,%xmm2
942 movdqa %xmm5,208-128(%rax)
943 paddd %xmm10,%xmm5
944
945 psrld $11,%xmm1
946 pxor %xmm2,%xmm7
947 pslld $21-7,%xmm2
948 paddd 32(%rbp),%xmm5
949 pxor %xmm1,%xmm7
950
951 psrld $25-11,%xmm1
952 movdqa %xmm15,%xmm0
953
954 pxor %xmm2,%xmm7
955 movdqa %xmm15,%xmm4
956 pslld $26-21,%xmm2
957 pandn %xmm9,%xmm0
958 pand %xmm8,%xmm4
959 pxor %xmm1,%xmm7
960
961
962 movdqa %xmm11,%xmm1
963 pxor %xmm2,%xmm7
964 movdqa %xmm11,%xmm2
965 psrld $2,%xmm1
966 paddd %xmm7,%xmm5
967 pxor %xmm4,%xmm0
968 movdqa %xmm12,%xmm4
969 movdqa %xmm11,%xmm7
970 pslld $10,%xmm2
971 pxor %xmm11,%xmm4
972
973
974 psrld $13,%xmm7
975 pxor %xmm2,%xmm1
976 paddd %xmm0,%xmm5
977 pslld $19-10,%xmm2
978 pand %xmm4,%xmm3
979 pxor %xmm7,%xmm1
980
981
982 psrld $22-13,%xmm7
983 pxor %xmm2,%xmm1
984 movdqa %xmm12,%xmm10
985 pslld $30-19,%xmm2
986 pxor %xmm1,%xmm7
987 pxor %xmm3,%xmm10
988 paddd %xmm5,%xmm14
989 pxor %xmm2,%xmm7
990
991 paddd %xmm5,%xmm10
992 paddd %xmm7,%xmm10
993 movd 56(%r8),%xmm5
994 movd 56(%r9),%xmm0
995 movd 56(%r10),%xmm1
996 movd 56(%r11),%xmm2
997 punpckldq %xmm1,%xmm5
998 punpckldq %xmm2,%xmm0
999 punpckldq %xmm0,%xmm5
1000 movdqa %xmm14,%xmm7
1001 .byte 102,15,56,0,238
1002 movdqa %xmm14,%xmm2
1003
1004 psrld $6,%xmm7
1005 movdqa %xmm14,%xmm1
1006 pslld $7,%xmm2
1007 movdqa %xmm5,224-128(%rax)
1008 paddd %xmm9,%xmm5
1009
1010 psrld $11,%xmm1
1011 pxor %xmm2,%xmm7
1012 pslld $21-7,%xmm2
1013 paddd 64(%rbp),%xmm5
1014 pxor %xmm1,%xmm7
1015
1016 psrld $25-11,%xmm1
1017 movdqa %xmm14,%xmm0
1018
1019 pxor %xmm2,%xmm7
1020 movdqa %xmm14,%xmm3
1021 pslld $26-21,%xmm2
1022 pandn %xmm8,%xmm0
1023 pand %xmm15,%xmm3
1024 pxor %xmm1,%xmm7
1025
1026
1027 movdqa %xmm10,%xmm1
1028 pxor %xmm2,%xmm7
1029 movdqa %xmm10,%xmm2
1030 psrld $2,%xmm1
1031 paddd %xmm7,%xmm5
1032 pxor %xmm3,%xmm0
1033 movdqa %xmm11,%xmm3
1034 movdqa %xmm10,%xmm7
1035 pslld $10,%xmm2
1036 pxor %xmm10,%xmm3
1037
1038
1039 psrld $13,%xmm7
1040 pxor %xmm2,%xmm1
1041 paddd %xmm0,%xmm5
1042 pslld $19-10,%xmm2
1043 pand %xmm3,%xmm4
1044 pxor %xmm7,%xmm1
1045
1046
1047 psrld $22-13,%xmm7
1048 pxor %xmm2,%xmm1
1049 movdqa %xmm11,%xmm9
1050 pslld $30-19,%xmm2
1051 pxor %xmm1,%xmm7
1052 pxor %xmm4,%xmm9
1053 paddd %xmm5,%xmm13
1054 pxor %xmm2,%xmm7
1055
1056 paddd %xmm5,%xmm9
1057 paddd %xmm7,%xmm9
1058 movd 60(%r8),%xmm5
1059 leaq 64(%r8),%r8
1060 movd 60(%r9),%xmm0
1061 leaq 64(%r9),%r9
1062 movd 60(%r10),%xmm1
1063 leaq 64(%r10),%r10
1064 movd 60(%r11),%xmm2
1065 leaq 64(%r11),%r11
1066 punpckldq %xmm1,%xmm5
1067 punpckldq %xmm2,%xmm0
1068 punpckldq %xmm0,%xmm5
1069 movdqa %xmm13,%xmm7
1070
1071 movdqa %xmm13,%xmm2
1072 .byte 102,15,56,0,238
1073 psrld $6,%xmm7
1074 movdqa %xmm13,%xmm1
1075 pslld $7,%xmm2
1076 movdqa %xmm5,240-128(%rax)
1077 paddd %xmm8,%xmm5
1078
1079 psrld $11,%xmm1
1080 pxor %xmm2,%xmm7
1081 pslld $21-7,%xmm2
1082 paddd 96(%rbp),%xmm5
1083 pxor %xmm1,%xmm7
1084
1085 psrld $25-11,%xmm1
1086 movdqa %xmm13,%xmm0
1087 prefetcht0 63(%r8)
1088 pxor %xmm2,%xmm7
1089 movdqa %xmm13,%xmm4
1090 pslld $26-21,%xmm2
1091 pandn %xmm15,%xmm0
1092 pand %xmm14,%xmm4
1093 pxor %xmm1,%xmm7
1094
1095 prefetcht0 63(%r9)
1096 movdqa %xmm9,%xmm1
1097 pxor %xmm2,%xmm7
1098 movdqa %xmm9,%xmm2
1099 psrld $2,%xmm1
1100 paddd %xmm7,%xmm5
1101 pxor %xmm4,%xmm0
1102 movdqa %xmm10,%xmm4
1103 movdqa %xmm9,%xmm7
1104 pslld $10,%xmm2
1105 pxor %xmm9,%xmm4
1106
1107 prefetcht0 63(%r10)
1108 psrld $13,%xmm7
1109 pxor %xmm2,%xmm1
1110 paddd %xmm0,%xmm5
1111 pslld $19-10,%xmm2
1112 pand %xmm4,%xmm3
1113 pxor %xmm7,%xmm1
1114
1115 prefetcht0 63(%r11)
1116 psrld $22-13,%xmm7
1117 pxor %xmm2,%xmm1
1118 movdqa %xmm10,%xmm8
1119 pslld $30-19,%xmm2
1120 pxor %xmm1,%xmm7
1121 pxor %xmm3,%xmm8
1122 paddd %xmm5,%xmm12
1123 pxor %xmm2,%xmm7
1124
1125 paddd %xmm5,%xmm8
1126 paddd %xmm7,%xmm8
1127 leaq 256(%rbp),%rbp
1128 movdqu 0-128(%rax),%xmm5
1129 movl $3,%ecx
1130 jmp .Loop_16_xx
1131 .align 32
1132 .Loop_16_xx:
1133 movdqa 16-128(%rax),%xmm6
1134 paddd 144-128(%rax),%xmm5
1135
1136 movdqa %xmm6,%xmm7
1137 movdqa %xmm6,%xmm1
1138 psrld $3,%xmm7
1139 movdqa %xmm6,%xmm2
1140
1141 psrld $7,%xmm1
1142 movdqa 224-128(%rax),%xmm0
1143 pslld $14,%xmm2
1144 pxor %xmm1,%xmm7
1145 psrld $18-7,%xmm1
1146 movdqa %xmm0,%xmm3
1147 pxor %xmm2,%xmm7
1148 pslld $25-14,%xmm2
1149 pxor %xmm1,%xmm7
1150 psrld $10,%xmm0
1151 movdqa %xmm3,%xmm1
1152
1153 psrld $17,%xmm3
1154 pxor %xmm2,%xmm7
1155 pslld $13,%xmm1
1156 paddd %xmm7,%xmm5
1157 pxor %xmm3,%xmm0
1158 psrld $19-17,%xmm3
1159 pxor %xmm1,%xmm0
1160 pslld $15-13,%xmm1
1161 pxor %xmm3,%xmm0
1162 pxor %xmm1,%xmm0
1163 paddd %xmm0,%xmm5
1164 movdqa %xmm12,%xmm7
1165
1166 movdqa %xmm12,%xmm2
1167
1168 psrld $6,%xmm7
1169 movdqa %xmm12,%xmm1
1170 pslld $7,%xmm2
1171 movdqa %xmm5,0-128(%rax)
1172 paddd %xmm15,%xmm5
1173
1174 psrld $11,%xmm1
1175 pxor %xmm2,%xmm7
1176 pslld $21-7,%xmm2
1177 paddd -128(%rbp),%xmm5
1178 pxor %xmm1,%xmm7
1179
1180 psrld $25-11,%xmm1
1181 movdqa %xmm12,%xmm0
1182
1183 pxor %xmm2,%xmm7
1184 movdqa %xmm12,%xmm3
1185 pslld $26-21,%xmm2
1186 pandn %xmm14,%xmm0
1187 pand %xmm13,%xmm3
1188 pxor %xmm1,%xmm7
1189
1190
1191 movdqa %xmm8,%xmm1
1192 pxor %xmm2,%xmm7
1193 movdqa %xmm8,%xmm2
1194 psrld $2,%xmm1
1195 paddd %xmm7,%xmm5
1196 pxor %xmm3,%xmm0
1197 movdqa %xmm9,%xmm3
1198 movdqa %xmm8,%xmm7
1199 pslld $10,%xmm2
1200 pxor %xmm8,%xmm3
1201
1202
1203 psrld $13,%xmm7
1204 pxor %xmm2,%xmm1
1205 paddd %xmm0,%xmm5
1206 pslld $19-10,%xmm2
1207 pand %xmm3,%xmm4
1208 pxor %xmm7,%xmm1
1209
1210
1211 psrld $22-13,%xmm7
1212 pxor %xmm2,%xmm1
1213 movdqa %xmm9,%xmm15
1214 pslld $30-19,%xmm2
1215 pxor %xmm1,%xmm7
1216 pxor %xmm4,%xmm15
1217 paddd %xmm5,%xmm11
1218 pxor %xmm2,%xmm7
1219
1220 paddd %xmm5,%xmm15
1221 paddd %xmm7,%xmm15
1222 movdqa 32-128(%rax),%xmm5
1223 paddd 160-128(%rax),%xmm6
1224
1225 movdqa %xmm5,%xmm7
1226 movdqa %xmm5,%xmm1
1227 psrld $3,%xmm7
1228 movdqa %xmm5,%xmm2
1229
1230 psrld $7,%xmm1
1231 movdqa 240-128(%rax),%xmm0
1232 pslld $14,%xmm2
1233 pxor %xmm1,%xmm7
1234 psrld $18-7,%xmm1
1235 movdqa %xmm0,%xmm4
1236 pxor %xmm2,%xmm7
1237 pslld $25-14,%xmm2
1238 pxor %xmm1,%xmm7
1239 psrld $10,%xmm0
1240 movdqa %xmm4,%xmm1
1241
1242 psrld $17,%xmm4
1243 pxor %xmm2,%xmm7
1244 pslld $13,%xmm1
1245 paddd %xmm7,%xmm6
1246 pxor %xmm4,%xmm0
1247 psrld $19-17,%xmm4
1248 pxor %xmm1,%xmm0
1249 pslld $15-13,%xmm1
1250 pxor %xmm4,%xmm0
1251 pxor %xmm1,%xmm0
1252 paddd %xmm0,%xmm6
1253 movdqa %xmm11,%xmm7
1254
1255 movdqa %xmm11,%xmm2
1256
1257 psrld $6,%xmm7
1258 movdqa %xmm11,%xmm1
1259 pslld $7,%xmm2
1260 movdqa %xmm6,16-128(%rax)
1261 paddd %xmm14,%xmm6
1262
1263 psrld $11,%xmm1
1264 pxor %xmm2,%xmm7
1265 pslld $21-7,%xmm2
1266 paddd -96(%rbp),%xmm6
1267 pxor %xmm1,%xmm7
1268
1269 psrld $25-11,%xmm1
1270 movdqa %xmm11,%xmm0
1271
1272 pxor %xmm2,%xmm7
1273 movdqa %xmm11,%xmm4
1274 pslld $26-21,%xmm2
1275 pandn %xmm13,%xmm0
1276 pand %xmm12,%xmm4
1277 pxor %xmm1,%xmm7
1278
1279
1280 movdqa %xmm15,%xmm1
1281 pxor %xmm2,%xmm7
1282 movdqa %xmm15,%xmm2
1283 psrld $2,%xmm1
1284 paddd %xmm7,%xmm6
1285 pxor %xmm4,%xmm0
1286 movdqa %xmm8,%xmm4
1287 movdqa %xmm15,%xmm7
1288 pslld $10,%xmm2
1289 pxor %xmm15,%xmm4
1290
1291
1292 psrld $13,%xmm7
1293 pxor %xmm2,%xmm1
1294 paddd %xmm0,%xmm6
1295 pslld $19-10,%xmm2
1296 pand %xmm4,%xmm3
1297 pxor %xmm7,%xmm1
1298
1299
1300 psrld $22-13,%xmm7
1301 pxor %xmm2,%xmm1
1302 movdqa %xmm8,%xmm14
1303 pslld $30-19,%xmm2
1304 pxor %xmm1,%xmm7
1305 pxor %xmm3,%xmm14
1306 paddd %xmm6,%xmm10
1307 pxor %xmm2,%xmm7
1308
1309 paddd %xmm6,%xmm14
1310 paddd %xmm7,%xmm14
1311 movdqa 48-128(%rax),%xmm6
1312 paddd 176-128(%rax),%xmm5
1313
1314 movdqa %xmm6,%xmm7
1315 movdqa %xmm6,%xmm1
1316 psrld $3,%xmm7
1317 movdqa %xmm6,%xmm2
1318
1319 psrld $7,%xmm1
1320 movdqa 0-128(%rax),%xmm0
1321 pslld $14,%xmm2
1322 pxor %xmm1,%xmm7
1323 psrld $18-7,%xmm1
1324 movdqa %xmm0,%xmm3
1325 pxor %xmm2,%xmm7
1326 pslld $25-14,%xmm2
1327 pxor %xmm1,%xmm7
1328 psrld $10,%xmm0
1329 movdqa %xmm3,%xmm1
1330
1331 psrld $17,%xmm3
1332 pxor %xmm2,%xmm7
1333 pslld $13,%xmm1
1334 paddd %xmm7,%xmm5
1335 pxor %xmm3,%xmm0
1336 psrld $19-17,%xmm3
1337 pxor %xmm1,%xmm0
1338 pslld $15-13,%xmm1
1339 pxor %xmm3,%xmm0
1340 pxor %xmm1,%xmm0
1341 paddd %xmm0,%xmm5
1342 movdqa %xmm10,%xmm7
1343
1344 movdqa %xmm10,%xmm2
1345
1346 psrld $6,%xmm7
1347 movdqa %xmm10,%xmm1
1348 pslld $7,%xmm2
1349 movdqa %xmm5,32-128(%rax)
1350 paddd %xmm13,%xmm5
1351
1352 psrld $11,%xmm1
1353 pxor %xmm2,%xmm7
1354 pslld $21-7,%xmm2
1355 paddd -64(%rbp),%xmm5
1356 pxor %xmm1,%xmm7
1357
1358 psrld $25-11,%xmm1
1359 movdqa %xmm10,%xmm0
1360
1361 pxor %xmm2,%xmm7
1362 movdqa %xmm10,%xmm3
1363 pslld $26-21,%xmm2
1364 pandn %xmm12,%xmm0
1365 pand %xmm11,%xmm3
1366 pxor %xmm1,%xmm7
1367
1368
1369 movdqa %xmm14,%xmm1
1370 pxor %xmm2,%xmm7
1371 movdqa %xmm14,%xmm2
1372 psrld $2,%xmm1
1373 paddd %xmm7,%xmm5
1374 pxor %xmm3,%xmm0
1375 movdqa %xmm15,%xmm3
1376 movdqa %xmm14,%xmm7
1377 pslld $10,%xmm2
1378 pxor %xmm14,%xmm3
1379
1380
1381 psrld $13,%xmm7
1382 pxor %xmm2,%xmm1
1383 paddd %xmm0,%xmm5
1384 pslld $19-10,%xmm2
1385 pand %xmm3,%xmm4
1386 pxor %xmm7,%xmm1
1387
1388
1389 psrld $22-13,%xmm7
1390 pxor %xmm2,%xmm1
1391 movdqa %xmm15,%xmm13
1392 pslld $30-19,%xmm2
1393 pxor %xmm1,%xmm7
1394 pxor %xmm4,%xmm13
1395 paddd %xmm5,%xmm9
1396 pxor %xmm2,%xmm7
1397
1398 paddd %xmm5,%xmm13
1399 paddd %xmm7,%xmm13
1400 movdqa 64-128(%rax),%xmm5
1401 paddd 192-128(%rax),%xmm6
1402
1403 movdqa %xmm5,%xmm7
1404 movdqa %xmm5,%xmm1
1405 psrld $3,%xmm7
1406 movdqa %xmm5,%xmm2
1407
1408 psrld $7,%xmm1
1409 movdqa 16-128(%rax),%xmm0
1410 pslld $14,%xmm2
1411 pxor %xmm1,%xmm7
1412 psrld $18-7,%xmm1
1413 movdqa %xmm0,%xmm4
1414 pxor %xmm2,%xmm7
1415 pslld $25-14,%xmm2
1416 pxor %xmm1,%xmm7
1417 psrld $10,%xmm0
1418 movdqa %xmm4,%xmm1
1419
1420 psrld $17,%xmm4
1421 pxor %xmm2,%xmm7
1422 pslld $13,%xmm1
1423 paddd %xmm7,%xmm6
1424 pxor %xmm4,%xmm0
1425 psrld $19-17,%xmm4
1426 pxor %xmm1,%xmm0
1427 pslld $15-13,%xmm1
1428 pxor %xmm4,%xmm0
1429 pxor %xmm1,%xmm0
1430 paddd %xmm0,%xmm6
1431 movdqa %xmm9,%xmm7
1432
1433 movdqa %xmm9,%xmm2
1434
1435 psrld $6,%xmm7
1436 movdqa %xmm9,%xmm1
1437 pslld $7,%xmm2
1438 movdqa %xmm6,48-128(%rax)
1439 paddd %xmm12,%xmm6
1440
1441 psrld $11,%xmm1
1442 pxor %xmm2,%xmm7
1443 pslld $21-7,%xmm2
1444 paddd -32(%rbp),%xmm6
1445 pxor %xmm1,%xmm7
1446
1447 psrld $25-11,%xmm1
1448 movdqa %xmm9,%xmm0
1449
1450 pxor %xmm2,%xmm7
1451 movdqa %xmm9,%xmm4
1452 pslld $26-21,%xmm2
1453 pandn %xmm11,%xmm0
1454 pand %xmm10,%xmm4
1455 pxor %xmm1,%xmm7
1456
1457
1458 movdqa %xmm13,%xmm1
1459 pxor %xmm2,%xmm7
1460 movdqa %xmm13,%xmm2
1461 psrld $2,%xmm1
1462 paddd %xmm7,%xmm6
1463 pxor %xmm4,%xmm0
1464 movdqa %xmm14,%xmm4
1465 movdqa %xmm13,%xmm7
1466 pslld $10,%xmm2
1467 pxor %xmm13,%xmm4
1468
1469
1470 psrld $13,%xmm7
1471 pxor %xmm2,%xmm1
1472 paddd %xmm0,%xmm6
1473 pslld $19-10,%xmm2
1474 pand %xmm4,%xmm3
1475 pxor %xmm7,%xmm1
1476
1477
1478 psrld $22-13,%xmm7
1479 pxor %xmm2,%xmm1
1480 movdqa %xmm14,%xmm12
1481 pslld $30-19,%xmm2
1482 pxor %xmm1,%xmm7
1483 pxor %xmm3,%xmm12
1484 paddd %xmm6,%xmm8
1485 pxor %xmm2,%xmm7
1486
1487 paddd %xmm6,%xmm12
1488 paddd %xmm7,%xmm12
1489 movdqa 80-128(%rax),%xmm6
1490 paddd 208-128(%rax),%xmm5
1491
1492 movdqa %xmm6,%xmm7
1493 movdqa %xmm6,%xmm1
1494 psrld $3,%xmm7
1495 movdqa %xmm6,%xmm2
1496
1497 psrld $7,%xmm1
1498 movdqa 32-128(%rax),%xmm0
1499 pslld $14,%xmm2
1500 pxor %xmm1,%xmm7
1501 psrld $18-7,%xmm1
1502 movdqa %xmm0,%xmm3
1503 pxor %xmm2,%xmm7
1504 pslld $25-14,%xmm2
1505 pxor %xmm1,%xmm7
1506 psrld $10,%xmm0
1507 movdqa %xmm3,%xmm1
1508
1509 psrld $17,%xmm3
1510 pxor %xmm2,%xmm7
1511 pslld $13,%xmm1
1512 paddd %xmm7,%xmm5
1513 pxor %xmm3,%xmm0
1514 psrld $19-17,%xmm3
1515 pxor %xmm1,%xmm0
1516 pslld $15-13,%xmm1
1517 pxor %xmm3,%xmm0
1518 pxor %xmm1,%xmm0
1519 paddd %xmm0,%xmm5
1520 movdqa %xmm8,%xmm7
1521
1522 movdqa %xmm8,%xmm2
1523
1524 psrld $6,%xmm7
1525 movdqa %xmm8,%xmm1
1526 pslld $7,%xmm2
1527 movdqa %xmm5,64-128(%rax)
1528 paddd %xmm11,%xmm5
1529
1530 psrld $11,%xmm1
1531 pxor %xmm2,%xmm7
1532 pslld $21-7,%xmm2
1533 paddd 0(%rbp),%xmm5
1534 pxor %xmm1,%xmm7
1535
1536 psrld $25-11,%xmm1
1537 movdqa %xmm8,%xmm0
1538
1539 pxor %xmm2,%xmm7
1540 movdqa %xmm8,%xmm3
1541 pslld $26-21,%xmm2
1542 pandn %xmm10,%xmm0
1543 pand %xmm9,%xmm3
1544 pxor %xmm1,%xmm7
1545
1546
1547 movdqa %xmm12,%xmm1
1548 pxor %xmm2,%xmm7
1549 movdqa %xmm12,%xmm2
1550 psrld $2,%xmm1
1551 paddd %xmm7,%xmm5
1552 pxor %xmm3,%xmm0
1553 movdqa %xmm13,%xmm3
1554 movdqa %xmm12,%xmm7
1555 pslld $10,%xmm2
1556 pxor %xmm12,%xmm3
1557
1558
1559 psrld $13,%xmm7
1560 pxor %xmm2,%xmm1
1561 paddd %xmm0,%xmm5
1562 pslld $19-10,%xmm2
1563 pand %xmm3,%xmm4
1564 pxor %xmm7,%xmm1
1565
1566
1567 psrld $22-13,%xmm7
1568 pxor %xmm2,%xmm1
1569 movdqa %xmm13,%xmm11
1570 pslld $30-19,%xmm2
1571 pxor %xmm1,%xmm7
1572 pxor %xmm4,%xmm11
1573 paddd %xmm5,%xmm15
1574 pxor %xmm2,%xmm7
1575
1576 paddd %xmm5,%xmm11
1577 paddd %xmm7,%xmm11
1578 movdqa 96-128(%rax),%xmm5
1579 paddd 224-128(%rax),%xmm6
1580
1581 movdqa %xmm5,%xmm7
1582 movdqa %xmm5,%xmm1
1583 psrld $3,%xmm7
1584 movdqa %xmm5,%xmm2
1585
1586 psrld $7,%xmm1
1587 movdqa 48-128(%rax),%xmm0
1588 pslld $14,%xmm2
1589 pxor %xmm1,%xmm7
1590 psrld $18-7,%xmm1
1591 movdqa %xmm0,%xmm4
1592 pxor %xmm2,%xmm7
1593 pslld $25-14,%xmm2
1594 pxor %xmm1,%xmm7
1595 psrld $10,%xmm0
1596 movdqa %xmm4,%xmm1
1597
1598 psrld $17,%xmm4
1599 pxor %xmm2,%xmm7
1600 pslld $13,%xmm1
1601 paddd %xmm7,%xmm6
1602 pxor %xmm4,%xmm0
1603 psrld $19-17,%xmm4
1604 pxor %xmm1,%xmm0
1605 pslld $15-13,%xmm1
1606 pxor %xmm4,%xmm0
1607 pxor %xmm1,%xmm0
1608 paddd %xmm0,%xmm6
1609 movdqa %xmm15,%xmm7
1610
1611 movdqa %xmm15,%xmm2
1612
1613 psrld $6,%xmm7
1614 movdqa %xmm15,%xmm1
1615 pslld $7,%xmm2
1616 movdqa %xmm6,80-128(%rax)
1617 paddd %xmm10,%xmm6
1618
1619 psrld $11,%xmm1
1620 pxor %xmm2,%xmm7
1621 pslld $21-7,%xmm2
1622 paddd 32(%rbp),%xmm6
1623 pxor %xmm1,%xmm7
1624
1625 psrld $25-11,%xmm1
1626 movdqa %xmm15,%xmm0
1627
1628 pxor %xmm2,%xmm7
1629 movdqa %xmm15,%xmm4
1630 pslld $26-21,%xmm2
1631 pandn %xmm9,%xmm0
1632 pand %xmm8,%xmm4
1633 pxor %xmm1,%xmm7
1634
1635
1636 movdqa %xmm11,%xmm1
1637 pxor %xmm2,%xmm7
1638 movdqa %xmm11,%xmm2
1639 psrld $2,%xmm1
1640 paddd %xmm7,%xmm6
1641 pxor %xmm4,%xmm0
1642 movdqa %xmm12,%xmm4
1643 movdqa %xmm11,%xmm7
1644 pslld $10,%xmm2
1645 pxor %xmm11,%xmm4
1646
1647
1648 psrld $13,%xmm7
1649 pxor %xmm2,%xmm1
1650 paddd %xmm0,%xmm6
1651 pslld $19-10,%xmm2
1652 pand %xmm4,%xmm3
1653 pxor %xmm7,%xmm1
1654
1655
1656 psrld $22-13,%xmm7
1657 pxor %xmm2,%xmm1
1658 movdqa %xmm12,%xmm10
1659 pslld $30-19,%xmm2
1660 pxor %xmm1,%xmm7
1661 pxor %xmm3,%xmm10
1662 paddd %xmm6,%xmm14
1663 pxor %xmm2,%xmm7
1664
1665 paddd %xmm6,%xmm10
1666 paddd %xmm7,%xmm10
1667 movdqa 112-128(%rax),%xmm6
1668 paddd 240-128(%rax),%xmm5
1669
1670 movdqa %xmm6,%xmm7
1671 movdqa %xmm6,%xmm1
1672 psrld $3,%xmm7
1673 movdqa %xmm6,%xmm2
1674
1675 psrld $7,%xmm1
1676 movdqa 64-128(%rax),%xmm0
1677 pslld $14,%xmm2
1678 pxor %xmm1,%xmm7
1679 psrld $18-7,%xmm1
1680 movdqa %xmm0,%xmm3
1681 pxor %xmm2,%xmm7
1682 pslld $25-14,%xmm2
1683 pxor %xmm1,%xmm7
1684 psrld $10,%xmm0
1685 movdqa %xmm3,%xmm1
1686
1687 psrld $17,%xmm3
1688 pxor %xmm2,%xmm7
1689 pslld $13,%xmm1
1690 paddd %xmm7,%xmm5
1691 pxor %xmm3,%xmm0
1692 psrld $19-17,%xmm3
1693 pxor %xmm1,%xmm0
1694 pslld $15-13,%xmm1
1695 pxor %xmm3,%xmm0
1696 pxor %xmm1,%xmm0
1697 paddd %xmm0,%xmm5
1698 movdqa %xmm14,%xmm7
1699
1700 movdqa %xmm14,%xmm2
1701
1702 psrld $6,%xmm7
1703 movdqa %xmm14,%xmm1
1704 pslld $7,%xmm2
1705 movdqa %xmm5,96-128(%rax)
1706 paddd %xmm9,%xmm5
1707
1708 psrld $11,%xmm1
1709 pxor %xmm2,%xmm7
1710 pslld $21-7,%xmm2
1711 paddd 64(%rbp),%xmm5
1712 pxor %xmm1,%xmm7
1713
1714 psrld $25-11,%xmm1
1715 movdqa %xmm14,%xmm0
1716
1717 pxor %xmm2,%xmm7
1718 movdqa %xmm14,%xmm3
1719 pslld $26-21,%xmm2
1720 pandn %xmm8,%xmm0
1721 pand %xmm15,%xmm3
1722 pxor %xmm1,%xmm7
1723
1724
1725 movdqa %xmm10,%xmm1
1726 pxor %xmm2,%xmm7
1727 movdqa %xmm10,%xmm2
1728 psrld $2,%xmm1
1729 paddd %xmm7,%xmm5
1730 pxor %xmm3,%xmm0
1731 movdqa %xmm11,%xmm3
1732 movdqa %xmm10,%xmm7
1733 pslld $10,%xmm2
1734 pxor %xmm10,%xmm3
1735
1736
1737 psrld $13,%xmm7
1738 pxor %xmm2,%xmm1
1739 paddd %xmm0,%xmm5
1740 pslld $19-10,%xmm2
1741 pand %xmm3,%xmm4
1742 pxor %xmm7,%xmm1
1743
1744
1745 psrld $22-13,%xmm7
1746 pxor %xmm2,%xmm1
1747 movdqa %xmm11,%xmm9
1748 pslld $30-19,%xmm2
1749 pxor %xmm1,%xmm7
1750 pxor %xmm4,%xmm9
1751 paddd %xmm5,%xmm13
1752 pxor %xmm2,%xmm7
1753
1754 paddd %xmm5,%xmm9
1755 paddd %xmm7,%xmm9
1756 movdqa 128-128(%rax),%xmm5
1757 paddd 0-128(%rax),%xmm6
1758
1759 movdqa %xmm5,%xmm7
1760 movdqa %xmm5,%xmm1
1761 psrld $3,%xmm7
1762 movdqa %xmm5,%xmm2
1763
1764 psrld $7,%xmm1
1765 movdqa 80-128(%rax),%xmm0
1766 pslld $14,%xmm2
1767 pxor %xmm1,%xmm7
1768 psrld $18-7,%xmm1
1769 movdqa %xmm0,%xmm4
1770 pxor %xmm2,%xmm7
1771 pslld $25-14,%xmm2
1772 pxor %xmm1,%xmm7
1773 psrld $10,%xmm0
1774 movdqa %xmm4,%xmm1
1775
1776 psrld $17,%xmm4
1777 pxor %xmm2,%xmm7
1778 pslld $13,%xmm1
1779 paddd %xmm7,%xmm6
1780 pxor %xmm4,%xmm0
1781 psrld $19-17,%xmm4
1782 pxor %xmm1,%xmm0
1783 pslld $15-13,%xmm1
1784 pxor %xmm4,%xmm0
1785 pxor %xmm1,%xmm0
1786 paddd %xmm0,%xmm6
1787 movdqa %xmm13,%xmm7
1788
1789 movdqa %xmm13,%xmm2
1790
1791 psrld $6,%xmm7
1792 movdqa %xmm13,%xmm1
1793 pslld $7,%xmm2
1794 movdqa %xmm6,112-128(%rax)
1795 paddd %xmm8,%xmm6
1796
1797 psrld $11,%xmm1
1798 pxor %xmm2,%xmm7
1799 pslld $21-7,%xmm2
1800 paddd 96(%rbp),%xmm6
1801 pxor %xmm1,%xmm7
1802
1803 psrld $25-11,%xmm1
1804 movdqa %xmm13,%xmm0
1805
1806 pxor %xmm2,%xmm7
1807 movdqa %xmm13,%xmm4
1808 pslld $26-21,%xmm2
1809 pandn %xmm15,%xmm0
1810 pand %xmm14,%xmm4
1811 pxor %xmm1,%xmm7
1812
1813
1814 movdqa %xmm9,%xmm1
1815 pxor %xmm2,%xmm7
1816 movdqa %xmm9,%xmm2
1817 psrld $2,%xmm1
1818 paddd %xmm7,%xmm6
1819 pxor %xmm4,%xmm0
1820 movdqa %xmm10,%xmm4
1821 movdqa %xmm9,%xmm7
1822 pslld $10,%xmm2
1823 pxor %xmm9,%xmm4
1824
1825
1826 psrld $13,%xmm7
1827 pxor %xmm2,%xmm1
1828 paddd %xmm0,%xmm6
1829 pslld $19-10,%xmm2
1830 pand %xmm4,%xmm3
1831 pxor %xmm7,%xmm1
1832
1833
1834 psrld $22-13,%xmm7
1835 pxor %xmm2,%xmm1
1836 movdqa %xmm10,%xmm8
1837 pslld $30-19,%xmm2
1838 pxor %xmm1,%xmm7
1839 pxor %xmm3,%xmm8
1840 paddd %xmm6,%xmm12
1841 pxor %xmm2,%xmm7
1842
1843 paddd %xmm6,%xmm8
1844 paddd %xmm7,%xmm8
1845 leaq 256(%rbp),%rbp
1846 movdqa 144-128(%rax),%xmm6
1847 paddd 16-128(%rax),%xmm5
1848
1849 movdqa %xmm6,%xmm7
1850 movdqa %xmm6,%xmm1
1851 psrld $3,%xmm7
1852 movdqa %xmm6,%xmm2
1853
1854 psrld $7,%xmm1
1855 movdqa 96-128(%rax),%xmm0
1856 pslld $14,%xmm2
1857 pxor %xmm1,%xmm7
1858 psrld $18-7,%xmm1
1859 movdqa %xmm0,%xmm3
1860 pxor %xmm2,%xmm7
1861 pslld $25-14,%xmm2
1862 pxor %xmm1,%xmm7
1863 psrld $10,%xmm0
1864 movdqa %xmm3,%xmm1
1865
1866 psrld $17,%xmm3
1867 pxor %xmm2,%xmm7
1868 pslld $13,%xmm1
1869 paddd %xmm7,%xmm5
1870 pxor %xmm3,%xmm0
1871 psrld $19-17,%xmm3
1872 pxor %xmm1,%xmm0
1873 pslld $15-13,%xmm1
1874 pxor %xmm3,%xmm0
1875 pxor %xmm1,%xmm0
1876 paddd %xmm0,%xmm5
1877 movdqa %xmm12,%xmm7
1878
1879 movdqa %xmm12,%xmm2
1880
1881 psrld $6,%xmm7
1882 movdqa %xmm12,%xmm1
1883 pslld $7,%xmm2
1884 movdqa %xmm5,128-128(%rax)
1885 paddd %xmm15,%xmm5
1886
1887 psrld $11,%xmm1
1888 pxor %xmm2,%xmm7
1889 pslld $21-7,%xmm2
1890 paddd -128(%rbp),%xmm5
1891 pxor %xmm1,%xmm7
1892
1893 psrld $25-11,%xmm1
1894 movdqa %xmm12,%xmm0
1895
1896 pxor %xmm2,%xmm7
1897 movdqa %xmm12,%xmm3
1898 pslld $26-21,%xmm2
1899 pandn %xmm14,%xmm0
1900 pand %xmm13,%xmm3
1901 pxor %xmm1,%xmm7
1902
1903
1904 movdqa %xmm8,%xmm1
1905 pxor %xmm2,%xmm7
1906 movdqa %xmm8,%xmm2
1907 psrld $2,%xmm1
1908 paddd %xmm7,%xmm5
1909 pxor %xmm3,%xmm0
1910 movdqa %xmm9,%xmm3
1911 movdqa %xmm8,%xmm7
1912 pslld $10,%xmm2
1913 pxor %xmm8,%xmm3
1914
1915
1916 psrld $13,%xmm7
1917 pxor %xmm2,%xmm1
1918 paddd %xmm0,%xmm5
1919 pslld $19-10,%xmm2
1920 pand %xmm3,%xmm4
1921 pxor %xmm7,%xmm1
1922
1923
1924 psrld $22-13,%xmm7
1925 pxor %xmm2,%xmm1
1926 movdqa %xmm9,%xmm15
1927 pslld $30-19,%xmm2
1928 pxor %xmm1,%xmm7
1929 pxor %xmm4,%xmm15
1930 paddd %xmm5,%xmm11
1931 pxor %xmm2,%xmm7
1932
1933 paddd %xmm5,%xmm15
1934 paddd %xmm7,%xmm15
1935 movdqa 160-128(%rax),%xmm5
1936 paddd 32-128(%rax),%xmm6
1937
1938 movdqa %xmm5,%xmm7
1939 movdqa %xmm5,%xmm1
1940 psrld $3,%xmm7
1941 movdqa %xmm5,%xmm2
1942
1943 psrld $7,%xmm1
1944 movdqa 112-128(%rax),%xmm0
1945 pslld $14,%xmm2
1946 pxor %xmm1,%xmm7
1947 psrld $18-7,%xmm1
1948 movdqa %xmm0,%xmm4
1949 pxor %xmm2,%xmm7
1950 pslld $25-14,%xmm2
1951 pxor %xmm1,%xmm7
1952 psrld $10,%xmm0
1953 movdqa %xmm4,%xmm1
1954
1955 psrld $17,%xmm4
1956 pxor %xmm2,%xmm7
1957 pslld $13,%xmm1
1958 paddd %xmm7,%xmm6
1959 pxor %xmm4,%xmm0
1960 psrld $19-17,%xmm4
1961 pxor %xmm1,%xmm0
1962 pslld $15-13,%xmm1
1963 pxor %xmm4,%xmm0
1964 pxor %xmm1,%xmm0
1965 paddd %xmm0,%xmm6
1966 movdqa %xmm11,%xmm7
1967
1968 movdqa %xmm11,%xmm2
1969
1970 psrld $6,%xmm7
1971 movdqa %xmm11,%xmm1
1972 pslld $7,%xmm2
1973 movdqa %xmm6,144-128(%rax)
1974 paddd %xmm14,%xmm6
1975
1976 psrld $11,%xmm1
1977 pxor %xmm2,%xmm7
1978 pslld $21-7,%xmm2
1979 paddd -96(%rbp),%xmm6
1980 pxor %xmm1,%xmm7
1981
1982 psrld $25-11,%xmm1
1983 movdqa %xmm11,%xmm0
1984
1985 pxor %xmm2,%xmm7
1986 movdqa %xmm11,%xmm4
1987 pslld $26-21,%xmm2
1988 pandn %xmm13,%xmm0
1989 pand %xmm12,%xmm4
1990 pxor %xmm1,%xmm7
1991
1992
1993 movdqa %xmm15,%xmm1
1994 pxor %xmm2,%xmm7
1995 movdqa %xmm15,%xmm2
1996 psrld $2,%xmm1
1997 paddd %xmm7,%xmm6
1998 pxor %xmm4,%xmm0
1999 movdqa %xmm8,%xmm4
2000 movdqa %xmm15,%xmm7
2001 pslld $10,%xmm2
2002 pxor %xmm15,%xmm4
2003
2004
2005 psrld $13,%xmm7
2006 pxor %xmm2,%xmm1
2007 paddd %xmm0,%xmm6
2008 pslld $19-10,%xmm2
2009 pand %xmm4,%xmm3
2010 pxor %xmm7,%xmm1
2011
2012
2013 psrld $22-13,%xmm7
2014 pxor %xmm2,%xmm1
2015 movdqa %xmm8,%xmm14
2016 pslld $30-19,%xmm2
2017 pxor %xmm1,%xmm7
2018 pxor %xmm3,%xmm14
2019 paddd %xmm6,%xmm10
2020 pxor %xmm2,%xmm7
2021
2022 paddd %xmm6,%xmm14
2023 paddd %xmm7,%xmm14
2024 movdqa 176-128(%rax),%xmm6
2025 paddd 48-128(%rax),%xmm5
2026
2027 movdqa %xmm6,%xmm7
2028 movdqa %xmm6,%xmm1
2029 psrld $3,%xmm7
2030 movdqa %xmm6,%xmm2
2031
2032 psrld $7,%xmm1
2033 movdqa 128-128(%rax),%xmm0
2034 pslld $14,%xmm2
2035 pxor %xmm1,%xmm7
2036 psrld $18-7,%xmm1
2037 movdqa %xmm0,%xmm3
2038 pxor %xmm2,%xmm7
2039 pslld $25-14,%xmm2
2040 pxor %xmm1,%xmm7
2041 psrld $10,%xmm0
2042 movdqa %xmm3,%xmm1
2043
2044 psrld $17,%xmm3
2045 pxor %xmm2,%xmm7
2046 pslld $13,%xmm1
2047 paddd %xmm7,%xmm5
2048 pxor %xmm3,%xmm0
2049 psrld $19-17,%xmm3
2050 pxor %xmm1,%xmm0
2051 pslld $15-13,%xmm1
2052 pxor %xmm3,%xmm0
2053 pxor %xmm1,%xmm0
2054 paddd %xmm0,%xmm5
2055 movdqa %xmm10,%xmm7
2056
2057 movdqa %xmm10,%xmm2
2058
2059 psrld $6,%xmm7
2060 movdqa %xmm10,%xmm1
2061 pslld $7,%xmm2
2062 movdqa %xmm5,160-128(%rax)
2063 paddd %xmm13,%xmm5
2064
2065 psrld $11,%xmm1
2066 pxor %xmm2,%xmm7
2067 pslld $21-7,%xmm2
2068 paddd -64(%rbp),%xmm5
2069 pxor %xmm1,%xmm7
2070
2071 psrld $25-11,%xmm1
2072 movdqa %xmm10,%xmm0
2073
2074 pxor %xmm2,%xmm7
2075 movdqa %xmm10,%xmm3
2076 pslld $26-21,%xmm2
2077 pandn %xmm12,%xmm0
2078 pand %xmm11,%xmm3
2079 pxor %xmm1,%xmm7
2080
2081
2082 movdqa %xmm14,%xmm1
2083 pxor %xmm2,%xmm7
2084 movdqa %xmm14,%xmm2
2085 psrld $2,%xmm1
2086 paddd %xmm7,%xmm5
2087 pxor %xmm3,%xmm0
2088 movdqa %xmm15,%xmm3
2089 movdqa %xmm14,%xmm7
2090 pslld $10,%xmm2
2091 pxor %xmm14,%xmm3
2092
2093
2094 psrld $13,%xmm7
2095 pxor %xmm2,%xmm1
2096 paddd %xmm0,%xmm5
2097 pslld $19-10,%xmm2
2098 pand %xmm3,%xmm4
2099 pxor %xmm7,%xmm1
2100
2101
2102 psrld $22-13,%xmm7
2103 pxor %xmm2,%xmm1
2104 movdqa %xmm15,%xmm13
2105 pslld $30-19,%xmm2
2106 pxor %xmm1,%xmm7
2107 pxor %xmm4,%xmm13
2108 paddd %xmm5,%xmm9
2109 pxor %xmm2,%xmm7
2110
2111 paddd %xmm5,%xmm13
2112 paddd %xmm7,%xmm13
2113 movdqa 192-128(%rax),%xmm5
2114 paddd 64-128(%rax),%xmm6
2115
2116 movdqa %xmm5,%xmm7
2117 movdqa %xmm5,%xmm1
2118 psrld $3,%xmm7
2119 movdqa %xmm5,%xmm2
2120
2121 psrld $7,%xmm1
2122 movdqa 144-128(%rax),%xmm0
2123 pslld $14,%xmm2
2124 pxor %xmm1,%xmm7
2125 psrld $18-7,%xmm1
2126 movdqa %xmm0,%xmm4
2127 pxor %xmm2,%xmm7
2128 pslld $25-14,%xmm2
2129 pxor %xmm1,%xmm7
2130 psrld $10,%xmm0
2131 movdqa %xmm4,%xmm1
2132
2133 psrld $17,%xmm4
2134 pxor %xmm2,%xmm7
2135 pslld $13,%xmm1
2136 paddd %xmm7,%xmm6
2137 pxor %xmm4,%xmm0
2138 psrld $19-17,%xmm4
2139 pxor %xmm1,%xmm0
2140 pslld $15-13,%xmm1
2141 pxor %xmm4,%xmm0
2142 pxor %xmm1,%xmm0
2143 paddd %xmm0,%xmm6
2144 movdqa %xmm9,%xmm7
2145
2146 movdqa %xmm9,%xmm2
2147
2148 psrld $6,%xmm7
2149 movdqa %xmm9,%xmm1
2150 pslld $7,%xmm2
2151 movdqa %xmm6,176-128(%rax)
2152 paddd %xmm12,%xmm6
2153
2154 psrld $11,%xmm1
2155 pxor %xmm2,%xmm7
2156 pslld $21-7,%xmm2
2157 paddd -32(%rbp),%xmm6
2158 pxor %xmm1,%xmm7
2159
2160 psrld $25-11,%xmm1
2161 movdqa %xmm9,%xmm0
2162
2163 pxor %xmm2,%xmm7
2164 movdqa %xmm9,%xmm4
2165 pslld $26-21,%xmm2
2166 pandn %xmm11,%xmm0
2167 pand %xmm10,%xmm4
2168 pxor %xmm1,%xmm7
2169
2170
2171 movdqa %xmm13,%xmm1
2172 pxor %xmm2,%xmm7
2173 movdqa %xmm13,%xmm2
2174 psrld $2,%xmm1
2175 paddd %xmm7,%xmm6
2176 pxor %xmm4,%xmm0
2177 movdqa %xmm14,%xmm4
2178 movdqa %xmm13,%xmm7
2179 pslld $10,%xmm2
2180 pxor %xmm13,%xmm4
2181
2182
2183 psrld $13,%xmm7
2184 pxor %xmm2,%xmm1
2185 paddd %xmm0,%xmm6
2186 pslld $19-10,%xmm2
2187 pand %xmm4,%xmm3
2188 pxor %xmm7,%xmm1
2189
2190
2191 psrld $22-13,%xmm7
2192 pxor %xmm2,%xmm1
2193 movdqa %xmm14,%xmm12
2194 pslld $30-19,%xmm2
2195 pxor %xmm1,%xmm7
2196 pxor %xmm3,%xmm12
2197 paddd %xmm6,%xmm8
2198 pxor %xmm2,%xmm7
2199
2200 paddd %xmm6,%xmm12
2201 paddd %xmm7,%xmm12
2202 movdqa 208-128(%rax),%xmm6
2203 paddd 80-128(%rax),%xmm5
2204
2205 movdqa %xmm6,%xmm7
2206 movdqa %xmm6,%xmm1
2207 psrld $3,%xmm7
2208 movdqa %xmm6,%xmm2
2209
2210 psrld $7,%xmm1
2211 movdqa 160-128(%rax),%xmm0
2212 pslld $14,%xmm2
2213 pxor %xmm1,%xmm7
2214 psrld $18-7,%xmm1
2215 movdqa %xmm0,%xmm3
2216 pxor %xmm2,%xmm7
2217 pslld $25-14,%xmm2
2218 pxor %xmm1,%xmm7
2219 psrld $10,%xmm0
2220 movdqa %xmm3,%xmm1
2221
2222 psrld $17,%xmm3
2223 pxor %xmm2,%xmm7
2224 pslld $13,%xmm1
2225 paddd %xmm7,%xmm5
2226 pxor %xmm3,%xmm0
2227 psrld $19-17,%xmm3
2228 pxor %xmm1,%xmm0
2229 pslld $15-13,%xmm1
2230 pxor %xmm3,%xmm0
2231 pxor %xmm1,%xmm0
2232 paddd %xmm0,%xmm5
2233 movdqa %xmm8,%xmm7
2234
2235 movdqa %xmm8,%xmm2
2236
2237 psrld $6,%xmm7
2238 movdqa %xmm8,%xmm1
2239 pslld $7,%xmm2
2240 movdqa %xmm5,192-128(%rax)
2241 paddd %xmm11,%xmm5
2242
2243 psrld $11,%xmm1
2244 pxor %xmm2,%xmm7
2245 pslld $21-7,%xmm2
2246 paddd 0(%rbp),%xmm5
2247 pxor %xmm1,%xmm7
2248
2249 psrld $25-11,%xmm1
2250 movdqa %xmm8,%xmm0
2251
2252 pxor %xmm2,%xmm7
2253 movdqa %xmm8,%xmm3
2254 pslld $26-21,%xmm2
2255 pandn %xmm10,%xmm0
2256 pand %xmm9,%xmm3
2257 pxor %xmm1,%xmm7
2258
2259
2260 movdqa %xmm12,%xmm1
2261 pxor %xmm2,%xmm7
2262 movdqa %xmm12,%xmm2
2263 psrld $2,%xmm1
2264 paddd %xmm7,%xmm5
2265 pxor %xmm3,%xmm0
2266 movdqa %xmm13,%xmm3
2267 movdqa %xmm12,%xmm7
2268 pslld $10,%xmm2
2269 pxor %xmm12,%xmm3
2270
2271
2272 psrld $13,%xmm7
2273 pxor %xmm2,%xmm1
2274 paddd %xmm0,%xmm5
2275 pslld $19-10,%xmm2
2276 pand %xmm3,%xmm4
2277 pxor %xmm7,%xmm1
2278
2279
2280 psrld $22-13,%xmm7
2281 pxor %xmm2,%xmm1
2282 movdqa %xmm13,%xmm11
2283 pslld $30-19,%xmm2
2284 pxor %xmm1,%xmm7
2285 pxor %xmm4,%xmm11
2286 paddd %xmm5,%xmm15
2287 pxor %xmm2,%xmm7
2288
2289 paddd %xmm5,%xmm11
2290 paddd %xmm7,%xmm11
2291 movdqa 224-128(%rax),%xmm5
2292 paddd 96-128(%rax),%xmm6
2293
2294 movdqa %xmm5,%xmm7
2295 movdqa %xmm5,%xmm1
2296 psrld $3,%xmm7
2297 movdqa %xmm5,%xmm2
2298
2299 psrld $7,%xmm1
2300 movdqa 176-128(%rax),%xmm0
2301 pslld $14,%xmm2
2302 pxor %xmm1,%xmm7
2303 psrld $18-7,%xmm1
2304 movdqa %xmm0,%xmm4
2305 pxor %xmm2,%xmm7
2306 pslld $25-14,%xmm2
2307 pxor %xmm1,%xmm7
2308 psrld $10,%xmm0
2309 movdqa %xmm4,%xmm1
2310
2311 psrld $17,%xmm4
2312 pxor %xmm2,%xmm7
2313 pslld $13,%xmm1
2314 paddd %xmm7,%xmm6
2315 pxor %xmm4,%xmm0
2316 psrld $19-17,%xmm4
2317 pxor %xmm1,%xmm0
2318 pslld $15-13,%xmm1
2319 pxor %xmm4,%xmm0
2320 pxor %xmm1,%xmm0
2321 paddd %xmm0,%xmm6
2322 movdqa %xmm15,%xmm7
2323
2324 movdqa %xmm15,%xmm2
2325
2326 psrld $6,%xmm7
2327 movdqa %xmm15,%xmm1
2328 pslld $7,%xmm2
2329 movdqa %xmm6,208-128(%rax)
2330 paddd %xmm10,%xmm6
2331
2332 psrld $11,%xmm1
2333 pxor %xmm2,%xmm7
2334 pslld $21-7,%xmm2
2335 paddd 32(%rbp),%xmm6
2336 pxor %xmm1,%xmm7
2337
2338 psrld $25-11,%xmm1
2339 movdqa %xmm15,%xmm0
2340
2341 pxor %xmm2,%xmm7
2342 movdqa %xmm15,%xmm4
2343 pslld $26-21,%xmm2
2344 pandn %xmm9,%xmm0
2345 pand %xmm8,%xmm4
2346 pxor %xmm1,%xmm7
2347
2348
2349 movdqa %xmm11,%xmm1
2350 pxor %xmm2,%xmm7
2351 movdqa %xmm11,%xmm2
2352 psrld $2,%xmm1
2353 paddd %xmm7,%xmm6
2354 pxor %xmm4,%xmm0
2355 movdqa %xmm12,%xmm4
2356 movdqa %xmm11,%xmm7
2357 pslld $10,%xmm2
2358 pxor %xmm11,%xmm4
2359
2360
2361 psrld $13,%xmm7
2362 pxor %xmm2,%xmm1
2363 paddd %xmm0,%xmm6
2364 pslld $19-10,%xmm2
2365 pand %xmm4,%xmm3
2366 pxor %xmm7,%xmm1
2367
2368
2369 psrld $22-13,%xmm7
2370 pxor %xmm2,%xmm1
2371 movdqa %xmm12,%xmm10
2372 pslld $30-19,%xmm2
2373 pxor %xmm1,%xmm7
2374 pxor %xmm3,%xmm10
2375 paddd %xmm6,%xmm14
2376 pxor %xmm2,%xmm7
2377
2378 paddd %xmm6,%xmm10
2379 paddd %xmm7,%xmm10
2380 movdqa 240-128(%rax),%xmm6
2381 paddd 112-128(%rax),%xmm5
2382
2383 movdqa %xmm6,%xmm7
2384 movdqa %xmm6,%xmm1
2385 psrld $3,%xmm7
2386 movdqa %xmm6,%xmm2
2387
2388 psrld $7,%xmm1
2389 movdqa 192-128(%rax),%xmm0
2390 pslld $14,%xmm2
2391 pxor %xmm1,%xmm7
2392 psrld $18-7,%xmm1
2393 movdqa %xmm0,%xmm3
2394 pxor %xmm2,%xmm7
2395 pslld $25-14,%xmm2
2396 pxor %xmm1,%xmm7
2397 psrld $10,%xmm0
2398 movdqa %xmm3,%xmm1
2399
2400 psrld $17,%xmm3
2401 pxor %xmm2,%xmm7
2402 pslld $13,%xmm1
2403 paddd %xmm7,%xmm5
2404 pxor %xmm3,%xmm0
2405 psrld $19-17,%xmm3
2406 pxor %xmm1,%xmm0
2407 pslld $15-13,%xmm1
2408 pxor %xmm3,%xmm0
2409 pxor %xmm1,%xmm0
2410 paddd %xmm0,%xmm5
2411 movdqa %xmm14,%xmm7
2412
2413 movdqa %xmm14,%xmm2
2414
2415 psrld $6,%xmm7
2416 movdqa %xmm14,%xmm1
2417 pslld $7,%xmm2
2418 movdqa %xmm5,224-128(%rax)
2419 paddd %xmm9,%xmm5
2420
2421 psrld $11,%xmm1
2422 pxor %xmm2,%xmm7
2423 pslld $21-7,%xmm2
2424 paddd 64(%rbp),%xmm5
2425 pxor %xmm1,%xmm7
2426
2427 psrld $25-11,%xmm1
2428 movdqa %xmm14,%xmm0
2429
2430 pxor %xmm2,%xmm7
2431 movdqa %xmm14,%xmm3
2432 pslld $26-21,%xmm2
2433 pandn %xmm8,%xmm0
2434 pand %xmm15,%xmm3
2435 pxor %xmm1,%xmm7
2436
2437
2438 movdqa %xmm10,%xmm1
2439 pxor %xmm2,%xmm7
2440 movdqa %xmm10,%xmm2
2441 psrld $2,%xmm1
2442 paddd %xmm7,%xmm5
2443 pxor %xmm3,%xmm0
2444 movdqa %xmm11,%xmm3
2445 movdqa %xmm10,%xmm7
2446 pslld $10,%xmm2
2447 pxor %xmm10,%xmm3
2448
2449
2450 psrld $13,%xmm7
2451 pxor %xmm2,%xmm1
2452 paddd %xmm0,%xmm5
2453 pslld $19-10,%xmm2
2454 pand %xmm3,%xmm4
2455 pxor %xmm7,%xmm1
2456
2457
2458 psrld $22-13,%xmm7
2459 pxor %xmm2,%xmm1
2460 movdqa %xmm11,%xmm9
2461 pslld $30-19,%xmm2
2462 pxor %xmm1,%xmm7
2463 pxor %xmm4,%xmm9
2464 paddd %xmm5,%xmm13
2465 pxor %xmm2,%xmm7
2466
2467 paddd %xmm5,%xmm9
2468 paddd %xmm7,%xmm9
2469 movdqa 0-128(%rax),%xmm5
2470 paddd 128-128(%rax),%xmm6
2471
2472 movdqa %xmm5,%xmm7
2473 movdqa %xmm5,%xmm1
2474 psrld $3,%xmm7
2475 movdqa %xmm5,%xmm2
2476
2477 psrld $7,%xmm1
2478 movdqa 208-128(%rax),%xmm0
2479 pslld $14,%xmm2
2480 pxor %xmm1,%xmm7
2481 psrld $18-7,%xmm1
2482 movdqa %xmm0,%xmm4
2483 pxor %xmm2,%xmm7
2484 pslld $25-14,%xmm2
2485 pxor %xmm1,%xmm7
2486 psrld $10,%xmm0
2487 movdqa %xmm4,%xmm1
2488
2489 psrld $17,%xmm4
2490 pxor %xmm2,%xmm7
2491 pslld $13,%xmm1
2492 paddd %xmm7,%xmm6
2493 pxor %xmm4,%xmm0
2494 psrld $19-17,%xmm4
2495 pxor %xmm1,%xmm0
2496 pslld $15-13,%xmm1
2497 pxor %xmm4,%xmm0
2498 pxor %xmm1,%xmm0
2499 paddd %xmm0,%xmm6
2500 movdqa %xmm13,%xmm7
2501
2502 movdqa %xmm13,%xmm2
2503
2504 psrld $6,%xmm7
2505 movdqa %xmm13,%xmm1
2506 pslld $7,%xmm2
2507 movdqa %xmm6,240-128(%rax)
2508 paddd %xmm8,%xmm6
2509
2510 psrld $11,%xmm1
2511 pxor %xmm2,%xmm7
2512 pslld $21-7,%xmm2
2513 paddd 96(%rbp),%xmm6
2514 pxor %xmm1,%xmm7
2515
2516 psrld $25-11,%xmm1
2517 movdqa %xmm13,%xmm0
2518
2519 pxor %xmm2,%xmm7
2520 movdqa %xmm13,%xmm4
2521 pslld $26-21,%xmm2
2522 pandn %xmm15,%xmm0
2523 pand %xmm14,%xmm4
2524 pxor %xmm1,%xmm7
2525
2526
2527 movdqa %xmm9,%xmm1
2528 pxor %xmm2,%xmm7
2529 movdqa %xmm9,%xmm2
2530 psrld $2,%xmm1
2531 paddd %xmm7,%xmm6
2532 pxor %xmm4,%xmm0
2533 movdqa %xmm10,%xmm4
2534 movdqa %xmm9,%xmm7
2535 pslld $10,%xmm2
2536 pxor %xmm9,%xmm4
2537
2538
2539 psrld $13,%xmm7
2540 pxor %xmm2,%xmm1
2541 paddd %xmm0,%xmm6
2542 pslld $19-10,%xmm2
2543 pand %xmm4,%xmm3
2544 pxor %xmm7,%xmm1
2545
2546
2547 psrld $22-13,%xmm7
2548 pxor %xmm2,%xmm1
2549 movdqa %xmm10,%xmm8
2550 pslld $30-19,%xmm2
2551 pxor %xmm1,%xmm7
2552 pxor %xmm3,%xmm8
2553 paddd %xmm6,%xmm12
2554 pxor %xmm2,%xmm7
2555
2556 paddd %xmm6,%xmm8
2557 paddd %xmm7,%xmm8
2558 leaq 256(%rbp),%rbp
2559 decl %ecx
2560 jnz .Loop_16_xx
2561
2562 movl $1,%ecx
2563 leaq K256+128(%rip),%rbp
2564
2565 movdqa (%rbx),%xmm7
2566 cmpl 0(%rbx),%ecx
2567 pxor %xmm0,%xmm0
2568 cmovgeq %rbp,%r8
2569 cmpl 4(%rbx),%ecx
2570 movdqa %xmm7,%xmm6
2571 cmovgeq %rbp,%r9
2572 cmpl 8(%rbx),%ecx
2573 pcmpgtd %xmm0,%xmm6
2574 cmovgeq %rbp,%r10
2575 cmpl 12(%rbx),%ecx
2576 paddd %xmm6,%xmm7
2577 cmovgeq %rbp,%r11
2578
2579 movdqu 0-128(%rdi),%xmm0
2580 pand %xmm6,%xmm8
2581 movdqu 32-128(%rdi),%xmm1
2582 pand %xmm6,%xmm9
2583 movdqu 64-128(%rdi),%xmm2
2584 pand %xmm6,%xmm10
2585 movdqu 96-128(%rdi),%xmm5
2586 pand %xmm6,%xmm11
2587 paddd %xmm0,%xmm8
2588 movdqu 128-128(%rdi),%xmm0
2589 pand %xmm6,%xmm12
2590 paddd %xmm1,%xmm9
2591 movdqu 160-128(%rdi),%xmm1
2592 pand %xmm6,%xmm13
2593 paddd %xmm2,%xmm10
2594 movdqu 192-128(%rdi),%xmm2
2595 pand %xmm6,%xmm14
2596 paddd %xmm5,%xmm11
2597 movdqu 224-128(%rdi),%xmm5
2598 pand %xmm6,%xmm15
2599 paddd %xmm0,%xmm12
2600 paddd %xmm1,%xmm13
2601 movdqu %xmm8,0-128(%rdi)
2602 paddd %xmm2,%xmm14
2603 movdqu %xmm9,32-128(%rdi)
2604 paddd %xmm5,%xmm15
2605 movdqu %xmm10,64-128(%rdi)
2606 movdqu %xmm11,96-128(%rdi)
2607 movdqu %xmm12,128-128(%rdi)
2608 movdqu %xmm13,160-128(%rdi)
2609 movdqu %xmm14,192-128(%rdi)
2610 movdqu %xmm15,224-128(%rdi)
2611
2612 movdqa %xmm7,(%rbx)
2613 movdqa .Lpbswap(%rip),%xmm6
2614 decl %edx
2615 jnz .Loop
2616
2617 movl 280(%rsp),%edx
2618 leaq 16(%rdi),%rdi
2619 leaq 64(%rsi),%rsi
2620 decl %edx
2621 jnz .Loop_grande
2622
2623 .Ldone:
2624 movq 272(%rsp),%rax
2625 .cfi_def_cfa %rax,8
2626 movq -16(%rax),%rbp
2627 .cfi_restore %rbp
2628 movq -8(%rax),%rbx
2629 .cfi_restore %rbx
2630 leaq (%rax),%rsp
2631 .cfi_def_cfa_register %rsp
2632 .Lepilogue:
2633 .byte 0xf3,0xc3
2634 .cfi_endproc
2635 .size sha256_multi_block,.-sha256_multi_block
2636 .type sha256_multi_block_shaext,@function
2637 .align 32
2638 sha256_multi_block_shaext:
2639 .cfi_startproc
2640 _shaext_shortcut:
2641 movq %rsp,%rax
2642 .cfi_def_cfa_register %rax
2643 pushq %rbx
2644 .cfi_offset %rbx,-16
2645 pushq %rbp
2646 .cfi_offset %rbp,-24
2647 subq $288,%rsp
2648 shll $1,%edx
2649 andq $-256,%rsp
2650 leaq 128(%rdi),%rdi
2651 movq %rax,272(%rsp)
2652 .Lbody_shaext:
2653 leaq 256(%rsp),%rbx
2654 leaq K256_shaext+128(%rip),%rbp
2655
2656 .Loop_grande_shaext:
2657 movl %edx,280(%rsp)
2658 xorl %edx,%edx
2659 movq 0(%rsi),%r8
2660 movl 8(%rsi),%ecx
2661 cmpl %edx,%ecx
2662 cmovgl %ecx,%edx
2663 testl %ecx,%ecx
2664 movl %ecx,0(%rbx)
2665 cmovleq %rsp,%r8
2666 movq 16(%rsi),%r9
2667 movl 24(%rsi),%ecx
2668 cmpl %edx,%ecx
2669 cmovgl %ecx,%edx
2670 testl %ecx,%ecx
2671 movl %ecx,4(%rbx)
2672 cmovleq %rsp,%r9
2673 testl %edx,%edx
2674 jz .Ldone_shaext
2675
2676 movq 0-128(%rdi),%xmm12
2677 movq 32-128(%rdi),%xmm4
2678 movq 64-128(%rdi),%xmm13
2679 movq 96-128(%rdi),%xmm5
2680 movq 128-128(%rdi),%xmm8
2681 movq 160-128(%rdi),%xmm9
2682 movq 192-128(%rdi),%xmm10
2683 movq 224-128(%rdi),%xmm11
2684
2685 punpckldq %xmm4,%xmm12
2686 punpckldq %xmm5,%xmm13
2687 punpckldq %xmm9,%xmm8
2688 punpckldq %xmm11,%xmm10
2689 movdqa K256_shaext-16(%rip),%xmm3
2690
2691 movdqa %xmm12,%xmm14
2692 movdqa %xmm13,%xmm15
2693 punpcklqdq %xmm8,%xmm12
2694 punpcklqdq %xmm10,%xmm13
2695 punpckhqdq %xmm8,%xmm14
2696 punpckhqdq %xmm10,%xmm15
2697
2698 pshufd $27,%xmm12,%xmm12
2699 pshufd $27,%xmm13,%xmm13
2700 pshufd $27,%xmm14,%xmm14
2701 pshufd $27,%xmm15,%xmm15
2702 jmp .Loop_shaext
2703
2704 .align 32
2705 .Loop_shaext:
2706 movdqu 0(%r8),%xmm4
2707 movdqu 0(%r9),%xmm8
2708 movdqu 16(%r8),%xmm5
2709 movdqu 16(%r9),%xmm9
2710 movdqu 32(%r8),%xmm6
2711 .byte 102,15,56,0,227
2712 movdqu 32(%r9),%xmm10
2713 .byte 102,68,15,56,0,195
2714 movdqu 48(%r8),%xmm7
2715 leaq 64(%r8),%r8
2716 movdqu 48(%r9),%xmm11
2717 leaq 64(%r9),%r9
2718
2719 movdqa 0-128(%rbp),%xmm0
2720 .byte 102,15,56,0,235
2721 paddd %xmm4,%xmm0
2722 pxor %xmm12,%xmm4
2723 movdqa %xmm0,%xmm1
2724 movdqa 0-128(%rbp),%xmm2
2725 .byte 102,68,15,56,0,203
2726 paddd %xmm8,%xmm2
2727 movdqa %xmm13,80(%rsp)
2728 .byte 69,15,56,203,236
2729 pxor %xmm14,%xmm8
2730 movdqa %xmm2,%xmm0
2731 movdqa %xmm15,112(%rsp)
2732 .byte 69,15,56,203,254
2733 pshufd $0x0e,%xmm1,%xmm0
2734 pxor %xmm12,%xmm4
2735 movdqa %xmm12,64(%rsp)
2736 .byte 69,15,56,203,229
2737 pshufd $0x0e,%xmm2,%xmm0
2738 pxor %xmm14,%xmm8
2739 movdqa %xmm14,96(%rsp)
2740 movdqa 16-128(%rbp),%xmm1
2741 paddd %xmm5,%xmm1
2742 .byte 102,15,56,0,243
2743 .byte 69,15,56,203,247
2744
2745 movdqa %xmm1,%xmm0
2746 movdqa 16-128(%rbp),%xmm2
2747 paddd %xmm9,%xmm2
2748 .byte 69,15,56,203,236
2749 movdqa %xmm2,%xmm0
2750 prefetcht0 127(%r8)
2751 .byte 102,15,56,0,251
2752 .byte 102,68,15,56,0,211
2753 prefetcht0 127(%r9)
2754 .byte 69,15,56,203,254
2755 pshufd $0x0e,%xmm1,%xmm0
2756 .byte 102,68,15,56,0,219
2757 .byte 15,56,204,229
2758 .byte 69,15,56,203,229
2759 pshufd $0x0e,%xmm2,%xmm0
2760 movdqa 32-128(%rbp),%xmm1
2761 paddd %xmm6,%xmm1
2762 .byte 69,15,56,203,247
2763
2764 movdqa %xmm1,%xmm0
2765 movdqa 32-128(%rbp),%xmm2
2766 paddd %xmm10,%xmm2
2767 .byte 69,15,56,203,236
2768 .byte 69,15,56,204,193
2769 movdqa %xmm2,%xmm0
2770 movdqa %xmm7,%xmm3
2771 .byte 69,15,56,203,254
2772 pshufd $0x0e,%xmm1,%xmm0
2773 .byte 102,15,58,15,222,4
2774 paddd %xmm3,%xmm4
2775 movdqa %xmm11,%xmm3
2776 .byte 102,65,15,58,15,218,4
2777 .byte 15,56,204,238
2778 .byte 69,15,56,203,229
2779 pshufd $0x0e,%xmm2,%xmm0
2780 movdqa 48-128(%rbp),%xmm1
2781 paddd %xmm7,%xmm1
2782 .byte 69,15,56,203,247
2783 .byte 69,15,56,204,202
2784
2785 movdqa %xmm1,%xmm0
2786 movdqa 48-128(%rbp),%xmm2
2787 paddd %xmm3,%xmm8
2788 paddd %xmm11,%xmm2
2789 .byte 15,56,205,231
2790 .byte 69,15,56,203,236
2791 movdqa %xmm2,%xmm0
2792 movdqa %xmm4,%xmm3
2793 .byte 102,15,58,15,223,4
2794 .byte 69,15,56,203,254
2795 .byte 69,15,56,205,195
2796 pshufd $0x0e,%xmm1,%xmm0
2797 paddd %xmm3,%xmm5
2798 movdqa %xmm8,%xmm3
2799 .byte 102,65,15,58,15,219,4
2800 .byte 15,56,204,247
2801 .byte 69,15,56,203,229
2802 pshufd $0x0e,%xmm2,%xmm0
2803 movdqa 64-128(%rbp),%xmm1
2804 paddd %xmm4,%xmm1
2805 .byte 69,15,56,203,247
2806 .byte 69,15,56,204,211
2807 movdqa %xmm1,%xmm0
2808 movdqa 64-128(%rbp),%xmm2
2809 paddd %xmm3,%xmm9
2810 paddd %xmm8,%xmm2
2811 .byte 15,56,205,236
2812 .byte 69,15,56,203,236
2813 movdqa %xmm2,%xmm0
2814 movdqa %xmm5,%xmm3
2815 .byte 102,15,58,15,220,4
2816 .byte 69,15,56,203,254
2817 .byte 69,15,56,205,200
2818 pshufd $0x0e,%xmm1,%xmm0
2819 paddd %xmm3,%xmm6
2820 movdqa %xmm9,%xmm3
2821 .byte 102,65,15,58,15,216,4
2822 .byte 15,56,204,252
2823 .byte 69,15,56,203,229
2824 pshufd $0x0e,%xmm2,%xmm0
2825 movdqa 80-128(%rbp),%xmm1
2826 paddd %xmm5,%xmm1
2827 .byte 69,15,56,203,247
2828 .byte 69,15,56,204,216
2829 movdqa %xmm1,%xmm0
2830 movdqa 80-128(%rbp),%xmm2
2831 paddd %xmm3,%xmm10
2832 paddd %xmm9,%xmm2
2833 .byte 15,56,205,245
2834 .byte 69,15,56,203,236
2835 movdqa %xmm2,%xmm0
2836 movdqa %xmm6,%xmm3
2837 .byte 102,15,58,15,221,4
2838 .byte 69,15,56,203,254
2839 .byte 69,15,56,205,209
2840 pshufd $0x0e,%xmm1,%xmm0
2841 paddd %xmm3,%xmm7
2842 movdqa %xmm10,%xmm3
2843 .byte 102,65,15,58,15,217,4
2844 .byte 15,56,204,229
2845 .byte 69,15,56,203,229
2846 pshufd $0x0e,%xmm2,%xmm0
2847 movdqa 96-128(%rbp),%xmm1
2848 paddd %xmm6,%xmm1
2849 .byte 69,15,56,203,247
2850 .byte 69,15,56,204,193
2851 movdqa %xmm1,%xmm0
2852 movdqa 96-128(%rbp),%xmm2
2853 paddd %xmm3,%xmm11
2854 paddd %xmm10,%xmm2
2855 .byte 15,56,205,254
2856 .byte 69,15,56,203,236
2857 movdqa %xmm2,%xmm0
2858 movdqa %xmm7,%xmm3
2859 .byte 102,15,58,15,222,4
2860 .byte 69,15,56,203,254
2861 .byte 69,15,56,205,218
2862 pshufd $0x0e,%xmm1,%xmm0
2863 paddd %xmm3,%xmm4
2864 movdqa %xmm11,%xmm3
2865 .byte 102,65,15,58,15,218,4
2866 .byte 15,56,204,238
2867 .byte 69,15,56,203,229
2868 pshufd $0x0e,%xmm2,%xmm0
2869 movdqa 112-128(%rbp),%xmm1
2870 paddd %xmm7,%xmm1
2871 .byte 69,15,56,203,247
2872 .byte 69,15,56,204,202
2873 movdqa %xmm1,%xmm0
2874 movdqa 112-128(%rbp),%xmm2
2875 paddd %xmm3,%xmm8
2876 paddd %xmm11,%xmm2
2877 .byte 15,56,205,231
2878 .byte 69,15,56,203,236
2879 movdqa %xmm2,%xmm0
2880 movdqa %xmm4,%xmm3
2881 .byte 102,15,58,15,223,4
2882 .byte 69,15,56,203,254
2883 .byte 69,15,56,205,195
2884 pshufd $0x0e,%xmm1,%xmm0
2885 paddd %xmm3,%xmm5
2886 movdqa %xmm8,%xmm3
2887 .byte 102,65,15,58,15,219,4
2888 .byte 15,56,204,247
2889 .byte 69,15,56,203,229
2890 pshufd $0x0e,%xmm2,%xmm0
2891 movdqa 128-128(%rbp),%xmm1
2892 paddd %xmm4,%xmm1
2893 .byte 69,15,56,203,247
2894 .byte 69,15,56,204,211
2895 movdqa %xmm1,%xmm0
2896 movdqa 128-128(%rbp),%xmm2
2897 paddd %xmm3,%xmm9
2898 paddd %xmm8,%xmm2
2899 .byte 15,56,205,236
2900 .byte 69,15,56,203,236
2901 movdqa %xmm2,%xmm0
2902 movdqa %xmm5,%xmm3
2903 .byte 102,15,58,15,220,4
2904 .byte 69,15,56,203,254
2905 .byte 69,15,56,205,200
2906 pshufd $0x0e,%xmm1,%xmm0
2907 paddd %xmm3,%xmm6
2908 movdqa %xmm9,%xmm3
2909 .byte 102,65,15,58,15,216,4
2910 .byte 15,56,204,252
2911 .byte 69,15,56,203,229
2912 pshufd $0x0e,%xmm2,%xmm0
2913 movdqa 144-128(%rbp),%xmm1
2914 paddd %xmm5,%xmm1
2915 .byte 69,15,56,203,247
2916 .byte 69,15,56,204,216
2917 movdqa %xmm1,%xmm0
2918 movdqa 144-128(%rbp),%xmm2
2919 paddd %xmm3,%xmm10
2920 paddd %xmm9,%xmm2
2921 .byte 15,56,205,245
2922 .byte 69,15,56,203,236
2923 movdqa %xmm2,%xmm0
2924 movdqa %xmm6,%xmm3
2925 .byte 102,15,58,15,221,4
2926 .byte 69,15,56,203,254
2927 .byte 69,15,56,205,209
2928 pshufd $0x0e,%xmm1,%xmm0
2929 paddd %xmm3,%xmm7
2930 movdqa %xmm10,%xmm3
2931 .byte 102,65,15,58,15,217,4
2932 .byte 15,56,204,229
2933 .byte 69,15,56,203,229
2934 pshufd $0x0e,%xmm2,%xmm0
2935 movdqa 160-128(%rbp),%xmm1
2936 paddd %xmm6,%xmm1
2937 .byte 69,15,56,203,247
2938 .byte 69,15,56,204,193
2939 movdqa %xmm1,%xmm0
2940 movdqa 160-128(%rbp),%xmm2
2941 paddd %xmm3,%xmm11
2942 paddd %xmm10,%xmm2
2943 .byte 15,56,205,254
2944 .byte 69,15,56,203,236
2945 movdqa %xmm2,%xmm0
2946 movdqa %xmm7,%xmm3
2947 .byte 102,15,58,15,222,4
2948 .byte 69,15,56,203,254
2949 .byte 69,15,56,205,218
2950 pshufd $0x0e,%xmm1,%xmm0
2951 paddd %xmm3,%xmm4
2952 movdqa %xmm11,%xmm3
2953 .byte 102,65,15,58,15,218,4
2954 .byte 15,56,204,238
2955 .byte 69,15,56,203,229
2956 pshufd $0x0e,%xmm2,%xmm0
2957 movdqa 176-128(%rbp),%xmm1
2958 paddd %xmm7,%xmm1
2959 .byte 69,15,56,203,247
2960 .byte 69,15,56,204,202
2961 movdqa %xmm1,%xmm0
2962 movdqa 176-128(%rbp),%xmm2
2963 paddd %xmm3,%xmm8
2964 paddd %xmm11,%xmm2
2965 .byte 15,56,205,231
2966 .byte 69,15,56,203,236
2967 movdqa %xmm2,%xmm0
2968 movdqa %xmm4,%xmm3
2969 .byte 102,15,58,15,223,4
2970 .byte 69,15,56,203,254
2971 .byte 69,15,56,205,195
2972 pshufd $0x0e,%xmm1,%xmm0
2973 paddd %xmm3,%xmm5
2974 movdqa %xmm8,%xmm3
2975 .byte 102,65,15,58,15,219,4
2976 .byte 15,56,204,247
2977 .byte 69,15,56,203,229
2978 pshufd $0x0e,%xmm2,%xmm0
2979 movdqa 192-128(%rbp),%xmm1
2980 paddd %xmm4,%xmm1
2981 .byte 69,15,56,203,247
2982 .byte 69,15,56,204,211
2983 movdqa %xmm1,%xmm0
2984 movdqa 192-128(%rbp),%xmm2
2985 paddd %xmm3,%xmm9
2986 paddd %xmm8,%xmm2
2987 .byte 15,56,205,236
2988 .byte 69,15,56,203,236
2989 movdqa %xmm2,%xmm0
2990 movdqa %xmm5,%xmm3
2991 .byte 102,15,58,15,220,4
2992 .byte 69,15,56,203,254
2993 .byte 69,15,56,205,200
2994 pshufd $0x0e,%xmm1,%xmm0
2995 paddd %xmm3,%xmm6
2996 movdqa %xmm9,%xmm3
2997 .byte 102,65,15,58,15,216,4
2998 .byte 15,56,204,252
2999 .byte 69,15,56,203,229
3000 pshufd $0x0e,%xmm2,%xmm0
3001 movdqa 208-128(%rbp),%xmm1
3002 paddd %xmm5,%xmm1
3003 .byte 69,15,56,203,247
3004 .byte 69,15,56,204,216
3005 movdqa %xmm1,%xmm0
3006 movdqa 208-128(%rbp),%xmm2
3007 paddd %xmm3,%xmm10
3008 paddd %xmm9,%xmm2
3009 .byte 15,56,205,245
3010 .byte 69,15,56,203,236
3011 movdqa %xmm2,%xmm0
3012 movdqa %xmm6,%xmm3
3013 .byte 102,15,58,15,221,4
3014 .byte 69,15,56,203,254
3015 .byte 69,15,56,205,209
3016 pshufd $0x0e,%xmm1,%xmm0
3017 paddd %xmm3,%xmm7
3018 movdqa %xmm10,%xmm3
3019 .byte 102,65,15,58,15,217,4
3020 nop
3021 .byte 69,15,56,203,229
3022 pshufd $0x0e,%xmm2,%xmm0
3023 movdqa 224-128(%rbp),%xmm1
3024 paddd %xmm6,%xmm1
3025 .byte 69,15,56,203,247
3026
3027 movdqa %xmm1,%xmm0
3028 movdqa 224-128(%rbp),%xmm2
3029 paddd %xmm3,%xmm11
3030 paddd %xmm10,%xmm2
3031 .byte 15,56,205,254
3032 nop
3033 .byte 69,15,56,203,236
3034 movdqa %xmm2,%xmm0
3035 movl $1,%ecx
3036 pxor %xmm6,%xmm6
3037 .byte 69,15,56,203,254
3038 .byte 69,15,56,205,218
3039 pshufd $0x0e,%xmm1,%xmm0
3040 movdqa 240-128(%rbp),%xmm1
3041 paddd %xmm7,%xmm1
3042 movq (%rbx),%xmm7
3043 nop
3044 .byte 69,15,56,203,229
3045 pshufd $0x0e,%xmm2,%xmm0
3046 movdqa 240-128(%rbp),%xmm2
3047 paddd %xmm11,%xmm2
3048 .byte 69,15,56,203,247
3049
3050 movdqa %xmm1,%xmm0
3051 cmpl 0(%rbx),%ecx
3052 cmovgeq %rsp,%r8
3053 cmpl 4(%rbx),%ecx
3054 cmovgeq %rsp,%r9
3055 pshufd $0x00,%xmm7,%xmm9
3056 .byte 69,15,56,203,236
3057 movdqa %xmm2,%xmm0
3058 pshufd $0x55,%xmm7,%xmm10
3059 movdqa %xmm7,%xmm11
3060 .byte 69,15,56,203,254
3061 pshufd $0x0e,%xmm1,%xmm0
3062 pcmpgtd %xmm6,%xmm9
3063 pcmpgtd %xmm6,%xmm10
3064 .byte 69,15,56,203,229
3065 pshufd $0x0e,%xmm2,%xmm0
3066 pcmpgtd %xmm6,%xmm11
3067 movdqa K256_shaext-16(%rip),%xmm3
3068 .byte 69,15,56,203,247
3069
3070 pand %xmm9,%xmm13
3071 pand %xmm10,%xmm15
3072 pand %xmm9,%xmm12
3073 pand %xmm10,%xmm14
3074 paddd %xmm7,%xmm11
3075
3076 paddd 80(%rsp),%xmm13
3077 paddd 112(%rsp),%xmm15
3078 paddd 64(%rsp),%xmm12
3079 paddd 96(%rsp),%xmm14
3080
3081 movq %xmm11,(%rbx)
3082 decl %edx
3083 jnz .Loop_shaext
3084
3085 movl 280(%rsp),%edx
3086
3087 pshufd $27,%xmm12,%xmm12
3088 pshufd $27,%xmm13,%xmm13
3089 pshufd $27,%xmm14,%xmm14
3090 pshufd $27,%xmm15,%xmm15
3091
3092 movdqa %xmm12,%xmm5
3093 movdqa %xmm13,%xmm6
3094 punpckldq %xmm14,%xmm12
3095 punpckhdq %xmm14,%xmm5
3096 punpckldq %xmm15,%xmm13
3097 punpckhdq %xmm15,%xmm6
3098
3099 movq %xmm12,0-128(%rdi)
3100 psrldq $8,%xmm12
3101 movq %xmm5,128-128(%rdi)
3102 psrldq $8,%xmm5
3103 movq %xmm12,32-128(%rdi)
3104 movq %xmm5,160-128(%rdi)
3105
3106 movq %xmm13,64-128(%rdi)
3107 psrldq $8,%xmm13
3108 movq %xmm6,192-128(%rdi)
3109 psrldq $8,%xmm6
3110 movq %xmm13,96-128(%rdi)
3111 movq %xmm6,224-128(%rdi)
3112
3113 leaq 8(%rdi),%rdi
3114 leaq 32(%rsi),%rsi
3115 decl %edx
3116 jnz .Loop_grande_shaext
3117
3118 .Ldone_shaext:
3119
3120 movq -16(%rax),%rbp
3121 .cfi_restore %rbp
3122 movq -8(%rax),%rbx
3123 .cfi_restore %rbx
3124 leaq (%rax),%rsp
3125 .cfi_def_cfa_register %rsp
3126 .Lepilogue_shaext:
3127 .byte 0xf3,0xc3
3128 .cfi_endproc
3129 .size sha256_multi_block_shaext,.-sha256_multi_block_shaext
3130 .type sha256_multi_block_avx,@function
3131 .align 32
3132 sha256_multi_block_avx:
3133 .cfi_startproc
3134 _avx_shortcut:
3135 shrq $32,%rcx
3136 cmpl $2,%edx
3137 jb .Lavx
3138 testl $32,%ecx
3139 jnz _avx2_shortcut
3140 jmp .Lavx
3141 .align 32
3142 .Lavx:
3143 movq %rsp,%rax
3144 .cfi_def_cfa_register %rax
3145 pushq %rbx
3146 .cfi_offset %rbx,-16
3147 pushq %rbp
3148 .cfi_offset %rbp,-24
3149 subq $288,%rsp
3150 andq $-256,%rsp
3151 movq %rax,272(%rsp)
3152 .cfi_escape 0x0f,0x06,0x77,0x90,0x02,0x06,0x23,0x08
3153 .Lbody_avx:
3154 leaq K256+128(%rip),%rbp
3155 leaq 256(%rsp),%rbx
3156 leaq 128(%rdi),%rdi
3157
3158 .Loop_grande_avx:
3159 movl %edx,280(%rsp)
3160 xorl %edx,%edx
3161 movq 0(%rsi),%r8
3162 movl 8(%rsi),%ecx
3163 cmpl %edx,%ecx
3164 cmovgl %ecx,%edx
3165 testl %ecx,%ecx
3166 movl %ecx,0(%rbx)
3167 cmovleq %rbp,%r8
3168 movq 16(%rsi),%r9
3169 movl 24(%rsi),%ecx
3170 cmpl %edx,%ecx
3171 cmovgl %ecx,%edx
3172 testl %ecx,%ecx
3173 movl %ecx,4(%rbx)
3174 cmovleq %rbp,%r9
3175 movq 32(%rsi),%r10
3176 movl 40(%rsi),%ecx
3177 cmpl %edx,%ecx
3178 cmovgl %ecx,%edx
3179 testl %ecx,%ecx
3180 movl %ecx,8(%rbx)
3181 cmovleq %rbp,%r10
3182 movq 48(%rsi),%r11
3183 movl 56(%rsi),%ecx
3184 cmpl %edx,%ecx
3185 cmovgl %ecx,%edx
3186 testl %ecx,%ecx
3187 movl %ecx,12(%rbx)
3188 cmovleq %rbp,%r11
3189 testl %edx,%edx
3190 jz .Ldone_avx
3191
3192 vmovdqu 0-128(%rdi),%xmm8
3193 leaq 128(%rsp),%rax
3194 vmovdqu 32-128(%rdi),%xmm9
3195 vmovdqu 64-128(%rdi),%xmm10
3196 vmovdqu 96-128(%rdi),%xmm11
3197 vmovdqu 128-128(%rdi),%xmm12
3198 vmovdqu 160-128(%rdi),%xmm13
3199 vmovdqu 192-128(%rdi),%xmm14
3200 vmovdqu 224-128(%rdi),%xmm15
3201 vmovdqu .Lpbswap(%rip),%xmm6
3202 jmp .Loop_avx
3203
3204 .align 32
3205 .Loop_avx:
3206 vpxor %xmm9,%xmm10,%xmm4
3207 vmovd 0(%r8),%xmm5
3208 vmovd 0(%r9),%xmm0
3209 vpinsrd $1,0(%r10),%xmm5,%xmm5
3210 vpinsrd $1,0(%r11),%xmm0,%xmm0
3211 vpunpckldq %xmm0,%xmm5,%xmm5
3212 vpshufb %xmm6,%xmm5,%xmm5
3213 vpsrld $6,%xmm12,%xmm7
3214 vpslld $26,%xmm12,%xmm2
3215 vmovdqu %xmm5,0-128(%rax)
3216 vpaddd %xmm15,%xmm5,%xmm5
3217
3218 vpsrld $11,%xmm12,%xmm1
3219 vpxor %xmm2,%xmm7,%xmm7
3220 vpslld $21,%xmm12,%xmm2
3221 vpaddd -128(%rbp),%xmm5,%xmm5
3222 vpxor %xmm1,%xmm7,%xmm7
3223
3224 vpsrld $25,%xmm12,%xmm1
3225 vpxor %xmm2,%xmm7,%xmm7
3226
3227 vpslld $7,%xmm12,%xmm2
3228 vpandn %xmm14,%xmm12,%xmm0
3229 vpand %xmm13,%xmm12,%xmm3
3230
3231 vpxor %xmm1,%xmm7,%xmm7
3232
3233 vpsrld $2,%xmm8,%xmm15
3234 vpxor %xmm2,%xmm7,%xmm7
3235
3236 vpslld $30,%xmm8,%xmm1
3237 vpxor %xmm3,%xmm0,%xmm0
3238 vpxor %xmm8,%xmm9,%xmm3
3239
3240 vpxor %xmm1,%xmm15,%xmm15
3241 vpaddd %xmm7,%xmm5,%xmm5
3242
3243 vpsrld $13,%xmm8,%xmm1
3244
3245 vpslld $19,%xmm8,%xmm2
3246 vpaddd %xmm0,%xmm5,%xmm5
3247 vpand %xmm3,%xmm4,%xmm4
3248
3249 vpxor %xmm1,%xmm15,%xmm7
3250
3251 vpsrld $22,%xmm8,%xmm1
3252 vpxor %xmm2,%xmm7,%xmm7
3253
3254 vpslld $10,%xmm8,%xmm2
3255 vpxor %xmm4,%xmm9,%xmm15
3256 vpaddd %xmm5,%xmm11,%xmm11
3257
3258 vpxor %xmm1,%xmm7,%xmm7
3259 vpxor %xmm2,%xmm7,%xmm7
3260
3261 vpaddd %xmm5,%xmm15,%xmm15
3262 vpaddd %xmm7,%xmm15,%xmm15
3263 vmovd 4(%r8),%xmm5
3264 vmovd 4(%r9),%xmm0
3265 vpinsrd $1,4(%r10),%xmm5,%xmm5
3266 vpinsrd $1,4(%r11),%xmm0,%xmm0
3267 vpunpckldq %xmm0,%xmm5,%xmm5
3268 vpshufb %xmm6,%xmm5,%xmm5
3269 vpsrld $6,%xmm11,%xmm7
3270 vpslld $26,%xmm11,%xmm2
3271 vmovdqu %xmm5,16-128(%rax)
3272 vpaddd %xmm14,%xmm5,%xmm5
3273
3274 vpsrld $11,%xmm11,%xmm1
3275 vpxor %xmm2,%xmm7,%xmm7
3276 vpslld $21,%xmm11,%xmm2
3277 vpaddd -96(%rbp),%xmm5,%xmm5
3278 vpxor %xmm1,%xmm7,%xmm7
3279
3280 vpsrld $25,%xmm11,%xmm1
3281 vpxor %xmm2,%xmm7,%xmm7
3282
3283 vpslld $7,%xmm11,%xmm2
3284 vpandn %xmm13,%xmm11,%xmm0
3285 vpand %xmm12,%xmm11,%xmm4
3286
3287 vpxor %xmm1,%xmm7,%xmm7
3288
3289 vpsrld $2,%xmm15,%xmm14
3290 vpxor %xmm2,%xmm7,%xmm7
3291
3292 vpslld $30,%xmm15,%xmm1
3293 vpxor %xmm4,%xmm0,%xmm0
3294 vpxor %xmm15,%xmm8,%xmm4
3295
3296 vpxor %xmm1,%xmm14,%xmm14
3297 vpaddd %xmm7,%xmm5,%xmm5
3298
3299 vpsrld $13,%xmm15,%xmm1
3300
3301 vpslld $19,%xmm15,%xmm2
3302 vpaddd %xmm0,%xmm5,%xmm5
3303 vpand %xmm4,%xmm3,%xmm3
3304
3305 vpxor %xmm1,%xmm14,%xmm7
3306
3307 vpsrld $22,%xmm15,%xmm1
3308 vpxor %xmm2,%xmm7,%xmm7
3309
3310 vpslld $10,%xmm15,%xmm2
3311 vpxor %xmm3,%xmm8,%xmm14
3312 vpaddd %xmm5,%xmm10,%xmm10
3313
3314 vpxor %xmm1,%xmm7,%xmm7
3315 vpxor %xmm2,%xmm7,%xmm7
3316
3317 vpaddd %xmm5,%xmm14,%xmm14
3318 vpaddd %xmm7,%xmm14,%xmm14
3319 vmovd 8(%r8),%xmm5
3320 vmovd 8(%r9),%xmm0
3321 vpinsrd $1,8(%r10),%xmm5,%xmm5
3322 vpinsrd $1,8(%r11),%xmm0,%xmm0
3323 vpunpckldq %xmm0,%xmm5,%xmm5
3324 vpshufb %xmm6,%xmm5,%xmm5
3325 vpsrld $6,%xmm10,%xmm7
3326 vpslld $26,%xmm10,%xmm2
3327 vmovdqu %xmm5,32-128(%rax)
3328 vpaddd %xmm13,%xmm5,%xmm5
3329
3330 vpsrld $11,%xmm10,%xmm1
3331 vpxor %xmm2,%xmm7,%xmm7
3332 vpslld $21,%xmm10,%xmm2
3333 vpaddd -64(%rbp),%xmm5,%xmm5
3334 vpxor %xmm1,%xmm7,%xmm7
3335
3336 vpsrld $25,%xmm10,%xmm1
3337 vpxor %xmm2,%xmm7,%xmm7
3338
3339 vpslld $7,%xmm10,%xmm2
3340 vpandn %xmm12,%xmm10,%xmm0
3341 vpand %xmm11,%xmm10,%xmm3
3342
3343 vpxor %xmm1,%xmm7,%xmm7
3344
3345 vpsrld $2,%xmm14,%xmm13
3346 vpxor %xmm2,%xmm7,%xmm7
3347
3348 vpslld $30,%xmm14,%xmm1
3349 vpxor %xmm3,%xmm0,%xmm0
3350 vpxor %xmm14,%xmm15,%xmm3
3351
3352 vpxor %xmm1,%xmm13,%xmm13
3353 vpaddd %xmm7,%xmm5,%xmm5
3354
3355 vpsrld $13,%xmm14,%xmm1
3356
3357 vpslld $19,%xmm14,%xmm2
3358 vpaddd %xmm0,%xmm5,%xmm5
3359 vpand %xmm3,%xmm4,%xmm4
3360
3361 vpxor %xmm1,%xmm13,%xmm7
3362
3363 vpsrld $22,%xmm14,%xmm1
3364 vpxor %xmm2,%xmm7,%xmm7
3365
3366 vpslld $10,%xmm14,%xmm2
3367 vpxor %xmm4,%xmm15,%xmm13
3368 vpaddd %xmm5,%xmm9,%xmm9
3369
3370 vpxor %xmm1,%xmm7,%xmm7
3371 vpxor %xmm2,%xmm7,%xmm7
3372
3373 vpaddd %xmm5,%xmm13,%xmm13
3374 vpaddd %xmm7,%xmm13,%xmm13
3375 vmovd 12(%r8),%xmm5
3376 vmovd 12(%r9),%xmm0
3377 vpinsrd $1,12(%r10),%xmm5,%xmm5
3378 vpinsrd $1,12(%r11),%xmm0,%xmm0
3379 vpunpckldq %xmm0,%xmm5,%xmm5
3380 vpshufb %xmm6,%xmm5,%xmm5
3381 vpsrld $6,%xmm9,%xmm7
3382 vpslld $26,%xmm9,%xmm2
3383 vmovdqu %xmm5,48-128(%rax)
3384 vpaddd %xmm12,%xmm5,%xmm5
3385
3386 vpsrld $11,%xmm9,%xmm1
3387 vpxor %xmm2,%xmm7,%xmm7
3388 vpslld $21,%xmm9,%xmm2
3389 vpaddd -32(%rbp),%xmm5,%xmm5
3390 vpxor %xmm1,%xmm7,%xmm7
3391
3392 vpsrld $25,%xmm9,%xmm1
3393 vpxor %xmm2,%xmm7,%xmm7
3394
3395 vpslld $7,%xmm9,%xmm2
3396 vpandn %xmm11,%xmm9,%xmm0
3397 vpand %xmm10,%xmm9,%xmm4
3398
3399 vpxor %xmm1,%xmm7,%xmm7
3400
3401 vpsrld $2,%xmm13,%xmm12
3402 vpxor %xmm2,%xmm7,%xmm7
3403
3404 vpslld $30,%xmm13,%xmm1
3405 vpxor %xmm4,%xmm0,%xmm0
3406 vpxor %xmm13,%xmm14,%xmm4
3407
3408 vpxor %xmm1,%xmm12,%xmm12
3409 vpaddd %xmm7,%xmm5,%xmm5
3410
3411 vpsrld $13,%xmm13,%xmm1
3412
3413 vpslld $19,%xmm13,%xmm2
3414 vpaddd %xmm0,%xmm5,%xmm5
3415 vpand %xmm4,%xmm3,%xmm3
3416
3417 vpxor %xmm1,%xmm12,%xmm7
3418
3419 vpsrld $22,%xmm13,%xmm1
3420 vpxor %xmm2,%xmm7,%xmm7
3421
3422 vpslld $10,%xmm13,%xmm2
3423 vpxor %xmm3,%xmm14,%xmm12
3424 vpaddd %xmm5,%xmm8,%xmm8
3425
3426 vpxor %xmm1,%xmm7,%xmm7
3427 vpxor %xmm2,%xmm7,%xmm7
3428
3429 vpaddd %xmm5,%xmm12,%xmm12
3430 vpaddd %xmm7,%xmm12,%xmm12
3431 vmovd 16(%r8),%xmm5
3432 vmovd 16(%r9),%xmm0
3433 vpinsrd $1,16(%r10),%xmm5,%xmm5
3434 vpinsrd $1,16(%r11),%xmm0,%xmm0
3435 vpunpckldq %xmm0,%xmm5,%xmm5
3436 vpshufb %xmm6,%xmm5,%xmm5
3437 vpsrld $6,%xmm8,%xmm7
3438 vpslld $26,%xmm8,%xmm2
3439 vmovdqu %xmm5,64-128(%rax)
3440 vpaddd %xmm11,%xmm5,%xmm5
3441
3442 vpsrld $11,%xmm8,%xmm1
3443 vpxor %xmm2,%xmm7,%xmm7
3444 vpslld $21,%xmm8,%xmm2
3445 vpaddd 0(%rbp),%xmm5,%xmm5
3446 vpxor %xmm1,%xmm7,%xmm7
3447
3448 vpsrld $25,%xmm8,%xmm1
3449 vpxor %xmm2,%xmm7,%xmm7
3450
3451 vpslld $7,%xmm8,%xmm2
3452 vpandn %xmm10,%xmm8,%xmm0
3453 vpand %xmm9,%xmm8,%xmm3
3454
3455 vpxor %xmm1,%xmm7,%xmm7
3456
3457 vpsrld $2,%xmm12,%xmm11
3458 vpxor %xmm2,%xmm7,%xmm7
3459
3460 vpslld $30,%xmm12,%xmm1
3461 vpxor %xmm3,%xmm0,%xmm0
3462 vpxor %xmm12,%xmm13,%xmm3
3463
3464 vpxor %xmm1,%xmm11,%xmm11
3465 vpaddd %xmm7,%xmm5,%xmm5
3466
3467 vpsrld $13,%xmm12,%xmm1
3468
3469 vpslld $19,%xmm12,%xmm2
3470 vpaddd %xmm0,%xmm5,%xmm5
3471 vpand %xmm3,%xmm4,%xmm4
3472
3473 vpxor %xmm1,%xmm11,%xmm7
3474
3475 vpsrld $22,%xmm12,%xmm1
3476 vpxor %xmm2,%xmm7,%xmm7
3477
3478 vpslld $10,%xmm12,%xmm2
3479 vpxor %xmm4,%xmm13,%xmm11
3480 vpaddd %xmm5,%xmm15,%xmm15
3481
3482 vpxor %xmm1,%xmm7,%xmm7
3483 vpxor %xmm2,%xmm7,%xmm7
3484
3485 vpaddd %xmm5,%xmm11,%xmm11
3486 vpaddd %xmm7,%xmm11,%xmm11
3487 vmovd 20(%r8),%xmm5
3488 vmovd 20(%r9),%xmm0
3489 vpinsrd $1,20(%r10),%xmm5,%xmm5
3490 vpinsrd $1,20(%r11),%xmm0,%xmm0
3491 vpunpckldq %xmm0,%xmm5,%xmm5
3492 vpshufb %xmm6,%xmm5,%xmm5
3493 vpsrld $6,%xmm15,%xmm7
3494 vpslld $26,%xmm15,%xmm2
3495 vmovdqu %xmm5,80-128(%rax)
3496 vpaddd %xmm10,%xmm5,%xmm5
3497
3498 vpsrld $11,%xmm15,%xmm1
3499 vpxor %xmm2,%xmm7,%xmm7
3500 vpslld $21,%xmm15,%xmm2
3501 vpaddd 32(%rbp),%xmm5,%xmm5
3502 vpxor %xmm1,%xmm7,%xmm7
3503
3504 vpsrld $25,%xmm15,%xmm1
3505 vpxor %xmm2,%xmm7,%xmm7
3506
3507 vpslld $7,%xmm15,%xmm2
3508 vpandn %xmm9,%xmm15,%xmm0
3509 vpand %xmm8,%xmm15,%xmm4
3510
3511 vpxor %xmm1,%xmm7,%xmm7
3512
3513 vpsrld $2,%xmm11,%xmm10
3514 vpxor %xmm2,%xmm7,%xmm7
3515
3516 vpslld $30,%xmm11,%xmm1
3517 vpxor %xmm4,%xmm0,%xmm0
3518 vpxor %xmm11,%xmm12,%xmm4
3519
3520 vpxor %xmm1,%xmm10,%xmm10
3521 vpaddd %xmm7,%xmm5,%xmm5
3522
3523 vpsrld $13,%xmm11,%xmm1
3524
3525 vpslld $19,%xmm11,%xmm2
3526 vpaddd %xmm0,%xmm5,%xmm5
3527 vpand %xmm4,%xmm3,%xmm3
3528
3529 vpxor %xmm1,%xmm10,%xmm7
3530
3531 vpsrld $22,%xmm11,%xmm1
3532 vpxor %xmm2,%xmm7,%xmm7
3533
3534 vpslld $10,%xmm11,%xmm2
3535 vpxor %xmm3,%xmm12,%xmm10
3536 vpaddd %xmm5,%xmm14,%xmm14
3537
3538 vpxor %xmm1,%xmm7,%xmm7
3539 vpxor %xmm2,%xmm7,%xmm7
3540
3541 vpaddd %xmm5,%xmm10,%xmm10
3542 vpaddd %xmm7,%xmm10,%xmm10
3543 vmovd 24(%r8),%xmm5
3544 vmovd 24(%r9),%xmm0
3545 vpinsrd $1,24(%r10),%xmm5,%xmm5
3546 vpinsrd $1,24(%r11),%xmm0,%xmm0
3547 vpunpckldq %xmm0,%xmm5,%xmm5
3548 vpshufb %xmm6,%xmm5,%xmm5
3549 vpsrld $6,%xmm14,%xmm7
3550 vpslld $26,%xmm14,%xmm2
3551 vmovdqu %xmm5,96-128(%rax)
3552 vpaddd %xmm9,%xmm5,%xmm5
3553
3554 vpsrld $11,%xmm14,%xmm1
3555 vpxor %xmm2,%xmm7,%xmm7
3556 vpslld $21,%xmm14,%xmm2
3557 vpaddd 64(%rbp),%xmm5,%xmm5
3558 vpxor %xmm1,%xmm7,%xmm7
3559
3560 vpsrld $25,%xmm14,%xmm1
3561 vpxor %xmm2,%xmm7,%xmm7
3562
3563 vpslld $7,%xmm14,%xmm2
3564 vpandn %xmm8,%xmm14,%xmm0
3565 vpand %xmm15,%xmm14,%xmm3
3566
3567 vpxor %xmm1,%xmm7,%xmm7
3568
3569 vpsrld $2,%xmm10,%xmm9
3570 vpxor %xmm2,%xmm7,%xmm7
3571
3572 vpslld $30,%xmm10,%xmm1
3573 vpxor %xmm3,%xmm0,%xmm0
3574 vpxor %xmm10,%xmm11,%xmm3
3575
3576 vpxor %xmm1,%xmm9,%xmm9
3577 vpaddd %xmm7,%xmm5,%xmm5
3578
3579 vpsrld $13,%xmm10,%xmm1
3580
3581 vpslld $19,%xmm10,%xmm2
3582 vpaddd %xmm0,%xmm5,%xmm5
3583 vpand %xmm3,%xmm4,%xmm4
3584
3585 vpxor %xmm1,%xmm9,%xmm7
3586
3587 vpsrld $22,%xmm10,%xmm1
3588 vpxor %xmm2,%xmm7,%xmm7
3589
3590 vpslld $10,%xmm10,%xmm2
3591 vpxor %xmm4,%xmm11,%xmm9
3592 vpaddd %xmm5,%xmm13,%xmm13
3593
3594 vpxor %xmm1,%xmm7,%xmm7
3595 vpxor %xmm2,%xmm7,%xmm7
3596
3597 vpaddd %xmm5,%xmm9,%xmm9
3598 vpaddd %xmm7,%xmm9,%xmm9
3599 vmovd 28(%r8),%xmm5
3600 vmovd 28(%r9),%xmm0
3601 vpinsrd $1,28(%r10),%xmm5,%xmm5
3602 vpinsrd $1,28(%r11),%xmm0,%xmm0
3603 vpunpckldq %xmm0,%xmm5,%xmm5
3604 vpshufb %xmm6,%xmm5,%xmm5
3605 vpsrld $6,%xmm13,%xmm7
3606 vpslld $26,%xmm13,%xmm2
3607 vmovdqu %xmm5,112-128(%rax)
3608 vpaddd %xmm8,%xmm5,%xmm5
3609
3610 vpsrld $11,%xmm13,%xmm1
3611 vpxor %xmm2,%xmm7,%xmm7
3612 vpslld $21,%xmm13,%xmm2
3613 vpaddd 96(%rbp),%xmm5,%xmm5
3614 vpxor %xmm1,%xmm7,%xmm7
3615
3616 vpsrld $25,%xmm13,%xmm1
3617 vpxor %xmm2,%xmm7,%xmm7
3618
3619 vpslld $7,%xmm13,%xmm2
3620 vpandn %xmm15,%xmm13,%xmm0
3621 vpand %xmm14,%xmm13,%xmm4
3622
3623 vpxor %xmm1,%xmm7,%xmm7
3624
3625 vpsrld $2,%xmm9,%xmm8
3626 vpxor %xmm2,%xmm7,%xmm7
3627
3628 vpslld $30,%xmm9,%xmm1
3629 vpxor %xmm4,%xmm0,%xmm0
3630 vpxor %xmm9,%xmm10,%xmm4
3631
3632 vpxor %xmm1,%xmm8,%xmm8
3633 vpaddd %xmm7,%xmm5,%xmm5
3634
3635 vpsrld $13,%xmm9,%xmm1
3636
3637 vpslld $19,%xmm9,%xmm2
3638 vpaddd %xmm0,%xmm5,%xmm5
3639 vpand %xmm4,%xmm3,%xmm3
3640
3641 vpxor %xmm1,%xmm8,%xmm7
3642
3643 vpsrld $22,%xmm9,%xmm1
3644 vpxor %xmm2,%xmm7,%xmm7
3645
3646 vpslld $10,%xmm9,%xmm2
3647 vpxor %xmm3,%xmm10,%xmm8
3648 vpaddd %xmm5,%xmm12,%xmm12
3649
3650 vpxor %xmm1,%xmm7,%xmm7
3651 vpxor %xmm2,%xmm7,%xmm7
3652
3653 vpaddd %xmm5,%xmm8,%xmm8
3654 vpaddd %xmm7,%xmm8,%xmm8
3655 addq $256,%rbp
3656 vmovd 32(%r8),%xmm5
3657 vmovd 32(%r9),%xmm0
3658 vpinsrd $1,32(%r10),%xmm5,%xmm5
3659 vpinsrd $1,32(%r11),%xmm0,%xmm0
3660 vpunpckldq %xmm0,%xmm5,%xmm5
3661 vpshufb %xmm6,%xmm5,%xmm5
3662 vpsrld $6,%xmm12,%xmm7
3663 vpslld $26,%xmm12,%xmm2
3664 vmovdqu %xmm5,128-128(%rax)
3665 vpaddd %xmm15,%xmm5,%xmm5
3666
3667 vpsrld $11,%xmm12,%xmm1
3668 vpxor %xmm2,%xmm7,%xmm7
3669 vpslld $21,%xmm12,%xmm2
3670 vpaddd -128(%rbp),%xmm5,%xmm5
3671 vpxor %xmm1,%xmm7,%xmm7
3672
3673 vpsrld $25,%xmm12,%xmm1
3674 vpxor %xmm2,%xmm7,%xmm7
3675
3676 vpslld $7,%xmm12,%xmm2
3677 vpandn %xmm14,%xmm12,%xmm0
3678 vpand %xmm13,%xmm12,%xmm3
3679
3680 vpxor %xmm1,%xmm7,%xmm7
3681
3682 vpsrld $2,%xmm8,%xmm15
3683 vpxor %xmm2,%xmm7,%xmm7
3684
3685 vpslld $30,%xmm8,%xmm1
3686 vpxor %xmm3,%xmm0,%xmm0
3687 vpxor %xmm8,%xmm9,%xmm3
3688
3689 vpxor %xmm1,%xmm15,%xmm15
3690 vpaddd %xmm7,%xmm5,%xmm5
3691
3692 vpsrld $13,%xmm8,%xmm1
3693
3694 vpslld $19,%xmm8,%xmm2
3695 vpaddd %xmm0,%xmm5,%xmm5
3696 vpand %xmm3,%xmm4,%xmm4
3697
3698 vpxor %xmm1,%xmm15,%xmm7
3699
3700 vpsrld $22,%xmm8,%xmm1
3701 vpxor %xmm2,%xmm7,%xmm7
3702
3703 vpslld $10,%xmm8,%xmm2
3704 vpxor %xmm4,%xmm9,%xmm15
3705 vpaddd %xmm5,%xmm11,%xmm11
3706
3707 vpxor %xmm1,%xmm7,%xmm7
3708 vpxor %xmm2,%xmm7,%xmm7
3709
3710 vpaddd %xmm5,%xmm15,%xmm15
3711 vpaddd %xmm7,%xmm15,%xmm15
3712 vmovd 36(%r8),%xmm5
3713 vmovd 36(%r9),%xmm0
3714 vpinsrd $1,36(%r10),%xmm5,%xmm5
3715 vpinsrd $1,36(%r11),%xmm0,%xmm0
3716 vpunpckldq %xmm0,%xmm5,%xmm5
3717 vpshufb %xmm6,%xmm5,%xmm5
3718 vpsrld $6,%xmm11,%xmm7
3719 vpslld $26,%xmm11,%xmm2
3720 vmovdqu %xmm5,144-128(%rax)
3721 vpaddd %xmm14,%xmm5,%xmm5
3722
3723 vpsrld $11,%xmm11,%xmm1
3724 vpxor %xmm2,%xmm7,%xmm7
3725 vpslld $21,%xmm11,%xmm2
3726 vpaddd -96(%rbp),%xmm5,%xmm5
3727 vpxor %xmm1,%xmm7,%xmm7
3728
3729 vpsrld $25,%xmm11,%xmm1
3730 vpxor %xmm2,%xmm7,%xmm7
3731
3732 vpslld $7,%xmm11,%xmm2
3733 vpandn %xmm13,%xmm11,%xmm0
3734 vpand %xmm12,%xmm11,%xmm4
3735
3736 vpxor %xmm1,%xmm7,%xmm7
3737
3738 vpsrld $2,%xmm15,%xmm14
3739 vpxor %xmm2,%xmm7,%xmm7
3740
3741 vpslld $30,%xmm15,%xmm1
3742 vpxor %xmm4,%xmm0,%xmm0
3743 vpxor %xmm15,%xmm8,%xmm4
3744
3745 vpxor %xmm1,%xmm14,%xmm14
3746 vpaddd %xmm7,%xmm5,%xmm5
3747
3748 vpsrld $13,%xmm15,%xmm1
3749
3750 vpslld $19,%xmm15,%xmm2
3751 vpaddd %xmm0,%xmm5,%xmm5
3752 vpand %xmm4,%xmm3,%xmm3
3753
3754 vpxor %xmm1,%xmm14,%xmm7
3755
3756 vpsrld $22,%xmm15,%xmm1
3757 vpxor %xmm2,%xmm7,%xmm7
3758
3759 vpslld $10,%xmm15,%xmm2
3760 vpxor %xmm3,%xmm8,%xmm14
3761 vpaddd %xmm5,%xmm10,%xmm10
3762
3763 vpxor %xmm1,%xmm7,%xmm7
3764 vpxor %xmm2,%xmm7,%xmm7
3765
3766 vpaddd %xmm5,%xmm14,%xmm14
3767 vpaddd %xmm7,%xmm14,%xmm14
3768 vmovd 40(%r8),%xmm5
3769 vmovd 40(%r9),%xmm0
3770 vpinsrd $1,40(%r10),%xmm5,%xmm5
3771 vpinsrd $1,40(%r11),%xmm0,%xmm0
3772 vpunpckldq %xmm0,%xmm5,%xmm5
3773 vpshufb %xmm6,%xmm5,%xmm5
3774 vpsrld $6,%xmm10,%xmm7
3775 vpslld $26,%xmm10,%xmm2
3776 vmovdqu %xmm5,160-128(%rax)
3777 vpaddd %xmm13,%xmm5,%xmm5
3778
3779 vpsrld $11,%xmm10,%xmm1
3780 vpxor %xmm2,%xmm7,%xmm7
3781 vpslld $21,%xmm10,%xmm2
3782 vpaddd -64(%rbp),%xmm5,%xmm5
3783 vpxor %xmm1,%xmm7,%xmm7
3784
3785 vpsrld $25,%xmm10,%xmm1
3786 vpxor %xmm2,%xmm7,%xmm7
3787
3788 vpslld $7,%xmm10,%xmm2
3789 vpandn %xmm12,%xmm10,%xmm0
3790 vpand %xmm11,%xmm10,%xmm3
3791
3792 vpxor %xmm1,%xmm7,%xmm7
3793
3794 vpsrld $2,%xmm14,%xmm13
3795 vpxor %xmm2,%xmm7,%xmm7
3796
3797 vpslld $30,%xmm14,%xmm1
3798 vpxor %xmm3,%xmm0,%xmm0
3799 vpxor %xmm14,%xmm15,%xmm3
3800
3801 vpxor %xmm1,%xmm13,%xmm13
3802 vpaddd %xmm7,%xmm5,%xmm5
3803
3804 vpsrld $13,%xmm14,%xmm1
3805
3806 vpslld $19,%xmm14,%xmm2
3807 vpaddd %xmm0,%xmm5,%xmm5
3808 vpand %xmm3,%xmm4,%xmm4
3809
3810 vpxor %xmm1,%xmm13,%xmm7
3811
3812 vpsrld $22,%xmm14,%xmm1
3813 vpxor %xmm2,%xmm7,%xmm7
3814
3815 vpslld $10,%xmm14,%xmm2
3816 vpxor %xmm4,%xmm15,%xmm13
3817 vpaddd %xmm5,%xmm9,%xmm9
3818
3819 vpxor %xmm1,%xmm7,%xmm7
3820 vpxor %xmm2,%xmm7,%xmm7
3821
3822 vpaddd %xmm5,%xmm13,%xmm13
3823 vpaddd %xmm7,%xmm13,%xmm13
3824 vmovd 44(%r8),%xmm5
3825 vmovd 44(%r9),%xmm0
3826 vpinsrd $1,44(%r10),%xmm5,%xmm5
3827 vpinsrd $1,44(%r11),%xmm0,%xmm0
3828 vpunpckldq %xmm0,%xmm5,%xmm5
3829 vpshufb %xmm6,%xmm5,%xmm5
3830 vpsrld $6,%xmm9,%xmm7
3831 vpslld $26,%xmm9,%xmm2
3832 vmovdqu %xmm5,176-128(%rax)
3833 vpaddd %xmm12,%xmm5,%xmm5
3834
3835 vpsrld $11,%xmm9,%xmm1
3836 vpxor %xmm2,%xmm7,%xmm7
3837 vpslld $21,%xmm9,%xmm2
3838 vpaddd -32(%rbp),%xmm5,%xmm5
3839 vpxor %xmm1,%xmm7,%xmm7
3840
3841 vpsrld $25,%xmm9,%xmm1
3842 vpxor %xmm2,%xmm7,%xmm7
3843
3844 vpslld $7,%xmm9,%xmm2
3845 vpandn %xmm11,%xmm9,%xmm0
3846 vpand %xmm10,%xmm9,%xmm4
3847
3848 vpxor %xmm1,%xmm7,%xmm7
3849
3850 vpsrld $2,%xmm13,%xmm12
3851 vpxor %xmm2,%xmm7,%xmm7
3852
3853 vpslld $30,%xmm13,%xmm1
3854 vpxor %xmm4,%xmm0,%xmm0
3855 vpxor %xmm13,%xmm14,%xmm4
3856
3857 vpxor %xmm1,%xmm12,%xmm12
3858 vpaddd %xmm7,%xmm5,%xmm5
3859
3860 vpsrld $13,%xmm13,%xmm1
3861
3862 vpslld $19,%xmm13,%xmm2
3863 vpaddd %xmm0,%xmm5,%xmm5
3864 vpand %xmm4,%xmm3,%xmm3
3865
3866 vpxor %xmm1,%xmm12,%xmm7
3867
3868 vpsrld $22,%xmm13,%xmm1
3869 vpxor %xmm2,%xmm7,%xmm7
3870
3871 vpslld $10,%xmm13,%xmm2
3872 vpxor %xmm3,%xmm14,%xmm12
3873 vpaddd %xmm5,%xmm8,%xmm8
3874
3875 vpxor %xmm1,%xmm7,%xmm7
3876 vpxor %xmm2,%xmm7,%xmm7
3877
3878 vpaddd %xmm5,%xmm12,%xmm12
3879 vpaddd %xmm7,%xmm12,%xmm12
3880 vmovd 48(%r8),%xmm5
3881 vmovd 48(%r9),%xmm0
3882 vpinsrd $1,48(%r10),%xmm5,%xmm5
3883 vpinsrd $1,48(%r11),%xmm0,%xmm0
3884 vpunpckldq %xmm0,%xmm5,%xmm5
3885 vpshufb %xmm6,%xmm5,%xmm5
3886 vpsrld $6,%xmm8,%xmm7
3887 vpslld $26,%xmm8,%xmm2
3888 vmovdqu %xmm5,192-128(%rax)
3889 vpaddd %xmm11,%xmm5,%xmm5
3890
3891 vpsrld $11,%xmm8,%xmm1
3892 vpxor %xmm2,%xmm7,%xmm7
3893 vpslld $21,%xmm8,%xmm2
3894 vpaddd 0(%rbp),%xmm5,%xmm5
3895 vpxor %xmm1,%xmm7,%xmm7
3896
3897 vpsrld $25,%xmm8,%xmm1
3898 vpxor %xmm2,%xmm7,%xmm7
3899
3900 vpslld $7,%xmm8,%xmm2
3901 vpandn %xmm10,%xmm8,%xmm0
3902 vpand %xmm9,%xmm8,%xmm3
3903
3904 vpxor %xmm1,%xmm7,%xmm7
3905
3906 vpsrld $2,%xmm12,%xmm11
3907 vpxor %xmm2,%xmm7,%xmm7
3908
3909 vpslld $30,%xmm12,%xmm1
3910 vpxor %xmm3,%xmm0,%xmm0
3911 vpxor %xmm12,%xmm13,%xmm3
3912
3913 vpxor %xmm1,%xmm11,%xmm11
3914 vpaddd %xmm7,%xmm5,%xmm5
3915
3916 vpsrld $13,%xmm12,%xmm1
3917
3918 vpslld $19,%xmm12,%xmm2
3919 vpaddd %xmm0,%xmm5,%xmm5
3920 vpand %xmm3,%xmm4,%xmm4
3921
3922 vpxor %xmm1,%xmm11,%xmm7
3923
3924 vpsrld $22,%xmm12,%xmm1
3925 vpxor %xmm2,%xmm7,%xmm7
3926
3927 vpslld $10,%xmm12,%xmm2
3928 vpxor %xmm4,%xmm13,%xmm11
3929 vpaddd %xmm5,%xmm15,%xmm15
3930
3931 vpxor %xmm1,%xmm7,%xmm7
3932 vpxor %xmm2,%xmm7,%xmm7
3933
3934 vpaddd %xmm5,%xmm11,%xmm11
3935 vpaddd %xmm7,%xmm11,%xmm11
3936 vmovd 52(%r8),%xmm5
3937 vmovd 52(%r9),%xmm0
3938 vpinsrd $1,52(%r10),%xmm5,%xmm5
3939 vpinsrd $1,52(%r11),%xmm0,%xmm0
3940 vpunpckldq %xmm0,%xmm5,%xmm5
3941 vpshufb %xmm6,%xmm5,%xmm5
3942 vpsrld $6,%xmm15,%xmm7
3943 vpslld $26,%xmm15,%xmm2
3944 vmovdqu %xmm5,208-128(%rax)
3945 vpaddd %xmm10,%xmm5,%xmm5
3946
3947 vpsrld $11,%xmm15,%xmm1
3948 vpxor %xmm2,%xmm7,%xmm7
3949 vpslld $21,%xmm15,%xmm2
3950 vpaddd 32(%rbp),%xmm5,%xmm5
3951 vpxor %xmm1,%xmm7,%xmm7
3952
3953 vpsrld $25,%xmm15,%xmm1
3954 vpxor %xmm2,%xmm7,%xmm7
3955
3956 vpslld $7,%xmm15,%xmm2
3957 vpandn %xmm9,%xmm15,%xmm0
3958 vpand %xmm8,%xmm15,%xmm4
3959
3960 vpxor %xmm1,%xmm7,%xmm7
3961
3962 vpsrld $2,%xmm11,%xmm10
3963 vpxor %xmm2,%xmm7,%xmm7
3964
3965 vpslld $30,%xmm11,%xmm1
3966 vpxor %xmm4,%xmm0,%xmm0
3967 vpxor %xmm11,%xmm12,%xmm4
3968
3969 vpxor %xmm1,%xmm10,%xmm10
3970 vpaddd %xmm7,%xmm5,%xmm5
3971
3972 vpsrld $13,%xmm11,%xmm1
3973
3974 vpslld $19,%xmm11,%xmm2
3975 vpaddd %xmm0,%xmm5,%xmm5
3976 vpand %xmm4,%xmm3,%xmm3
3977
3978 vpxor %xmm1,%xmm10,%xmm7
3979
3980 vpsrld $22,%xmm11,%xmm1
3981 vpxor %xmm2,%xmm7,%xmm7
3982
3983 vpslld $10,%xmm11,%xmm2
3984 vpxor %xmm3,%xmm12,%xmm10
3985 vpaddd %xmm5,%xmm14,%xmm14
3986
3987 vpxor %xmm1,%xmm7,%xmm7
3988 vpxor %xmm2,%xmm7,%xmm7
3989
3990 vpaddd %xmm5,%xmm10,%xmm10
3991 vpaddd %xmm7,%xmm10,%xmm10
3992 vmovd 56(%r8),%xmm5
3993 vmovd 56(%r9),%xmm0
3994 vpinsrd $1,56(%r10),%xmm5,%xmm5
3995 vpinsrd $1,56(%r11),%xmm0,%xmm0
3996 vpunpckldq %xmm0,%xmm5,%xmm5
3997 vpshufb %xmm6,%xmm5,%xmm5
3998 vpsrld $6,%xmm14,%xmm7
3999 vpslld $26,%xmm14,%xmm2
4000 vmovdqu %xmm5,224-128(%rax)
4001 vpaddd %xmm9,%xmm5,%xmm5
4002
4003 vpsrld $11,%xmm14,%xmm1
4004 vpxor %xmm2,%xmm7,%xmm7
4005 vpslld $21,%xmm14,%xmm2
4006 vpaddd 64(%rbp),%xmm5,%xmm5
4007 vpxor %xmm1,%xmm7,%xmm7
4008
4009 vpsrld $25,%xmm14,%xmm1
4010 vpxor %xmm2,%xmm7,%xmm7
4011
4012 vpslld $7,%xmm14,%xmm2
4013 vpandn %xmm8,%xmm14,%xmm0
4014 vpand %xmm15,%xmm14,%xmm3
4015
4016 vpxor %xmm1,%xmm7,%xmm7
4017
4018 vpsrld $2,%xmm10,%xmm9
4019 vpxor %xmm2,%xmm7,%xmm7
4020
4021 vpslld $30,%xmm10,%xmm1
4022 vpxor %xmm3,%xmm0,%xmm0
4023 vpxor %xmm10,%xmm11,%xmm3
4024
4025 vpxor %xmm1,%xmm9,%xmm9
4026 vpaddd %xmm7,%xmm5,%xmm5
4027
4028 vpsrld $13,%xmm10,%xmm1
4029
4030 vpslld $19,%xmm10,%xmm2
4031 vpaddd %xmm0,%xmm5,%xmm5
4032 vpand %xmm3,%xmm4,%xmm4
4033
4034 vpxor %xmm1,%xmm9,%xmm7
4035
4036 vpsrld $22,%xmm10,%xmm1
4037 vpxor %xmm2,%xmm7,%xmm7
4038
4039 vpslld $10,%xmm10,%xmm2
4040 vpxor %xmm4,%xmm11,%xmm9
4041 vpaddd %xmm5,%xmm13,%xmm13
4042
4043 vpxor %xmm1,%xmm7,%xmm7
4044 vpxor %xmm2,%xmm7,%xmm7
4045
4046 vpaddd %xmm5,%xmm9,%xmm9
4047 vpaddd %xmm7,%xmm9,%xmm9
4048 vmovd 60(%r8),%xmm5
4049 leaq 64(%r8),%r8
4050 vmovd 60(%r9),%xmm0
4051 leaq 64(%r9),%r9
4052 vpinsrd $1,60(%r10),%xmm5,%xmm5
4053 leaq 64(%r10),%r10
4054 vpinsrd $1,60(%r11),%xmm0,%xmm0
4055 leaq 64(%r11),%r11
4056 vpunpckldq %xmm0,%xmm5,%xmm5
4057 vpshufb %xmm6,%xmm5,%xmm5
4058 vpsrld $6,%xmm13,%xmm7
4059 vpslld $26,%xmm13,%xmm2
4060 vmovdqu %xmm5,240-128(%rax)
4061 vpaddd %xmm8,%xmm5,%xmm5
4062
4063 vpsrld $11,%xmm13,%xmm1
4064 vpxor %xmm2,%xmm7,%xmm7
4065 vpslld $21,%xmm13,%xmm2
4066 vpaddd 96(%rbp),%xmm5,%xmm5
4067 vpxor %xmm1,%xmm7,%xmm7
4068
4069 vpsrld $25,%xmm13,%xmm1
4070 vpxor %xmm2,%xmm7,%xmm7
4071 prefetcht0 63(%r8)
4072 vpslld $7,%xmm13,%xmm2
4073 vpandn %xmm15,%xmm13,%xmm0
4074 vpand %xmm14,%xmm13,%xmm4
4075 prefetcht0 63(%r9)
4076 vpxor %xmm1,%xmm7,%xmm7
4077
4078 vpsrld $2,%xmm9,%xmm8
4079 vpxor %xmm2,%xmm7,%xmm7
4080 prefetcht0 63(%r10)
4081 vpslld $30,%xmm9,%xmm1
4082 vpxor %xmm4,%xmm0,%xmm0
4083 vpxor %xmm9,%xmm10,%xmm4
4084 prefetcht0 63(%r11)
4085 vpxor %xmm1,%xmm8,%xmm8
4086 vpaddd %xmm7,%xmm5,%xmm5
4087
4088 vpsrld $13,%xmm9,%xmm1
4089
4090 vpslld $19,%xmm9,%xmm2
4091 vpaddd %xmm0,%xmm5,%xmm5
4092 vpand %xmm4,%xmm3,%xmm3
4093
4094 vpxor %xmm1,%xmm8,%xmm7
4095
4096 vpsrld $22,%xmm9,%xmm1
4097 vpxor %xmm2,%xmm7,%xmm7
4098
4099 vpslld $10,%xmm9,%xmm2
4100 vpxor %xmm3,%xmm10,%xmm8
4101 vpaddd %xmm5,%xmm12,%xmm12
4102
4103 vpxor %xmm1,%xmm7,%xmm7
4104 vpxor %xmm2,%xmm7,%xmm7
4105
4106 vpaddd %xmm5,%xmm8,%xmm8
4107 vpaddd %xmm7,%xmm8,%xmm8
4108 addq $256,%rbp
4109 vmovdqu 0-128(%rax),%xmm5
4110 movl $3,%ecx
4111 jmp .Loop_16_xx_avx
4112 .align 32
4113 .Loop_16_xx_avx:
4114 vmovdqu 16-128(%rax),%xmm6
4115 vpaddd 144-128(%rax),%xmm5,%xmm5
4116
4117 vpsrld $3,%xmm6,%xmm7
4118 vpsrld $7,%xmm6,%xmm1
4119 vpslld $25,%xmm6,%xmm2
4120 vpxor %xmm1,%xmm7,%xmm7
4121 vpsrld $18,%xmm6,%xmm1
4122 vpxor %xmm2,%xmm7,%xmm7
4123 vpslld $14,%xmm6,%xmm2
4124 vmovdqu 224-128(%rax),%xmm0
4125 vpsrld $10,%xmm0,%xmm3
4126
4127 vpxor %xmm1,%xmm7,%xmm7
4128 vpsrld $17,%xmm0,%xmm1
4129 vpxor %xmm2,%xmm7,%xmm7
4130 vpslld $15,%xmm0,%xmm2
4131 vpaddd %xmm7,%xmm5,%xmm5
4132 vpxor %xmm1,%xmm3,%xmm7
4133 vpsrld $19,%xmm0,%xmm1
4134 vpxor %xmm2,%xmm7,%xmm7
4135 vpslld $13,%xmm0,%xmm2
4136 vpxor %xmm1,%xmm7,%xmm7
4137 vpxor %xmm2,%xmm7,%xmm7
4138 vpaddd %xmm7,%xmm5,%xmm5
4139 vpsrld $6,%xmm12,%xmm7
4140 vpslld $26,%xmm12,%xmm2
4141 vmovdqu %xmm5,0-128(%rax)
4142 vpaddd %xmm15,%xmm5,%xmm5
4143
4144 vpsrld $11,%xmm12,%xmm1
4145 vpxor %xmm2,%xmm7,%xmm7
4146 vpslld $21,%xmm12,%xmm2
4147 vpaddd -128(%rbp),%xmm5,%xmm5
4148 vpxor %xmm1,%xmm7,%xmm7
4149
4150 vpsrld $25,%xmm12,%xmm1
4151 vpxor %xmm2,%xmm7,%xmm7
4152
4153 vpslld $7,%xmm12,%xmm2
4154 vpandn %xmm14,%xmm12,%xmm0
4155 vpand %xmm13,%xmm12,%xmm3
4156
4157 vpxor %xmm1,%xmm7,%xmm7
4158
4159 vpsrld $2,%xmm8,%xmm15
4160 vpxor %xmm2,%xmm7,%xmm7
4161
4162 vpslld $30,%xmm8,%xmm1
4163 vpxor %xmm3,%xmm0,%xmm0
4164 vpxor %xmm8,%xmm9,%xmm3
4165
4166 vpxor %xmm1,%xmm15,%xmm15
4167 vpaddd %xmm7,%xmm5,%xmm5
4168
4169 vpsrld $13,%xmm8,%xmm1
4170
4171 vpslld $19,%xmm8,%xmm2
4172 vpaddd %xmm0,%xmm5,%xmm5
4173 vpand %xmm3,%xmm4,%xmm4
4174
4175 vpxor %xmm1,%xmm15,%xmm7
4176
4177 vpsrld $22,%xmm8,%xmm1
4178 vpxor %xmm2,%xmm7,%xmm7
4179
4180 vpslld $10,%xmm8,%xmm2
4181 vpxor %xmm4,%xmm9,%xmm15
4182 vpaddd %xmm5,%xmm11,%xmm11
4183
4184 vpxor %xmm1,%xmm7,%xmm7
4185 vpxor %xmm2,%xmm7,%xmm7
4186
4187 vpaddd %xmm5,%xmm15,%xmm15
4188 vpaddd %xmm7,%xmm15,%xmm15
4189 vmovdqu 32-128(%rax),%xmm5
4190 vpaddd 160-128(%rax),%xmm6,%xmm6
4191
4192 vpsrld $3,%xmm5,%xmm7
4193 vpsrld $7,%xmm5,%xmm1
4194 vpslld $25,%xmm5,%xmm2
4195 vpxor %xmm1,%xmm7,%xmm7
4196 vpsrld $18,%xmm5,%xmm1
4197 vpxor %xmm2,%xmm7,%xmm7
4198 vpslld $14,%xmm5,%xmm2
4199 vmovdqu 240-128(%rax),%xmm0
4200 vpsrld $10,%xmm0,%xmm4
4201
4202 vpxor %xmm1,%xmm7,%xmm7
4203 vpsrld $17,%xmm0,%xmm1
4204 vpxor %xmm2,%xmm7,%xmm7
4205 vpslld $15,%xmm0,%xmm2
4206 vpaddd %xmm7,%xmm6,%xmm6
4207 vpxor %xmm1,%xmm4,%xmm7
4208 vpsrld $19,%xmm0,%xmm1
4209 vpxor %xmm2,%xmm7,%xmm7
4210 vpslld $13,%xmm0,%xmm2
4211 vpxor %xmm1,%xmm7,%xmm7
4212 vpxor %xmm2,%xmm7,%xmm7
4213 vpaddd %xmm7,%xmm6,%xmm6
4214 vpsrld $6,%xmm11,%xmm7
4215 vpslld $26,%xmm11,%xmm2
4216 vmovdqu %xmm6,16-128(%rax)
4217 vpaddd %xmm14,%xmm6,%xmm6
4218
4219 vpsrld $11,%xmm11,%xmm1
4220 vpxor %xmm2,%xmm7,%xmm7
4221 vpslld $21,%xmm11,%xmm2
4222 vpaddd -96(%rbp),%xmm6,%xmm6
4223 vpxor %xmm1,%xmm7,%xmm7
4224
4225 vpsrld $25,%xmm11,%xmm1
4226 vpxor %xmm2,%xmm7,%xmm7
4227
4228 vpslld $7,%xmm11,%xmm2
4229 vpandn %xmm13,%xmm11,%xmm0
4230 vpand %xmm12,%xmm11,%xmm4
4231
4232 vpxor %xmm1,%xmm7,%xmm7
4233
4234 vpsrld $2,%xmm15,%xmm14
4235 vpxor %xmm2,%xmm7,%xmm7
4236
4237 vpslld $30,%xmm15,%xmm1
4238 vpxor %xmm4,%xmm0,%xmm0
4239 vpxor %xmm15,%xmm8,%xmm4
4240
4241 vpxor %xmm1,%xmm14,%xmm14
4242 vpaddd %xmm7,%xmm6,%xmm6
4243
4244 vpsrld $13,%xmm15,%xmm1
4245
4246 vpslld $19,%xmm15,%xmm2
4247 vpaddd %xmm0,%xmm6,%xmm6
4248 vpand %xmm4,%xmm3,%xmm3
4249
4250 vpxor %xmm1,%xmm14,%xmm7
4251
4252 vpsrld $22,%xmm15,%xmm1
4253 vpxor %xmm2,%xmm7,%xmm7
4254
4255 vpslld $10,%xmm15,%xmm2
4256 vpxor %xmm3,%xmm8,%xmm14
4257 vpaddd %xmm6,%xmm10,%xmm10
4258
4259 vpxor %xmm1,%xmm7,%xmm7
4260 vpxor %xmm2,%xmm7,%xmm7
4261
4262 vpaddd %xmm6,%xmm14,%xmm14
4263 vpaddd %xmm7,%xmm14,%xmm14
4264 vmovdqu 48-128(%rax),%xmm6
4265 vpaddd 176-128(%rax),%xmm5,%xmm5
4266
4267 vpsrld $3,%xmm6,%xmm7
4268 vpsrld $7,%xmm6,%xmm1
4269 vpslld $25,%xmm6,%xmm2
4270 vpxor %xmm1,%xmm7,%xmm7
4271 vpsrld $18,%xmm6,%xmm1
4272 vpxor %xmm2,%xmm7,%xmm7
4273 vpslld $14,%xmm6,%xmm2
4274 vmovdqu 0-128(%rax),%xmm0
4275 vpsrld $10,%xmm0,%xmm3
4276
4277 vpxor %xmm1,%xmm7,%xmm7
4278 vpsrld $17,%xmm0,%xmm1
4279 vpxor %xmm2,%xmm7,%xmm7
4280 vpslld $15,%xmm0,%xmm2
4281 vpaddd %xmm7,%xmm5,%xmm5
4282 vpxor %xmm1,%xmm3,%xmm7
4283 vpsrld $19,%xmm0,%xmm1
4284 vpxor %xmm2,%xmm7,%xmm7
4285 vpslld $13,%xmm0,%xmm2
4286 vpxor %xmm1,%xmm7,%xmm7
4287 vpxor %xmm2,%xmm7,%xmm7
4288 vpaddd %xmm7,%xmm5,%xmm5
4289 vpsrld $6,%xmm10,%xmm7
4290 vpslld $26,%xmm10,%xmm2
4291 vmovdqu %xmm5,32-128(%rax)
4292 vpaddd %xmm13,%xmm5,%xmm5
4293
4294 vpsrld $11,%xmm10,%xmm1
4295 vpxor %xmm2,%xmm7,%xmm7
4296 vpslld $21,%xmm10,%xmm2
4297 vpaddd -64(%rbp),%xmm5,%xmm5
4298 vpxor %xmm1,%xmm7,%xmm7
4299
4300 vpsrld $25,%xmm10,%xmm1
4301 vpxor %xmm2,%xmm7,%xmm7
4302
4303 vpslld $7,%xmm10,%xmm2
4304 vpandn %xmm12,%xmm10,%xmm0
4305 vpand %xmm11,%xmm10,%xmm3
4306
4307 vpxor %xmm1,%xmm7,%xmm7
4308
4309 vpsrld $2,%xmm14,%xmm13
4310 vpxor %xmm2,%xmm7,%xmm7
4311
4312 vpslld $30,%xmm14,%xmm1
4313 vpxor %xmm3,%xmm0,%xmm0
4314 vpxor %xmm14,%xmm15,%xmm3
4315
4316 vpxor %xmm1,%xmm13,%xmm13
4317 vpaddd %xmm7,%xmm5,%xmm5
4318
4319 vpsrld $13,%xmm14,%xmm1
4320
4321 vpslld $19,%xmm14,%xmm2
4322 vpaddd %xmm0,%xmm5,%xmm5
4323 vpand %xmm3,%xmm4,%xmm4
4324
4325 vpxor %xmm1,%xmm13,%xmm7
4326
4327 vpsrld $22,%xmm14,%xmm1
4328 vpxor %xmm2,%xmm7,%xmm7
4329
4330 vpslld $10,%xmm14,%xmm2
4331 vpxor %xmm4,%xmm15,%xmm13
4332 vpaddd %xmm5,%xmm9,%xmm9
4333
4334 vpxor %xmm1,%xmm7,%xmm7
4335 vpxor %xmm2,%xmm7,%xmm7
4336
4337 vpaddd %xmm5,%xmm13,%xmm13
4338 vpaddd %xmm7,%xmm13,%xmm13
4339 vmovdqu 64-128(%rax),%xmm5
4340 vpaddd 192-128(%rax),%xmm6,%xmm6
4341
4342 vpsrld $3,%xmm5,%xmm7
4343 vpsrld $7,%xmm5,%xmm1
4344 vpslld $25,%xmm5,%xmm2
4345 vpxor %xmm1,%xmm7,%xmm7
4346 vpsrld $18,%xmm5,%xmm1
4347 vpxor %xmm2,%xmm7,%xmm7
4348 vpslld $14,%xmm5,%xmm2
4349 vmovdqu 16-128(%rax),%xmm0
4350 vpsrld $10,%xmm0,%xmm4
4351
4352 vpxor %xmm1,%xmm7,%xmm7
4353 vpsrld $17,%xmm0,%xmm1
4354 vpxor %xmm2,%xmm7,%xmm7
4355 vpslld $15,%xmm0,%xmm2
4356 vpaddd %xmm7,%xmm6,%xmm6
4357 vpxor %xmm1,%xmm4,%xmm7
4358 vpsrld $19,%xmm0,%xmm1
4359 vpxor %xmm2,%xmm7,%xmm7
4360 vpslld $13,%xmm0,%xmm2
4361 vpxor %xmm1,%xmm7,%xmm7
4362 vpxor %xmm2,%xmm7,%xmm7
4363 vpaddd %xmm7,%xmm6,%xmm6
4364 vpsrld $6,%xmm9,%xmm7
4365 vpslld $26,%xmm9,%xmm2
4366 vmovdqu %xmm6,48-128(%rax)
4367 vpaddd %xmm12,%xmm6,%xmm6
4368
4369 vpsrld $11,%xmm9,%xmm1
4370 vpxor %xmm2,%xmm7,%xmm7
4371 vpslld $21,%xmm9,%xmm2
4372 vpaddd -32(%rbp),%xmm6,%xmm6
4373 vpxor %xmm1,%xmm7,%xmm7
4374
4375 vpsrld $25,%xmm9,%xmm1
4376 vpxor %xmm2,%xmm7,%xmm7
4377
4378 vpslld $7,%xmm9,%xmm2
4379 vpandn %xmm11,%xmm9,%xmm0
4380 vpand %xmm10,%xmm9,%xmm4
4381
4382 vpxor %xmm1,%xmm7,%xmm7
4383
4384 vpsrld $2,%xmm13,%xmm12
4385 vpxor %xmm2,%xmm7,%xmm7
4386
4387 vpslld $30,%xmm13,%xmm1
4388 vpxor %xmm4,%xmm0,%xmm0
4389 vpxor %xmm13,%xmm14,%xmm4
4390
4391 vpxor %xmm1,%xmm12,%xmm12
4392 vpaddd %xmm7,%xmm6,%xmm6
4393
4394 vpsrld $13,%xmm13,%xmm1
4395
4396 vpslld $19,%xmm13,%xmm2
4397 vpaddd %xmm0,%xmm6,%xmm6
4398 vpand %xmm4,%xmm3,%xmm3
4399
4400 vpxor %xmm1,%xmm12,%xmm7
4401
4402 vpsrld $22,%xmm13,%xmm1
4403 vpxor %xmm2,%xmm7,%xmm7
4404
4405 vpslld $10,%xmm13,%xmm2
4406 vpxor %xmm3,%xmm14,%xmm12
4407 vpaddd %xmm6,%xmm8,%xmm8
4408
4409 vpxor %xmm1,%xmm7,%xmm7
4410 vpxor %xmm2,%xmm7,%xmm7
4411
4412 vpaddd %xmm6,%xmm12,%xmm12
4413 vpaddd %xmm7,%xmm12,%xmm12
4414 vmovdqu 80-128(%rax),%xmm6
4415 vpaddd 208-128(%rax),%xmm5,%xmm5
4416
4417 vpsrld $3,%xmm6,%xmm7
4418 vpsrld $7,%xmm6,%xmm1
4419 vpslld $25,%xmm6,%xmm2
4420 vpxor %xmm1,%xmm7,%xmm7
4421 vpsrld $18,%xmm6,%xmm1
4422 vpxor %xmm2,%xmm7,%xmm7
4423 vpslld $14,%xmm6,%xmm2
4424 vmovdqu 32-128(%rax),%xmm0
4425 vpsrld $10,%xmm0,%xmm3
4426
4427 vpxor %xmm1,%xmm7,%xmm7
4428 vpsrld $17,%xmm0,%xmm1
4429 vpxor %xmm2,%xmm7,%xmm7
4430 vpslld $15,%xmm0,%xmm2
4431 vpaddd %xmm7,%xmm5,%xmm5
4432 vpxor %xmm1,%xmm3,%xmm7
4433 vpsrld $19,%xmm0,%xmm1
4434 vpxor %xmm2,%xmm7,%xmm7
4435 vpslld $13,%xmm0,%xmm2
4436 vpxor %xmm1,%xmm7,%xmm7
4437 vpxor %xmm2,%xmm7,%xmm7
4438 vpaddd %xmm7,%xmm5,%xmm5
4439 vpsrld $6,%xmm8,%xmm7
4440 vpslld $26,%xmm8,%xmm2
4441 vmovdqu %xmm5,64-128(%rax)
4442 vpaddd %xmm11,%xmm5,%xmm5
4443
4444 vpsrld $11,%xmm8,%xmm1
4445 vpxor %xmm2,%xmm7,%xmm7
4446 vpslld $21,%xmm8,%xmm2
4447 vpaddd 0(%rbp),%xmm5,%xmm5
4448 vpxor %xmm1,%xmm7,%xmm7
4449
4450 vpsrld $25,%xmm8,%xmm1
4451 vpxor %xmm2,%xmm7,%xmm7
4452
4453 vpslld $7,%xmm8,%xmm2
4454 vpandn %xmm10,%xmm8,%xmm0
4455 vpand %xmm9,%xmm8,%xmm3
4456
4457 vpxor %xmm1,%xmm7,%xmm7
4458
4459 vpsrld $2,%xmm12,%xmm11
4460 vpxor %xmm2,%xmm7,%xmm7
4461
4462 vpslld $30,%xmm12,%xmm1
4463 vpxor %xmm3,%xmm0,%xmm0
4464 vpxor %xmm12,%xmm13,%xmm3
4465
4466 vpxor %xmm1,%xmm11,%xmm11
4467 vpaddd %xmm7,%xmm5,%xmm5
4468
4469 vpsrld $13,%xmm12,%xmm1
4470
4471 vpslld $19,%xmm12,%xmm2
4472 vpaddd %xmm0,%xmm5,%xmm5
4473 vpand %xmm3,%xmm4,%xmm4
4474
4475 vpxor %xmm1,%xmm11,%xmm7
4476
4477 vpsrld $22,%xmm12,%xmm1
4478 vpxor %xmm2,%xmm7,%xmm7
4479
4480 vpslld $10,%xmm12,%xmm2
4481 vpxor %xmm4,%xmm13,%xmm11
4482 vpaddd %xmm5,%xmm15,%xmm15
4483
4484 vpxor %xmm1,%xmm7,%xmm7
4485 vpxor %xmm2,%xmm7,%xmm7
4486
4487 vpaddd %xmm5,%xmm11,%xmm11
4488 vpaddd %xmm7,%xmm11,%xmm11
4489 vmovdqu 96-128(%rax),%xmm5
4490 vpaddd 224-128(%rax),%xmm6,%xmm6
4491
4492 vpsrld $3,%xmm5,%xmm7
4493 vpsrld $7,%xmm5,%xmm1
4494 vpslld $25,%xmm5,%xmm2
4495 vpxor %xmm1,%xmm7,%xmm7
4496 vpsrld $18,%xmm5,%xmm1
4497 vpxor %xmm2,%xmm7,%xmm7
4498 vpslld $14,%xmm5,%xmm2
4499 vmovdqu 48-128(%rax),%xmm0
4500 vpsrld $10,%xmm0,%xmm4
4501
4502 vpxor %xmm1,%xmm7,%xmm7
4503 vpsrld $17,%xmm0,%xmm1
4504 vpxor %xmm2,%xmm7,%xmm7
4505 vpslld $15,%xmm0,%xmm2
4506 vpaddd %xmm7,%xmm6,%xmm6
4507 vpxor %xmm1,%xmm4,%xmm7
4508 vpsrld $19,%xmm0,%xmm1
4509 vpxor %xmm2,%xmm7,%xmm7
4510 vpslld $13,%xmm0,%xmm2
4511 vpxor %xmm1,%xmm7,%xmm7
4512 vpxor %xmm2,%xmm7,%xmm7
4513 vpaddd %xmm7,%xmm6,%xmm6
4514 vpsrld $6,%xmm15,%xmm7
4515 vpslld $26,%xmm15,%xmm2
4516 vmovdqu %xmm6,80-128(%rax)
4517 vpaddd %xmm10,%xmm6,%xmm6
4518
4519 vpsrld $11,%xmm15,%xmm1
4520 vpxor %xmm2,%xmm7,%xmm7
4521 vpslld $21,%xmm15,%xmm2
4522 vpaddd 32(%rbp),%xmm6,%xmm6
4523 vpxor %xmm1,%xmm7,%xmm7
4524
4525 vpsrld $25,%xmm15,%xmm1
4526 vpxor %xmm2,%xmm7,%xmm7
4527
4528 vpslld $7,%xmm15,%xmm2
4529 vpandn %xmm9,%xmm15,%xmm0
4530 vpand %xmm8,%xmm15,%xmm4
4531
4532 vpxor %xmm1,%xmm7,%xmm7
4533
4534 vpsrld $2,%xmm11,%xmm10
4535 vpxor %xmm2,%xmm7,%xmm7
4536
4537 vpslld $30,%xmm11,%xmm1
4538 vpxor %xmm4,%xmm0,%xmm0
4539 vpxor %xmm11,%xmm12,%xmm4
4540
4541 vpxor %xmm1,%xmm10,%xmm10
4542 vpaddd %xmm7,%xmm6,%xmm6
4543
4544 vpsrld $13,%xmm11,%xmm1
4545
4546 vpslld $19,%xmm11,%xmm2
4547 vpaddd %xmm0,%xmm6,%xmm6
4548 vpand %xmm4,%xmm3,%xmm3
4549
4550 vpxor %xmm1,%xmm10,%xmm7
4551
4552 vpsrld $22,%xmm11,%xmm1
4553 vpxor %xmm2,%xmm7,%xmm7
4554
4555 vpslld $10,%xmm11,%xmm2
4556 vpxor %xmm3,%xmm12,%xmm10
4557 vpaddd %xmm6,%xmm14,%xmm14
4558
4559 vpxor %xmm1,%xmm7,%xmm7
4560 vpxor %xmm2,%xmm7,%xmm7
4561
4562 vpaddd %xmm6,%xmm10,%xmm10
4563 vpaddd %xmm7,%xmm10,%xmm10
4564 vmovdqu 112-128(%rax),%xmm6
4565 vpaddd 240-128(%rax),%xmm5,%xmm5
4566
4567 vpsrld $3,%xmm6,%xmm7
4568 vpsrld $7,%xmm6,%xmm1
4569 vpslld $25,%xmm6,%xmm2
4570 vpxor %xmm1,%xmm7,%xmm7
4571 vpsrld $18,%xmm6,%xmm1
4572 vpxor %xmm2,%xmm7,%xmm7
4573 vpslld $14,%xmm6,%xmm2
4574 vmovdqu 64-128(%rax),%xmm0
4575 vpsrld $10,%xmm0,%xmm3
4576
4577 vpxor %xmm1,%xmm7,%xmm7
4578 vpsrld $17,%xmm0,%xmm1
4579 vpxor %xmm2,%xmm7,%xmm7
4580 vpslld $15,%xmm0,%xmm2
4581 vpaddd %xmm7,%xmm5,%xmm5
4582 vpxor %xmm1,%xmm3,%xmm7
4583 vpsrld $19,%xmm0,%xmm1
4584 vpxor %xmm2,%xmm7,%xmm7
4585 vpslld $13,%xmm0,%xmm2
4586 vpxor %xmm1,%xmm7,%xmm7
4587 vpxor %xmm2,%xmm7,%xmm7
4588 vpaddd %xmm7,%xmm5,%xmm5
4589 vpsrld $6,%xmm14,%xmm7
4590 vpslld $26,%xmm14,%xmm2
4591 vmovdqu %xmm5,96-128(%rax)
4592 vpaddd %xmm9,%xmm5,%xmm5
4593
4594 vpsrld $11,%xmm14,%xmm1
4595 vpxor %xmm2,%xmm7,%xmm7
4596 vpslld $21,%xmm14,%xmm2
4597 vpaddd 64(%rbp),%xmm5,%xmm5
4598 vpxor %xmm1,%xmm7,%xmm7
4599
4600 vpsrld $25,%xmm14,%xmm1
4601 vpxor %xmm2,%xmm7,%xmm7
4602
4603 vpslld $7,%xmm14,%xmm2
4604 vpandn %xmm8,%xmm14,%xmm0
4605 vpand %xmm15,%xmm14,%xmm3
4606
4607 vpxor %xmm1,%xmm7,%xmm7
4608
4609 vpsrld $2,%xmm10,%xmm9
4610 vpxor %xmm2,%xmm7,%xmm7
4611
4612 vpslld $30,%xmm10,%xmm1
4613 vpxor %xmm3,%xmm0,%xmm0
4614 vpxor %xmm10,%xmm11,%xmm3
4615
4616 vpxor %xmm1,%xmm9,%xmm9
4617 vpaddd %xmm7,%xmm5,%xmm5
4618
4619 vpsrld $13,%xmm10,%xmm1
4620
4621 vpslld $19,%xmm10,%xmm2
4622 vpaddd %xmm0,%xmm5,%xmm5
4623 vpand %xmm3,%xmm4,%xmm4
4624
4625 vpxor %xmm1,%xmm9,%xmm7
4626
4627 vpsrld $22,%xmm10,%xmm1
4628 vpxor %xmm2,%xmm7,%xmm7
4629
4630 vpslld $10,%xmm10,%xmm2
4631 vpxor %xmm4,%xmm11,%xmm9
4632 vpaddd %xmm5,%xmm13,%xmm13
4633
4634 vpxor %xmm1,%xmm7,%xmm7
4635 vpxor %xmm2,%xmm7,%xmm7
4636
4637 vpaddd %xmm5,%xmm9,%xmm9
4638 vpaddd %xmm7,%xmm9,%xmm9
4639 vmovdqu 128-128(%rax),%xmm5
4640 vpaddd 0-128(%rax),%xmm6,%xmm6
4641
4642 vpsrld $3,%xmm5,%xmm7
4643 vpsrld $7,%xmm5,%xmm1
4644 vpslld $25,%xmm5,%xmm2
4645 vpxor %xmm1,%xmm7,%xmm7
4646 vpsrld $18,%xmm5,%xmm1
4647 vpxor %xmm2,%xmm7,%xmm7
4648 vpslld $14,%xmm5,%xmm2
4649 vmovdqu 80-128(%rax),%xmm0
4650 vpsrld $10,%xmm0,%xmm4
4651
4652 vpxor %xmm1,%xmm7,%xmm7
4653 vpsrld $17,%xmm0,%xmm1
4654 vpxor %xmm2,%xmm7,%xmm7
4655 vpslld $15,%xmm0,%xmm2
4656 vpaddd %xmm7,%xmm6,%xmm6
4657 vpxor %xmm1,%xmm4,%xmm7
4658 vpsrld $19,%xmm0,%xmm1
4659 vpxor %xmm2,%xmm7,%xmm7
4660 vpslld $13,%xmm0,%xmm2
4661 vpxor %xmm1,%xmm7,%xmm7
4662 vpxor %xmm2,%xmm7,%xmm7
4663 vpaddd %xmm7,%xmm6,%xmm6
4664 vpsrld $6,%xmm13,%xmm7
4665 vpslld $26,%xmm13,%xmm2
4666 vmovdqu %xmm6,112-128(%rax)
4667 vpaddd %xmm8,%xmm6,%xmm6
4668
4669 vpsrld $11,%xmm13,%xmm1
4670 vpxor %xmm2,%xmm7,%xmm7
4671 vpslld $21,%xmm13,%xmm2
4672 vpaddd 96(%rbp),%xmm6,%xmm6
4673 vpxor %xmm1,%xmm7,%xmm7
4674
4675 vpsrld $25,%xmm13,%xmm1
4676 vpxor %xmm2,%xmm7,%xmm7
4677
4678 vpslld $7,%xmm13,%xmm2
4679 vpandn %xmm15,%xmm13,%xmm0
4680 vpand %xmm14,%xmm13,%xmm4
4681
4682 vpxor %xmm1,%xmm7,%xmm7
4683
4684 vpsrld $2,%xmm9,%xmm8
4685 vpxor %xmm2,%xmm7,%xmm7
4686
4687 vpslld $30,%xmm9,%xmm1
4688 vpxor %xmm4,%xmm0,%xmm0
4689 vpxor %xmm9,%xmm10,%xmm4
4690
4691 vpxor %xmm1,%xmm8,%xmm8
4692 vpaddd %xmm7,%xmm6,%xmm6
4693
4694 vpsrld $13,%xmm9,%xmm1
4695
4696 vpslld $19,%xmm9,%xmm2
4697 vpaddd %xmm0,%xmm6,%xmm6
4698 vpand %xmm4,%xmm3,%xmm3
4699
4700 vpxor %xmm1,%xmm8,%xmm7
4701
4702 vpsrld $22,%xmm9,%xmm1
4703 vpxor %xmm2,%xmm7,%xmm7
4704
4705 vpslld $10,%xmm9,%xmm2
4706 vpxor %xmm3,%xmm10,%xmm8
4707 vpaddd %xmm6,%xmm12,%xmm12
4708
4709 vpxor %xmm1,%xmm7,%xmm7
4710 vpxor %xmm2,%xmm7,%xmm7
4711
4712 vpaddd %xmm6,%xmm8,%xmm8
4713 vpaddd %xmm7,%xmm8,%xmm8
4714 addq $256,%rbp
4715 vmovdqu 144-128(%rax),%xmm6
4716 vpaddd 16-128(%rax),%xmm5,%xmm5
4717
4718 vpsrld $3,%xmm6,%xmm7
4719 vpsrld $7,%xmm6,%xmm1
4720 vpslld $25,%xmm6,%xmm2
4721 vpxor %xmm1,%xmm7,%xmm7
4722 vpsrld $18,%xmm6,%xmm1
4723 vpxor %xmm2,%xmm7,%xmm7
4724 vpslld $14,%xmm6,%xmm2
4725 vmovdqu 96-128(%rax),%xmm0
4726 vpsrld $10,%xmm0,%xmm3
4727
4728 vpxor %xmm1,%xmm7,%xmm7
4729 vpsrld $17,%xmm0,%xmm1
4730 vpxor %xmm2,%xmm7,%xmm7
4731 vpslld $15,%xmm0,%xmm2
4732 vpaddd %xmm7,%xmm5,%xmm5
4733 vpxor %xmm1,%xmm3,%xmm7
4734 vpsrld $19,%xmm0,%xmm1
4735 vpxor %xmm2,%xmm7,%xmm7
4736 vpslld $13,%xmm0,%xmm2
4737 vpxor %xmm1,%xmm7,%xmm7
4738 vpxor %xmm2,%xmm7,%xmm7
4739 vpaddd %xmm7,%xmm5,%xmm5
4740 vpsrld $6,%xmm12,%xmm7
4741 vpslld $26,%xmm12,%xmm2
4742 vmovdqu %xmm5,128-128(%rax)
4743 vpaddd %xmm15,%xmm5,%xmm5
4744
4745 vpsrld $11,%xmm12,%xmm1
4746 vpxor %xmm2,%xmm7,%xmm7
4747 vpslld $21,%xmm12,%xmm2
4748 vpaddd -128(%rbp),%xmm5,%xmm5
4749 vpxor %xmm1,%xmm7,%xmm7
4750
4751 vpsrld $25,%xmm12,%xmm1
4752 vpxor %xmm2,%xmm7,%xmm7
4753
4754 vpslld $7,%xmm12,%xmm2
4755 vpandn %xmm14,%xmm12,%xmm0
4756 vpand %xmm13,%xmm12,%xmm3
4757
4758 vpxor %xmm1,%xmm7,%xmm7
4759
4760 vpsrld $2,%xmm8,%xmm15
4761 vpxor %xmm2,%xmm7,%xmm7
4762
4763 vpslld $30,%xmm8,%xmm1
4764 vpxor %xmm3,%xmm0,%xmm0
4765 vpxor %xmm8,%xmm9,%xmm3
4766
4767 vpxor %xmm1,%xmm15,%xmm15
4768 vpaddd %xmm7,%xmm5,%xmm5
4769
4770 vpsrld $13,%xmm8,%xmm1
4771
4772 vpslld $19,%xmm8,%xmm2
4773 vpaddd %xmm0,%xmm5,%xmm5
4774 vpand %xmm3,%xmm4,%xmm4
4775
4776 vpxor %xmm1,%xmm15,%xmm7
4777
4778 vpsrld $22,%xmm8,%xmm1
4779 vpxor %xmm2,%xmm7,%xmm7
4780
4781 vpslld $10,%xmm8,%xmm2
4782 vpxor %xmm4,%xmm9,%xmm15
4783 vpaddd %xmm5,%xmm11,%xmm11
4784
4785 vpxor %xmm1,%xmm7,%xmm7
4786 vpxor %xmm2,%xmm7,%xmm7
4787
4788 vpaddd %xmm5,%xmm15,%xmm15
4789 vpaddd %xmm7,%xmm15,%xmm15
4790 vmovdqu 160-128(%rax),%xmm5
4791 vpaddd 32-128(%rax),%xmm6,%xmm6
4792
4793 vpsrld $3,%xmm5,%xmm7
4794 vpsrld $7,%xmm5,%xmm1
4795 vpslld $25,%xmm5,%xmm2
4796 vpxor %xmm1,%xmm7,%xmm7
4797 vpsrld $18,%xmm5,%xmm1
4798 vpxor %xmm2,%xmm7,%xmm7
4799 vpslld $14,%xmm5,%xmm2
4800 vmovdqu 112-128(%rax),%xmm0
4801 vpsrld $10,%xmm0,%xmm4
4802
4803 vpxor %xmm1,%xmm7,%xmm7
4804 vpsrld $17,%xmm0,%xmm1
4805 vpxor %xmm2,%xmm7,%xmm7
4806 vpslld $15,%xmm0,%xmm2
4807 vpaddd %xmm7,%xmm6,%xmm6
4808 vpxor %xmm1,%xmm4,%xmm7
4809 vpsrld $19,%xmm0,%xmm1
4810 vpxor %xmm2,%xmm7,%xmm7
4811 vpslld $13,%xmm0,%xmm2
4812 vpxor %xmm1,%xmm7,%xmm7
4813 vpxor %xmm2,%xmm7,%xmm7
4814 vpaddd %xmm7,%xmm6,%xmm6
4815 vpsrld $6,%xmm11,%xmm7
4816 vpslld $26,%xmm11,%xmm2
4817 vmovdqu %xmm6,144-128(%rax)
4818 vpaddd %xmm14,%xmm6,%xmm6
4819
4820 vpsrld $11,%xmm11,%xmm1
4821 vpxor %xmm2,%xmm7,%xmm7
4822 vpslld $21,%xmm11,%xmm2
4823 vpaddd -96(%rbp),%xmm6,%xmm6
4824 vpxor %xmm1,%xmm7,%xmm7
4825
4826 vpsrld $25,%xmm11,%xmm1
4827 vpxor %xmm2,%xmm7,%xmm7
4828
4829 vpslld $7,%xmm11,%xmm2
4830 vpandn %xmm13,%xmm11,%xmm0
4831 vpand %xmm12,%xmm11,%xmm4
4832
4833 vpxor %xmm1,%xmm7,%xmm7
4834
4835 vpsrld $2,%xmm15,%xmm14
4836 vpxor %xmm2,%xmm7,%xmm7
4837
4838 vpslld $30,%xmm15,%xmm1
4839 vpxor %xmm4,%xmm0,%xmm0
4840 vpxor %xmm15,%xmm8,%xmm4
4841
4842 vpxor %xmm1,%xmm14,%xmm14
4843 vpaddd %xmm7,%xmm6,%xmm6
4844
4845 vpsrld $13,%xmm15,%xmm1
4846
4847 vpslld $19,%xmm15,%xmm2
4848 vpaddd %xmm0,%xmm6,%xmm6
4849 vpand %xmm4,%xmm3,%xmm3
4850
4851 vpxor %xmm1,%xmm14,%xmm7
4852
4853 vpsrld $22,%xmm15,%xmm1
4854 vpxor %xmm2,%xmm7,%xmm7
4855
4856 vpslld $10,%xmm15,%xmm2
4857 vpxor %xmm3,%xmm8,%xmm14
4858 vpaddd %xmm6,%xmm10,%xmm10
4859
4860 vpxor %xmm1,%xmm7,%xmm7
4861 vpxor %xmm2,%xmm7,%xmm7
4862
4863 vpaddd %xmm6,%xmm14,%xmm14
4864 vpaddd %xmm7,%xmm14,%xmm14
4865 vmovdqu 176-128(%rax),%xmm6
4866 vpaddd 48-128(%rax),%xmm5,%xmm5
4867
4868 vpsrld $3,%xmm6,%xmm7
4869 vpsrld $7,%xmm6,%xmm1
4870 vpslld $25,%xmm6,%xmm2
4871 vpxor %xmm1,%xmm7,%xmm7
4872 vpsrld $18,%xmm6,%xmm1
4873 vpxor %xmm2,%xmm7,%xmm7
4874 vpslld $14,%xmm6,%xmm2
4875 vmovdqu 128-128(%rax),%xmm0
4876 vpsrld $10,%xmm0,%xmm3
4877
4878 vpxor %xmm1,%xmm7,%xmm7
4879 vpsrld $17,%xmm0,%xmm1
4880 vpxor %xmm2,%xmm7,%xmm7
4881 vpslld $15,%xmm0,%xmm2
4882 vpaddd %xmm7,%xmm5,%xmm5
4883 vpxor %xmm1,%xmm3,%xmm7
4884 vpsrld $19,%xmm0,%xmm1
4885 vpxor %xmm2,%xmm7,%xmm7
4886 vpslld $13,%xmm0,%xmm2
4887 vpxor %xmm1,%xmm7,%xmm7
4888 vpxor %xmm2,%xmm7,%xmm7
4889 vpaddd %xmm7,%xmm5,%xmm5
4890 vpsrld $6,%xmm10,%xmm7
4891 vpslld $26,%xmm10,%xmm2
4892 vmovdqu %xmm5,160-128(%rax)
4893 vpaddd %xmm13,%xmm5,%xmm5
4894
4895 vpsrld $11,%xmm10,%xmm1
4896 vpxor %xmm2,%xmm7,%xmm7
4897 vpslld $21,%xmm10,%xmm2
4898 vpaddd -64(%rbp),%xmm5,%xmm5
4899 vpxor %xmm1,%xmm7,%xmm7
4900
4901 vpsrld $25,%xmm10,%xmm1
4902 vpxor %xmm2,%xmm7,%xmm7
4903
4904 vpslld $7,%xmm10,%xmm2
4905 vpandn %xmm12,%xmm10,%xmm0
4906 vpand %xmm11,%xmm10,%xmm3
4907
4908 vpxor %xmm1,%xmm7,%xmm7
4909
4910 vpsrld $2,%xmm14,%xmm13
4911 vpxor %xmm2,%xmm7,%xmm7
4912
4913 vpslld $30,%xmm14,%xmm1
4914 vpxor %xmm3,%xmm0,%xmm0
4915 vpxor %xmm14,%xmm15,%xmm3
4916
4917 vpxor %xmm1,%xmm13,%xmm13
4918 vpaddd %xmm7,%xmm5,%xmm5
4919
4920 vpsrld $13,%xmm14,%xmm1
4921
4922 vpslld $19,%xmm14,%xmm2
4923 vpaddd %xmm0,%xmm5,%xmm5
4924 vpand %xmm3,%xmm4,%xmm4
4925
4926 vpxor %xmm1,%xmm13,%xmm7
4927
4928 vpsrld $22,%xmm14,%xmm1
4929 vpxor %xmm2,%xmm7,%xmm7
4930
4931 vpslld $10,%xmm14,%xmm2
4932 vpxor %xmm4,%xmm15,%xmm13
4933 vpaddd %xmm5,%xmm9,%xmm9
4934
4935 vpxor %xmm1,%xmm7,%xmm7
4936 vpxor %xmm2,%xmm7,%xmm7
4937
4938 vpaddd %xmm5,%xmm13,%xmm13
4939 vpaddd %xmm7,%xmm13,%xmm13
4940 vmovdqu 192-128(%rax),%xmm5
4941 vpaddd 64-128(%rax),%xmm6,%xmm6
4942
4943 vpsrld $3,%xmm5,%xmm7
4944 vpsrld $7,%xmm5,%xmm1
4945 vpslld $25,%xmm5,%xmm2
4946 vpxor %xmm1,%xmm7,%xmm7
4947 vpsrld $18,%xmm5,%xmm1
4948 vpxor %xmm2,%xmm7,%xmm7
4949 vpslld $14,%xmm5,%xmm2
4950 vmovdqu 144-128(%rax),%xmm0
4951 vpsrld $10,%xmm0,%xmm4
4952
4953 vpxor %xmm1,%xmm7,%xmm7
4954 vpsrld $17,%xmm0,%xmm1
4955 vpxor %xmm2,%xmm7,%xmm7
4956 vpslld $15,%xmm0,%xmm2
4957 vpaddd %xmm7,%xmm6,%xmm6
4958 vpxor %xmm1,%xmm4,%xmm7
4959 vpsrld $19,%xmm0,%xmm1
4960 vpxor %xmm2,%xmm7,%xmm7
4961 vpslld $13,%xmm0,%xmm2
4962 vpxor %xmm1,%xmm7,%xmm7
4963 vpxor %xmm2,%xmm7,%xmm7
4964 vpaddd %xmm7,%xmm6,%xmm6
4965 vpsrld $6,%xmm9,%xmm7
4966 vpslld $26,%xmm9,%xmm2
4967 vmovdqu %xmm6,176-128(%rax)
4968 vpaddd %xmm12,%xmm6,%xmm6
4969
4970 vpsrld $11,%xmm9,%xmm1
4971 vpxor %xmm2,%xmm7,%xmm7
4972 vpslld $21,%xmm9,%xmm2
4973 vpaddd -32(%rbp),%xmm6,%xmm6
4974 vpxor %xmm1,%xmm7,%xmm7
4975
4976 vpsrld $25,%xmm9,%xmm1
4977 vpxor %xmm2,%xmm7,%xmm7
4978
4979 vpslld $7,%xmm9,%xmm2
4980 vpandn %xmm11,%xmm9,%xmm0
4981 vpand %xmm10,%xmm9,%xmm4
4982
4983 vpxor %xmm1,%xmm7,%xmm7
4984
4985 vpsrld $2,%xmm13,%xmm12
4986 vpxor %xmm2,%xmm7,%xmm7
4987
4988 vpslld $30,%xmm13,%xmm1
4989 vpxor %xmm4,%xmm0,%xmm0
4990 vpxor %xmm13,%xmm14,%xmm4
4991
4992 vpxor %xmm1,%xmm12,%xmm12
4993 vpaddd %xmm7,%xmm6,%xmm6
4994
4995 vpsrld $13,%xmm13,%xmm1
4996
4997 vpslld $19,%xmm13,%xmm2
4998 vpaddd %xmm0,%xmm6,%xmm6
4999 vpand %xmm4,%xmm3,%xmm3
5000
5001 vpxor %xmm1,%xmm12,%xmm7
5002
5003 vpsrld $22,%xmm13,%xmm1
5004 vpxor %xmm2,%xmm7,%xmm7
5005
5006 vpslld $10,%xmm13,%xmm2
5007 vpxor %xmm3,%xmm14,%xmm12
5008 vpaddd %xmm6,%xmm8,%xmm8
5009
5010 vpxor %xmm1,%xmm7,%xmm7
5011 vpxor %xmm2,%xmm7,%xmm7
5012
5013 vpaddd %xmm6,%xmm12,%xmm12
5014 vpaddd %xmm7,%xmm12,%xmm12
5015 vmovdqu 208-128(%rax),%xmm6
5016 vpaddd 80-128(%rax),%xmm5,%xmm5
5017
5018 vpsrld $3,%xmm6,%xmm7
5019 vpsrld $7,%xmm6,%xmm1
5020 vpslld $25,%xmm6,%xmm2
5021 vpxor %xmm1,%xmm7,%xmm7
5022 vpsrld $18,%xmm6,%xmm1
5023 vpxor %xmm2,%xmm7,%xmm7
5024 vpslld $14,%xmm6,%xmm2
5025 vmovdqu 160-128(%rax),%xmm0
5026 vpsrld $10,%xmm0,%xmm3
5027
5028 vpxor %xmm1,%xmm7,%xmm7
5029 vpsrld $17,%xmm0,%xmm1
5030 vpxor %xmm2,%xmm7,%xmm7
5031 vpslld $15,%xmm0,%xmm2
5032 vpaddd %xmm7,%xmm5,%xmm5
5033 vpxor %xmm1,%xmm3,%xmm7
5034 vpsrld $19,%xmm0,%xmm1
5035 vpxor %xmm2,%xmm7,%xmm7
5036 vpslld $13,%xmm0,%xmm2
5037 vpxor %xmm1,%xmm7,%xmm7
5038 vpxor %xmm2,%xmm7,%xmm7
5039 vpaddd %xmm7,%xmm5,%xmm5
5040 vpsrld $6,%xmm8,%xmm7
5041 vpslld $26,%xmm8,%xmm2
5042 vmovdqu %xmm5,192-128(%rax)
5043 vpaddd %xmm11,%xmm5,%xmm5
5044
5045 vpsrld $11,%xmm8,%xmm1
5046 vpxor %xmm2,%xmm7,%xmm7
5047 vpslld $21,%xmm8,%xmm2
5048 vpaddd 0(%rbp),%xmm5,%xmm5
5049 vpxor %xmm1,%xmm7,%xmm7
5050
5051 vpsrld $25,%xmm8,%xmm1
5052 vpxor %xmm2,%xmm7,%xmm7
5053
5054 vpslld $7,%xmm8,%xmm2
5055 vpandn %xmm10,%xmm8,%xmm0
5056 vpand %xmm9,%xmm8,%xmm3
5057
5058 vpxor %xmm1,%xmm7,%xmm7
5059
5060 vpsrld $2,%xmm12,%xmm11
5061 vpxor %xmm2,%xmm7,%xmm7
5062
5063 vpslld $30,%xmm12,%xmm1
5064 vpxor %xmm3,%xmm0,%xmm0
5065 vpxor %xmm12,%xmm13,%xmm3
5066
5067 vpxor %xmm1,%xmm11,%xmm11
5068 vpaddd %xmm7,%xmm5,%xmm5
5069
5070 vpsrld $13,%xmm12,%xmm1
5071
5072 vpslld $19,%xmm12,%xmm2
5073 vpaddd %xmm0,%xmm5,%xmm5
5074 vpand %xmm3,%xmm4,%xmm4
5075
5076 vpxor %xmm1,%xmm11,%xmm7
5077
5078 vpsrld $22,%xmm12,%xmm1
5079 vpxor %xmm2,%xmm7,%xmm7
5080
5081 vpslld $10,%xmm12,%xmm2
5082 vpxor %xmm4,%xmm13,%xmm11
5083 vpaddd %xmm5,%xmm15,%xmm15
5084
5085 vpxor %xmm1,%xmm7,%xmm7
5086 vpxor %xmm2,%xmm7,%xmm7
5087
5088 vpaddd %xmm5,%xmm11,%xmm11
5089 vpaddd %xmm7,%xmm11,%xmm11
5090 vmovdqu 224-128(%rax),%xmm5
5091 vpaddd 96-128(%rax),%xmm6,%xmm6
5092
5093 vpsrld $3,%xmm5,%xmm7
5094 vpsrld $7,%xmm5,%xmm1
5095 vpslld $25,%xmm5,%xmm2
5096 vpxor %xmm1,%xmm7,%xmm7
5097 vpsrld $18,%xmm5,%xmm1
5098 vpxor %xmm2,%xmm7,%xmm7
5099 vpslld $14,%xmm5,%xmm2
5100 vmovdqu 176-128(%rax),%xmm0
5101 vpsrld $10,%xmm0,%xmm4
5102
5103 vpxor %xmm1,%xmm7,%xmm7
5104 vpsrld $17,%xmm0,%xmm1
5105 vpxor %xmm2,%xmm7,%xmm7
5106 vpslld $15,%xmm0,%xmm2
5107 vpaddd %xmm7,%xmm6,%xmm6
5108 vpxor %xmm1,%xmm4,%xmm7
5109 vpsrld $19,%xmm0,%xmm1
5110 vpxor %xmm2,%xmm7,%xmm7
5111 vpslld $13,%xmm0,%xmm2
5112 vpxor %xmm1,%xmm7,%xmm7
5113 vpxor %xmm2,%xmm7,%xmm7
5114 vpaddd %xmm7,%xmm6,%xmm6
5115 vpsrld $6,%xmm15,%xmm7
5116 vpslld $26,%xmm15,%xmm2
5117 vmovdqu %xmm6,208-128(%rax)
5118 vpaddd %xmm10,%xmm6,%xmm6
5119
5120 vpsrld $11,%xmm15,%xmm1
5121 vpxor %xmm2,%xmm7,%xmm7
5122 vpslld $21,%xmm15,%xmm2
5123 vpaddd 32(%rbp),%xmm6,%xmm6
5124 vpxor %xmm1,%xmm7,%xmm7
5125
5126 vpsrld $25,%xmm15,%xmm1
5127 vpxor %xmm2,%xmm7,%xmm7
5128
5129 vpslld $7,%xmm15,%xmm2
5130 vpandn %xmm9,%xmm15,%xmm0
5131 vpand %xmm8,%xmm15,%xmm4
5132
5133 vpxor %xmm1,%xmm7,%xmm7
5134
5135 vpsrld $2,%xmm11,%xmm10
5136 vpxor %xmm2,%xmm7,%xmm7
5137
5138 vpslld $30,%xmm11,%xmm1
5139 vpxor %xmm4,%xmm0,%xmm0
5140 vpxor %xmm11,%xmm12,%xmm4
5141
5142 vpxor %xmm1,%xmm10,%xmm10
5143 vpaddd %xmm7,%xmm6,%xmm6
5144
5145 vpsrld $13,%xmm11,%xmm1
5146
5147 vpslld $19,%xmm11,%xmm2
5148 vpaddd %xmm0,%xmm6,%xmm6
5149 vpand %xmm4,%xmm3,%xmm3
5150
5151 vpxor %xmm1,%xmm10,%xmm7
5152
5153 vpsrld $22,%xmm11,%xmm1
5154 vpxor %xmm2,%xmm7,%xmm7
5155
5156 vpslld $10,%xmm11,%xmm2
5157 vpxor %xmm3,%xmm12,%xmm10
5158 vpaddd %xmm6,%xmm14,%xmm14
5159
5160 vpxor %xmm1,%xmm7,%xmm7
5161 vpxor %xmm2,%xmm7,%xmm7
5162
5163 vpaddd %xmm6,%xmm10,%xmm10
5164 vpaddd %xmm7,%xmm10,%xmm10
5165 vmovdqu 240-128(%rax),%xmm6
5166 vpaddd 112-128(%rax),%xmm5,%xmm5
5167
5168 vpsrld $3,%xmm6,%xmm7
5169 vpsrld $7,%xmm6,%xmm1
5170 vpslld $25,%xmm6,%xmm2
5171 vpxor %xmm1,%xmm7,%xmm7
5172 vpsrld $18,%xmm6,%xmm1
5173 vpxor %xmm2,%xmm7,%xmm7
5174 vpslld $14,%xmm6,%xmm2
5175 vmovdqu 192-128(%rax),%xmm0
5176 vpsrld $10,%xmm0,%xmm3
5177
5178 vpxor %xmm1,%xmm7,%xmm7
5179 vpsrld $17,%xmm0,%xmm1
5180 vpxor %xmm2,%xmm7,%xmm7
5181 vpslld $15,%xmm0,%xmm2
5182 vpaddd %xmm7,%xmm5,%xmm5
5183 vpxor %xmm1,%xmm3,%xmm7
5184 vpsrld $19,%xmm0,%xmm1
5185 vpxor %xmm2,%xmm7,%xmm7
5186 vpslld $13,%xmm0,%xmm2
5187 vpxor %xmm1,%xmm7,%xmm7
5188 vpxor %xmm2,%xmm7,%xmm7
5189 vpaddd %xmm7,%xmm5,%xmm5
5190 vpsrld $6,%xmm14,%xmm7
5191 vpslld $26,%xmm14,%xmm2
5192 vmovdqu %xmm5,224-128(%rax)
5193 vpaddd %xmm9,%xmm5,%xmm5
5194
5195 vpsrld $11,%xmm14,%xmm1
5196 vpxor %xmm2,%xmm7,%xmm7
5197 vpslld $21,%xmm14,%xmm2
5198 vpaddd 64(%rbp),%xmm5,%xmm5
5199 vpxor %xmm1,%xmm7,%xmm7
5200
5201 vpsrld $25,%xmm14,%xmm1
5202 vpxor %xmm2,%xmm7,%xmm7
5203
5204 vpslld $7,%xmm14,%xmm2
5205 vpandn %xmm8,%xmm14,%xmm0
5206 vpand %xmm15,%xmm14,%xmm3
5207
5208 vpxor %xmm1,%xmm7,%xmm7
5209
5210 vpsrld $2,%xmm10,%xmm9
5211 vpxor %xmm2,%xmm7,%xmm7
5212
5213 vpslld $30,%xmm10,%xmm1
5214 vpxor %xmm3,%xmm0,%xmm0
5215 vpxor %xmm10,%xmm11,%xmm3
5216
5217 vpxor %xmm1,%xmm9,%xmm9
5218 vpaddd %xmm7,%xmm5,%xmm5
5219
5220 vpsrld $13,%xmm10,%xmm1
5221
5222 vpslld $19,%xmm10,%xmm2
5223 vpaddd %xmm0,%xmm5,%xmm5
5224 vpand %xmm3,%xmm4,%xmm4
5225
5226 vpxor %xmm1,%xmm9,%xmm7
5227
5228 vpsrld $22,%xmm10,%xmm1
5229 vpxor %xmm2,%xmm7,%xmm7
5230
5231 vpslld $10,%xmm10,%xmm2
5232 vpxor %xmm4,%xmm11,%xmm9
5233 vpaddd %xmm5,%xmm13,%xmm13
5234
5235 vpxor %xmm1,%xmm7,%xmm7
5236 vpxor %xmm2,%xmm7,%xmm7
5237
5238 vpaddd %xmm5,%xmm9,%xmm9
5239 vpaddd %xmm7,%xmm9,%xmm9
5240 vmovdqu 0-128(%rax),%xmm5
5241 vpaddd 128-128(%rax),%xmm6,%xmm6
5242
5243 vpsrld $3,%xmm5,%xmm7
5244 vpsrld $7,%xmm5,%xmm1
5245 vpslld $25,%xmm5,%xmm2
5246 vpxor %xmm1,%xmm7,%xmm7
5247 vpsrld $18,%xmm5,%xmm1
5248 vpxor %xmm2,%xmm7,%xmm7
5249 vpslld $14,%xmm5,%xmm2
5250 vmovdqu 208-128(%rax),%xmm0
5251 vpsrld $10,%xmm0,%xmm4
5252
5253 vpxor %xmm1,%xmm7,%xmm7
5254 vpsrld $17,%xmm0,%xmm1
5255 vpxor %xmm2,%xmm7,%xmm7
5256 vpslld $15,%xmm0,%xmm2
5257 vpaddd %xmm7,%xmm6,%xmm6
5258 vpxor %xmm1,%xmm4,%xmm7
5259 vpsrld $19,%xmm0,%xmm1
5260 vpxor %xmm2,%xmm7,%xmm7
5261 vpslld $13,%xmm0,%xmm2
5262 vpxor %xmm1,%xmm7,%xmm7
5263 vpxor %xmm2,%xmm7,%xmm7
5264 vpaddd %xmm7,%xmm6,%xmm6
5265 vpsrld $6,%xmm13,%xmm7
5266 vpslld $26,%xmm13,%xmm2
5267 vmovdqu %xmm6,240-128(%rax)
5268 vpaddd %xmm8,%xmm6,%xmm6
5269
5270 vpsrld $11,%xmm13,%xmm1
5271 vpxor %xmm2,%xmm7,%xmm7
5272 vpslld $21,%xmm13,%xmm2
5273 vpaddd 96(%rbp),%xmm6,%xmm6
5274 vpxor %xmm1,%xmm7,%xmm7
5275
5276 vpsrld $25,%xmm13,%xmm1
5277 vpxor %xmm2,%xmm7,%xmm7
5278
5279 vpslld $7,%xmm13,%xmm2
5280 vpandn %xmm15,%xmm13,%xmm0
5281 vpand %xmm14,%xmm13,%xmm4
5282
5283 vpxor %xmm1,%xmm7,%xmm7
5284
5285 vpsrld $2,%xmm9,%xmm8
5286 vpxor %xmm2,%xmm7,%xmm7
5287
5288 vpslld $30,%xmm9,%xmm1
5289 vpxor %xmm4,%xmm0,%xmm0
5290 vpxor %xmm9,%xmm10,%xmm4
5291
5292 vpxor %xmm1,%xmm8,%xmm8
5293 vpaddd %xmm7,%xmm6,%xmm6
5294
5295 vpsrld $13,%xmm9,%xmm1
5296
5297 vpslld $19,%xmm9,%xmm2
5298 vpaddd %xmm0,%xmm6,%xmm6
5299 vpand %xmm4,%xmm3,%xmm3
5300
5301 vpxor %xmm1,%xmm8,%xmm7
5302
5303 vpsrld $22,%xmm9,%xmm1
5304 vpxor %xmm2,%xmm7,%xmm7
5305
5306 vpslld $10,%xmm9,%xmm2
5307 vpxor %xmm3,%xmm10,%xmm8
5308 vpaddd %xmm6,%xmm12,%xmm12
5309
5310 vpxor %xmm1,%xmm7,%xmm7
5311 vpxor %xmm2,%xmm7,%xmm7
5312
5313 vpaddd %xmm6,%xmm8,%xmm8
5314 vpaddd %xmm7,%xmm8,%xmm8
5315 addq $256,%rbp
5316 decl %ecx
5317 jnz .Loop_16_xx_avx
5318
5319 movl $1,%ecx
5320 leaq K256+128(%rip),%rbp
5321 cmpl 0(%rbx),%ecx
5322 cmovgeq %rbp,%r8
5323 cmpl 4(%rbx),%ecx
5324 cmovgeq %rbp,%r9
5325 cmpl 8(%rbx),%ecx
5326 cmovgeq %rbp,%r10
5327 cmpl 12(%rbx),%ecx
5328 cmovgeq %rbp,%r11
5329 vmovdqa (%rbx),%xmm7
5330 vpxor %xmm0,%xmm0,%xmm0
5331 vmovdqa %xmm7,%xmm6
5332 vpcmpgtd %xmm0,%xmm6,%xmm6
5333 vpaddd %xmm6,%xmm7,%xmm7
5334
5335 vmovdqu 0-128(%rdi),%xmm0
5336 vpand %xmm6,%xmm8,%xmm8
5337 vmovdqu 32-128(%rdi),%xmm1
5338 vpand %xmm6,%xmm9,%xmm9
5339 vmovdqu 64-128(%rdi),%xmm2
5340 vpand %xmm6,%xmm10,%xmm10
5341 vmovdqu 96-128(%rdi),%xmm5
5342 vpand %xmm6,%xmm11,%xmm11
5343 vpaddd %xmm0,%xmm8,%xmm8
5344 vmovdqu 128-128(%rdi),%xmm0
5345 vpand %xmm6,%xmm12,%xmm12
5346 vpaddd %xmm1,%xmm9,%xmm9
5347 vmovdqu 160-128(%rdi),%xmm1
5348 vpand %xmm6,%xmm13,%xmm13
5349 vpaddd %xmm2,%xmm10,%xmm10
5350 vmovdqu 192-128(%rdi),%xmm2
5351 vpand %xmm6,%xmm14,%xmm14
5352 vpaddd %xmm5,%xmm11,%xmm11
5353 vmovdqu 224-128(%rdi),%xmm5
5354 vpand %xmm6,%xmm15,%xmm15
5355 vpaddd %xmm0,%xmm12,%xmm12
5356 vpaddd %xmm1,%xmm13,%xmm13
5357 vmovdqu %xmm8,0-128(%rdi)
5358 vpaddd %xmm2,%xmm14,%xmm14
5359 vmovdqu %xmm9,32-128(%rdi)
5360 vpaddd %xmm5,%xmm15,%xmm15
5361 vmovdqu %xmm10,64-128(%rdi)
5362 vmovdqu %xmm11,96-128(%rdi)
5363 vmovdqu %xmm12,128-128(%rdi)
5364 vmovdqu %xmm13,160-128(%rdi)
5365 vmovdqu %xmm14,192-128(%rdi)
5366 vmovdqu %xmm15,224-128(%rdi)
5367
5368 vmovdqu %xmm7,(%rbx)
5369 vmovdqu .Lpbswap(%rip),%xmm6
5370 decl %edx
5371 jnz .Loop_avx
5372
5373 movl 280(%rsp),%edx
5374 leaq 16(%rdi),%rdi
5375 leaq 64(%rsi),%rsi
5376 decl %edx
5377 jnz .Loop_grande_avx
5378
5379 .Ldone_avx:
5380 movq 272(%rsp),%rax
5381 .cfi_def_cfa %rax,8
5382 vzeroupper
5383 movq -16(%rax),%rbp
5384 .cfi_restore %rbp
5385 movq -8(%rax),%rbx
5386 .cfi_restore %rbx
5387 leaq (%rax),%rsp
5388 .cfi_def_cfa_register %rsp
5389 .Lepilogue_avx:
5390 .byte 0xf3,0xc3
5391 .cfi_endproc
5392 .size sha256_multi_block_avx,.-sha256_multi_block_avx
5393 .type sha256_multi_block_avx2,@function
5394 .align 32
5395 sha256_multi_block_avx2:
5396 .cfi_startproc
5397 _avx2_shortcut:
5398 movq %rsp,%rax
5399 .cfi_def_cfa_register %rax
5400 pushq %rbx
5401 .cfi_offset %rbx,-16
5402 pushq %rbp
5403 .cfi_offset %rbp,-24
5404 pushq %r12
5405 .cfi_offset %r12,-32
5406 pushq %r13
5407 .cfi_offset %r13,-40
5408 pushq %r14
5409 .cfi_offset %r14,-48
5410 pushq %r15
5411 .cfi_offset %r15,-56
5412 subq $576,%rsp
5413 andq $-256,%rsp
5414 movq %rax,544(%rsp)
5415 .cfi_escape 0x0f,0x06,0x77,0xa0,0x04,0x06,0x23,0x08
5416 .Lbody_avx2:
5417 leaq K256+128(%rip),%rbp
5418 leaq 128(%rdi),%rdi
5419
5420 .Loop_grande_avx2:
5421 movl %edx,552(%rsp)
5422 xorl %edx,%edx
5423 leaq 512(%rsp),%rbx
5424 movq 0(%rsi),%r12
5425 movl 8(%rsi),%ecx
5426 cmpl %edx,%ecx
5427 cmovgl %ecx,%edx
5428 testl %ecx,%ecx
5429 movl %ecx,0(%rbx)
5430 cmovleq %rbp,%r12
5431 movq 16(%rsi),%r13
5432 movl 24(%rsi),%ecx
5433 cmpl %edx,%ecx
5434 cmovgl %ecx,%edx
5435 testl %ecx,%ecx
5436 movl %ecx,4(%rbx)
5437 cmovleq %rbp,%r13
5438 movq 32(%rsi),%r14
5439 movl 40(%rsi),%ecx
5440 cmpl %edx,%ecx
5441 cmovgl %ecx,%edx
5442 testl %ecx,%ecx
5443 movl %ecx,8(%rbx)
5444 cmovleq %rbp,%r14
5445 movq 48(%rsi),%r15
5446 movl 56(%rsi),%ecx
5447 cmpl %edx,%ecx
5448 cmovgl %ecx,%edx
5449 testl %ecx,%ecx
5450 movl %ecx,12(%rbx)
5451 cmovleq %rbp,%r15
5452 movq 64(%rsi),%r8
5453 movl 72(%rsi),%ecx
5454 cmpl %edx,%ecx
5455 cmovgl %ecx,%edx
5456 testl %ecx,%ecx
5457 movl %ecx,16(%rbx)
5458 cmovleq %rbp,%r8
5459 movq 80(%rsi),%r9
5460 movl 88(%rsi),%ecx
5461 cmpl %edx,%ecx
5462 cmovgl %ecx,%edx
5463 testl %ecx,%ecx
5464 movl %ecx,20(%rbx)
5465 cmovleq %rbp,%r9
5466 movq 96(%rsi),%r10
5467 movl 104(%rsi),%ecx
5468 cmpl %edx,%ecx
5469 cmovgl %ecx,%edx
5470 testl %ecx,%ecx
5471 movl %ecx,24(%rbx)
5472 cmovleq %rbp,%r10
5473 movq 112(%rsi),%r11
5474 movl 120(%rsi),%ecx
5475 cmpl %edx,%ecx
5476 cmovgl %ecx,%edx
5477 testl %ecx,%ecx
5478 movl %ecx,28(%rbx)
5479 cmovleq %rbp,%r11
5480 vmovdqu 0-128(%rdi),%ymm8
5481 leaq 128(%rsp),%rax
5482 vmovdqu 32-128(%rdi),%ymm9
5483 leaq 256+128(%rsp),%rbx
5484 vmovdqu 64-128(%rdi),%ymm10
5485 vmovdqu 96-128(%rdi),%ymm11
5486 vmovdqu 128-128(%rdi),%ymm12
5487 vmovdqu 160-128(%rdi),%ymm13
5488 vmovdqu 192-128(%rdi),%ymm14
5489 vmovdqu 224-128(%rdi),%ymm15
5490 vmovdqu .Lpbswap(%rip),%ymm6
5491 jmp .Loop_avx2
5492
5493 .align 32
5494 .Loop_avx2:
5495 vpxor %ymm9,%ymm10,%ymm4
5496 vmovd 0(%r12),%xmm5
5497 vmovd 0(%r8),%xmm0
5498 vmovd 0(%r13),%xmm1
5499 vmovd 0(%r9),%xmm2
5500 vpinsrd $1,0(%r14),%xmm5,%xmm5
5501 vpinsrd $1,0(%r10),%xmm0,%xmm0
5502 vpinsrd $1,0(%r15),%xmm1,%xmm1
5503 vpunpckldq %ymm1,%ymm5,%ymm5
5504 vpinsrd $1,0(%r11),%xmm2,%xmm2
5505 vpunpckldq %ymm2,%ymm0,%ymm0
5506 vinserti128 $1,%xmm0,%ymm5,%ymm5
5507 vpshufb %ymm6,%ymm5,%ymm5
5508 vpsrld $6,%ymm12,%ymm7
5509 vpslld $26,%ymm12,%ymm2
5510 vmovdqu %ymm5,0-128(%rax)
5511 vpaddd %ymm15,%ymm5,%ymm5
5512
5513 vpsrld $11,%ymm12,%ymm1
5514 vpxor %ymm2,%ymm7,%ymm7
5515 vpslld $21,%ymm12,%ymm2
5516 vpaddd -128(%rbp),%ymm5,%ymm5
5517 vpxor %ymm1,%ymm7,%ymm7
5518
5519 vpsrld $25,%ymm12,%ymm1
5520 vpxor %ymm2,%ymm7,%ymm7
5521
5522 vpslld $7,%ymm12,%ymm2
5523 vpandn %ymm14,%ymm12,%ymm0
5524 vpand %ymm13,%ymm12,%ymm3
5525
5526 vpxor %ymm1,%ymm7,%ymm7
5527
5528 vpsrld $2,%ymm8,%ymm15
5529 vpxor %ymm2,%ymm7,%ymm7
5530
5531 vpslld $30,%ymm8,%ymm1
5532 vpxor %ymm3,%ymm0,%ymm0
5533 vpxor %ymm8,%ymm9,%ymm3
5534
5535 vpxor %ymm1,%ymm15,%ymm15
5536 vpaddd %ymm7,%ymm5,%ymm5
5537
5538 vpsrld $13,%ymm8,%ymm1
5539
5540 vpslld $19,%ymm8,%ymm2
5541 vpaddd %ymm0,%ymm5,%ymm5
5542 vpand %ymm3,%ymm4,%ymm4
5543
5544 vpxor %ymm1,%ymm15,%ymm7
5545
5546 vpsrld $22,%ymm8,%ymm1
5547 vpxor %ymm2,%ymm7,%ymm7
5548
5549 vpslld $10,%ymm8,%ymm2
5550 vpxor %ymm4,%ymm9,%ymm15
5551 vpaddd %ymm5,%ymm11,%ymm11
5552
5553 vpxor %ymm1,%ymm7,%ymm7
5554 vpxor %ymm2,%ymm7,%ymm7
5555
5556 vpaddd %ymm5,%ymm15,%ymm15
5557 vpaddd %ymm7,%ymm15,%ymm15
5558 vmovd 4(%r12),%xmm5
5559 vmovd 4(%r8),%xmm0
5560 vmovd 4(%r13),%xmm1
5561 vmovd 4(%r9),%xmm2
5562 vpinsrd $1,4(%r14),%xmm5,%xmm5
5563 vpinsrd $1,4(%r10),%xmm0,%xmm0
5564 vpinsrd $1,4(%r15),%xmm1,%xmm1
5565 vpunpckldq %ymm1,%ymm5,%ymm5
5566 vpinsrd $1,4(%r11),%xmm2,%xmm2
5567 vpunpckldq %ymm2,%ymm0,%ymm0
5568 vinserti128 $1,%xmm0,%ymm5,%ymm5
5569 vpshufb %ymm6,%ymm5,%ymm5
5570 vpsrld $6,%ymm11,%ymm7
5571 vpslld $26,%ymm11,%ymm2
5572 vmovdqu %ymm5,32-128(%rax)
5573 vpaddd %ymm14,%ymm5,%ymm5
5574
5575 vpsrld $11,%ymm11,%ymm1
5576 vpxor %ymm2,%ymm7,%ymm7
5577 vpslld $21,%ymm11,%ymm2
5578 vpaddd -96(%rbp),%ymm5,%ymm5
5579 vpxor %ymm1,%ymm7,%ymm7
5580
5581 vpsrld $25,%ymm11,%ymm1
5582 vpxor %ymm2,%ymm7,%ymm7
5583
5584 vpslld $7,%ymm11,%ymm2
5585 vpandn %ymm13,%ymm11,%ymm0
5586 vpand %ymm12,%ymm11,%ymm4
5587
5588 vpxor %ymm1,%ymm7,%ymm7
5589
5590 vpsrld $2,%ymm15,%ymm14
5591 vpxor %ymm2,%ymm7,%ymm7
5592
5593 vpslld $30,%ymm15,%ymm1
5594 vpxor %ymm4,%ymm0,%ymm0
5595 vpxor %ymm15,%ymm8,%ymm4
5596
5597 vpxor %ymm1,%ymm14,%ymm14
5598 vpaddd %ymm7,%ymm5,%ymm5
5599
5600 vpsrld $13,%ymm15,%ymm1
5601
5602 vpslld $19,%ymm15,%ymm2
5603 vpaddd %ymm0,%ymm5,%ymm5
5604 vpand %ymm4,%ymm3,%ymm3
5605
5606 vpxor %ymm1,%ymm14,%ymm7
5607
5608 vpsrld $22,%ymm15,%ymm1
5609 vpxor %ymm2,%ymm7,%ymm7
5610
5611 vpslld $10,%ymm15,%ymm2
5612 vpxor %ymm3,%ymm8,%ymm14
5613 vpaddd %ymm5,%ymm10,%ymm10
5614
5615 vpxor %ymm1,%ymm7,%ymm7
5616 vpxor %ymm2,%ymm7,%ymm7
5617
5618 vpaddd %ymm5,%ymm14,%ymm14
5619 vpaddd %ymm7,%ymm14,%ymm14
5620 vmovd 8(%r12),%xmm5
5621 vmovd 8(%r8),%xmm0
5622 vmovd 8(%r13),%xmm1
5623 vmovd 8(%r9),%xmm2
5624 vpinsrd $1,8(%r14),%xmm5,%xmm5
5625 vpinsrd $1,8(%r10),%xmm0,%xmm0
5626 vpinsrd $1,8(%r15),%xmm1,%xmm1
5627 vpunpckldq %ymm1,%ymm5,%ymm5
5628 vpinsrd $1,8(%r11),%xmm2,%xmm2
5629 vpunpckldq %ymm2,%ymm0,%ymm0
5630 vinserti128 $1,%xmm0,%ymm5,%ymm5
5631 vpshufb %ymm6,%ymm5,%ymm5
5632 vpsrld $6,%ymm10,%ymm7
5633 vpslld $26,%ymm10,%ymm2
5634 vmovdqu %ymm5,64-128(%rax)
5635 vpaddd %ymm13,%ymm5,%ymm5
5636
5637 vpsrld $11,%ymm10,%ymm1
5638 vpxor %ymm2,%ymm7,%ymm7
5639 vpslld $21,%ymm10,%ymm2
5640 vpaddd -64(%rbp),%ymm5,%ymm5
5641 vpxor %ymm1,%ymm7,%ymm7
5642
5643 vpsrld $25,%ymm10,%ymm1
5644 vpxor %ymm2,%ymm7,%ymm7
5645
5646 vpslld $7,%ymm10,%ymm2
5647 vpandn %ymm12,%ymm10,%ymm0
5648 vpand %ymm11,%ymm10,%ymm3
5649
5650 vpxor %ymm1,%ymm7,%ymm7
5651
5652 vpsrld $2,%ymm14,%ymm13
5653 vpxor %ymm2,%ymm7,%ymm7
5654
5655 vpslld $30,%ymm14,%ymm1
5656 vpxor %ymm3,%ymm0,%ymm0
5657 vpxor %ymm14,%ymm15,%ymm3
5658
5659 vpxor %ymm1,%ymm13,%ymm13
5660 vpaddd %ymm7,%ymm5,%ymm5
5661
5662 vpsrld $13,%ymm14,%ymm1
5663
5664 vpslld $19,%ymm14,%ymm2
5665 vpaddd %ymm0,%ymm5,%ymm5
5666 vpand %ymm3,%ymm4,%ymm4
5667
5668 vpxor %ymm1,%ymm13,%ymm7
5669
5670 vpsrld $22,%ymm14,%ymm1
5671 vpxor %ymm2,%ymm7,%ymm7
5672
5673 vpslld $10,%ymm14,%ymm2
5674 vpxor %ymm4,%ymm15,%ymm13
5675 vpaddd %ymm5,%ymm9,%ymm9
5676
5677 vpxor %ymm1,%ymm7,%ymm7
5678 vpxor %ymm2,%ymm7,%ymm7
5679
5680 vpaddd %ymm5,%ymm13,%ymm13
5681 vpaddd %ymm7,%ymm13,%ymm13
5682 vmovd 12(%r12),%xmm5
5683 vmovd 12(%r8),%xmm0
5684 vmovd 12(%r13),%xmm1
5685 vmovd 12(%r9),%xmm2
5686 vpinsrd $1,12(%r14),%xmm5,%xmm5
5687 vpinsrd $1,12(%r10),%xmm0,%xmm0
5688 vpinsrd $1,12(%r15),%xmm1,%xmm1
5689 vpunpckldq %ymm1,%ymm5,%ymm5
5690 vpinsrd $1,12(%r11),%xmm2,%xmm2
5691 vpunpckldq %ymm2,%ymm0,%ymm0
5692 vinserti128 $1,%xmm0,%ymm5,%ymm5
5693 vpshufb %ymm6,%ymm5,%ymm5
5694 vpsrld $6,%ymm9,%ymm7
5695 vpslld $26,%ymm9,%ymm2
5696 vmovdqu %ymm5,96-128(%rax)
5697 vpaddd %ymm12,%ymm5,%ymm5
5698
5699 vpsrld $11,%ymm9,%ymm1
5700 vpxor %ymm2,%ymm7,%ymm7
5701 vpslld $21,%ymm9,%ymm2
5702 vpaddd -32(%rbp),%ymm5,%ymm5
5703 vpxor %ymm1,%ymm7,%ymm7
5704
5705 vpsrld $25,%ymm9,%ymm1
5706 vpxor %ymm2,%ymm7,%ymm7
5707
5708 vpslld $7,%ymm9,%ymm2
5709 vpandn %ymm11,%ymm9,%ymm0
5710 vpand %ymm10,%ymm9,%ymm4
5711
5712 vpxor %ymm1,%ymm7,%ymm7
5713
5714 vpsrld $2,%ymm13,%ymm12
5715 vpxor %ymm2,%ymm7,%ymm7
5716
5717 vpslld $30,%ymm13,%ymm1
5718 vpxor %ymm4,%ymm0,%ymm0
5719 vpxor %ymm13,%ymm14,%ymm4
5720
5721 vpxor %ymm1,%ymm12,%ymm12
5722 vpaddd %ymm7,%ymm5,%ymm5
5723
5724 vpsrld $13,%ymm13,%ymm1
5725
5726 vpslld $19,%ymm13,%ymm2
5727 vpaddd %ymm0,%ymm5,%ymm5
5728 vpand %ymm4,%ymm3,%ymm3
5729
5730 vpxor %ymm1,%ymm12,%ymm7
5731
5732 vpsrld $22,%ymm13,%ymm1
5733 vpxor %ymm2,%ymm7,%ymm7
5734
5735 vpslld $10,%ymm13,%ymm2
5736 vpxor %ymm3,%ymm14,%ymm12
5737 vpaddd %ymm5,%ymm8,%ymm8
5738
5739 vpxor %ymm1,%ymm7,%ymm7
5740 vpxor %ymm2,%ymm7,%ymm7
5741
5742 vpaddd %ymm5,%ymm12,%ymm12
5743 vpaddd %ymm7,%ymm12,%ymm12
5744 vmovd 16(%r12),%xmm5
5745 vmovd 16(%r8),%xmm0
5746 vmovd 16(%r13),%xmm1
5747 vmovd 16(%r9),%xmm2
5748 vpinsrd $1,16(%r14),%xmm5,%xmm5
5749 vpinsrd $1,16(%r10),%xmm0,%xmm0
5750 vpinsrd $1,16(%r15),%xmm1,%xmm1
5751 vpunpckldq %ymm1,%ymm5,%ymm5
5752 vpinsrd $1,16(%r11),%xmm2,%xmm2
5753 vpunpckldq %ymm2,%ymm0,%ymm0
5754 vinserti128 $1,%xmm0,%ymm5,%ymm5
5755 vpshufb %ymm6,%ymm5,%ymm5
5756 vpsrld $6,%ymm8,%ymm7
5757 vpslld $26,%ymm8,%ymm2
5758 vmovdqu %ymm5,128-128(%rax)
5759 vpaddd %ymm11,%ymm5,%ymm5
5760
5761 vpsrld $11,%ymm8,%ymm1
5762 vpxor %ymm2,%ymm7,%ymm7
5763 vpslld $21,%ymm8,%ymm2
5764 vpaddd 0(%rbp),%ymm5,%ymm5
5765 vpxor %ymm1,%ymm7,%ymm7
5766
5767 vpsrld $25,%ymm8,%ymm1
5768 vpxor %ymm2,%ymm7,%ymm7
5769
5770 vpslld $7,%ymm8,%ymm2
5771 vpandn %ymm10,%ymm8,%ymm0
5772 vpand %ymm9,%ymm8,%ymm3
5773
5774 vpxor %ymm1,%ymm7,%ymm7
5775
5776 vpsrld $2,%ymm12,%ymm11
5777 vpxor %ymm2,%ymm7,%ymm7
5778
5779 vpslld $30,%ymm12,%ymm1
5780 vpxor %ymm3,%ymm0,%ymm0
5781 vpxor %ymm12,%ymm13,%ymm3
5782
5783 vpxor %ymm1,%ymm11,%ymm11
5784 vpaddd %ymm7,%ymm5,%ymm5
5785
5786 vpsrld $13,%ymm12,%ymm1
5787
5788 vpslld $19,%ymm12,%ymm2
5789 vpaddd %ymm0,%ymm5,%ymm5
5790 vpand %ymm3,%ymm4,%ymm4
5791
5792 vpxor %ymm1,%ymm11,%ymm7
5793
5794 vpsrld $22,%ymm12,%ymm1
5795 vpxor %ymm2,%ymm7,%ymm7
5796
5797 vpslld $10,%ymm12,%ymm2
5798 vpxor %ymm4,%ymm13,%ymm11
5799 vpaddd %ymm5,%ymm15,%ymm15
5800
5801 vpxor %ymm1,%ymm7,%ymm7
5802 vpxor %ymm2,%ymm7,%ymm7
5803
5804 vpaddd %ymm5,%ymm11,%ymm11
5805 vpaddd %ymm7,%ymm11,%ymm11
5806 vmovd 20(%r12),%xmm5
5807 vmovd 20(%r8),%xmm0
5808 vmovd 20(%r13),%xmm1
5809 vmovd 20(%r9),%xmm2
5810 vpinsrd $1,20(%r14),%xmm5,%xmm5
5811 vpinsrd $1,20(%r10),%xmm0,%xmm0
5812 vpinsrd $1,20(%r15),%xmm1,%xmm1
5813 vpunpckldq %ymm1,%ymm5,%ymm5
5814 vpinsrd $1,20(%r11),%xmm2,%xmm2
5815 vpunpckldq %ymm2,%ymm0,%ymm0
5816 vinserti128 $1,%xmm0,%ymm5,%ymm5
5817 vpshufb %ymm6,%ymm5,%ymm5
5818 vpsrld $6,%ymm15,%ymm7
5819 vpslld $26,%ymm15,%ymm2
5820 vmovdqu %ymm5,160-128(%rax)
5821 vpaddd %ymm10,%ymm5,%ymm5
5822
5823 vpsrld $11,%ymm15,%ymm1
5824 vpxor %ymm2,%ymm7,%ymm7
5825 vpslld $21,%ymm15,%ymm2
5826 vpaddd 32(%rbp),%ymm5,%ymm5
5827 vpxor %ymm1,%ymm7,%ymm7
5828
5829 vpsrld $25,%ymm15,%ymm1
5830 vpxor %ymm2,%ymm7,%ymm7
5831
5832 vpslld $7,%ymm15,%ymm2
5833 vpandn %ymm9,%ymm15,%ymm0
5834 vpand %ymm8,%ymm15,%ymm4
5835
5836 vpxor %ymm1,%ymm7,%ymm7
5837
5838 vpsrld $2,%ymm11,%ymm10
5839 vpxor %ymm2,%ymm7,%ymm7
5840
5841 vpslld $30,%ymm11,%ymm1
5842 vpxor %ymm4,%ymm0,%ymm0
5843 vpxor %ymm11,%ymm12,%ymm4
5844
5845 vpxor %ymm1,%ymm10,%ymm10
5846 vpaddd %ymm7,%ymm5,%ymm5
5847
5848 vpsrld $13,%ymm11,%ymm1
5849
5850 vpslld $19,%ymm11,%ymm2
5851 vpaddd %ymm0,%ymm5,%ymm5
5852 vpand %ymm4,%ymm3,%ymm3
5853
5854 vpxor %ymm1,%ymm10,%ymm7
5855
5856 vpsrld $22,%ymm11,%ymm1
5857 vpxor %ymm2,%ymm7,%ymm7
5858
5859 vpslld $10,%ymm11,%ymm2
5860 vpxor %ymm3,%ymm12,%ymm10
5861 vpaddd %ymm5,%ymm14,%ymm14
5862
5863 vpxor %ymm1,%ymm7,%ymm7
5864 vpxor %ymm2,%ymm7,%ymm7
5865
5866 vpaddd %ymm5,%ymm10,%ymm10
5867 vpaddd %ymm7,%ymm10,%ymm10
5868 vmovd 24(%r12),%xmm5
5869 vmovd 24(%r8),%xmm0
5870 vmovd 24(%r13),%xmm1
5871 vmovd 24(%r9),%xmm2
5872 vpinsrd $1,24(%r14),%xmm5,%xmm5
5873 vpinsrd $1,24(%r10),%xmm0,%xmm0
5874 vpinsrd $1,24(%r15),%xmm1,%xmm1
5875 vpunpckldq %ymm1,%ymm5,%ymm5
5876 vpinsrd $1,24(%r11),%xmm2,%xmm2
5877 vpunpckldq %ymm2,%ymm0,%ymm0
5878 vinserti128 $1,%xmm0,%ymm5,%ymm5
5879 vpshufb %ymm6,%ymm5,%ymm5
5880 vpsrld $6,%ymm14,%ymm7
5881 vpslld $26,%ymm14,%ymm2
5882 vmovdqu %ymm5,192-128(%rax)
5883 vpaddd %ymm9,%ymm5,%ymm5
5884
5885 vpsrld $11,%ymm14,%ymm1
5886 vpxor %ymm2,%ymm7,%ymm7
5887 vpslld $21,%ymm14,%ymm2
5888 vpaddd 64(%rbp),%ymm5,%ymm5
5889 vpxor %ymm1,%ymm7,%ymm7
5890
5891 vpsrld $25,%ymm14,%ymm1
5892 vpxor %ymm2,%ymm7,%ymm7
5893
5894 vpslld $7,%ymm14,%ymm2
5895 vpandn %ymm8,%ymm14,%ymm0
5896 vpand %ymm15,%ymm14,%ymm3
5897
5898 vpxor %ymm1,%ymm7,%ymm7
5899
5900 vpsrld $2,%ymm10,%ymm9
5901 vpxor %ymm2,%ymm7,%ymm7
5902
5903 vpslld $30,%ymm10,%ymm1
5904 vpxor %ymm3,%ymm0,%ymm0
5905 vpxor %ymm10,%ymm11,%ymm3
5906
5907 vpxor %ymm1,%ymm9,%ymm9
5908 vpaddd %ymm7,%ymm5,%ymm5
5909
5910 vpsrld $13,%ymm10,%ymm1
5911
5912 vpslld $19,%ymm10,%ymm2
5913 vpaddd %ymm0,%ymm5,%ymm5
5914 vpand %ymm3,%ymm4,%ymm4
5915
5916 vpxor %ymm1,%ymm9,%ymm7
5917
5918 vpsrld $22,%ymm10,%ymm1
5919 vpxor %ymm2,%ymm7,%ymm7
5920
5921 vpslld $10,%ymm10,%ymm2
5922 vpxor %ymm4,%ymm11,%ymm9
5923 vpaddd %ymm5,%ymm13,%ymm13
5924
5925 vpxor %ymm1,%ymm7,%ymm7
5926 vpxor %ymm2,%ymm7,%ymm7
5927
5928 vpaddd %ymm5,%ymm9,%ymm9
5929 vpaddd %ymm7,%ymm9,%ymm9
5930 vmovd 28(%r12),%xmm5
5931 vmovd 28(%r8),%xmm0
5932 vmovd 28(%r13),%xmm1
5933 vmovd 28(%r9),%xmm2
5934 vpinsrd $1,28(%r14),%xmm5,%xmm5
5935 vpinsrd $1,28(%r10),%xmm0,%xmm0
5936 vpinsrd $1,28(%r15),%xmm1,%xmm1
5937 vpunpckldq %ymm1,%ymm5,%ymm5
5938 vpinsrd $1,28(%r11),%xmm2,%xmm2
5939 vpunpckldq %ymm2,%ymm0,%ymm0
5940 vinserti128 $1,%xmm0,%ymm5,%ymm5
5941 vpshufb %ymm6,%ymm5,%ymm5
5942 vpsrld $6,%ymm13,%ymm7
5943 vpslld $26,%ymm13,%ymm2
5944 vmovdqu %ymm5,224-128(%rax)
5945 vpaddd %ymm8,%ymm5,%ymm5
5946
5947 vpsrld $11,%ymm13,%ymm1
5948 vpxor %ymm2,%ymm7,%ymm7
5949 vpslld $21,%ymm13,%ymm2
5950 vpaddd 96(%rbp),%ymm5,%ymm5
5951 vpxor %ymm1,%ymm7,%ymm7
5952
5953 vpsrld $25,%ymm13,%ymm1
5954 vpxor %ymm2,%ymm7,%ymm7
5955
5956 vpslld $7,%ymm13,%ymm2
5957 vpandn %ymm15,%ymm13,%ymm0
5958 vpand %ymm14,%ymm13,%ymm4
5959
5960 vpxor %ymm1,%ymm7,%ymm7
5961
5962 vpsrld $2,%ymm9,%ymm8
5963 vpxor %ymm2,%ymm7,%ymm7
5964
5965 vpslld $30,%ymm9,%ymm1
5966 vpxor %ymm4,%ymm0,%ymm0
5967 vpxor %ymm9,%ymm10,%ymm4
5968
5969 vpxor %ymm1,%ymm8,%ymm8
5970 vpaddd %ymm7,%ymm5,%ymm5
5971
5972 vpsrld $13,%ymm9,%ymm1
5973
5974 vpslld $19,%ymm9,%ymm2
5975 vpaddd %ymm0,%ymm5,%ymm5
5976 vpand %ymm4,%ymm3,%ymm3
5977
5978 vpxor %ymm1,%ymm8,%ymm7
5979
5980 vpsrld $22,%ymm9,%ymm1
5981 vpxor %ymm2,%ymm7,%ymm7
5982
5983 vpslld $10,%ymm9,%ymm2
5984 vpxor %ymm3,%ymm10,%ymm8
5985 vpaddd %ymm5,%ymm12,%ymm12
5986
5987 vpxor %ymm1,%ymm7,%ymm7
5988 vpxor %ymm2,%ymm7,%ymm7
5989
5990 vpaddd %ymm5,%ymm8,%ymm8
5991 vpaddd %ymm7,%ymm8,%ymm8
5992 addq $256,%rbp
5993 vmovd 32(%r12),%xmm5
5994 vmovd 32(%r8),%xmm0
5995 vmovd 32(%r13),%xmm1
5996 vmovd 32(%r9),%xmm2
5997 vpinsrd $1,32(%r14),%xmm5,%xmm5
5998 vpinsrd $1,32(%r10),%xmm0,%xmm0
5999 vpinsrd $1,32(%r15),%xmm1,%xmm1
6000 vpunpckldq %ymm1,%ymm5,%ymm5
6001 vpinsrd $1,32(%r11),%xmm2,%xmm2
6002 vpunpckldq %ymm2,%ymm0,%ymm0
6003 vinserti128 $1,%xmm0,%ymm5,%ymm5
6004 vpshufb %ymm6,%ymm5,%ymm5
6005 vpsrld $6,%ymm12,%ymm7
6006 vpslld $26,%ymm12,%ymm2
6007 vmovdqu %ymm5,256-256-128(%rbx)
6008 vpaddd %ymm15,%ymm5,%ymm5
6009
6010 vpsrld $11,%ymm12,%ymm1
6011 vpxor %ymm2,%ymm7,%ymm7
6012 vpslld $21,%ymm12,%ymm2
6013 vpaddd -128(%rbp),%ymm5,%ymm5
6014 vpxor %ymm1,%ymm7,%ymm7
6015
6016 vpsrld $25,%ymm12,%ymm1
6017 vpxor %ymm2,%ymm7,%ymm7
6018
6019 vpslld $7,%ymm12,%ymm2
6020 vpandn %ymm14,%ymm12,%ymm0
6021 vpand %ymm13,%ymm12,%ymm3
6022
6023 vpxor %ymm1,%ymm7,%ymm7
6024
6025 vpsrld $2,%ymm8,%ymm15
6026 vpxor %ymm2,%ymm7,%ymm7
6027
6028 vpslld $30,%ymm8,%ymm1
6029 vpxor %ymm3,%ymm0,%ymm0
6030 vpxor %ymm8,%ymm9,%ymm3
6031
6032 vpxor %ymm1,%ymm15,%ymm15
6033 vpaddd %ymm7,%ymm5,%ymm5
6034
6035 vpsrld $13,%ymm8,%ymm1
6036
6037 vpslld $19,%ymm8,%ymm2
6038 vpaddd %ymm0,%ymm5,%ymm5
6039 vpand %ymm3,%ymm4,%ymm4
6040
6041 vpxor %ymm1,%ymm15,%ymm7
6042
6043 vpsrld $22,%ymm8,%ymm1
6044 vpxor %ymm2,%ymm7,%ymm7
6045
6046 vpslld $10,%ymm8,%ymm2
6047 vpxor %ymm4,%ymm9,%ymm15
6048 vpaddd %ymm5,%ymm11,%ymm11
6049
6050 vpxor %ymm1,%ymm7,%ymm7
6051 vpxor %ymm2,%ymm7,%ymm7
6052
6053 vpaddd %ymm5,%ymm15,%ymm15
6054 vpaddd %ymm7,%ymm15,%ymm15
6055 vmovd 36(%r12),%xmm5
6056 vmovd 36(%r8),%xmm0
6057 vmovd 36(%r13),%xmm1
6058 vmovd 36(%r9),%xmm2
6059 vpinsrd $1,36(%r14),%xmm5,%xmm5
6060 vpinsrd $1,36(%r10),%xmm0,%xmm0
6061 vpinsrd $1,36(%r15),%xmm1,%xmm1
6062 vpunpckldq %ymm1,%ymm5,%ymm5
6063 vpinsrd $1,36(%r11),%xmm2,%xmm2
6064 vpunpckldq %ymm2,%ymm0,%ymm0
6065 vinserti128 $1,%xmm0,%ymm5,%ymm5
6066 vpshufb %ymm6,%ymm5,%ymm5
6067 vpsrld $6,%ymm11,%ymm7
6068 vpslld $26,%ymm11,%ymm2
6069 vmovdqu %ymm5,288-256-128(%rbx)
6070 vpaddd %ymm14,%ymm5,%ymm5
6071
6072 vpsrld $11,%ymm11,%ymm1
6073 vpxor %ymm2,%ymm7,%ymm7
6074 vpslld $21,%ymm11,%ymm2
6075 vpaddd -96(%rbp),%ymm5,%ymm5
6076 vpxor %ymm1,%ymm7,%ymm7
6077
6078 vpsrld $25,%ymm11,%ymm1
6079 vpxor %ymm2,%ymm7,%ymm7
6080
6081 vpslld $7,%ymm11,%ymm2
6082 vpandn %ymm13,%ymm11,%ymm0
6083 vpand %ymm12,%ymm11,%ymm4
6084
6085 vpxor %ymm1,%ymm7,%ymm7
6086
6087 vpsrld $2,%ymm15,%ymm14
6088 vpxor %ymm2,%ymm7,%ymm7
6089
6090 vpslld $30,%ymm15,%ymm1
6091 vpxor %ymm4,%ymm0,%ymm0
6092 vpxor %ymm15,%ymm8,%ymm4
6093
6094 vpxor %ymm1,%ymm14,%ymm14
6095 vpaddd %ymm7,%ymm5,%ymm5
6096
6097 vpsrld $13,%ymm15,%ymm1
6098
6099 vpslld $19,%ymm15,%ymm2
6100 vpaddd %ymm0,%ymm5,%ymm5
6101 vpand %ymm4,%ymm3,%ymm3
6102
6103 vpxor %ymm1,%ymm14,%ymm7
6104
6105 vpsrld $22,%ymm15,%ymm1
6106 vpxor %ymm2,%ymm7,%ymm7
6107
6108 vpslld $10,%ymm15,%ymm2
6109 vpxor %ymm3,%ymm8,%ymm14
6110 vpaddd %ymm5,%ymm10,%ymm10
6111
6112 vpxor %ymm1,%ymm7,%ymm7
6113 vpxor %ymm2,%ymm7,%ymm7
6114
6115 vpaddd %ymm5,%ymm14,%ymm14
6116 vpaddd %ymm7,%ymm14,%ymm14
6117 vmovd 40(%r12),%xmm5
6118 vmovd 40(%r8),%xmm0
6119 vmovd 40(%r13),%xmm1
6120 vmovd 40(%r9),%xmm2
6121 vpinsrd $1,40(%r14),%xmm5,%xmm5
6122 vpinsrd $1,40(%r10),%xmm0,%xmm0
6123 vpinsrd $1,40(%r15),%xmm1,%xmm1
6124 vpunpckldq %ymm1,%ymm5,%ymm5
6125 vpinsrd $1,40(%r11),%xmm2,%xmm2
6126 vpunpckldq %ymm2,%ymm0,%ymm0
6127 vinserti128 $1,%xmm0,%ymm5,%ymm5
6128 vpshufb %ymm6,%ymm5,%ymm5
6129 vpsrld $6,%ymm10,%ymm7
6130 vpslld $26,%ymm10,%ymm2
6131 vmovdqu %ymm5,320-256-128(%rbx)
6132 vpaddd %ymm13,%ymm5,%ymm5
6133
6134 vpsrld $11,%ymm10,%ymm1
6135 vpxor %ymm2,%ymm7,%ymm7
6136 vpslld $21,%ymm10,%ymm2
6137 vpaddd -64(%rbp),%ymm5,%ymm5
6138 vpxor %ymm1,%ymm7,%ymm7
6139
6140 vpsrld $25,%ymm10,%ymm1
6141 vpxor %ymm2,%ymm7,%ymm7
6142
6143 vpslld $7,%ymm10,%ymm2
6144 vpandn %ymm12,%ymm10,%ymm0
6145 vpand %ymm11,%ymm10,%ymm3
6146
6147 vpxor %ymm1,%ymm7,%ymm7
6148
6149 vpsrld $2,%ymm14,%ymm13
6150 vpxor %ymm2,%ymm7,%ymm7
6151
6152 vpslld $30,%ymm14,%ymm1
6153 vpxor %ymm3,%ymm0,%ymm0
6154 vpxor %ymm14,%ymm15,%ymm3
6155
6156 vpxor %ymm1,%ymm13,%ymm13
6157 vpaddd %ymm7,%ymm5,%ymm5
6158
6159 vpsrld $13,%ymm14,%ymm1
6160
6161 vpslld $19,%ymm14,%ymm2
6162 vpaddd %ymm0,%ymm5,%ymm5
6163 vpand %ymm3,%ymm4,%ymm4
6164
6165 vpxor %ymm1,%ymm13,%ymm7
6166
6167 vpsrld $22,%ymm14,%ymm1
6168 vpxor %ymm2,%ymm7,%ymm7
6169
6170 vpslld $10,%ymm14,%ymm2
6171 vpxor %ymm4,%ymm15,%ymm13
6172 vpaddd %ymm5,%ymm9,%ymm9
6173
6174 vpxor %ymm1,%ymm7,%ymm7
6175 vpxor %ymm2,%ymm7,%ymm7
6176
6177 vpaddd %ymm5,%ymm13,%ymm13
6178 vpaddd %ymm7,%ymm13,%ymm13
6179 vmovd 44(%r12),%xmm5
6180 vmovd 44(%r8),%xmm0
6181 vmovd 44(%r13),%xmm1
6182 vmovd 44(%r9),%xmm2
6183 vpinsrd $1,44(%r14),%xmm5,%xmm5
6184 vpinsrd $1,44(%r10),%xmm0,%xmm0
6185 vpinsrd $1,44(%r15),%xmm1,%xmm1
6186 vpunpckldq %ymm1,%ymm5,%ymm5
6187 vpinsrd $1,44(%r11),%xmm2,%xmm2
6188 vpunpckldq %ymm2,%ymm0,%ymm0
6189 vinserti128 $1,%xmm0,%ymm5,%ymm5
6190 vpshufb %ymm6,%ymm5,%ymm5
6191 vpsrld $6,%ymm9,%ymm7
6192 vpslld $26,%ymm9,%ymm2
6193 vmovdqu %ymm5,352-256-128(%rbx)
6194 vpaddd %ymm12,%ymm5,%ymm5
6195
6196 vpsrld $11,%ymm9,%ymm1
6197 vpxor %ymm2,%ymm7,%ymm7
6198 vpslld $21,%ymm9,%ymm2
6199 vpaddd -32(%rbp),%ymm5,%ymm5
6200 vpxor %ymm1,%ymm7,%ymm7
6201
6202 vpsrld $25,%ymm9,%ymm1
6203 vpxor %ymm2,%ymm7,%ymm7
6204
6205 vpslld $7,%ymm9,%ymm2
6206 vpandn %ymm11,%ymm9,%ymm0
6207 vpand %ymm10,%ymm9,%ymm4
6208
6209 vpxor %ymm1,%ymm7,%ymm7
6210
6211 vpsrld $2,%ymm13,%ymm12
6212 vpxor %ymm2,%ymm7,%ymm7
6213
6214 vpslld $30,%ymm13,%ymm1
6215 vpxor %ymm4,%ymm0,%ymm0
6216 vpxor %ymm13,%ymm14,%ymm4
6217
6218 vpxor %ymm1,%ymm12,%ymm12
6219 vpaddd %ymm7,%ymm5,%ymm5
6220
6221 vpsrld $13,%ymm13,%ymm1
6222
6223 vpslld $19,%ymm13,%ymm2
6224 vpaddd %ymm0,%ymm5,%ymm5
6225 vpand %ymm4,%ymm3,%ymm3
6226
6227 vpxor %ymm1,%ymm12,%ymm7
6228
6229 vpsrld $22,%ymm13,%ymm1
6230 vpxor %ymm2,%ymm7,%ymm7
6231
6232 vpslld $10,%ymm13,%ymm2
6233 vpxor %ymm3,%ymm14,%ymm12
6234 vpaddd %ymm5,%ymm8,%ymm8
6235
6236 vpxor %ymm1,%ymm7,%ymm7
6237 vpxor %ymm2,%ymm7,%ymm7
6238
6239 vpaddd %ymm5,%ymm12,%ymm12
6240 vpaddd %ymm7,%ymm12,%ymm12
6241 vmovd 48(%r12),%xmm5
6242 vmovd 48(%r8),%xmm0
6243 vmovd 48(%r13),%xmm1
6244 vmovd 48(%r9),%xmm2
6245 vpinsrd $1,48(%r14),%xmm5,%xmm5
6246 vpinsrd $1,48(%r10),%xmm0,%xmm0
6247 vpinsrd $1,48(%r15),%xmm1,%xmm1
6248 vpunpckldq %ymm1,%ymm5,%ymm5
6249 vpinsrd $1,48(%r11),%xmm2,%xmm2
6250 vpunpckldq %ymm2,%ymm0,%ymm0
6251 vinserti128 $1,%xmm0,%ymm5,%ymm5
6252 vpshufb %ymm6,%ymm5,%ymm5
6253 vpsrld $6,%ymm8,%ymm7
6254 vpslld $26,%ymm8,%ymm2
6255 vmovdqu %ymm5,384-256-128(%rbx)
6256 vpaddd %ymm11,%ymm5,%ymm5
6257
6258 vpsrld $11,%ymm8,%ymm1
6259 vpxor %ymm2,%ymm7,%ymm7
6260 vpslld $21,%ymm8,%ymm2
6261 vpaddd 0(%rbp),%ymm5,%ymm5
6262 vpxor %ymm1,%ymm7,%ymm7
6263
6264 vpsrld $25,%ymm8,%ymm1
6265 vpxor %ymm2,%ymm7,%ymm7
6266
6267 vpslld $7,%ymm8,%ymm2
6268 vpandn %ymm10,%ymm8,%ymm0
6269 vpand %ymm9,%ymm8,%ymm3
6270
6271 vpxor %ymm1,%ymm7,%ymm7
6272
6273 vpsrld $2,%ymm12,%ymm11
6274 vpxor %ymm2,%ymm7,%ymm7
6275
6276 vpslld $30,%ymm12,%ymm1
6277 vpxor %ymm3,%ymm0,%ymm0
6278 vpxor %ymm12,%ymm13,%ymm3
6279
6280 vpxor %ymm1,%ymm11,%ymm11
6281 vpaddd %ymm7,%ymm5,%ymm5
6282
6283 vpsrld $13,%ymm12,%ymm1
6284
6285 vpslld $19,%ymm12,%ymm2
6286 vpaddd %ymm0,%ymm5,%ymm5
6287 vpand %ymm3,%ymm4,%ymm4
6288
6289 vpxor %ymm1,%ymm11,%ymm7
6290
6291 vpsrld $22,%ymm12,%ymm1
6292 vpxor %ymm2,%ymm7,%ymm7
6293
6294 vpslld $10,%ymm12,%ymm2
6295 vpxor %ymm4,%ymm13,%ymm11
6296 vpaddd %ymm5,%ymm15,%ymm15
6297
6298 vpxor %ymm1,%ymm7,%ymm7
6299 vpxor %ymm2,%ymm7,%ymm7
6300
6301 vpaddd %ymm5,%ymm11,%ymm11
6302 vpaddd %ymm7,%ymm11,%ymm11
6303 vmovd 52(%r12),%xmm5
6304 vmovd 52(%r8),%xmm0
6305 vmovd 52(%r13),%xmm1
6306 vmovd 52(%r9),%xmm2
6307 vpinsrd $1,52(%r14),%xmm5,%xmm5
6308 vpinsrd $1,52(%r10),%xmm0,%xmm0
6309 vpinsrd $1,52(%r15),%xmm1,%xmm1
6310 vpunpckldq %ymm1,%ymm5,%ymm5
6311 vpinsrd $1,52(%r11),%xmm2,%xmm2
6312 vpunpckldq %ymm2,%ymm0,%ymm0
6313 vinserti128 $1,%xmm0,%ymm5,%ymm5
6314 vpshufb %ymm6,%ymm5,%ymm5
6315 vpsrld $6,%ymm15,%ymm7
6316 vpslld $26,%ymm15,%ymm2
6317 vmovdqu %ymm5,416-256-128(%rbx)
6318 vpaddd %ymm10,%ymm5,%ymm5
6319
6320 vpsrld $11,%ymm15,%ymm1
6321 vpxor %ymm2,%ymm7,%ymm7
6322 vpslld $21,%ymm15,%ymm2
6323 vpaddd 32(%rbp),%ymm5,%ymm5
6324 vpxor %ymm1,%ymm7,%ymm7
6325
6326 vpsrld $25,%ymm15,%ymm1
6327 vpxor %ymm2,%ymm7,%ymm7
6328
6329 vpslld $7,%ymm15,%ymm2
6330 vpandn %ymm9,%ymm15,%ymm0
6331 vpand %ymm8,%ymm15,%ymm4
6332
6333 vpxor %ymm1,%ymm7,%ymm7
6334
6335 vpsrld $2,%ymm11,%ymm10
6336 vpxor %ymm2,%ymm7,%ymm7
6337
6338 vpslld $30,%ymm11,%ymm1
6339 vpxor %ymm4,%ymm0,%ymm0
6340 vpxor %ymm11,%ymm12,%ymm4
6341
6342 vpxor %ymm1,%ymm10,%ymm10
6343 vpaddd %ymm7,%ymm5,%ymm5
6344
6345 vpsrld $13,%ymm11,%ymm1
6346
6347 vpslld $19,%ymm11,%ymm2
6348 vpaddd %ymm0,%ymm5,%ymm5
6349 vpand %ymm4,%ymm3,%ymm3
6350
6351 vpxor %ymm1,%ymm10,%ymm7
6352
6353 vpsrld $22,%ymm11,%ymm1
6354 vpxor %ymm2,%ymm7,%ymm7
6355
6356 vpslld $10,%ymm11,%ymm2
6357 vpxor %ymm3,%ymm12,%ymm10
6358 vpaddd %ymm5,%ymm14,%ymm14
6359
6360 vpxor %ymm1,%ymm7,%ymm7
6361 vpxor %ymm2,%ymm7,%ymm7
6362
6363 vpaddd %ymm5,%ymm10,%ymm10
6364 vpaddd %ymm7,%ymm10,%ymm10
6365 vmovd 56(%r12),%xmm5
6366 vmovd 56(%r8),%xmm0
6367 vmovd 56(%r13),%xmm1
6368 vmovd 56(%r9),%xmm2
6369 vpinsrd $1,56(%r14),%xmm5,%xmm5
6370 vpinsrd $1,56(%r10),%xmm0,%xmm0
6371 vpinsrd $1,56(%r15),%xmm1,%xmm1
6372 vpunpckldq %ymm1,%ymm5,%ymm5
6373 vpinsrd $1,56(%r11),%xmm2,%xmm2
6374 vpunpckldq %ymm2,%ymm0,%ymm0
6375 vinserti128 $1,%xmm0,%ymm5,%ymm5
6376 vpshufb %ymm6,%ymm5,%ymm5
6377 vpsrld $6,%ymm14,%ymm7
6378 vpslld $26,%ymm14,%ymm2
6379 vmovdqu %ymm5,448-256-128(%rbx)
6380 vpaddd %ymm9,%ymm5,%ymm5
6381
6382 vpsrld $11,%ymm14,%ymm1
6383 vpxor %ymm2,%ymm7,%ymm7
6384 vpslld $21,%ymm14,%ymm2
6385 vpaddd 64(%rbp),%ymm5,%ymm5
6386 vpxor %ymm1,%ymm7,%ymm7
6387
6388 vpsrld $25,%ymm14,%ymm1
6389 vpxor %ymm2,%ymm7,%ymm7
6390
6391 vpslld $7,%ymm14,%ymm2
6392 vpandn %ymm8,%ymm14,%ymm0
6393 vpand %ymm15,%ymm14,%ymm3
6394
6395 vpxor %ymm1,%ymm7,%ymm7
6396
6397 vpsrld $2,%ymm10,%ymm9
6398 vpxor %ymm2,%ymm7,%ymm7
6399
6400 vpslld $30,%ymm10,%ymm1
6401 vpxor %ymm3,%ymm0,%ymm0
6402 vpxor %ymm10,%ymm11,%ymm3
6403
6404 vpxor %ymm1,%ymm9,%ymm9
6405 vpaddd %ymm7,%ymm5,%ymm5
6406
6407 vpsrld $13,%ymm10,%ymm1
6408
6409 vpslld $19,%ymm10,%ymm2
6410 vpaddd %ymm0,%ymm5,%ymm5
6411 vpand %ymm3,%ymm4,%ymm4
6412
6413 vpxor %ymm1,%ymm9,%ymm7
6414
6415 vpsrld $22,%ymm10,%ymm1
6416 vpxor %ymm2,%ymm7,%ymm7
6417
6418 vpslld $10,%ymm10,%ymm2
6419 vpxor %ymm4,%ymm11,%ymm9
6420 vpaddd %ymm5,%ymm13,%ymm13
6421
6422 vpxor %ymm1,%ymm7,%ymm7
6423 vpxor %ymm2,%ymm7,%ymm7
6424
6425 vpaddd %ymm5,%ymm9,%ymm9
6426 vpaddd %ymm7,%ymm9,%ymm9
6427 vmovd 60(%r12),%xmm5
6428 leaq 64(%r12),%r12
6429 vmovd 60(%r8),%xmm0
6430 leaq 64(%r8),%r8
6431 vmovd 60(%r13),%xmm1
6432 leaq 64(%r13),%r13
6433 vmovd 60(%r9),%xmm2
6434 leaq 64(%r9),%r9
6435 vpinsrd $1,60(%r14),%xmm5,%xmm5
6436 leaq 64(%r14),%r14
6437 vpinsrd $1,60(%r10),%xmm0,%xmm0
6438 leaq 64(%r10),%r10
6439 vpinsrd $1,60(%r15),%xmm1,%xmm1
6440 leaq 64(%r15),%r15
6441 vpunpckldq %ymm1,%ymm5,%ymm5
6442 vpinsrd $1,60(%r11),%xmm2,%xmm2
6443 leaq 64(%r11),%r11
6444 vpunpckldq %ymm2,%ymm0,%ymm0
6445 vinserti128 $1,%xmm0,%ymm5,%ymm5
6446 vpshufb %ymm6,%ymm5,%ymm5
6447 vpsrld $6,%ymm13,%ymm7
6448 vpslld $26,%ymm13,%ymm2
6449 vmovdqu %ymm5,480-256-128(%rbx)
6450 vpaddd %ymm8,%ymm5,%ymm5
6451
6452 vpsrld $11,%ymm13,%ymm1
6453 vpxor %ymm2,%ymm7,%ymm7
6454 vpslld $21,%ymm13,%ymm2
6455 vpaddd 96(%rbp),%ymm5,%ymm5
6456 vpxor %ymm1,%ymm7,%ymm7
6457
6458 vpsrld $25,%ymm13,%ymm1
6459 vpxor %ymm2,%ymm7,%ymm7
6460 prefetcht0 63(%r12)
6461 vpslld $7,%ymm13,%ymm2
6462 vpandn %ymm15,%ymm13,%ymm0
6463 vpand %ymm14,%ymm13,%ymm4
6464 prefetcht0 63(%r13)
6465 vpxor %ymm1,%ymm7,%ymm7
6466
6467 vpsrld $2,%ymm9,%ymm8
6468 vpxor %ymm2,%ymm7,%ymm7
6469 prefetcht0 63(%r14)
6470 vpslld $30,%ymm9,%ymm1
6471 vpxor %ymm4,%ymm0,%ymm0
6472 vpxor %ymm9,%ymm10,%ymm4
6473 prefetcht0 63(%r15)
6474 vpxor %ymm1,%ymm8,%ymm8
6475 vpaddd %ymm7,%ymm5,%ymm5
6476
6477 vpsrld $13,%ymm9,%ymm1
6478 prefetcht0 63(%r8)
6479 vpslld $19,%ymm9,%ymm2
6480 vpaddd %ymm0,%ymm5,%ymm5
6481 vpand %ymm4,%ymm3,%ymm3
6482 prefetcht0 63(%r9)
6483 vpxor %ymm1,%ymm8,%ymm7
6484
6485 vpsrld $22,%ymm9,%ymm1
6486 vpxor %ymm2,%ymm7,%ymm7
6487 prefetcht0 63(%r10)
6488 vpslld $10,%ymm9,%ymm2
6489 vpxor %ymm3,%ymm10,%ymm8
6490 vpaddd %ymm5,%ymm12,%ymm12
6491 prefetcht0 63(%r11)
6492 vpxor %ymm1,%ymm7,%ymm7
6493 vpxor %ymm2,%ymm7,%ymm7
6494
6495 vpaddd %ymm5,%ymm8,%ymm8
6496 vpaddd %ymm7,%ymm8,%ymm8
6497 addq $256,%rbp
6498 vmovdqu 0-128(%rax),%ymm5
6499 movl $3,%ecx
6500 jmp .Loop_16_xx_avx2
6501 .align 32
6502 .Loop_16_xx_avx2:
6503 vmovdqu 32-128(%rax),%ymm6
6504 vpaddd 288-256-128(%rbx),%ymm5,%ymm5
6505
6506 vpsrld $3,%ymm6,%ymm7
6507 vpsrld $7,%ymm6,%ymm1
6508 vpslld $25,%ymm6,%ymm2
6509 vpxor %ymm1,%ymm7,%ymm7
6510 vpsrld $18,%ymm6,%ymm1
6511 vpxor %ymm2,%ymm7,%ymm7
6512 vpslld $14,%ymm6,%ymm2
6513 vmovdqu 448-256-128(%rbx),%ymm0
6514 vpsrld $10,%ymm0,%ymm3
6515
6516 vpxor %ymm1,%ymm7,%ymm7
6517 vpsrld $17,%ymm0,%ymm1
6518 vpxor %ymm2,%ymm7,%ymm7
6519 vpslld $15,%ymm0,%ymm2
6520 vpaddd %ymm7,%ymm5,%ymm5
6521 vpxor %ymm1,%ymm3,%ymm7
6522 vpsrld $19,%ymm0,%ymm1
6523 vpxor %ymm2,%ymm7,%ymm7
6524 vpslld $13,%ymm0,%ymm2
6525 vpxor %ymm1,%ymm7,%ymm7
6526 vpxor %ymm2,%ymm7,%ymm7
6527 vpaddd %ymm7,%ymm5,%ymm5
6528 vpsrld $6,%ymm12,%ymm7
6529 vpslld $26,%ymm12,%ymm2
6530 vmovdqu %ymm5,0-128(%rax)
6531 vpaddd %ymm15,%ymm5,%ymm5
6532
6533 vpsrld $11,%ymm12,%ymm1
6534 vpxor %ymm2,%ymm7,%ymm7
6535 vpslld $21,%ymm12,%ymm2
6536 vpaddd -128(%rbp),%ymm5,%ymm5
6537 vpxor %ymm1,%ymm7,%ymm7
6538
6539 vpsrld $25,%ymm12,%ymm1
6540 vpxor %ymm2,%ymm7,%ymm7
6541
6542 vpslld $7,%ymm12,%ymm2
6543 vpandn %ymm14,%ymm12,%ymm0
6544 vpand %ymm13,%ymm12,%ymm3
6545
6546 vpxor %ymm1,%ymm7,%ymm7
6547
6548 vpsrld $2,%ymm8,%ymm15
6549 vpxor %ymm2,%ymm7,%ymm7
6550
6551 vpslld $30,%ymm8,%ymm1
6552 vpxor %ymm3,%ymm0,%ymm0
6553 vpxor %ymm8,%ymm9,%ymm3
6554
6555 vpxor %ymm1,%ymm15,%ymm15
6556 vpaddd %ymm7,%ymm5,%ymm5
6557
6558 vpsrld $13,%ymm8,%ymm1
6559
6560 vpslld $19,%ymm8,%ymm2
6561 vpaddd %ymm0,%ymm5,%ymm5
6562 vpand %ymm3,%ymm4,%ymm4
6563
6564 vpxor %ymm1,%ymm15,%ymm7
6565
6566 vpsrld $22,%ymm8,%ymm1
6567 vpxor %ymm2,%ymm7,%ymm7
6568
6569 vpslld $10,%ymm8,%ymm2
6570 vpxor %ymm4,%ymm9,%ymm15
6571 vpaddd %ymm5,%ymm11,%ymm11
6572
6573 vpxor %ymm1,%ymm7,%ymm7
6574 vpxor %ymm2,%ymm7,%ymm7
6575
6576 vpaddd %ymm5,%ymm15,%ymm15
6577 vpaddd %ymm7,%ymm15,%ymm15
6578 vmovdqu 64-128(%rax),%ymm5
6579 vpaddd 320-256-128(%rbx),%ymm6,%ymm6
6580
6581 vpsrld $3,%ymm5,%ymm7
6582 vpsrld $7,%ymm5,%ymm1
6583 vpslld $25,%ymm5,%ymm2
6584 vpxor %ymm1,%ymm7,%ymm7
6585 vpsrld $18,%ymm5,%ymm1
6586 vpxor %ymm2,%ymm7,%ymm7
6587 vpslld $14,%ymm5,%ymm2
6588 vmovdqu 480-256-128(%rbx),%ymm0
6589 vpsrld $10,%ymm0,%ymm4
6590
6591 vpxor %ymm1,%ymm7,%ymm7
6592 vpsrld $17,%ymm0,%ymm1
6593 vpxor %ymm2,%ymm7,%ymm7
6594 vpslld $15,%ymm0,%ymm2
6595 vpaddd %ymm7,%ymm6,%ymm6
6596 vpxor %ymm1,%ymm4,%ymm7
6597 vpsrld $19,%ymm0,%ymm1
6598 vpxor %ymm2,%ymm7,%ymm7
6599 vpslld $13,%ymm0,%ymm2
6600 vpxor %ymm1,%ymm7,%ymm7
6601 vpxor %ymm2,%ymm7,%ymm7
6602 vpaddd %ymm7,%ymm6,%ymm6
6603 vpsrld $6,%ymm11,%ymm7
6604 vpslld $26,%ymm11,%ymm2
6605 vmovdqu %ymm6,32-128(%rax)
6606 vpaddd %ymm14,%ymm6,%ymm6
6607
6608 vpsrld $11,%ymm11,%ymm1
6609 vpxor %ymm2,%ymm7,%ymm7
6610 vpslld $21,%ymm11,%ymm2
6611 vpaddd -96(%rbp),%ymm6,%ymm6
6612 vpxor %ymm1,%ymm7,%ymm7
6613
6614 vpsrld $25,%ymm11,%ymm1
6615 vpxor %ymm2,%ymm7,%ymm7
6616
6617 vpslld $7,%ymm11,%ymm2
6618 vpandn %ymm13,%ymm11,%ymm0
6619 vpand %ymm12,%ymm11,%ymm4
6620
6621 vpxor %ymm1,%ymm7,%ymm7
6622
6623 vpsrld $2,%ymm15,%ymm14
6624 vpxor %ymm2,%ymm7,%ymm7
6625
6626 vpslld $30,%ymm15,%ymm1
6627 vpxor %ymm4,%ymm0,%ymm0
6628 vpxor %ymm15,%ymm8,%ymm4
6629
6630 vpxor %ymm1,%ymm14,%ymm14
6631 vpaddd %ymm7,%ymm6,%ymm6
6632
6633 vpsrld $13,%ymm15,%ymm1
6634
6635 vpslld $19,%ymm15,%ymm2
6636 vpaddd %ymm0,%ymm6,%ymm6
6637 vpand %ymm4,%ymm3,%ymm3
6638
6639 vpxor %ymm1,%ymm14,%ymm7
6640
6641 vpsrld $22,%ymm15,%ymm1
6642 vpxor %ymm2,%ymm7,%ymm7
6643
6644 vpslld $10,%ymm15,%ymm2
6645 vpxor %ymm3,%ymm8,%ymm14
6646 vpaddd %ymm6,%ymm10,%ymm10
6647
6648 vpxor %ymm1,%ymm7,%ymm7
6649 vpxor %ymm2,%ymm7,%ymm7
6650
6651 vpaddd %ymm6,%ymm14,%ymm14
6652 vpaddd %ymm7,%ymm14,%ymm14
6653 vmovdqu 96-128(%rax),%ymm6
6654 vpaddd 352-256-128(%rbx),%ymm5,%ymm5
6655
6656 vpsrld $3,%ymm6,%ymm7
6657 vpsrld $7,%ymm6,%ymm1
6658 vpslld $25,%ymm6,%ymm2
6659 vpxor %ymm1,%ymm7,%ymm7
6660 vpsrld $18,%ymm6,%ymm1
6661 vpxor %ymm2,%ymm7,%ymm7
6662 vpslld $14,%ymm6,%ymm2
6663 vmovdqu 0-128(%rax),%ymm0
6664 vpsrld $10,%ymm0,%ymm3
6665
6666 vpxor %ymm1,%ymm7,%ymm7
6667 vpsrld $17,%ymm0,%ymm1
6668 vpxor %ymm2,%ymm7,%ymm7
6669 vpslld $15,%ymm0,%ymm2
6670 vpaddd %ymm7,%ymm5,%ymm5
6671 vpxor %ymm1,%ymm3,%ymm7
6672 vpsrld $19,%ymm0,%ymm1
6673 vpxor %ymm2,%ymm7,%ymm7
6674 vpslld $13,%ymm0,%ymm2
6675 vpxor %ymm1,%ymm7,%ymm7
6676 vpxor %ymm2,%ymm7,%ymm7
6677 vpaddd %ymm7,%ymm5,%ymm5
6678 vpsrld $6,%ymm10,%ymm7
6679 vpslld $26,%ymm10,%ymm2
6680 vmovdqu %ymm5,64-128(%rax)
6681 vpaddd %ymm13,%ymm5,%ymm5
6682
6683 vpsrld $11,%ymm10,%ymm1
6684 vpxor %ymm2,%ymm7,%ymm7
6685 vpslld $21,%ymm10,%ymm2
6686 vpaddd -64(%rbp),%ymm5,%ymm5
6687 vpxor %ymm1,%ymm7,%ymm7
6688
6689 vpsrld $25,%ymm10,%ymm1
6690 vpxor %ymm2,%ymm7,%ymm7
6691
6692 vpslld $7,%ymm10,%ymm2
6693 vpandn %ymm12,%ymm10,%ymm0
6694 vpand %ymm11,%ymm10,%ymm3
6695
6696 vpxor %ymm1,%ymm7,%ymm7
6697
6698 vpsrld $2,%ymm14,%ymm13
6699 vpxor %ymm2,%ymm7,%ymm7
6700
6701 vpslld $30,%ymm14,%ymm1
6702 vpxor %ymm3,%ymm0,%ymm0
6703 vpxor %ymm14,%ymm15,%ymm3
6704
6705 vpxor %ymm1,%ymm13,%ymm13
6706 vpaddd %ymm7,%ymm5,%ymm5
6707
6708 vpsrld $13,%ymm14,%ymm1
6709
6710 vpslld $19,%ymm14,%ymm2
6711 vpaddd %ymm0,%ymm5,%ymm5
6712 vpand %ymm3,%ymm4,%ymm4
6713
6714 vpxor %ymm1,%ymm13,%ymm7
6715
6716 vpsrld $22,%ymm14,%ymm1
6717 vpxor %ymm2,%ymm7,%ymm7
6718
6719 vpslld $10,%ymm14,%ymm2
6720 vpxor %ymm4,%ymm15,%ymm13
6721 vpaddd %ymm5,%ymm9,%ymm9
6722
6723 vpxor %ymm1,%ymm7,%ymm7
6724 vpxor %ymm2,%ymm7,%ymm7
6725
6726 vpaddd %ymm5,%ymm13,%ymm13
6727 vpaddd %ymm7,%ymm13,%ymm13
6728 vmovdqu 128-128(%rax),%ymm5
6729 vpaddd 384-256-128(%rbx),%ymm6,%ymm6
6730
6731 vpsrld $3,%ymm5,%ymm7
6732 vpsrld $7,%ymm5,%ymm1
6733 vpslld $25,%ymm5,%ymm2
6734 vpxor %ymm1,%ymm7,%ymm7
6735 vpsrld $18,%ymm5,%ymm1
6736 vpxor %ymm2,%ymm7,%ymm7
6737 vpslld $14,%ymm5,%ymm2
6738 vmovdqu 32-128(%rax),%ymm0
6739 vpsrld $10,%ymm0,%ymm4
6740
6741 vpxor %ymm1,%ymm7,%ymm7
6742 vpsrld $17,%ymm0,%ymm1
6743 vpxor %ymm2,%ymm7,%ymm7
6744 vpslld $15,%ymm0,%ymm2
6745 vpaddd %ymm7,%ymm6,%ymm6
6746 vpxor %ymm1,%ymm4,%ymm7
6747 vpsrld $19,%ymm0,%ymm1
6748 vpxor %ymm2,%ymm7,%ymm7
6749 vpslld $13,%ymm0,%ymm2
6750 vpxor %ymm1,%ymm7,%ymm7
6751 vpxor %ymm2,%ymm7,%ymm7
6752 vpaddd %ymm7,%ymm6,%ymm6
6753 vpsrld $6,%ymm9,%ymm7
6754 vpslld $26,%ymm9,%ymm2
6755 vmovdqu %ymm6,96-128(%rax)
6756 vpaddd %ymm12,%ymm6,%ymm6
6757
6758 vpsrld $11,%ymm9,%ymm1
6759 vpxor %ymm2,%ymm7,%ymm7
6760 vpslld $21,%ymm9,%ymm2
6761 vpaddd -32(%rbp),%ymm6,%ymm6
6762 vpxor %ymm1,%ymm7,%ymm7
6763
6764 vpsrld $25,%ymm9,%ymm1
6765 vpxor %ymm2,%ymm7,%ymm7
6766
6767 vpslld $7,%ymm9,%ymm2
6768 vpandn %ymm11,%ymm9,%ymm0
6769 vpand %ymm10,%ymm9,%ymm4
6770
6771 vpxor %ymm1,%ymm7,%ymm7
6772
6773 vpsrld $2,%ymm13,%ymm12
6774 vpxor %ymm2,%ymm7,%ymm7
6775
6776 vpslld $30,%ymm13,%ymm1
6777 vpxor %ymm4,%ymm0,%ymm0
6778 vpxor %ymm13,%ymm14,%ymm4
6779
6780 vpxor %ymm1,%ymm12,%ymm12
6781 vpaddd %ymm7,%ymm6,%ymm6
6782
6783 vpsrld $13,%ymm13,%ymm1
6784
6785 vpslld $19,%ymm13,%ymm2
6786 vpaddd %ymm0,%ymm6,%ymm6
6787 vpand %ymm4,%ymm3,%ymm3
6788
6789 vpxor %ymm1,%ymm12,%ymm7
6790
6791 vpsrld $22,%ymm13,%ymm1
6792 vpxor %ymm2,%ymm7,%ymm7
6793
6794 vpslld $10,%ymm13,%ymm2
6795 vpxor %ymm3,%ymm14,%ymm12
6796 vpaddd %ymm6,%ymm8,%ymm8
6797
6798 vpxor %ymm1,%ymm7,%ymm7
6799 vpxor %ymm2,%ymm7,%ymm7
6800
6801 vpaddd %ymm6,%ymm12,%ymm12
6802 vpaddd %ymm7,%ymm12,%ymm12
6803 vmovdqu 160-128(%rax),%ymm6
6804 vpaddd 416-256-128(%rbx),%ymm5,%ymm5
6805
6806 vpsrld $3,%ymm6,%ymm7
6807 vpsrld $7,%ymm6,%ymm1
6808 vpslld $25,%ymm6,%ymm2
6809 vpxor %ymm1,%ymm7,%ymm7
6810 vpsrld $18,%ymm6,%ymm1
6811 vpxor %ymm2,%ymm7,%ymm7
6812 vpslld $14,%ymm6,%ymm2
6813 vmovdqu 64-128(%rax),%ymm0
6814 vpsrld $10,%ymm0,%ymm3
6815
6816 vpxor %ymm1,%ymm7,%ymm7
6817 vpsrld $17,%ymm0,%ymm1
6818 vpxor %ymm2,%ymm7,%ymm7
6819 vpslld $15,%ymm0,%ymm2
6820 vpaddd %ymm7,%ymm5,%ymm5
6821 vpxor %ymm1,%ymm3,%ymm7
6822 vpsrld $19,%ymm0,%ymm1
6823 vpxor %ymm2,%ymm7,%ymm7
6824 vpslld $13,%ymm0,%ymm2
6825 vpxor %ymm1,%ymm7,%ymm7
6826 vpxor %ymm2,%ymm7,%ymm7
6827 vpaddd %ymm7,%ymm5,%ymm5
6828 vpsrld $6,%ymm8,%ymm7
6829 vpslld $26,%ymm8,%ymm2
6830 vmovdqu %ymm5,128-128(%rax)
6831 vpaddd %ymm11,%ymm5,%ymm5
6832
6833 vpsrld $11,%ymm8,%ymm1
6834 vpxor %ymm2,%ymm7,%ymm7
6835 vpslld $21,%ymm8,%ymm2
6836 vpaddd 0(%rbp),%ymm5,%ymm5
6837 vpxor %ymm1,%ymm7,%ymm7
6838
6839 vpsrld $25,%ymm8,%ymm1
6840 vpxor %ymm2,%ymm7,%ymm7
6841
6842 vpslld $7,%ymm8,%ymm2
6843 vpandn %ymm10,%ymm8,%ymm0
6844 vpand %ymm9,%ymm8,%ymm3
6845
6846 vpxor %ymm1,%ymm7,%ymm7
6847
6848 vpsrld $2,%ymm12,%ymm11
6849 vpxor %ymm2,%ymm7,%ymm7
6850
6851 vpslld $30,%ymm12,%ymm1
6852 vpxor %ymm3,%ymm0,%ymm0
6853 vpxor %ymm12,%ymm13,%ymm3
6854
6855 vpxor %ymm1,%ymm11,%ymm11
6856 vpaddd %ymm7,%ymm5,%ymm5
6857
6858 vpsrld $13,%ymm12,%ymm1
6859
6860 vpslld $19,%ymm12,%ymm2
6861 vpaddd %ymm0,%ymm5,%ymm5
6862 vpand %ymm3,%ymm4,%ymm4
6863
6864 vpxor %ymm1,%ymm11,%ymm7
6865
6866 vpsrld $22,%ymm12,%ymm1
6867 vpxor %ymm2,%ymm7,%ymm7
6868
6869 vpslld $10,%ymm12,%ymm2
6870 vpxor %ymm4,%ymm13,%ymm11
6871 vpaddd %ymm5,%ymm15,%ymm15
6872
6873 vpxor %ymm1,%ymm7,%ymm7
6874 vpxor %ymm2,%ymm7,%ymm7
6875
6876 vpaddd %ymm5,%ymm11,%ymm11
6877 vpaddd %ymm7,%ymm11,%ymm11
6878 vmovdqu 192-128(%rax),%ymm5
6879 vpaddd 448-256-128(%rbx),%ymm6,%ymm6
6880
6881 vpsrld $3,%ymm5,%ymm7
6882 vpsrld $7,%ymm5,%ymm1
6883 vpslld $25,%ymm5,%ymm2
6884 vpxor %ymm1,%ymm7,%ymm7
6885 vpsrld $18,%ymm5,%ymm1
6886 vpxor %ymm2,%ymm7,%ymm7
6887 vpslld $14,%ymm5,%ymm2
6888 vmovdqu 96-128(%rax),%ymm0
6889 vpsrld $10,%ymm0,%ymm4
6890
6891 vpxor %ymm1,%ymm7,%ymm7
6892 vpsrld $17,%ymm0,%ymm1
6893 vpxor %ymm2,%ymm7,%ymm7
6894 vpslld $15,%ymm0,%ymm2
6895 vpaddd %ymm7,%ymm6,%ymm6
6896 vpxor %ymm1,%ymm4,%ymm7
6897 vpsrld $19,%ymm0,%ymm1
6898 vpxor %ymm2,%ymm7,%ymm7
6899 vpslld $13,%ymm0,%ymm2
6900 vpxor %ymm1,%ymm7,%ymm7
6901 vpxor %ymm2,%ymm7,%ymm7
6902 vpaddd %ymm7,%ymm6,%ymm6
6903 vpsrld $6,%ymm15,%ymm7
6904 vpslld $26,%ymm15,%ymm2
6905 vmovdqu %ymm6,160-128(%rax)
6906 vpaddd %ymm10,%ymm6,%ymm6
6907
6908 vpsrld $11,%ymm15,%ymm1
6909 vpxor %ymm2,%ymm7,%ymm7
6910 vpslld $21,%ymm15,%ymm2
6911 vpaddd 32(%rbp),%ymm6,%ymm6
6912 vpxor %ymm1,%ymm7,%ymm7
6913
6914 vpsrld $25,%ymm15,%ymm1
6915 vpxor %ymm2,%ymm7,%ymm7
6916
6917 vpslld $7,%ymm15,%ymm2
6918 vpandn %ymm9,%ymm15,%ymm0
6919 vpand %ymm8,%ymm15,%ymm4
6920
6921 vpxor %ymm1,%ymm7,%ymm7
6922
6923 vpsrld $2,%ymm11,%ymm10
6924 vpxor %ymm2,%ymm7,%ymm7
6925
6926 vpslld $30,%ymm11,%ymm1
6927 vpxor %ymm4,%ymm0,%ymm0
6928 vpxor %ymm11,%ymm12,%ymm4
6929
6930 vpxor %ymm1,%ymm10,%ymm10
6931 vpaddd %ymm7,%ymm6,%ymm6
6932
6933 vpsrld $13,%ymm11,%ymm1
6934
6935 vpslld $19,%ymm11,%ymm2
6936 vpaddd %ymm0,%ymm6,%ymm6
6937 vpand %ymm4,%ymm3,%ymm3
6938
6939 vpxor %ymm1,%ymm10,%ymm7
6940
6941 vpsrld $22,%ymm11,%ymm1
6942 vpxor %ymm2,%ymm7,%ymm7
6943
6944 vpslld $10,%ymm11,%ymm2
6945 vpxor %ymm3,%ymm12,%ymm10
6946 vpaddd %ymm6,%ymm14,%ymm14
6947
6948 vpxor %ymm1,%ymm7,%ymm7
6949 vpxor %ymm2,%ymm7,%ymm7
6950
6951 vpaddd %ymm6,%ymm10,%ymm10
6952 vpaddd %ymm7,%ymm10,%ymm10
6953 vmovdqu 224-128(%rax),%ymm6
6954 vpaddd 480-256-128(%rbx),%ymm5,%ymm5
6955
6956 vpsrld $3,%ymm6,%ymm7
6957 vpsrld $7,%ymm6,%ymm1
6958 vpslld $25,%ymm6,%ymm2
6959 vpxor %ymm1,%ymm7,%ymm7
6960 vpsrld $18,%ymm6,%ymm1
6961 vpxor %ymm2,%ymm7,%ymm7
6962 vpslld $14,%ymm6,%ymm2
6963 vmovdqu 128-128(%rax),%ymm0
6964 vpsrld $10,%ymm0,%ymm3
6965
6966 vpxor %ymm1,%ymm7,%ymm7
6967 vpsrld $17,%ymm0,%ymm1
6968 vpxor %ymm2,%ymm7,%ymm7
6969 vpslld $15,%ymm0,%ymm2
6970 vpaddd %ymm7,%ymm5,%ymm5
6971 vpxor %ymm1,%ymm3,%ymm7
6972 vpsrld $19,%ymm0,%ymm1
6973 vpxor %ymm2,%ymm7,%ymm7
6974 vpslld $13,%ymm0,%ymm2
6975 vpxor %ymm1,%ymm7,%ymm7
6976 vpxor %ymm2,%ymm7,%ymm7
6977 vpaddd %ymm7,%ymm5,%ymm5
6978 vpsrld $6,%ymm14,%ymm7
6979 vpslld $26,%ymm14,%ymm2
6980 vmovdqu %ymm5,192-128(%rax)
6981 vpaddd %ymm9,%ymm5,%ymm5
6982
6983 vpsrld $11,%ymm14,%ymm1
6984 vpxor %ymm2,%ymm7,%ymm7
6985 vpslld $21,%ymm14,%ymm2
6986 vpaddd 64(%rbp),%ymm5,%ymm5
6987 vpxor %ymm1,%ymm7,%ymm7
6988
6989 vpsrld $25,%ymm14,%ymm1
6990 vpxor %ymm2,%ymm7,%ymm7
6991
6992 vpslld $7,%ymm14,%ymm2
6993 vpandn %ymm8,%ymm14,%ymm0
6994 vpand %ymm15,%ymm14,%ymm3
6995
6996 vpxor %ymm1,%ymm7,%ymm7
6997
6998 vpsrld $2,%ymm10,%ymm9
6999 vpxor %ymm2,%ymm7,%ymm7
7000
7001 vpslld $30,%ymm10,%ymm1
7002 vpxor %ymm3,%ymm0,%ymm0
7003 vpxor %ymm10,%ymm11,%ymm3
7004
7005 vpxor %ymm1,%ymm9,%ymm9
7006 vpaddd %ymm7,%ymm5,%ymm5
7007
7008 vpsrld $13,%ymm10,%ymm1
7009
7010 vpslld $19,%ymm10,%ymm2
7011 vpaddd %ymm0,%ymm5,%ymm5
7012 vpand %ymm3,%ymm4,%ymm4
7013
7014 vpxor %ymm1,%ymm9,%ymm7
7015
7016 vpsrld $22,%ymm10,%ymm1
7017 vpxor %ymm2,%ymm7,%ymm7
7018
7019 vpslld $10,%ymm10,%ymm2
7020 vpxor %ymm4,%ymm11,%ymm9
7021 vpaddd %ymm5,%ymm13,%ymm13
7022
7023 vpxor %ymm1,%ymm7,%ymm7
7024 vpxor %ymm2,%ymm7,%ymm7
7025
7026 vpaddd %ymm5,%ymm9,%ymm9
7027 vpaddd %ymm7,%ymm9,%ymm9
7028 vmovdqu 256-256-128(%rbx),%ymm5
7029 vpaddd 0-128(%rax),%ymm6,%ymm6
7030
7031 vpsrld $3,%ymm5,%ymm7
7032 vpsrld $7,%ymm5,%ymm1
7033 vpslld $25,%ymm5,%ymm2
7034 vpxor %ymm1,%ymm7,%ymm7
7035 vpsrld $18,%ymm5,%ymm1
7036 vpxor %ymm2,%ymm7,%ymm7
7037 vpslld $14,%ymm5,%ymm2
7038 vmovdqu 160-128(%rax),%ymm0
7039 vpsrld $10,%ymm0,%ymm4
7040
7041 vpxor %ymm1,%ymm7,%ymm7
7042 vpsrld $17,%ymm0,%ymm1
7043 vpxor %ymm2,%ymm7,%ymm7
7044 vpslld $15,%ymm0,%ymm2
7045 vpaddd %ymm7,%ymm6,%ymm6
7046 vpxor %ymm1,%ymm4,%ymm7
7047 vpsrld $19,%ymm0,%ymm1
7048 vpxor %ymm2,%ymm7,%ymm7
7049 vpslld $13,%ymm0,%ymm2
7050 vpxor %ymm1,%ymm7,%ymm7
7051 vpxor %ymm2,%ymm7,%ymm7
7052 vpaddd %ymm7,%ymm6,%ymm6
7053 vpsrld $6,%ymm13,%ymm7
7054 vpslld $26,%ymm13,%ymm2
7055 vmovdqu %ymm6,224-128(%rax)
7056 vpaddd %ymm8,%ymm6,%ymm6
7057
7058 vpsrld $11,%ymm13,%ymm1
7059 vpxor %ymm2,%ymm7,%ymm7
7060 vpslld $21,%ymm13,%ymm2
7061 vpaddd 96(%rbp),%ymm6,%ymm6
7062 vpxor %ymm1,%ymm7,%ymm7
7063
7064 vpsrld $25,%ymm13,%ymm1
7065 vpxor %ymm2,%ymm7,%ymm7
7066
7067 vpslld $7,%ymm13,%ymm2
7068 vpandn %ymm15,%ymm13,%ymm0
7069 vpand %ymm14,%ymm13,%ymm4
7070
7071 vpxor %ymm1,%ymm7,%ymm7
7072
7073 vpsrld $2,%ymm9,%ymm8
7074 vpxor %ymm2,%ymm7,%ymm7
7075
7076 vpslld $30,%ymm9,%ymm1
7077 vpxor %ymm4,%ymm0,%ymm0
7078 vpxor %ymm9,%ymm10,%ymm4
7079
7080 vpxor %ymm1,%ymm8,%ymm8
7081 vpaddd %ymm7,%ymm6,%ymm6
7082
7083 vpsrld $13,%ymm9,%ymm1
7084
7085 vpslld $19,%ymm9,%ymm2
7086 vpaddd %ymm0,%ymm6,%ymm6
7087 vpand %ymm4,%ymm3,%ymm3
7088
7089 vpxor %ymm1,%ymm8,%ymm7
7090
7091 vpsrld $22,%ymm9,%ymm1
7092 vpxor %ymm2,%ymm7,%ymm7
7093
7094 vpslld $10,%ymm9,%ymm2
7095 vpxor %ymm3,%ymm10,%ymm8
7096 vpaddd %ymm6,%ymm12,%ymm12
7097
7098 vpxor %ymm1,%ymm7,%ymm7
7099 vpxor %ymm2,%ymm7,%ymm7
7100
7101 vpaddd %ymm6,%ymm8,%ymm8
7102 vpaddd %ymm7,%ymm8,%ymm8
7103 addq $256,%rbp
7104 vmovdqu 288-256-128(%rbx),%ymm6
7105 vpaddd 32-128(%rax),%ymm5,%ymm5
7106
7107 vpsrld $3,%ymm6,%ymm7
7108 vpsrld $7,%ymm6,%ymm1
7109 vpslld $25,%ymm6,%ymm2
7110 vpxor %ymm1,%ymm7,%ymm7
7111 vpsrld $18,%ymm6,%ymm1
7112 vpxor %ymm2,%ymm7,%ymm7
7113 vpslld $14,%ymm6,%ymm2
7114 vmovdqu 192-128(%rax),%ymm0
7115 vpsrld $10,%ymm0,%ymm3
7116
7117 vpxor %ymm1,%ymm7,%ymm7
7118 vpsrld $17,%ymm0,%ymm1
7119 vpxor %ymm2,%ymm7,%ymm7
7120 vpslld $15,%ymm0,%ymm2
7121 vpaddd %ymm7,%ymm5,%ymm5
7122 vpxor %ymm1,%ymm3,%ymm7
7123 vpsrld $19,%ymm0,%ymm1
7124 vpxor %ymm2,%ymm7,%ymm7
7125 vpslld $13,%ymm0,%ymm2
7126 vpxor %ymm1,%ymm7,%ymm7
7127 vpxor %ymm2,%ymm7,%ymm7
7128 vpaddd %ymm7,%ymm5,%ymm5
7129 vpsrld $6,%ymm12,%ymm7
7130 vpslld $26,%ymm12,%ymm2
7131 vmovdqu %ymm5,256-256-128(%rbx)
7132 vpaddd %ymm15,%ymm5,%ymm5
7133
7134 vpsrld $11,%ymm12,%ymm1
7135 vpxor %ymm2,%ymm7,%ymm7
7136 vpslld $21,%ymm12,%ymm2
7137 vpaddd -128(%rbp),%ymm5,%ymm5
7138 vpxor %ymm1,%ymm7,%ymm7
7139
7140 vpsrld $25,%ymm12,%ymm1
7141 vpxor %ymm2,%ymm7,%ymm7
7142
7143 vpslld $7,%ymm12,%ymm2
7144 vpandn %ymm14,%ymm12,%ymm0
7145 vpand %ymm13,%ymm12,%ymm3
7146
7147 vpxor %ymm1,%ymm7,%ymm7
7148
7149 vpsrld $2,%ymm8,%ymm15
7150 vpxor %ymm2,%ymm7,%ymm7
7151
7152 vpslld $30,%ymm8,%ymm1
7153 vpxor %ymm3,%ymm0,%ymm0
7154 vpxor %ymm8,%ymm9,%ymm3
7155
7156 vpxor %ymm1,%ymm15,%ymm15
7157 vpaddd %ymm7,%ymm5,%ymm5
7158
7159 vpsrld $13,%ymm8,%ymm1
7160
7161 vpslld $19,%ymm8,%ymm2
7162 vpaddd %ymm0,%ymm5,%ymm5
7163 vpand %ymm3,%ymm4,%ymm4
7164
7165 vpxor %ymm1,%ymm15,%ymm7
7166
7167 vpsrld $22,%ymm8,%ymm1
7168 vpxor %ymm2,%ymm7,%ymm7
7169
7170 vpslld $10,%ymm8,%ymm2
7171 vpxor %ymm4,%ymm9,%ymm15
7172 vpaddd %ymm5,%ymm11,%ymm11
7173
7174 vpxor %ymm1,%ymm7,%ymm7
7175 vpxor %ymm2,%ymm7,%ymm7
7176
7177 vpaddd %ymm5,%ymm15,%ymm15
7178 vpaddd %ymm7,%ymm15,%ymm15
7179 vmovdqu 320-256-128(%rbx),%ymm5
7180 vpaddd 64-128(%rax),%ymm6,%ymm6
7181
7182 vpsrld $3,%ymm5,%ymm7
7183 vpsrld $7,%ymm5,%ymm1
7184 vpslld $25,%ymm5,%ymm2
7185 vpxor %ymm1,%ymm7,%ymm7
7186 vpsrld $18,%ymm5,%ymm1
7187 vpxor %ymm2,%ymm7,%ymm7
7188 vpslld $14,%ymm5,%ymm2
7189 vmovdqu 224-128(%rax),%ymm0
7190 vpsrld $10,%ymm0,%ymm4
7191
7192 vpxor %ymm1,%ymm7,%ymm7
7193 vpsrld $17,%ymm0,%ymm1
7194 vpxor %ymm2,%ymm7,%ymm7
7195 vpslld $15,%ymm0,%ymm2
7196 vpaddd %ymm7,%ymm6,%ymm6
7197 vpxor %ymm1,%ymm4,%ymm7
7198 vpsrld $19,%ymm0,%ymm1
7199 vpxor %ymm2,%ymm7,%ymm7
7200 vpslld $13,%ymm0,%ymm2
7201 vpxor %ymm1,%ymm7,%ymm7
7202 vpxor %ymm2,%ymm7,%ymm7
7203 vpaddd %ymm7,%ymm6,%ymm6
7204 vpsrld $6,%ymm11,%ymm7
7205 vpslld $26,%ymm11,%ymm2
7206 vmovdqu %ymm6,288-256-128(%rbx)
7207 vpaddd %ymm14,%ymm6,%ymm6
7208
7209 vpsrld $11,%ymm11,%ymm1
7210 vpxor %ymm2,%ymm7,%ymm7
7211 vpslld $21,%ymm11,%ymm2
7212 vpaddd -96(%rbp),%ymm6,%ymm6
7213 vpxor %ymm1,%ymm7,%ymm7
7214
7215 vpsrld $25,%ymm11,%ymm1
7216 vpxor %ymm2,%ymm7,%ymm7
7217
7218 vpslld $7,%ymm11,%ymm2
7219 vpandn %ymm13,%ymm11,%ymm0
7220 vpand %ymm12,%ymm11,%ymm4
7221
7222 vpxor %ymm1,%ymm7,%ymm7
7223
7224 vpsrld $2,%ymm15,%ymm14
7225 vpxor %ymm2,%ymm7,%ymm7
7226
7227 vpslld $30,%ymm15,%ymm1
7228 vpxor %ymm4,%ymm0,%ymm0
7229 vpxor %ymm15,%ymm8,%ymm4
7230
7231 vpxor %ymm1,%ymm14,%ymm14
7232 vpaddd %ymm7,%ymm6,%ymm6
7233
7234 vpsrld $13,%ymm15,%ymm1
7235
7236 vpslld $19,%ymm15,%ymm2
7237 vpaddd %ymm0,%ymm6,%ymm6
7238 vpand %ymm4,%ymm3,%ymm3
7239
7240 vpxor %ymm1,%ymm14,%ymm7
7241
7242 vpsrld $22,%ymm15,%ymm1
7243 vpxor %ymm2,%ymm7,%ymm7
7244
7245 vpslld $10,%ymm15,%ymm2
7246 vpxor %ymm3,%ymm8,%ymm14
7247 vpaddd %ymm6,%ymm10,%ymm10
7248
7249 vpxor %ymm1,%ymm7,%ymm7
7250 vpxor %ymm2,%ymm7,%ymm7
7251
7252 vpaddd %ymm6,%ymm14,%ymm14
7253 vpaddd %ymm7,%ymm14,%ymm14
7254 vmovdqu 352-256-128(%rbx),%ymm6
7255 vpaddd 96-128(%rax),%ymm5,%ymm5
7256
7257 vpsrld $3,%ymm6,%ymm7
7258 vpsrld $7,%ymm6,%ymm1
7259 vpslld $25,%ymm6,%ymm2
7260 vpxor %ymm1,%ymm7,%ymm7
7261 vpsrld $18,%ymm6,%ymm1
7262 vpxor %ymm2,%ymm7,%ymm7
7263 vpslld $14,%ymm6,%ymm2
7264 vmovdqu 256-256-128(%rbx),%ymm0
7265 vpsrld $10,%ymm0,%ymm3
7266
7267 vpxor %ymm1,%ymm7,%ymm7
7268 vpsrld $17,%ymm0,%ymm1
7269 vpxor %ymm2,%ymm7,%ymm7
7270 vpslld $15,%ymm0,%ymm2
7271 vpaddd %ymm7,%ymm5,%ymm5
7272 vpxor %ymm1,%ymm3,%ymm7
7273 vpsrld $19,%ymm0,%ymm1
7274 vpxor %ymm2,%ymm7,%ymm7
7275 vpslld $13,%ymm0,%ymm2
7276 vpxor %ymm1,%ymm7,%ymm7
7277 vpxor %ymm2,%ymm7,%ymm7
7278 vpaddd %ymm7,%ymm5,%ymm5
7279 vpsrld $6,%ymm10,%ymm7
7280 vpslld $26,%ymm10,%ymm2
7281 vmovdqu %ymm5,320-256-128(%rbx)
7282 vpaddd %ymm13,%ymm5,%ymm5
7283
7284 vpsrld $11,%ymm10,%ymm1
7285 vpxor %ymm2,%ymm7,%ymm7
7286 vpslld $21,%ymm10,%ymm2
7287 vpaddd -64(%rbp),%ymm5,%ymm5
7288 vpxor %ymm1,%ymm7,%ymm7
7289
7290 vpsrld $25,%ymm10,%ymm1
7291 vpxor %ymm2,%ymm7,%ymm7
7292
7293 vpslld $7,%ymm10,%ymm2
7294 vpandn %ymm12,%ymm10,%ymm0
7295 vpand %ymm11,%ymm10,%ymm3
7296
7297 vpxor %ymm1,%ymm7,%ymm7
7298
7299 vpsrld $2,%ymm14,%ymm13
7300 vpxor %ymm2,%ymm7,%ymm7
7301
7302 vpslld $30,%ymm14,%ymm1
7303 vpxor %ymm3,%ymm0,%ymm0
7304 vpxor %ymm14,%ymm15,%ymm3
7305
7306 vpxor %ymm1,%ymm13,%ymm13
7307 vpaddd %ymm7,%ymm5,%ymm5
7308
7309 vpsrld $13,%ymm14,%ymm1
7310
7311 vpslld $19,%ymm14,%ymm2
7312 vpaddd %ymm0,%ymm5,%ymm5
7313 vpand %ymm3,%ymm4,%ymm4
7314
7315 vpxor %ymm1,%ymm13,%ymm7
7316
7317 vpsrld $22,%ymm14,%ymm1
7318 vpxor %ymm2,%ymm7,%ymm7
7319
7320 vpslld $10,%ymm14,%ymm2
7321 vpxor %ymm4,%ymm15,%ymm13
7322 vpaddd %ymm5,%ymm9,%ymm9
7323
7324 vpxor %ymm1,%ymm7,%ymm7
7325 vpxor %ymm2,%ymm7,%ymm7
7326
7327 vpaddd %ymm5,%ymm13,%ymm13
7328 vpaddd %ymm7,%ymm13,%ymm13
7329 vmovdqu 384-256-128(%rbx),%ymm5
7330 vpaddd 128-128(%rax),%ymm6,%ymm6
7331
7332 vpsrld $3,%ymm5,%ymm7
7333 vpsrld $7,%ymm5,%ymm1
7334 vpslld $25,%ymm5,%ymm2
7335 vpxor %ymm1,%ymm7,%ymm7
7336 vpsrld $18,%ymm5,%ymm1
7337 vpxor %ymm2,%ymm7,%ymm7
7338 vpslld $14,%ymm5,%ymm2
7339 vmovdqu 288-256-128(%rbx),%ymm0
7340 vpsrld $10,%ymm0,%ymm4
7341
7342 vpxor %ymm1,%ymm7,%ymm7
7343 vpsrld $17,%ymm0,%ymm1
7344 vpxor %ymm2,%ymm7,%ymm7
7345 vpslld $15,%ymm0,%ymm2
7346 vpaddd %ymm7,%ymm6,%ymm6
7347 vpxor %ymm1,%ymm4,%ymm7
7348 vpsrld $19,%ymm0,%ymm1
7349 vpxor %ymm2,%ymm7,%ymm7
7350 vpslld $13,%ymm0,%ymm2
7351 vpxor %ymm1,%ymm7,%ymm7
7352 vpxor %ymm2,%ymm7,%ymm7
7353 vpaddd %ymm7,%ymm6,%ymm6
7354 vpsrld $6,%ymm9,%ymm7
7355 vpslld $26,%ymm9,%ymm2
7356 vmovdqu %ymm6,352-256-128(%rbx)
7357 vpaddd %ymm12,%ymm6,%ymm6
7358
7359 vpsrld $11,%ymm9,%ymm1
7360 vpxor %ymm2,%ymm7,%ymm7
7361 vpslld $21,%ymm9,%ymm2
7362 vpaddd -32(%rbp),%ymm6,%ymm6
7363 vpxor %ymm1,%ymm7,%ymm7
7364
7365 vpsrld $25,%ymm9,%ymm1
7366 vpxor %ymm2,%ymm7,%ymm7
7367
7368 vpslld $7,%ymm9,%ymm2
7369 vpandn %ymm11,%ymm9,%ymm0
7370 vpand %ymm10,%ymm9,%ymm4
7371
7372 vpxor %ymm1,%ymm7,%ymm7
7373
7374 vpsrld $2,%ymm13,%ymm12
7375 vpxor %ymm2,%ymm7,%ymm7
7376
7377 vpslld $30,%ymm13,%ymm1
7378 vpxor %ymm4,%ymm0,%ymm0
7379 vpxor %ymm13,%ymm14,%ymm4
7380
7381 vpxor %ymm1,%ymm12,%ymm12
7382 vpaddd %ymm7,%ymm6,%ymm6
7383
7384 vpsrld $13,%ymm13,%ymm1
7385
7386 vpslld $19,%ymm13,%ymm2
7387 vpaddd %ymm0,%ymm6,%ymm6
7388 vpand %ymm4,%ymm3,%ymm3
7389
7390 vpxor %ymm1,%ymm12,%ymm7
7391
7392 vpsrld $22,%ymm13,%ymm1
7393 vpxor %ymm2,%ymm7,%ymm7
7394
7395 vpslld $10,%ymm13,%ymm2
7396 vpxor %ymm3,%ymm14,%ymm12
7397 vpaddd %ymm6,%ymm8,%ymm8
7398
7399 vpxor %ymm1,%ymm7,%ymm7
7400 vpxor %ymm2,%ymm7,%ymm7
7401
7402 vpaddd %ymm6,%ymm12,%ymm12
7403 vpaddd %ymm7,%ymm12,%ymm12
7404 vmovdqu 416-256-128(%rbx),%ymm6
7405 vpaddd 160-128(%rax),%ymm5,%ymm5
7406
7407 vpsrld $3,%ymm6,%ymm7
7408 vpsrld $7,%ymm6,%ymm1
7409 vpslld $25,%ymm6,%ymm2
7410 vpxor %ymm1,%ymm7,%ymm7
7411 vpsrld $18,%ymm6,%ymm1
7412 vpxor %ymm2,%ymm7,%ymm7
7413 vpslld $14,%ymm6,%ymm2
7414 vmovdqu 320-256-128(%rbx),%ymm0
7415 vpsrld $10,%ymm0,%ymm3
7416
7417 vpxor %ymm1,%ymm7,%ymm7
7418 vpsrld $17,%ymm0,%ymm1
7419 vpxor %ymm2,%ymm7,%ymm7
7420 vpslld $15,%ymm0,%ymm2
7421 vpaddd %ymm7,%ymm5,%ymm5
7422 vpxor %ymm1,%ymm3,%ymm7
7423 vpsrld $19,%ymm0,%ymm1
7424 vpxor %ymm2,%ymm7,%ymm7
7425 vpslld $13,%ymm0,%ymm2
7426 vpxor %ymm1,%ymm7,%ymm7
7427 vpxor %ymm2,%ymm7,%ymm7
7428 vpaddd %ymm7,%ymm5,%ymm5
7429 vpsrld $6,%ymm8,%ymm7
7430 vpslld $26,%ymm8,%ymm2
7431 vmovdqu %ymm5,384-256-128(%rbx)
7432 vpaddd %ymm11,%ymm5,%ymm5
7433
7434 vpsrld $11,%ymm8,%ymm1
7435 vpxor %ymm2,%ymm7,%ymm7
7436 vpslld $21,%ymm8,%ymm2
7437 vpaddd 0(%rbp),%ymm5,%ymm5
7438 vpxor %ymm1,%ymm7,%ymm7
7439
7440 vpsrld $25,%ymm8,%ymm1
7441 vpxor %ymm2,%ymm7,%ymm7
7442
7443 vpslld $7,%ymm8,%ymm2
7444 vpandn %ymm10,%ymm8,%ymm0
7445 vpand %ymm9,%ymm8,%ymm3
7446
7447 vpxor %ymm1,%ymm7,%ymm7
7448
7449 vpsrld $2,%ymm12,%ymm11
7450 vpxor %ymm2,%ymm7,%ymm7
7451
7452 vpslld $30,%ymm12,%ymm1
7453 vpxor %ymm3,%ymm0,%ymm0
7454 vpxor %ymm12,%ymm13,%ymm3
7455
7456 vpxor %ymm1,%ymm11,%ymm11
7457 vpaddd %ymm7,%ymm5,%ymm5
7458
7459 vpsrld $13,%ymm12,%ymm1
7460
7461 vpslld $19,%ymm12,%ymm2
7462 vpaddd %ymm0,%ymm5,%ymm5
7463 vpand %ymm3,%ymm4,%ymm4
7464
7465 vpxor %ymm1,%ymm11,%ymm7
7466
7467 vpsrld $22,%ymm12,%ymm1
7468 vpxor %ymm2,%ymm7,%ymm7
7469
7470 vpslld $10,%ymm12,%ymm2
7471 vpxor %ymm4,%ymm13,%ymm11
7472 vpaddd %ymm5,%ymm15,%ymm15
7473
7474 vpxor %ymm1,%ymm7,%ymm7
7475 vpxor %ymm2,%ymm7,%ymm7
7476
7477 vpaddd %ymm5,%ymm11,%ymm11
7478 vpaddd %ymm7,%ymm11,%ymm11
7479 vmovdqu 448-256-128(%rbx),%ymm5
7480 vpaddd 192-128(%rax),%ymm6,%ymm6
7481
7482 vpsrld $3,%ymm5,%ymm7
7483 vpsrld $7,%ymm5,%ymm1
7484 vpslld $25,%ymm5,%ymm2
7485 vpxor %ymm1,%ymm7,%ymm7
7486 vpsrld $18,%ymm5,%ymm1
7487 vpxor %ymm2,%ymm7,%ymm7
7488 vpslld $14,%ymm5,%ymm2
7489 vmovdqu 352-256-128(%rbx),%ymm0
7490 vpsrld $10,%ymm0,%ymm4
7491
7492 vpxor %ymm1,%ymm7,%ymm7
7493 vpsrld $17,%ymm0,%ymm1
7494 vpxor %ymm2,%ymm7,%ymm7
7495 vpslld $15,%ymm0,%ymm2
7496 vpaddd %ymm7,%ymm6,%ymm6
7497 vpxor %ymm1,%ymm4,%ymm7
7498 vpsrld $19,%ymm0,%ymm1
7499 vpxor %ymm2,%ymm7,%ymm7
7500 vpslld $13,%ymm0,%ymm2
7501 vpxor %ymm1,%ymm7,%ymm7
7502 vpxor %ymm2,%ymm7,%ymm7
7503 vpaddd %ymm7,%ymm6,%ymm6
7504 vpsrld $6,%ymm15,%ymm7
7505 vpslld $26,%ymm15,%ymm2
7506 vmovdqu %ymm6,416-256-128(%rbx)
7507 vpaddd %ymm10,%ymm6,%ymm6
7508
7509 vpsrld $11,%ymm15,%ymm1
7510 vpxor %ymm2,%ymm7,%ymm7
7511 vpslld $21,%ymm15,%ymm2
7512 vpaddd 32(%rbp),%ymm6,%ymm6
7513 vpxor %ymm1,%ymm7,%ymm7
7514
7515 vpsrld $25,%ymm15,%ymm1
7516 vpxor %ymm2,%ymm7,%ymm7
7517
7518 vpslld $7,%ymm15,%ymm2
7519 vpandn %ymm9,%ymm15,%ymm0
7520 vpand %ymm8,%ymm15,%ymm4
7521
7522 vpxor %ymm1,%ymm7,%ymm7
7523
7524 vpsrld $2,%ymm11,%ymm10
7525 vpxor %ymm2,%ymm7,%ymm7
7526
7527 vpslld $30,%ymm11,%ymm1
7528 vpxor %ymm4,%ymm0,%ymm0
7529 vpxor %ymm11,%ymm12,%ymm4
7530
7531 vpxor %ymm1,%ymm10,%ymm10
7532 vpaddd %ymm7,%ymm6,%ymm6
7533
7534 vpsrld $13,%ymm11,%ymm1
7535
7536 vpslld $19,%ymm11,%ymm2
7537 vpaddd %ymm0,%ymm6,%ymm6
7538 vpand %ymm4,%ymm3,%ymm3
7539
7540 vpxor %ymm1,%ymm10,%ymm7
7541
7542 vpsrld $22,%ymm11,%ymm1
7543 vpxor %ymm2,%ymm7,%ymm7
7544
7545 vpslld $10,%ymm11,%ymm2
7546 vpxor %ymm3,%ymm12,%ymm10
7547 vpaddd %ymm6,%ymm14,%ymm14
7548
7549 vpxor %ymm1,%ymm7,%ymm7
7550 vpxor %ymm2,%ymm7,%ymm7
7551
7552 vpaddd %ymm6,%ymm10,%ymm10
7553 vpaddd %ymm7,%ymm10,%ymm10
7554 vmovdqu 480-256-128(%rbx),%ymm6
7555 vpaddd 224-128(%rax),%ymm5,%ymm5
7556
7557 vpsrld $3,%ymm6,%ymm7
7558 vpsrld $7,%ymm6,%ymm1
7559 vpslld $25,%ymm6,%ymm2
7560 vpxor %ymm1,%ymm7,%ymm7
7561 vpsrld $18,%ymm6,%ymm1
7562 vpxor %ymm2,%ymm7,%ymm7
7563 vpslld $14,%ymm6,%ymm2
7564 vmovdqu 384-256-128(%rbx),%ymm0
7565 vpsrld $10,%ymm0,%ymm3
7566
7567 vpxor %ymm1,%ymm7,%ymm7
7568 vpsrld $17,%ymm0,%ymm1
7569 vpxor %ymm2,%ymm7,%ymm7
7570 vpslld $15,%ymm0,%ymm2
7571 vpaddd %ymm7,%ymm5,%ymm5
7572 vpxor %ymm1,%ymm3,%ymm7
7573 vpsrld $19,%ymm0,%ymm1
7574 vpxor %ymm2,%ymm7,%ymm7
7575 vpslld $13,%ymm0,%ymm2
7576 vpxor %ymm1,%ymm7,%ymm7
7577 vpxor %ymm2,%ymm7,%ymm7
7578 vpaddd %ymm7,%ymm5,%ymm5
7579 vpsrld $6,%ymm14,%ymm7
7580 vpslld $26,%ymm14,%ymm2
7581 vmovdqu %ymm5,448-256-128(%rbx)
7582 vpaddd %ymm9,%ymm5,%ymm5
7583
7584 vpsrld $11,%ymm14,%ymm1
7585 vpxor %ymm2,%ymm7,%ymm7
7586 vpslld $21,%ymm14,%ymm2
7587 vpaddd 64(%rbp),%ymm5,%ymm5
7588 vpxor %ymm1,%ymm7,%ymm7
7589
7590 vpsrld $25,%ymm14,%ymm1
7591 vpxor %ymm2,%ymm7,%ymm7
7592
7593 vpslld $7,%ymm14,%ymm2
7594 vpandn %ymm8,%ymm14,%ymm0
7595 vpand %ymm15,%ymm14,%ymm3
7596
7597 vpxor %ymm1,%ymm7,%ymm7
7598
7599 vpsrld $2,%ymm10,%ymm9
7600 vpxor %ymm2,%ymm7,%ymm7
7601
7602 vpslld $30,%ymm10,%ymm1
7603 vpxor %ymm3,%ymm0,%ymm0
7604 vpxor %ymm10,%ymm11,%ymm3
7605
7606 vpxor %ymm1,%ymm9,%ymm9
7607 vpaddd %ymm7,%ymm5,%ymm5
7608
7609 vpsrld $13,%ymm10,%ymm1
7610
7611 vpslld $19,%ymm10,%ymm2
7612 vpaddd %ymm0,%ymm5,%ymm5
7613 vpand %ymm3,%ymm4,%ymm4
7614
7615 vpxor %ymm1,%ymm9,%ymm7
7616
7617 vpsrld $22,%ymm10,%ymm1
7618 vpxor %ymm2,%ymm7,%ymm7
7619
7620 vpslld $10,%ymm10,%ymm2
7621 vpxor %ymm4,%ymm11,%ymm9
7622 vpaddd %ymm5,%ymm13,%ymm13
7623
7624 vpxor %ymm1,%ymm7,%ymm7
7625 vpxor %ymm2,%ymm7,%ymm7
7626
7627 vpaddd %ymm5,%ymm9,%ymm9
7628 vpaddd %ymm7,%ymm9,%ymm9
7629 vmovdqu 0-128(%rax),%ymm5
7630 vpaddd 256-256-128(%rbx),%ymm6,%ymm6
7631
7632 vpsrld $3,%ymm5,%ymm7
7633 vpsrld $7,%ymm5,%ymm1
7634 vpslld $25,%ymm5,%ymm2
7635 vpxor %ymm1,%ymm7,%ymm7
7636 vpsrld $18,%ymm5,%ymm1
7637 vpxor %ymm2,%ymm7,%ymm7
7638 vpslld $14,%ymm5,%ymm2
7639 vmovdqu 416-256-128(%rbx),%ymm0
7640 vpsrld $10,%ymm0,%ymm4
7641
7642 vpxor %ymm1,%ymm7,%ymm7
7643 vpsrld $17,%ymm0,%ymm1
7644 vpxor %ymm2,%ymm7,%ymm7
7645 vpslld $15,%ymm0,%ymm2
7646 vpaddd %ymm7,%ymm6,%ymm6
7647 vpxor %ymm1,%ymm4,%ymm7
7648 vpsrld $19,%ymm0,%ymm1
7649 vpxor %ymm2,%ymm7,%ymm7
7650 vpslld $13,%ymm0,%ymm2
7651 vpxor %ymm1,%ymm7,%ymm7
7652 vpxor %ymm2,%ymm7,%ymm7
7653 vpaddd %ymm7,%ymm6,%ymm6
7654 vpsrld $6,%ymm13,%ymm7
7655 vpslld $26,%ymm13,%ymm2
7656 vmovdqu %ymm6,480-256-128(%rbx)
7657 vpaddd %ymm8,%ymm6,%ymm6
7658
7659 vpsrld $11,%ymm13,%ymm1
7660 vpxor %ymm2,%ymm7,%ymm7
7661 vpslld $21,%ymm13,%ymm2
7662 vpaddd 96(%rbp),%ymm6,%ymm6
7663 vpxor %ymm1,%ymm7,%ymm7
7664
7665 vpsrld $25,%ymm13,%ymm1
7666 vpxor %ymm2,%ymm7,%ymm7
7667
7668 vpslld $7,%ymm13,%ymm2
7669 vpandn %ymm15,%ymm13,%ymm0
7670 vpand %ymm14,%ymm13,%ymm4
7671
7672 vpxor %ymm1,%ymm7,%ymm7
7673
7674 vpsrld $2,%ymm9,%ymm8
7675 vpxor %ymm2,%ymm7,%ymm7
7676
7677 vpslld $30,%ymm9,%ymm1
7678 vpxor %ymm4,%ymm0,%ymm0
7679 vpxor %ymm9,%ymm10,%ymm4
7680
7681 vpxor %ymm1,%ymm8,%ymm8
7682 vpaddd %ymm7,%ymm6,%ymm6
7683
7684 vpsrld $13,%ymm9,%ymm1
7685
7686 vpslld $19,%ymm9,%ymm2
7687 vpaddd %ymm0,%ymm6,%ymm6
7688 vpand %ymm4,%ymm3,%ymm3
7689
7690 vpxor %ymm1,%ymm8,%ymm7
7691
7692 vpsrld $22,%ymm9,%ymm1
7693 vpxor %ymm2,%ymm7,%ymm7
7694
7695 vpslld $10,%ymm9,%ymm2
7696 vpxor %ymm3,%ymm10,%ymm8
7697 vpaddd %ymm6,%ymm12,%ymm12
7698
7699 vpxor %ymm1,%ymm7,%ymm7
7700 vpxor %ymm2,%ymm7,%ymm7
7701
7702 vpaddd %ymm6,%ymm8,%ymm8
7703 vpaddd %ymm7,%ymm8,%ymm8
7704 addq $256,%rbp
7705 decl %ecx
7706 jnz .Loop_16_xx_avx2
7707
7708 movl $1,%ecx
7709 leaq 512(%rsp),%rbx
7710 leaq K256+128(%rip),%rbp
7711 cmpl 0(%rbx),%ecx
7712 cmovgeq %rbp,%r12
7713 cmpl 4(%rbx),%ecx
7714 cmovgeq %rbp,%r13
7715 cmpl 8(%rbx),%ecx
7716 cmovgeq %rbp,%r14
7717 cmpl 12(%rbx),%ecx
7718 cmovgeq %rbp,%r15
7719 cmpl 16(%rbx),%ecx
7720 cmovgeq %rbp,%r8
7721 cmpl 20(%rbx),%ecx
7722 cmovgeq %rbp,%r9
7723 cmpl 24(%rbx),%ecx
7724 cmovgeq %rbp,%r10
7725 cmpl 28(%rbx),%ecx
7726 cmovgeq %rbp,%r11
7727 vmovdqa (%rbx),%ymm7
7728 vpxor %ymm0,%ymm0,%ymm0
7729 vmovdqa %ymm7,%ymm6
7730 vpcmpgtd %ymm0,%ymm6,%ymm6
7731 vpaddd %ymm6,%ymm7,%ymm7
7732
7733 vmovdqu 0-128(%rdi),%ymm0
7734 vpand %ymm6,%ymm8,%ymm8
7735 vmovdqu 32-128(%rdi),%ymm1
7736 vpand %ymm6,%ymm9,%ymm9
7737 vmovdqu 64-128(%rdi),%ymm2
7738 vpand %ymm6,%ymm10,%ymm10
7739 vmovdqu 96-128(%rdi),%ymm5
7740 vpand %ymm6,%ymm11,%ymm11
7741 vpaddd %ymm0,%ymm8,%ymm8
7742 vmovdqu 128-128(%rdi),%ymm0
7743 vpand %ymm6,%ymm12,%ymm12
7744 vpaddd %ymm1,%ymm9,%ymm9
7745 vmovdqu 160-128(%rdi),%ymm1
7746 vpand %ymm6,%ymm13,%ymm13
7747 vpaddd %ymm2,%ymm10,%ymm10
7748 vmovdqu 192-128(%rdi),%ymm2
7749 vpand %ymm6,%ymm14,%ymm14
7750 vpaddd %ymm5,%ymm11,%ymm11
7751 vmovdqu 224-128(%rdi),%ymm5
7752 vpand %ymm6,%ymm15,%ymm15
7753 vpaddd %ymm0,%ymm12,%ymm12
7754 vpaddd %ymm1,%ymm13,%ymm13
7755 vmovdqu %ymm8,0-128(%rdi)
7756 vpaddd %ymm2,%ymm14,%ymm14
7757 vmovdqu %ymm9,32-128(%rdi)
7758 vpaddd %ymm5,%ymm15,%ymm15
7759 vmovdqu %ymm10,64-128(%rdi)
7760 vmovdqu %ymm11,96-128(%rdi)
7761 vmovdqu %ymm12,128-128(%rdi)
7762 vmovdqu %ymm13,160-128(%rdi)
7763 vmovdqu %ymm14,192-128(%rdi)
7764 vmovdqu %ymm15,224-128(%rdi)
7765
7766 vmovdqu %ymm7,(%rbx)
7767 leaq 256+128(%rsp),%rbx
7768 vmovdqu .Lpbswap(%rip),%ymm6
7769 decl %edx
7770 jnz .Loop_avx2
7771
7772
7773
7774
7775
7776
7777
7778 .Ldone_avx2:
7779 movq 544(%rsp),%rax
7780 .cfi_def_cfa %rax,8
7781 vzeroupper
7782 movq -48(%rax),%r15
7783 .cfi_restore %r15
7784 movq -40(%rax),%r14
7785 .cfi_restore %r14
7786 movq -32(%rax),%r13
7787 .cfi_restore %r13
7788 movq -24(%rax),%r12
7789 .cfi_restore %r12
7790 movq -16(%rax),%rbp
7791 .cfi_restore %rbp
7792 movq -8(%rax),%rbx
7793 .cfi_restore %rbx
7794 leaq (%rax),%rsp
7795 .cfi_def_cfa_register %rsp
7796 .Lepilogue_avx2:
7797 .byte 0xf3,0xc3
7798 .cfi_endproc
7799 .size sha256_multi_block_avx2,.-sha256_multi_block_avx2
7800 .align 256
7801 K256:
7802 .long 1116352408,1116352408,1116352408,1116352408
7803 .long 1116352408,1116352408,1116352408,1116352408
7804 .long 1899447441,1899447441,1899447441,1899447441
7805 .long 1899447441,1899447441,1899447441,1899447441
7806 .long 3049323471,3049323471,3049323471,3049323471
7807 .long 3049323471,3049323471,3049323471,3049323471
7808 .long 3921009573,3921009573,3921009573,3921009573
7809 .long 3921009573,3921009573,3921009573,3921009573
7810 .long 961987163,961987163,961987163,961987163
7811 .long 961987163,961987163,961987163,961987163
7812 .long 1508970993,1508970993,1508970993,1508970993
7813 .long 1508970993,1508970993,1508970993,1508970993
7814 .long 2453635748,2453635748,2453635748,2453635748
7815 .long 2453635748,2453635748,2453635748,2453635748
7816 .long 2870763221,2870763221,2870763221,2870763221
7817 .long 2870763221,2870763221,2870763221,2870763221
7818 .long 3624381080,3624381080,3624381080,3624381080
7819 .long 3624381080,3624381080,3624381080,3624381080
7820 .long 310598401,310598401,310598401,310598401
7821 .long 310598401,310598401,310598401,310598401
7822 .long 607225278,607225278,607225278,607225278
7823 .long 607225278,607225278,607225278,607225278
7824 .long 1426881987,1426881987,1426881987,1426881987
7825 .long 1426881987,1426881987,1426881987,1426881987
7826 .long 1925078388,1925078388,1925078388,1925078388
7827 .long 1925078388,1925078388,1925078388,1925078388
7828 .long 2162078206,2162078206,2162078206,2162078206
7829 .long 2162078206,2162078206,2162078206,2162078206
7830 .long 2614888103,2614888103,2614888103,2614888103
7831 .long 2614888103,2614888103,2614888103,2614888103
7832 .long 3248222580,3248222580,3248222580,3248222580
7833 .long 3248222580,3248222580,3248222580,3248222580
7834 .long 3835390401,3835390401,3835390401,3835390401
7835 .long 3835390401,3835390401,3835390401,3835390401
7836 .long 4022224774,4022224774,4022224774,4022224774
7837 .long 4022224774,4022224774,4022224774,4022224774
7838 .long 264347078,264347078,264347078,264347078
7839 .long 264347078,264347078,264347078,264347078
7840 .long 604807628,604807628,604807628,604807628
7841 .long 604807628,604807628,604807628,604807628
7842 .long 770255983,770255983,770255983,770255983
7843 .long 770255983,770255983,770255983,770255983
7844 .long 1249150122,1249150122,1249150122,1249150122
7845 .long 1249150122,1249150122,1249150122,1249150122
7846 .long 1555081692,1555081692,1555081692,1555081692
7847 .long 1555081692,1555081692,1555081692,1555081692
7848 .long 1996064986,1996064986,1996064986,1996064986
7849 .long 1996064986,1996064986,1996064986,1996064986
7850 .long 2554220882,2554220882,2554220882,2554220882
7851 .long 2554220882,2554220882,2554220882,2554220882
7852 .long 2821834349,2821834349,2821834349,2821834349
7853 .long 2821834349,2821834349,2821834349,2821834349
7854 .long 2952996808,2952996808,2952996808,2952996808
7855 .long 2952996808,2952996808,2952996808,2952996808
7856 .long 3210313671,3210313671,3210313671,3210313671
7857 .long 3210313671,3210313671,3210313671,3210313671
7858 .long 3336571891,3336571891,3336571891,3336571891
7859 .long 3336571891,3336571891,3336571891,3336571891
7860 .long 3584528711,3584528711,3584528711,3584528711
7861 .long 3584528711,3584528711,3584528711,3584528711
7862 .long 113926993,113926993,113926993,113926993
7863 .long 113926993,113926993,113926993,113926993
7864 .long 338241895,338241895,338241895,338241895
7865 .long 338241895,338241895,338241895,338241895
7866 .long 666307205,666307205,666307205,666307205
7867 .long 666307205,666307205,666307205,666307205
7868 .long 773529912,773529912,773529912,773529912
7869 .long 773529912,773529912,773529912,773529912
7870 .long 1294757372,1294757372,1294757372,1294757372
7871 .long 1294757372,1294757372,1294757372,1294757372
7872 .long 1396182291,1396182291,1396182291,1396182291
7873 .long 1396182291,1396182291,1396182291,1396182291
7874 .long 1695183700,1695183700,1695183700,1695183700
7875 .long 1695183700,1695183700,1695183700,1695183700
7876 .long 1986661051,1986661051,1986661051,1986661051
7877 .long 1986661051,1986661051,1986661051,1986661051
7878 .long 2177026350,2177026350,2177026350,2177026350
7879 .long 2177026350,2177026350,2177026350,2177026350
7880 .long 2456956037,2456956037,2456956037,2456956037
7881 .long 2456956037,2456956037,2456956037,2456956037
7882 .long 2730485921,2730485921,2730485921,2730485921
7883 .long 2730485921,2730485921,2730485921,2730485921
7884 .long 2820302411,2820302411,2820302411,2820302411
7885 .long 2820302411,2820302411,2820302411,2820302411
7886 .long 3259730800,3259730800,3259730800,3259730800
7887 .long 3259730800,3259730800,3259730800,3259730800
7888 .long 3345764771,3345764771,3345764771,3345764771
7889 .long 3345764771,3345764771,3345764771,3345764771
7890 .long 3516065817,3516065817,3516065817,3516065817
7891 .long 3516065817,3516065817,3516065817,3516065817
7892 .long 3600352804,3600352804,3600352804,3600352804
7893 .long 3600352804,3600352804,3600352804,3600352804
7894 .long 4094571909,4094571909,4094571909,4094571909
7895 .long 4094571909,4094571909,4094571909,4094571909
7896 .long 275423344,275423344,275423344,275423344
7897 .long 275423344,275423344,275423344,275423344
7898 .long 430227734,430227734,430227734,430227734
7899 .long 430227734,430227734,430227734,430227734
7900 .long 506948616,506948616,506948616,506948616
7901 .long 506948616,506948616,506948616,506948616
7902 .long 659060556,659060556,659060556,659060556
7903 .long 659060556,659060556,659060556,659060556
7904 .long 883997877,883997877,883997877,883997877
7905 .long 883997877,883997877,883997877,883997877
7906 .long 958139571,958139571,958139571,958139571
7907 .long 958139571,958139571,958139571,958139571
7908 .long 1322822218,1322822218,1322822218,1322822218
7909 .long 1322822218,1322822218,1322822218,1322822218
7910 .long 1537002063,1537002063,1537002063,1537002063
7911 .long 1537002063,1537002063,1537002063,1537002063
7912 .long 1747873779,1747873779,1747873779,1747873779
7913 .long 1747873779,1747873779,1747873779,1747873779
7914 .long 1955562222,1955562222,1955562222,1955562222
7915 .long 1955562222,1955562222,1955562222,1955562222
7916 .long 2024104815,2024104815,2024104815,2024104815
7917 .long 2024104815,2024104815,2024104815,2024104815
7918 .long 2227730452,2227730452,2227730452,2227730452
7919 .long 2227730452,2227730452,2227730452,2227730452
7920 .long 2361852424,2361852424,2361852424,2361852424
7921 .long 2361852424,2361852424,2361852424,2361852424
7922 .long 2428436474,2428436474,2428436474,2428436474
7923 .long 2428436474,2428436474,2428436474,2428436474
7924 .long 2756734187,2756734187,2756734187,2756734187
7925 .long 2756734187,2756734187,2756734187,2756734187
7926 .long 3204031479,3204031479,3204031479,3204031479
7927 .long 3204031479,3204031479,3204031479,3204031479
7928 .long 3329325298,3329325298,3329325298,3329325298
7929 .long 3329325298,3329325298,3329325298,3329325298
7930 .Lpbswap:
7931 .long 0x00010203,0x04050607,0x08090a0b,0x0c0d0e0f
7932 .long 0x00010203,0x04050607,0x08090a0b,0x0c0d0e0f
7933 K256_shaext:
7934 .long 0x428a2f98,0x71374491,0xb5c0fbcf,0xe9b5dba5
7935 .long 0x3956c25b,0x59f111f1,0x923f82a4,0xab1c5ed5
7936 .long 0xd807aa98,0x12835b01,0x243185be,0x550c7dc3
7937 .long 0x72be5d74,0x80deb1fe,0x9bdc06a7,0xc19bf174
7938 .long 0xe49b69c1,0xefbe4786,0x0fc19dc6,0x240ca1cc
7939 .long 0x2de92c6f,0x4a7484aa,0x5cb0a9dc,0x76f988da
7940 .long 0x983e5152,0xa831c66d,0xb00327c8,0xbf597fc7
7941 .long 0xc6e00bf3,0xd5a79147,0x06ca6351,0x14292967
7942 .long 0x27b70a85,0x2e1b2138,0x4d2c6dfc,0x53380d13
7943 .long 0x650a7354,0x766a0abb,0x81c2c92e,0x92722c85
7944 .long 0xa2bfe8a1,0xa81a664b,0xc24b8b70,0xc76c51a3
7945 .long 0xd192e819,0xd6990624,0xf40e3585,0x106aa070
7946 .long 0x19a4c116,0x1e376c08,0x2748774c,0x34b0bcb5
7947 .long 0x391c0cb3,0x4ed8aa4a,0x5b9cca4f,0x682e6ff3
7948 .long 0x748f82ee,0x78a5636f,0x84c87814,0x8cc70208
7949 .long 0x90befffa,0xa4506ceb,0xbef9a3f7,0xc67178f2
7950 .byte 83,72,65,50,53,54,32,109,117,108,116,105,45,98,108,111,99,107,32,116,114,97,110,115,102,111,114,109,32,102,111,114,32,120,56,54,95,54,52,44,32,67,82,89,80,84,79,71,65,77,83,32,98,121,32,60,97,112,112,114,111,64,111,112,101,110,115,115,108,46,111,114,103,62,0
Cache object: 8011216a24c187ff2929568b165b6d5b
|