Hex Artifact Content
Not logged in

Artifact 5d771412ff38ed4a000d53b86c31eabf0682db74:


0000: 64 6e 6c 20 20 49 6e 74 65 6c 20 50 65 6e 74 69  dnl  Intel Penti
0010: 75 6d 20 6d 70 6e 5f 63 6f 70 79 64 20 2d 2d 20  um mpn_copyd -- 
0020: 63 6f 70 79 20 6c 69 6d 62 20 76 65 63 74 6f 72  copy limb vector
0030: 2c 20 64 65 63 72 65 6d 65 6e 74 69 6e 67 2e 0a  , decrementing..
0040: 0a 64 6e 6c 20 20 43 6f 70 79 72 69 67 68 74 20  .dnl  Copyright 
0050: 31 39 39 36 2c 20 32 30 30 31 2c 20 32 30 30 32  1996, 2001, 2002
0060: 20 46 72 65 65 20 53 6f 66 74 77 61 72 65 20 46   Free Software F
0070: 6f 75 6e 64 61 74 69 6f 6e 2c 20 49 6e 63 2e 0a  oundation, Inc..
0080: 64 6e 6c 20 0a 64 6e 6c 20 20 54 68 69 73 20 66  dnl .dnl  This f
0090: 69 6c 65 20 69 73 20 70 61 72 74 20 6f 66 20 74  ile is part of t
00a0: 68 65 20 47 4e 55 20 4d 50 20 4c 69 62 72 61 72  he GNU MP Librar
00b0: 79 2e 0a 64 6e 6c 20 0a 64 6e 6c 20 20 54 68 65  y..dnl .dnl  The
00c0: 20 47 4e 55 20 4d 50 20 4c 69 62 72 61 72 79 20   GNU MP Library 
00d0: 69 73 20 66 72 65 65 20 73 6f 66 74 77 61 72 65  is free software
00e0: 3b 20 79 6f 75 20 63 61 6e 20 72 65 64 69 73 74  ; you can redist
00f0: 72 69 62 75 74 65 20 69 74 20 61 6e 64 2f 6f 72  ribute it and/or
0100: 0a 64 6e 6c 20 20 6d 6f 64 69 66 79 20 69 74 20  .dnl  modify it 
0110: 75 6e 64 65 72 20 74 68 65 20 74 65 72 6d 73 20  under the terms 
0120: 6f 66 20 74 68 65 20 47 4e 55 20 4c 65 73 73 65  of the GNU Lesse
0130: 72 20 47 65 6e 65 72 61 6c 20 50 75 62 6c 69 63  r General Public
0140: 20 4c 69 63 65 6e 73 65 20 61 73 0a 64 6e 6c 20   License as.dnl 
0150: 20 70 75 62 6c 69 73 68 65 64 20 62 79 20 74 68   published by th
0160: 65 20 46 72 65 65 20 53 6f 66 74 77 61 72 65 20  e Free Software 
0170: 46 6f 75 6e 64 61 74 69 6f 6e 3b 20 65 69 74 68  Foundation; eith
0180: 65 72 20 76 65 72 73 69 6f 6e 20 32 2e 31 20 6f  er version 2.1 o
0190: 66 20 74 68 65 0a 64 6e 6c 20 20 4c 69 63 65 6e  f the.dnl  Licen
01a0: 73 65 2c 20 6f 72 20 28 61 74 20 79 6f 75 72 20  se, or (at your 
01b0: 6f 70 74 69 6f 6e 29 20 61 6e 79 20 6c 61 74 65  option) any late
01c0: 72 20 76 65 72 73 69 6f 6e 2e 0a 64 6e 6c 20 0a  r version..dnl .
01d0: 64 6e 6c 20 20 54 68 65 20 47 4e 55 20 4d 50 20  dnl  The GNU MP 
01e0: 4c 69 62 72 61 72 79 20 69 73 20 64 69 73 74 72  Library is distr
01f0: 69 62 75 74 65 64 20 69 6e 20 74 68 65 20 68 6f  ibuted in the ho
0200: 70 65 20 74 68 61 74 20 69 74 20 77 69 6c 6c 20  pe that it will 
0210: 62 65 20 75 73 65 66 75 6c 2c 0a 64 6e 6c 20 20  be useful,.dnl  
0220: 62 75 74 20 57 49 54 48 4f 55 54 20 41 4e 59 20  but WITHOUT ANY 
0230: 57 41 52 52 41 4e 54 59 3b 20 77 69 74 68 6f 75  WARRANTY; withou
0240: 74 20 65 76 65 6e 20 74 68 65 20 69 6d 70 6c 69  t even the impli
0250: 65 64 20 77 61 72 72 61 6e 74 79 20 6f 66 0a 64  ed warranty of.d
0260: 6e 6c 20 20 4d 45 52 43 48 41 4e 54 41 42 49 4c  nl  MERCHANTABIL
0270: 49 54 59 20 6f 72 20 46 49 54 4e 45 53 53 20 46  ITY or FITNESS F
0280: 4f 52 20 41 20 50 41 52 54 49 43 55 4c 41 52 20  OR A PARTICULAR 
0290: 50 55 52 50 4f 53 45 2e 20 20 53 65 65 20 74 68  PURPOSE.  See th
02a0: 65 20 47 4e 55 0a 64 6e 6c 20 20 4c 65 73 73 65  e GNU.dnl  Lesse
02b0: 72 20 47 65 6e 65 72 61 6c 20 50 75 62 6c 69 63  r General Public
02c0: 20 4c 69 63 65 6e 73 65 20 66 6f 72 20 6d 6f 72   License for mor
02d0: 65 20 64 65 74 61 69 6c 73 2e 0a 64 6e 6c 20 0a  e details..dnl .
02e0: 64 6e 6c 20 20 59 6f 75 20 73 68 6f 75 6c 64 20  dnl  You should 
02f0: 68 61 76 65 20 72 65 63 65 69 76 65 64 20 61 20  have received a 
0300: 63 6f 70 79 20 6f 66 20 74 68 65 20 47 4e 55 20  copy of the GNU 
0310: 4c 65 73 73 65 72 20 47 65 6e 65 72 61 6c 20 50  Lesser General P
0320: 75 62 6c 69 63 0a 64 6e 6c 20 20 4c 69 63 65 6e  ublic.dnl  Licen
0330: 73 65 20 61 6c 6f 6e 67 20 77 69 74 68 20 74 68  se along with th
0340: 65 20 47 4e 55 20 4d 50 20 4c 69 62 72 61 72 79  e GNU MP Library
0350: 3b 20 73 65 65 20 74 68 65 20 66 69 6c 65 20 43  ; see the file C
0360: 4f 50 59 49 4e 47 2e 4c 49 42 2e 20 20 49 66 0a  OPYING.LIB.  If.
0370: 64 6e 6c 20 20 6e 6f 74 2c 20 77 72 69 74 65 20  dnl  not, write 
0380: 74 6f 20 74 68 65 20 46 72 65 65 20 53 6f 66 74  to the Free Soft
0390: 77 61 72 65 20 46 6f 75 6e 64 61 74 69 6f 6e 2c  ware Foundation,
03a0: 20 49 6e 63 2e 2c 20 35 39 20 54 65 6d 70 6c 65   Inc., 59 Temple
03b0: 20 50 6c 61 63 65 20 2d 0a 64 6e 6c 20 20 53 75   Place -.dnl  Su
03c0: 69 74 65 20 33 33 30 2c 20 42 6f 73 74 6f 6e 2c  ite 330, Boston,
03d0: 20 4d 41 20 30 32 31 31 31 2d 31 33 30 37 2c 20   MA 02111-1307, 
03e0: 55 53 41 2e 0a 0a 69 6e 63 6c 75 64 65 28 60 2e  USA...include(`.
03f0: 2e 2f 63 6f 6e 66 69 67 2e 6d 34 27 29 0a 0a 0a  ./config.m4')...
0400: 43 20 50 35 3a 20 31 2e 32 35 20 63 79 63 6c 65  C P5: 1.25 cycle
0410: 73 2f 6c 69 6d 62 0a 0a 0a 43 20 76 6f 69 64 20  s/limb...C void 
0420: 6d 70 6e 5f 63 6f 70 79 64 20 28 6d 70 5f 70 74  mpn_copyd (mp_pt
0430: 72 20 64 73 74 2c 20 6d 70 5f 73 72 63 70 74 72  r dst, mp_srcptr
0440: 20 73 72 63 2c 20 6d 70 5f 73 69 7a 65 5f 74 20   src, mp_size_t 
0450: 73 69 7a 65 29 3b 0a 43 0a 43 20 53 65 65 20 63  size);.C.C See c
0460: 6f 6d 6d 65 6e 74 73 20 69 6e 20 63 6f 70 79 69  omments in copyi
0470: 2e 61 73 6d 2e 0a 0a 64 65 66 66 72 61 6d 65 28  .asm...defframe(
0480: 50 41 52 41 4d 5f 53 49 5a 45 2c 31 32 29 0a 64  PARAM_SIZE,12).d
0490: 65 66 66 72 61 6d 65 28 50 41 52 41 4d 5f 53 52  efframe(PARAM_SR
04a0: 43 2c 20 38 29 0a 64 65 66 66 72 61 6d 65 28 50  C, 8).defframe(P
04b0: 41 52 41 4d 5f 44 53 54 2c 20 34 29 0a 0a 50 52  ARAM_DST, 4)..PR
04c0: 4f 4c 4f 47 55 45 28 6d 70 6e 5f 63 6f 70 79 64  OLOGUE(mpn_copyd
04d0: 29 0a 64 65 66 6c 69 74 28 60 46 52 41 4d 45 27  ).deflit(`FRAME'
04e0: 2c 30 29 0a 0a 09 6d 6f 76 6c 09 50 41 52 41 4d  ,0)...movl.PARAM
04f0: 5f 53 52 43 2c 20 25 65 61 78 0a 09 6d 6f 76 6c  _SRC, %eax..movl
0500: 09 50 41 52 41 4d 5f 53 49 5a 45 2c 20 25 65 63  .PARAM_SIZE, %ec
0510: 78 0a 0a 09 70 75 73 68 6c 09 25 65 73 69 09 46  x...pushl.%esi.F
0520: 52 41 4d 45 5f 70 75 73 68 6c 28 29 0a 09 70 75  RAME_pushl()..pu
0530: 73 68 6c 09 25 65 64 69 09 46 52 41 4d 45 5f 70  shl.%edi.FRAME_p
0540: 75 73 68 6c 28 29 0a 0a 09 6c 65 61 6c 09 2d 34  ushl()...leal.-4
0550: 28 25 65 61 78 2c 25 65 63 78 2c 34 29 2c 20 25  (%eax,%ecx,4), %
0560: 65 61 78 09 09 43 20 26 73 72 63 5b 73 69 7a 65  eax..C &src[size
0570: 2d 31 5d 0a 09 6d 6f 76 6c 09 50 41 52 41 4d 5f  -1]..movl.PARAM_
0580: 44 53 54 2c 20 25 65 64 78 0a 0a 09 73 75 62 6c  DST, %edx...subl
0590: 09 24 37 2c 20 25 65 63 78 09 09 09 43 20 73 69  .$7, %ecx...C si
05a0: 7a 65 2d 37 0a 09 6a 6c 65 09 4c 28 65 6e 64 29  ze-7..jle.L(end)
05b0: 0a 0a 09 6d 6f 76 6c 09 32 38 2d 34 28 25 65 64  ...movl.28-4(%ed
05c0: 78 2c 25 65 63 78 2c 34 29 2c 20 25 65 73 69 09  x,%ecx,4), %esi.
05d0: 09 43 20 70 72 65 66 65 74 63 68 20 63 61 63 68  .C prefetch cach
05e0: 65 2c 20 64 73 74 5b 73 69 7a 65 2d 31 5d 0a 09  e, dst[size-1]..
05f0: 6e 6f 70 0a 0a 4c 28 74 6f 70 29 3a 0a 09 43 20  nop..L(top):..C 
0600: 65 61 78 09 73 72 63 2c 20 64 65 63 72 65 6d 65  eax.src, decreme
0610: 6e 74 69 6e 67 0a 09 43 20 65 62 78 0a 09 43 20  nting..C ebx..C 
0620: 65 63 78 09 63 6f 75 6e 74 65 72 2c 20 6c 69 6d  ecx.counter, lim
0630: 62 73 0a 09 43 20 65 64 78 09 64 73 74 0a 09 43  bs..C edx.dst..C
0640: 20 65 73 69 09 73 63 72 61 74 63 68 0a 09 43 20   esi.scratch..C 
0650: 65 64 69 09 73 63 72 61 74 63 68 0a 09 43 20 65  edi.scratch..C e
0660: 62 70 0a 0a 09 6d 6f 76 6c 09 32 38 2d 33 32 28  bp...movl.28-32(
0670: 25 65 64 78 2c 25 65 63 78 2c 34 29 2c 20 25 65  %edx,%ecx,4), %e
0680: 73 69 09 43 20 70 72 65 66 65 74 63 68 20 64 73  si.C prefetch ds
0690: 74 20 63 61 63 68 65 20 6c 69 6e 65 0a 09 73 75  t cache line..su
06a0: 62 6c 09 24 38 2c 20 25 65 63 78 0a 0a 09 6d 6f  bl.$8, %ecx...mo
06b0: 76 6c 09 28 25 65 61 78 29 2c 20 25 65 73 69 09  vl.(%eax), %esi.
06c0: 09 09 43 20 72 65 61 64 20 77 6f 72 64 73 20 70  ..C read words p
06d0: 61 69 72 77 69 73 65 0a 09 6d 6f 76 6c 09 2d 34  airwise..movl.-4
06e0: 28 25 65 61 78 29 2c 20 25 65 64 69 0a 09 6d 6f  (%eax), %edi..mo
06f0: 76 6c 09 25 65 73 69 2c 20 35 36 28 25 65 64 78  vl.%esi, 56(%edx
0700: 2c 25 65 63 78 2c 34 29 09 09 43 20 73 74 6f 72  ,%ecx,4)..C stor
0710: 65 20 77 6f 72 64 73 20 70 61 69 72 77 69 73 65  e words pairwise
0720: 0a 09 6d 6f 76 6c 09 25 65 64 69 2c 20 35 32 28  ..movl.%edi, 52(
0730: 25 65 64 78 2c 25 65 63 78 2c 34 29 0a 0a 09 6d  %edx,%ecx,4)...m
0740: 6f 76 6c 09 2d 38 28 25 65 61 78 29 2c 20 25 65  ovl.-8(%eax), %e
0750: 73 69 0a 09 6d 6f 76 6c 09 2d 31 32 28 25 65 61  si..movl.-12(%ea
0760: 78 29 2c 20 25 65 64 69 0a 09 6d 6f 76 6c 09 25  x), %edi..movl.%
0770: 65 73 69 2c 20 34 38 28 25 65 64 78 2c 25 65 63  esi, 48(%edx,%ec
0780: 78 2c 34 29 0a 09 6d 6f 76 6c 09 25 65 64 69 2c  x,4)..movl.%edi,
0790: 20 34 34 28 25 65 64 78 2c 25 65 63 78 2c 34 29   44(%edx,%ecx,4)
07a0: 0a 0a 09 6d 6f 76 6c 09 2d 31 36 28 25 65 61 78  ...movl.-16(%eax
07b0: 29 2c 20 25 65 73 69 0a 09 6d 6f 76 6c 09 2d 32  ), %esi..movl.-2
07c0: 30 28 25 65 61 78 29 2c 20 25 65 64 69 0a 09 6d  0(%eax), %edi..m
07d0: 6f 76 6c 09 25 65 73 69 2c 20 34 30 28 25 65 64  ovl.%esi, 40(%ed
07e0: 78 2c 25 65 63 78 2c 34 29 0a 09 6d 6f 76 6c 09  x,%ecx,4)..movl.
07f0: 25 65 64 69 2c 20 33 36 28 25 65 64 78 2c 25 65  %edi, 36(%edx,%e
0800: 63 78 2c 34 29 0a 0a 09 6d 6f 76 6c 09 2d 32 34  cx,4)...movl.-24
0810: 28 25 65 61 78 29 2c 20 25 65 73 69 0a 09 6d 6f  (%eax), %esi..mo
0820: 76 6c 09 2d 32 38 28 25 65 61 78 29 2c 20 25 65  vl.-28(%eax), %e
0830: 64 69 0a 09 6d 6f 76 6c 09 25 65 73 69 2c 20 33  di..movl.%esi, 3
0840: 32 28 25 65 64 78 2c 25 65 63 78 2c 34 29 0a 09  2(%edx,%ecx,4)..
0850: 6d 6f 76 6c 09 25 65 64 69 2c 20 32 38 28 25 65  movl.%edi, 28(%e
0860: 64 78 2c 25 65 63 78 2c 34 29 0a 0a 09 6c 65 61  dx,%ecx,4)...lea
0870: 6c 09 2d 33 32 28 25 65 61 78 29 2c 20 25 65 61  l.-32(%eax), %ea
0880: 78 0a 09 6a 67 09 4c 28 74 6f 70 29 0a 0a 0a 4c  x..jg.L(top)...L
0890: 28 65 6e 64 29 3a 0a 09 43 20 65 63 78 09 2d 37  (end):..C ecx.-7
08a0: 20 74 6f 20 30 2c 20 72 65 70 72 65 73 65 6e 74   to 0, represent
08b0: 69 6e 67 20 72 65 73 70 65 63 74 69 76 65 6c 79  ing respectively
08c0: 20 30 20 74 6f 20 37 20 6c 69 6d 62 73 20 72 65   0 to 7 limbs re
08d0: 6d 61 69 6e 69 6e 67 0a 09 43 20 65 61 78 09 73  maining..C eax.s
08e0: 72 63 20 65 6e 64 0a 09 43 20 65 64 78 09 64 73  rc end..C edx.ds
08f0: 74 2c 20 6e 65 78 74 20 6c 6f 63 61 74 69 6f 6e  t, next location
0900: 20 74 6f 20 73 74 6f 72 65 0a 0a 09 61 64 64 6c   to store...addl
0910: 09 24 34 2c 20 25 65 63 78 0a 09 6a 6c 65 09 4c  .$4, %ecx..jle.L
0920: 28 6e 6f 34 29 0a 0a 09 6d 6f 76 6c 09 28 25 65  (no4)...movl.(%e
0930: 61 78 29 2c 20 25 65 73 69 0a 09 6d 6f 76 6c 09  ax), %esi..movl.
0940: 2d 34 28 25 65 61 78 29 2c 20 25 65 64 69 0a 09  -4(%eax), %edi..
0950: 6d 6f 76 6c 09 25 65 73 69 2c 20 38 28 25 65 64  movl.%esi, 8(%ed
0960: 78 2c 25 65 63 78 2c 34 29 0a 09 6d 6f 76 6c 09  x,%ecx,4)..movl.
0970: 25 65 64 69 2c 20 34 28 25 65 64 78 2c 25 65 63  %edi, 4(%edx,%ec
0980: 78 2c 34 29 0a 0a 09 6d 6f 76 6c 09 2d 38 28 25  x,4)...movl.-8(%
0990: 65 61 78 29 2c 20 25 65 73 69 0a 09 6d 6f 76 6c  eax), %esi..movl
09a0: 09 2d 31 32 28 25 65 61 78 29 2c 20 25 65 64 69  .-12(%eax), %edi
09b0: 0a 09 6d 6f 76 6c 09 25 65 73 69 2c 20 28 25 65  ..movl.%esi, (%e
09c0: 64 78 2c 25 65 63 78 2c 34 29 0a 09 6d 6f 76 6c  dx,%ecx,4)..movl
09d0: 09 25 65 64 69 2c 20 2d 34 28 25 65 64 78 2c 25  .%edi, -4(%edx,%
09e0: 65 63 78 2c 34 29 0a 0a 09 73 75 62 6c 09 24 31  ecx,4)...subl.$1
09f0: 36 2c 20 25 65 61 78 0a 09 73 75 62 6c 09 24 34  6, %eax..subl.$4
0a00: 2c 20 25 65 63 78 0a 4c 28 6e 6f 34 29 3a 0a 0a  , %ecx.L(no4):..
0a10: 09 61 64 64 6c 09 24 32 2c 20 25 65 63 78 0a 09  .addl.$2, %ecx..
0a20: 6a 6c 65 09 4c 28 6e 6f 32 29 0a 0a 09 6d 6f 76  jle.L(no2)...mov
0a30: 6c 09 28 25 65 61 78 29 2c 20 25 65 73 69 0a 09  l.(%eax), %esi..
0a40: 6d 6f 76 6c 09 2d 34 28 25 65 61 78 29 2c 20 25  movl.-4(%eax), %
0a50: 65 64 69 0a 09 6d 6f 76 6c 09 25 65 73 69 2c 20  edi..movl.%esi, 
0a60: 28 25 65 64 78 2c 25 65 63 78 2c 34 29 0a 09 6d  (%edx,%ecx,4)..m
0a70: 6f 76 6c 09 25 65 64 69 2c 20 2d 34 28 25 65 64  ovl.%edi, -4(%ed
0a80: 78 2c 25 65 63 78 2c 34 29 0a 0a 09 73 75 62 6c  x,%ecx,4)...subl
0a90: 09 24 38 2c 20 25 65 61 78 0a 09 73 75 62 6c 09  .$8, %eax..subl.
0aa0: 24 32 2c 20 25 65 63 78 0a 4c 28 6e 6f 32 29 3a  $2, %ecx.L(no2):
0ab0: 0a 0a 09 6a 6e 7a 09 4c 28 64 6f 6e 65 29 0a 0a  ...jnz.L(done)..
0ac0: 09 6d 6f 76 6c 09 28 25 65 61 78 29 2c 20 25 65  .movl.(%eax), %e
0ad0: 63 78 0a 09 6d 6f 76 6c 09 25 65 63 78 2c 20 28  cx..movl.%ecx, (
0ae0: 25 65 64 78 29 09 43 20 72 69 73 6b 20 6f 66 20  %edx).C risk of 
0af0: 63 61 63 68 65 20 62 61 6e 6b 20 63 6c 61 73 68  cache bank clash
0b00: 20 68 65 72 65 0a 0a 4c 28 64 6f 6e 65 29 3a 0a   here..L(done):.
0b10: 09 70 6f 70 6c 09 25 65 64 69 0a 09 70 6f 70 6c  .popl.%edi..popl
0b20: 09 25 65 73 69 0a 0a 09 72 65 74 0a 0a 45 50 49  .%esi...ret..EPI
0b30: 4c 4f 47 55 45 28 29 0a                          LOGUE().