Здравствуйте! Вот вполне стандартный фрагмент кода для сложения длинных целых чисел в дополнительном коде (занимающих не одно слово, а массив слов): Код (Text): mov edi,dword ptr [edx+4] // // edi = p2 [1]; mov eax,dword ptr [ecx+4] // // eax = p1 [1]; adc eax,edi // cf,eax = p1 [1] + p2 [1]+cf; mov dword ptr [ecx+4],eax // p1 [1] = eax; mov edi,dword ptr [edx+8] // // edi = p2 [2]; mov eax,dword ptr [ecx+8] // // eax = p1 [2]; adc eax,edi // cf,eax = p1 [2] + p2 [2]+cf; mov dword ptr [ecx+8],eax // p1 [2] = eax; ... Померено, что на любом Athlon-е от Thunderbird-а до 64-го каждый блок из четырех команд выполняется за 2 такта, на Pentium 3 - за 4 такта, а на Pentium 4 Northwood - за 8 тактов . Может ли кто подсказать - как переписать код для того, чтобы он быстро выполнялся на пне? Регистр ebx занят под счетчик цикла, esi свободен.