используй lodsb/stosb mov rax,[rsi]/add rsi,8/mov [rdi],rax/add rdi,8 push /pop lea xchg fbld/fbstp movups
А чем movs плохо ? Оно сделано специально для копирования строк, это будет куда быстрее, чем цикл с mmx etc.