Результаты поиска

Сообщение

Помощь с MMX

Если _size кратно 8, то примерно так: q1 dq 0706050403020100h q2 dq 0808080808080808h movzx eax,byte [_key] movd mm1,eax mov ecx,[_size]...

Сообщение от: leo, 24 янв 2009 в разделе: WASM.BEGINNERS

Сообщение

парсинг файла: как быстрее?

varnie Во-первых, советуют читать блочно по сравнению с дебильным вариантом т.е. посимвольного чтения с помощью АПИ ReadFile(hFile,buf,1,..),...

Сообщение от: leo, 23 янв 2009 в разделе: LANGS.C

Сообщение

парсинг файла: как быстрее?

varnie Каков вопрос - таков и ответ ;) То вообще беспочвенные рассуждения, то конкретная цифра "до неск килобайт (теоретически)", а теперь...

Сообщение от: leo, 23 янв 2009 в разделе: LANGS.C

Сообщение

парсинг файла: как быстрее?

varnie "Идею о первоначальном считывании всего файла" никто не забраковывал, т.к. все дело в размере файла. При обычном буферированном чтении (без...

Сообщение от: leo, 23 янв 2009 в разделе: LANGS.C

Сообщение

x86 Optimization Manuals

cppasm Ха-ха. И где же ты тут видишь 6 "операций" ?. Как я и предполагал, речь идет не об инструкциях или микрооперациях, а о высокоуровневых...

Сообщение от: leo, 16 янв 2009 в разделе: WASM.A&O

Сообщение

x86 Optimization Manuals

murder После декодирования VectorPath инструкции превращаются в последовательность микроопераций. Поэтому, во-первых, правильнее говорить не "по...

Сообщение от: leo, 15 янв 2009 в разделе: WASM.A&O

Сообщение

x86 Optimization Manuals

cppasm Это где же ты такое в "ихних мануалах" увидел ?! Может с SSE путаешь - 4 float параллельно ? Ничего "переводить" не нужно. Юзай...

Сообщение от: leo, 15 янв 2009 в разделе: WASM.A&O

Сообщение

Размещение данных на жестком диске

stellaco Интересно, каким образом добавление собственного заголовка в начало каждого кластера\страницы может ускорить доступ ? А если хочешь...

Сообщение от: leo, 14 янв 2009 в разделе: WASM.BEGINNERS

Сообщение

Пространства адресов

SII Дело не в процах, а в том что в 64-битном long mode используется плоская модель памяти (базовые адреса и переопределения сегментов кроме...

Сообщение от: leo, 13 янв 2009 в разделе: WASM.BEGINNERS

Сообщение

Пространства адресов

SII Не логическими, а линейными. В 1 томе мануала АМД-64 Technology (chapter 2. Memory model) все достаточно четко расписано: 1) Виртуальное...

Сообщение от: leo, 13 янв 2009 в разделе: WASM.BEGINNERS

Сообщение

x86 Optimization Manuals

murder Не обязательно долгое и не обязательно составного. Например: inc ebx ;(1) mov ecx,[ebx] ;(2) - явная зависимость от (1) по ebx mov...

Сообщение от: leo, 12 янв 2009 в разделе: WASM.A&O

Сообщение

Как организовать таймер?

_DEN_ Все имеет свою "гранулярность" ;) Поэтому перед юзаньем ММ-таймера не забудь вызвать timeBeginPeriod(1), иначе можешь получить ту же...

Сообщение от: leo, 12 янв 2009 в разделе: WASM.WIN32

Сообщение

x86 Optimization Manuals

В варианте "или" - вообще никаких зависимостей нет, т.к. кажущаяся зависимость по reg1 в современных процах устраняется за счет переименования...

Сообщение от: leo, 12 янв 2009 в разделе: WASM.A&O

Сообщение

x86 - Время выполнения

exst Латентность веществ.деления зависит от требуемой точности (single,double,extended). В SSE точность определяется типом операции и соотв-но...

Сообщение от: leo, 12 янв 2009 в разделе: WASM.ZEN

Сообщение

x86 - Время выполнения

exst Латентности инструкций приводятся в мануалах по оптимизации - у АМД подробно (практически для всех команд и вариаций операндов), а у Интел...

Сообщение от: leo, 11 янв 2009 в разделе: WASM.ZEN

Сообщение

Помогите с подсчётом колличества тактов процессора

Pavia Правильно. Поэтому: Что померить ? Правильно, среднее число тактов на одну итерацию цикла с учетом 1) возможного перекрытия итераций, 2)...

Сообщение от: leo, 9 янв 2009 в разделе: WASM.BEGINNERS

Сообщение

[abs(x)] Люди добрые подскажите плиз

Классика получения abs(eax) без усл.перехода: ;neg eax = (not eax)+1 cdq xor eax,edx sub eax,edx

Сообщение от: leo, 6 янв 2009 в разделе: WASM.BEGINNERS

Сообщение

Оптимизация времени выполнения процедуры.

Span На уровне оптимизации кода - устранения зависимой операции sum+=..., путем разбивки ее на 4 независимых sumd[0]+=.., sumd[1]+=.. и т.д. Т.к....

Сообщение от: leo, 5 янв 2009 в разделе: WASM.BEGINNERS

Сообщение

x86 Optimization Manuals

murder Во-первых, физ.адреса выделяются страницами по 4К, поэтому "непоследовательность" проявляется только при переходах от одной 4К страницы к...

Сообщение от: leo, 5 янв 2009 в разделе: WASM.A&O

Сообщение

x86 Optimization Manuals

murder Отличие некэшируемой записи movnt от обычной WB-записи заключается в том, что при movnt данные копятся в спец.WC-буферах (write combining)...

Сообщение от: leo, 5 янв 2009 в разделе: WASM.A&O

Результаты поиска

Быстрый поиск