Программирование вычислительных алгоритмов

1212 · 7 янв 2009

Кто подскажет как написать программу на АС-ме для воспроизведения, например, полинома 5-й степени используя фиксированную запятую (8, 16, 32 разряда)?

Freeman · 7 янв 2009

используя поразрядное суммирование и умножение.

1212 · 7 янв 2009

Спасибо!
Как применить Ваш совет к примеру: y= ax^5 - b*x^3 + x при следующих значениях
a= 120,
b= 6,
c=1
{x} = -2...+2 ?

murder · 7 янв 2009

для 4 можно на SSE

Код (Text):

movaps xmm0,dqword[xxxx] ;x,1,1,1

movaps xmm1,xmm0

shufps xmm1,xmm1,11110000b

mulps xmm0,xmm1 ;x^2,x,1,1

shufps xmm1,xmm1,11111100b

mulps xmm0,xmm1 ;x^3,x^2,x,1

shufps xmm1,xmm1,11111111b

mulps xmm0,xmm1 ;x^4,x^3,x^2,x

mulps xmm0,dqword[abcd] ;dx^4,cx^3,bx^2,ax

movhlps xmm1,xmm0

addps xmm0,xmm1 ;dx^4+bx^2,cx^3+ax

movaps xmm1,xmm0

shufps xmm0,xmm0,1

addss xmm0,xmm1 ;dx^4+bx^2+cx^3+ax

-//-

align 16

abcd dd 0.7,0.9,0.4,0.1 ;коэффиценты

xxxx dd 1.0,1.0,1.0,2.0 ;x=2

Добавлено:
C фиксированой запятой не знаю может MMX или SSE2. Но в любом случае для 5 степени нужна высокая точность желательно поболее 32 (если x не целое в диапазоне [-2;2]).

1212 · 7 янв 2009

Весь фокус в том, чтобы с фиксированной запятой!
Нет сложности на FPU, но не тот "коленкор"!

1212 · 7 янв 2009

Еще более сложнее и интереснее если:
a=1/120,
b=1/6,
c=1!

1212 · 9 янв 2009

Господа!
Дайте ваши комментарии на мое решение мною же поставленной задачи.
Исходное уравнение
у= 120*х^5 - 6*х^3 + x
при изменении аргумента от -2 до +2.
Решение.
Исходное уравнение преобразовал по схеме Горнера:
у=х*((6*х^2)*((20*х^2)-1)+1)
Арифметический алгоритм:
у1=х*х
у2=20*у1
у3=у2-1
у4=6*у1
у5=у3*у4
у6=у5+1
у7=у=у6*х.
Умножение на 20 и 6 выполнял не с помощью команды imul, а методом
сдвига и сложения. Шаг изменения аргумента взял равным 0,125.
Основное тело программы:
mov ax,x
imul ax
mov cx,dx ;cx->(x^2)*(2^-)2
shld dx,ax,2
mov bx,dx ;dx->x^2=y1
;----------------------------
add cx,dx ;cx->20*x^2=y2
;-----------------------------
sub cx,100h ;cx->(20*x^2-1)=y3
;---------------------------------
mov ax,bx
sar bx,1
add ax,bx ;ax->(6*x^2)=y4
;--------------------------------
imul cx
shld dx,ax,2 ;dx->y5=y4*y3
;-------------------------------
add dx,10h ;dx->y6=y5+1
;--------------------------------
mov ax,x
imul dx
shld dx,ax,2 ;dx->y6*x=y
mov y,dx
Программа написана для MS DOS (для ускорения ускорения отладки).
Наибольшая абсолютная ошибка вычисления составила 0,1640625, при наибольшем значении полинома 3794, математиическое ожидание погрешности - 0,041666667, дисперсия - 0,003430752
Готов ответить на любые вопросы по программе и методу реализации вычислений.
Нетрудно подсчитать объем ОЗУ, который требует эта программа, и число тактав
на ее исполнение. Согласен,что есть недостатки в стилистике, алгоритмизации,
в программипрвании. Вся работа над программой заняла 2 часа.
Жду ваши комментарии и вопросы, господа!

murder · 9 янв 2009

Насчёт мат. части х.з.

Если хочешь увеличить быстродействие замени shld на

Код (Text):

SHR REG2, 30

LEA REG1, [REG1*4 + REG2]

Можно и на MMX (SSE2) переписать

Forever · 9 янв 2009

По мат. части :

Исходное уравнение преобразовал по схеме Горнера:
у=х*((6*х^2)*((20*х^2)-1)+1)
Нажмите, чтобы раскрыть...

Это НЕ схема Горнера. =) Это схема имени тебя.

Freeman · 9 янв 2009

используя фиксированную запятую (8, 16, 32 разряда)?
Нажмите, чтобы раскрыть...

чтото я не пойму, то 8,16,32 разряда, то ограничиваемся шагом 0,125 изменения значения аргумента, почему не 1e-32?

Программа написана для MS DOS (для ускорения ускорения отладки)
Нажмите, чтобы раскрыть...

насколько отладчик под ДОС ускоряет ускоряет процесс отладки? и как он это делает?

1212 · 9 янв 2009

Уважаемый murder!
Спасибо за ответ!.
1. Теоретически, судя по описаниям процессоров, команды SHR и SHLD выполняются одинаково и за одно и тоже время, практически - я специально не проверял.
2. Бесусловно представляет интерес написать программу, реализующую этот алгоритм с
использованием технологии ММХ!
3. Я не силен в сленге Асс-щиков, но что означает Х.З.! Надеюсь не совсем плохое?!
Жду еще вопросов, с уважением, 1212.

Уважаемый Forever!
Вы наверное математик! Очень приятно, ведь не часто встречаются на подобных форумах профессионалы в нескольких областях! Прошу простить, это действительно не схема Горнера, а лишь только начальная стадия преобразования полинома, которую предложил Горнер для нахождения корней полинома!
Желаю Вам успехов на избранном поприще!
Жду еще вопросов, с уважением, 1212.

Уважаемый Freeman!
Спасибо за вопросы. Если есть вопросы, следовательно я не был понят. Все беды на Земле не от того, что люди злы и вредные, а от того, что мы друг-друга не понимаем!(Это я цитировал кого-то)/
1. Программа специально написана для 16-ти разрядной машины с представлением данных в форме с фиксированной запятой. (См. начало диалога по теме). Предложения о FPU менее интересны. Дело в том, что иногда приходится применять для реализации вычислительных алгоритмов процессоры, не имеющие формат плавающей запятой (например процессоры Blacfin фирмы Analog Devices). Нет смысла стрелять по
воробьям ракетами типа земля-земля. Можно проектировать программы для вычислительных алгоритмов использую фиксированную запятую. Такие программы обеспечат требуюмую точность, но будут исполняться быстрее, при этом занимая в ОЗУ гораздо меньше объема!
2. Если в предложенной программе заменить во всех регистрах Х на h или l, (разумеется поменяв определения для переменных), то программа будет работоспособна для байтовых переменных. точность будет хуже. По моей оценке наибольшая ошибка будет 70-100, при том же наибольшем значении полинома. Если ко всем РОНам в программе приписать букву Е, то программа будет обрабатывать данные 32-х разрядные. Точность повысится примерно в 5000 раз. Шаг изменения аргумента взят 0,125, Вы совершенно правы, с потолка. При этом шаге число точек вычислений полинома будет 33, что достаточно для
построения графика в EXEL. Вы совершенно правильно заметели, что шаг кратен целой степени двойки. Это резко повышает точность!
3. Говоря о повышении производительности при написании программы для MS DOS, я имел в виду себя лично и мое конкретное рабочее место с моим лично инструментарием. Не более!
Жду еще вопросов, с уважением, 1212.

Freeman · 10 янв 2009

не ожтдал от вас столь развернутого ответа

Я не силен в сленге Асс-щиков, но что означает Х.З.!
Нажмите, чтобы раскрыть...

дык это всемирно извесное выражение.. х. знает

Программа специально написана для 16-ти разрядной машины с представлением данных в форме с фиксированной запятой.
Нажмите, чтобы раскрыть...

данные можно записывать не только в регистры, что может существенно повысить разрядность обрабатываемых данных.

иногда приходится применять для реализации вычислительных алгоритмов процессоры
Нажмите, чтобы раскрыть...

для реализации применяецо мозг и компилятор. процессор лишь выполняет прогу.

например процессоры Blacfin фирмы Analog Devices
Нажмите, чтобы раскрыть...

довольно серъезный проц. можно под него и земля-земля накодеть

я имел в виду себя лично и мое конкретное рабочее место с моим лично инструментарием.
Нажмите, чтобы раскрыть...

нудык мы не экстрасенсы

murder · 10 янв 2009

1212
На процессорах AMD инструкция shld декодируется программно (т.н. VectorPath) и за такт может быть декодирована только одна такая инструкция. Аппаратно декодируемые инструкции (т.н. DirectPath) могут быть декодированы в количестве 3 штук за такт. Кроме того shr и lea выполняются в разных модулях обработки т.е. параллельно.

В AMD Athlon Processor x86 Code Optimization Guide есть оддельная тема про shld.

Программа специально написана для 16-ти разрядной машины
Нажмите, чтобы раскрыть...

Тогда MMX, а также 32-битный lea и инфа о shld не актуальны.

deLight · 10 янв 2009

Вот.. сделали бесплатно лабу человеку ))

Freeman · 10 янв 2009

deLight вы не правы

deLight · 10 янв 2009

ну так скучно когда кто-то всегда прав... =)

1212
>Дело в том, что иногда приходится применять для реализации вычислительных алгоритмов процессоры, не имеющие формат плавающей запятой (например процессоры Blacfin фирмы Analog Devices)

а где это используется, если не секрет?

murder · 10 янв 2009

а где это используется, если не секрет?
Нажмите, чтобы раскрыть...

Видимо для автоматизации производственных процессов.

1212 · 10 янв 2009

Уважаемые Ассемблерщики!
Для того, чтобы проблема была более понятной, (а все беды на Земле из-за непонимания друг друга) приведу конкретные цифры.
Если приведенный арифметический алгоритм реализовать «в лоб», без команды SHLD после каждой операции умножения, то будем иметь следующий результат:
наш полином пятого порядка имеет наибольшие значения (3794) на краях интервала изменения аргумента, т.е. при Х=+2 или – 2. Наибольший машинный Х -> 4000h, т.е. полностью использует разрядную сетку ЦВМ. При таком машинном аргументе программа написанная «в лоб» дает машинное значение полинома 0007H. Заметьте, это наибольшее значение полинома. Программа, написанная с использованием команды SHLD после каждой операции умножения, дает машинное значение полинома 7690H. Т.е. наибольшее значение полинома полностью использует информационную часть разрядной сетки процессора (не имеет балластом 12 старших информационных битов). Вывод: применение SHLD в предложенном варианте реализации вычислительного алгоритма повышает точность в 4096 раз!
Я акцентирую ваше внимание на один из возможных СПОСООВ ПОЛУЧЕНИЯ НАИБОЛЬШЕЙ ТОЧНОСТИ при реализации вычислительных алгоритмов на ассемблере!
Когда разработчики промышленных систем не имели возможность использовать импортные процессоры, то очень часто использовались 1810ВМ86. Этот процессор не имеет команду SHLD. Тогда мы применяли такую конструкцию для повышения точности команды умножения
Mov ax,x
Mov bx,ax
Imul bx
Sar dx, 1 ; повышение точности при одном разряде запаса по точности,
Sar ax, 1 ; если запас по точности в два разряда, то конструкцию
Adc dx,0 ; повторяют еще раз
В этом смысле SHLD лишь механизм для улучшения качества выполнения операции умножения.
Уважаемый murder, спасибо за высокопрофессиональный совет! Я этого не знал. Учту на будущее. Вы совершенно правы показывая всем, что ассембреристы должны очень хорошо знать аппаратную часть процессора, для которого пишут программы на языке низкого уровня!
Более интересной и практически значимой будет вторая задача:
Y= X - X^3/6 + X^5/120 при том же диапазоне изменения аргумента. Наверное многие вспомнили, что этот полином – три первых члена разложения в ряд Маклорена SIN(X). Если пытаться новый полином реализовать «в лоб» путем применения операции деления получим У=Х (проверьте!)
Если 1/6 и 1/120 заменить на соответствующие вычисленные коэффициенты, то эти коэффициенты будут периодическими дробями, т.е неточными, да прибавится погрешность при переводе этих коэффициентов в двоичную систему. Конечная дробь в одной системе счисления не обязательно будет конечной дробью в двоичной системе. Так конечная в десятичной системе дробь 0,8 есть периодическая дробь 0,(110) в двоичной.
Кто знает как решить задачу вычисления синуса по вышеприведенной формуле для 16-ти разрядных ЦВМ? Оптимальное решение этой задачи должно давать погрешность не хуже 0,1 процента. Это очень высокая точность. Разумеется, 32-х разрядные ЦВМ дадут значительно лучшую точность.
Ответ на вопрос а где это применяется – практически вами дан. В системах автоматизации производственных процессов! При этом будем под «это» понимать умение реализовывать вычислительные алгоритмы с предельной для используемой разрядности точностью. Стрельба из «земля-земля» (см. выше) – то же производственный процесс. Более конкретнее – системы управления подвижными объектами, роботами. Системы обработки радиолокационных сигналов.
Уважаемый delight если эта маленькая программка поможет Вам в лабораторных работах, то это очень прекрасно! Разберитесь в поставленных проблемах и методах их решения досконально и Вы сможете самостоятельно защитить лабораторку. Успехов Вам!
Жду ваших вопросов, коллеги!
С уважением, 1212

Mikl___ · 11 янв 2009

1212
Если в ваших приложениях требуется, чтобы значения синусов имели высокую точность можно написать программу вычисления синуса, но в большинстве случаев можно воспользоваться таблицей значений синусов углов. Для получения значения синуса любого угла от 0 до 360º достаточно получить значения синусов для углов от 0 до 90º. Остальное дополнит симметрия. В процедуре FIND_SIN табличная функция использзуется для преобразования угла в синус. Функция получает значение угла от 0 до 360º в регистре AX и возвращает значение синуса в регистре BX. Амплитуды синусов хранятся в виде целых чисел в таблице SIN. Они должны быть разделены на 10000 перед использованием.

Код (Text):

Sin dw 0,175,349,523,698,872; 0-5

dw 1045,1219,1392,1564,1736; 6-10

dw 1908,2079,2250,2419,2588; 11-15

dw 2756,2924,3090,3256,3420; 16-20

dw 3584,3746,3907,4067,4226; 21-25

dw 4384,4540,4695,4848,5000; 26-30

dw 5150,5299,5446,5592,5736; 31-35

dw 5878,6018,6157,6293,6428; 36-40

dw 6561,6691,6820,6947,7071; 41-45

dw 7193,7313,7431,7547,7660; 46-50

dw 7771,7880,7986,8090,8191; 51-55

dw 8290,8387,8480,8572,8660; 56-60

dw 8746,8829,8910,8988,9063; 61-65

dw 9135,9205,9272,9336,9397; 66-70

dw 9455,9511,9563,9613,9659; 71-75

dw 9703,9744,9781,9816,9848; 76-80

dw 9877,9903,9926,9945,9962; 81-85

dw 9976,9986,9994,9998,10000;86-90

proc find_sin

push ax

cmp ax,181

jb a2

sub ax,180

cmp ax,91

jb a1

neg ax

add ax,180

a1: add ax,ax

mov bx,sin[ax]

neg bx

jmp a4

a2: cmp ax,91

jb a3

neg ax

add ax,180

a3: add ax,ax

mov bx,sin[ax]

a4: pop ax

retn

endp find_sin

murder · 11 янв 2009

1212
Ну вот нашёл демку. Может пригодится.

Код (Text):

org 100h

mov al,13h

int 10h

push word 09000h

pop ds

xor si,si

mov di,395

Singen:mov [si],ch

add cx,di

mov ax,40

imul cx

sub di,dx

inc si

jnz Singen

push word 0A000h

pop es

xchg ax,dx

aloop:xor di,di

mov bl,200

yloop:mov cx,320

xloop:mov al,[bx]

mov si,cx

add al,[si]

add si,dx

add al,[si]

and al,dh

stosb

loop xloop

dec bl

jnz yloop

inc dx

jmp aloop

Войти или зарегистрироваться

Программирование вычислительных алгоритмов

1212 New Member

Freeman New Member

1212 New Member

murder Member

1212 New Member

1212 New Member

1212 New Member

murder Member

Forever Виталий

Freeman New Member

1212 New Member

Freeman New Member

murder Member

deLight New Member

Freeman New Member

deLight New Member

murder Member

1212 New Member

Mikl___ Супермодератор Команда форума

murder Member

Войти или зарегистрироваться

Программирование вычислительных алгоритмов

1212 New Member

Freeman New Member

1212 New Member

murder Member

1212 New Member

1212 New Member

1212 New Member

murder Member

Forever Виталий

Freeman New Member

1212 New Member

Freeman New Member

murder Member

deLight New Member

Freeman New Member

deLight New Member

murder Member

1212 New Member

Mikl___ Супермодератор Команда форума

murder Member

Быстрый поиск