Равное количество в битах

EvilsInterrupt · Apr 29, 2005

Я не знал как тему назвать,поэтому назвал так, хоть отдаленно но немного подходящее к задаче котороую мне надо решить.

Задача заключается в следующем:

Есть две последоватаельности байтов. Одна из 25 байтов, а другая из 32 байтов.

Надо составить последовательности так, чтобы биты были равновероятными или хотя бы стремились к этому.

Пример из двух байтов:

1010 1010

0101 0101

Если взять 7ые биты то количество 0 и 1 одинаково, такоже и в других разрядах.

Составить последовательности так, что если ты одно значение уже ввел в какую либо последовательность, то более ты уже не имеешь права вводить в ни в первую не во вторую последовательность такой же байт. То есть если в одной последовательности есть уже 4ah, то ни в этой последовательности не в другой такого значение быть не может!

Вопрос: можно ли составить такую последовательности? Если нет, та какие последовательности, наиболее будут стремиться к этим требованиям?

Спасибо за внимание

RElf · Apr 29, 2005

А зачем именно две последовательности длины 25 и 32, а не одна длины 25+32? Равновероятности битов можно добиться каждый раз беря вместе с байтом b его инверсию ~b. Но так как суммарная длина последовательностей нечетна, то точного совпадения количества нулей и единиц получить нельзя - у одного какого-то байта не будет инверсии.

EvilsInterrupt · Apr 29, 2005

Приведу кусок кода:

Code (Text):

mov ecx,256d

mov esi,offset buf

xor eax,eax

gen_buf:

mov byte ptr[esi],al

inc esi

inc eax

loop buf

...

buf db 256d dup(0)

Если ты заглянешь в отладчик и посмотришь buf, после loop тебе много станет понятно!

Только не смейся, если че смешного нашел ))

RElf · Apr 29, 2005

Если ты заглянешь в отладчик и посмотришь buf, после loop тебе много станет понятно!
Click to expand...

Можно и не заглядывать. В buf будет последовательность байт от 0 до 0xFF. И как это связано с исходной задачей?

EvilsInterrupt · Apr 29, 2005

Тогда если ты глянешь на смещения в этом буфер на 41h до скажем 5Ah и с 0с0h до 0dfh ну а далее на аналогичные массивы! ТО именно в этих последовательность мне не нравится статичность, поэтому я хочу сделать свой массив в которых будет куда получше чем в оригинальных массивах!

RElf · Apr 30, 2005

Тогда если ты глянешь на смещения в этом буфер на 41h до скажем 5Ah и с 0с0h до 0dfh ну а далее на аналогичные массивы! ТО именно в этих последовательность мне не нравится статичность, поэтому я хочу сделать свой массив в которых будет куда получше чем в оригинальных массивах!
Click to expand...

Борешся со статическим распознаванием текста? Замена тут не сильно поможет так как легко распознается частотным анализом. Почему бы вместо этого, например, просто не зашифровать текст каким-нибудь поточным алгоритмом (например, RC4) на фиксированном ключе. Тогда на выходе будет нечто неотличимое от случайной последовательности байт со всеми хорошими статистическими свойствами.

iron_nomad · Apr 30, 2005

RElf

может помочь, т.к. имена файлов как правило не более 40 символов, а этого не достаточно для анализа, плюс это ведь будет загрыто сверху более стойким шифром, к примеру twofish

С RC4 я не знаком, но посмотрю его.

Плюс не мог бы ты посоветовать алгоритм в котором можно шифровать только используя ключ шифрования, рса не предлагать - громоздко!

The Svin · May 1, 2005

Я опять ничего не понял

Нужен алгоритм генерации нового числа с таким же количеством бит как в заданном?

RElf · May 1, 2005

Плюс не мог бы ты посоветовать алгоритм в котором можно шифровать только используя ключ шифрования, рса не предлагать - громоздко!
Click to expand...

Все алгоритмы асимметричной криптографии так или иначе "громозки". В качестве альтернатывы RSA можно посмотреть на ElGamal и NTRU.

iron_nomad · May 1, 2005

>нового числа

Последовательности, а речь идет о том чтобы убрать частотность битов в кодировке win-1258. К примеру если ты составишь массив по коду выше, то увидишь, что по смещению 41h и так до Z стоит лат.алфавит загланых букв у них у каждой буквы 6й бит равен "1"

flankerx · May 1, 2005

плюс это ведь будет загрыто сверху более стойким шифром, к примеру twofish
Click to expand...

а если поверх нормальный алгоритм -- то нафига ты вообще этот огород городишь?

Честно говоря, я не вижу особой связи между исходной постановкой задачи и тем, что тут обсуждается

Задача заключается в следующем:

Есть две последоватаельности байтов. Одна из 25 байтов, а другая из 32 байтов.

Надо составить последовательности так, чтобы биты были равновероятными или хотя бы стремились к этому
Click to expand...

На это сеществуют генераторы псевдослучайных последовательностей. Тот же RC4, например. Любой блочный шифр в режиме CTR. И многое другое.

iron_nomad · May 1, 2005

Code (Text):

41 42 43 44 45 46 47 48 49 4A 4B 4C 4D 4E 4F @ABCDEFGHIJKLMNO

Это кусок из дампа. Если теперь это посмотреть как на биты, то:

Code (Text):

0100 0001

0100 0010

0100 0011

0100 0100

0100 0101

0100 0110

0100 0111

0100 1000

0100 1001

0100 1010

0100 1011

0100 1100

0100 1101

0100 1110

0100 1111

Ка видно каждая "буква" лат.алфавита прописных букв содержит в 6м

бите "1" и в 5м "0". В строчных буквах тоже есть статичность. В

русском алфавите тоже есть, как в заглавных так и в строчных. Мне

нужно избавиться от этой статичности! Для этого я подумал об новой

кодировке, которая бы убирала эту статичность.

Критерии бы к кодировке были бы таковы:

1. Каждый байт уникален, иначе это не кодировка

2. Если смотреть на биты последовательности, скажем лат. заглавные,

то в этой последовательности биты должны стремиться к равновероят-

ности, Т.е. если расположить байты, как я расположил выше, то в 7м

бите должно быть одинаковое кол-во "1" и "0", и в 6м, и в 5м, и в 4м,

и так далее...

Или максимально стремиться к этому!

Я предполагаю что из-за того, что каждый байт должен быть уникален,

то 2й критерий полностью неможет выполниться, более того, у меня

чувство, что одна последовательность будет более соответствовать 2му

критерею чем другая, а я бы не хотел такого. Лучше бы одинаково

распредилить статичность, как на заглавные и строчные любого алфавита.

flankerx · May 1, 2005

ну а в чем проблема?

выпиши все свои abcd...xyz и под ними напиши _случайные_ байты (из любого нормального ГПСЧ). Или вообще возьми base32/base64.

а вообще ИМХО то что ты делаешь -- это глупость (или я чего-то не понимаю). Избыточность содержится не в способе кодировки -- она в самом языке.

iron_nomad · May 1, 2005

flankerx

То что в языке это я знаю, но когда избыточность убрана из битов это уже получше.

iron_nomad · May 1, 2005

flankerx

и еще спасибо, за подсказку, но я так и делал, но на человеческие мозги в генерации хороших последовательность лучше не полагаться

valterg · May 4, 2005

EvilsInterrupt

На выбор два алгоритма.

1) Не учитываем избыточность : просто генерим случайные последовательности из 8 бит, проверяя на "повторы".

2) С учетом избыточности : код Huffman-a - часто встречающиеся буквы будут кодироваться меньшим числом бит и равновероятнось 0/1 идеальна с учетом дискретности материала. Для достижения более идеальной равновероятности у того же Huffmana предлагается кодировать пары и тройки букв и т.д до слов.

+++++++++++++++++++++

А собственно любой алгоритм сжатия и выдаст равновероятный поток битов.

EvilsInterrupt · May 4, 2005

valterg

Интересных тебе багов! старший товарищ. ))

EvilsInterrupt · May 4, 2005

http://www.compression.ru/download/articles/huff/huffman_1952_minimum- redundancy-codes.pdf

НАверное это ты имел в виду?

Log in or Sign up

Равное количество в битах

EvilsInterrupt Постигающий азы дзена

RElf New Member

EvilsInterrupt Постигающий азы дзена

RElf New Member

EvilsInterrupt Постигающий азы дзена

RElf New Member

iron_nomad New Member

The Svin New Member

RElf New Member

iron_nomad New Member

flankerx New Member

iron_nomad New Member

flankerx New Member

iron_nomad New Member

iron_nomad New Member

valterg Active Member

EvilsInterrupt Постигающий азы дзена

EvilsInterrupt Постигающий азы дзена

Log in or Sign up

Равное количество в битах

EvilsInterrupt Постигающий азы дзена

RElf New Member

EvilsInterrupt Постигающий азы дзена

RElf New Member

EvilsInterrupt Постигающий азы дзена

RElf New Member

iron_nomad New Member

The Svin New Member

RElf New Member

iron_nomad New Member

flankerx New Member

iron_nomad New Member

flankerx New Member

iron_nomad New Member

iron_nomad New Member

valterg Active Member

EvilsInterrupt Постигающий азы дзена

EvilsInterrupt Постигающий азы дзена

Useful Searches