Архиваторы: Избыточности не существует.

GoldFinch · 11 фев 2009

gazlan, ваша "теория" - это не теория а просто набор пустых фраз. Хотите выдвинуть теорию - сначала узнайте что означает термин "теория" а потом уже пишите свои домыслы.

1. Обмен информацией происходит между источником и приемником через канал связи (Посылка сообщения).
2. Материальные аспекты переноса (масса, энергия) игнорируются.
3. Оба - источник и приемник разделяют идентичную модель системы.
(Скажем, атомный цезиевый эталон времени и ходики с кукушкой разделяют модель "часы, способные отображать текущее время с точностью до одной минуты").
4. Информация, передаваемая по каналу связи используется для синхронизации моделей (Скажем, сигналы точного времени).
5. ...
Нажмите, чтобы раскрыть...

1. что такое информация в контексте вашей теории? что такое источник информации? что такое приемник информации? что такое канал связи?
2. почему игнорируются?
3. какой системы? какой критерий идентичности?
4. как информация может использоваться для синхронизации? зачем нужна синхронизация?

...
"Рассматривая Сообщение как многомерный вектор (объект с i степенями свободы)"
какому множеству принадлежит i?

сдвиг и поворот - это аффинные преобразования, у вас вектор в каком пространстве?

"Шифрование также является" это называется не шифрование а кодирование и только для цифрового представления сообщений.

_DEN_ · 11 фев 2009

Хы) Берем гигабайтный архив rar, создаем свой архиватор и добавляем этот архив в словарь. Имеем архиватор, пакующий гигабайтный рар в несколько байт

gazlan · 11 фев 2009

1. что такое информация в контексте вашей теории? что такое источник информации? что такое приемник информации? что такое канал связи?
2. почему игнорируются?
3. какой системы? какой критерий идентичности?
4. как информация может использоваться для синхронизации? зачем нужна синхронизация?
...
"Рассматривая Сообщение как многомерный вектор (объект с i степенями свободы)"
какому множеству принадлежит i?

сдвиг и поворот - это аффинные преобразования, у вас вектор в каком пространстве?

"Шифрование также является" это называется не шифрование а кодирование и только для цифрового представления сообщений.
Нажмите, чтобы раскрыть...

1. Начну с "системы". Объект характеризуемый набором состояний (т.е. их количеством и возможностью перехода из одного в другое) и набором связей (ограничений). Скажем, правила русского языка запрещают некоторые буквы, как начальные буквы слов.

Совокупность всех использумых правил будем называть моделью системы.

Две системы могут быть (слабо) связаны между сосбой. Изменение состояния одной из них влекут изменение состояния другой.

Если такая связь существует, мы говорим об информационном обмене. Термин "информационный" в данном контексте означает, что связь настолько слаба, что энергетикой переноса можно пренебречь.

Для простоты, рассматриваем процесс влияния как однонаправленный (довольно частый случай на практике), при этом задающая система является источником сигнала, а ведомая - приемником.

Каналом связи будем называть все что угодно, что служит целям такого обмена (электрическая линия, мировой эфир, компрессор-декомпрессор) - любую "проводящую прокладку" между двумя взаимодействующими системами. Для простоты, считаем канал идеальным (нет шумов, нет потерь).

2. Реальные процессы переноса всегда сводятся к переносу массы/энергии. Однако, при информационном обмене этот перенос (поток управления) настолько незначителен по сравнению с общей
энергетикой управляемой системы (для управления используется другой источник энергии - сравните, например, с управлением автомобилем), что энергетикой обмена можно пренебречь (как это всегда делалось в Теории Информации).

3. Речь идет о модели из п.1 Идентичность означает, что оба - источник и приемник - используют ту же самую модель. На практике, подмена модели означает, по сути, дезинформацию: корректные сообщения некорректно интерпретируются. Множество литературных произведений построено именно на этом.

4. Вообще говоря, (авто)синхронизация фундаментальное свойство реальных физических систем (резонанс планет; аплодисменты, переходящие в овации итд.), вероятно отвечающее критерию энергетической устойчивости (потенциальной яме). Практически, имеется бесчисленное количество примеров, где требуется синхронизация двух моделей - от сверки часов до управления армиями. По сути, информирование - это просто синоним для синхронизации моделей.

5. Считайте, для простоты, что речь идет о счетном множестве. Все реальные объекты конечны.

6. Термины "сдвиг и поворот" употребляются только как аналогия. Не принимайте их слишком всерьез. Реальные преобразования (таже компресиия) - нелинейны.

7. Разумеется, есть разница между шифрованием и кодированием, но в данном случае я хочу подчеркнуть общие аспекты преобразования.

GoldFinch · 11 фев 2009

бред (с)

int2e · 11 фев 2009

бред вся тема изначально

leo · 12 фев 2009

Может и не бред, а философские измышлизмы, не имеющие отношения к классической шенноновской теории. Но главная неувязочка в том, что об избыточности можно говорить только в случае определения некой меры информации и некой меры затраты неких ресурсов, на передачу единицы информации. У Шеннона это все четко определено, а у философа gazlan-а нет ни того, ни другого - поэтому и понятия избыточности нет

GoldFinch · 12 фев 2009

философские измышлизмы, не имеющие отношения к классической шенноновской теории
Нажмите, чтобы раскрыть...

а также к теории как к таковой вообще и к научному подходу

gazlan · 12 фев 2009

к теории как к таковой вообще
Нажмите, чтобы раскрыть...

Спасибо за высокую оценку
На самом деле, понятие модели введено в теорию Компрессии еще в 80-х годах прошлого века и давно стало общепризнанным. Представление дискретных нелинейных преобразований как движения в многомерном криволинейном пространстве (я использовал метафору "Сдвиг и поворот") восходит к 20-м годам прошлого века (работы Г.Крона), Теория Синхронизации - вполне разработанный раздел Прикладной Математики (интересные результаты можно найти в работах И. Блехмана). Что еще осталось? Нематериальность информации - следует из самого факта пренебрежения материальными аспектами переноса. Указание на то, что информационный обмен суть синхронизация? С удовольствием ознакомлюсь с вашей точкой зрения. Желательно кроме эмоций, привести и какие-либо доводы.

cppasm · 12 фев 2009

gazlan какой смысл парить себе и другим мозги?
Для начала: static Huffman - это НЕ переименование.
За счёт переименования ты избыточность не уберёш.
Основная суть в том, что кодирование исходного сообщения рассчитано на случайные равновероятные данные.
А кодирование "сжатого" - это кодирование с учётом специфики конкретного сообщения.
Т.е. если кодировать в ANSI любой текст, получаем 256 вариантов, или 8 бит/символ.
Но если кодировать конктретное сообщение, в котором символы не равновероятны - ты получиш для часто повторяющихся символов код короче 8 бит, для редко встречающихся - возможно больше 8 бит.
Длина кода будет разная.
Так что кодирование по Хаффману это не простое переименование.
Простое переименование - это табличная замена, и никого сжатия она не даст.

gazlan · 13 фев 2009

static Huffman - это НЕ переименование
Нажмите, чтобы раскрыть...

Ознакомьтесь, для начала с алгоритмом. Это именно табличная замена. Как именно инициализированна таблица, для данного обсуждения неважно.

cppasm · 13 фев 2009

С алгоритмом я знаком, а вот ты похоже нет.
У Хаффмана переменная длина кода, а у табличной замены постоянная.

gazlan · 14 фев 2009

а у табличной замены постоянная
Нажмите, чтобы раскрыть...

??
У static Huffman ни коды ни их длины НЕ изменяются после инициализации таблицы и, в общем случае, не связаны с заданным входным потоком (таблица строится заранее для некоторого класса сообщений).

Я даже больше скажу: Любой алгоритм lossless компресии суть табличная подстановка. Всего возможны три варианта:
1. замена блоков равной длины на блоки неравной длины (ex. Huffman).
2. замена блоков неравной длины на блоки равной длины (ex. LZ).
3. комбинация двух первых (ex. LZH).

В статических методах таблица (S-box) инициализирована статически, в адаптивных - обновляется. При шифровании, в инициализации и обновлении участвует также секретный ключ. Оставляя в стороне детали реализации, компрессия - это шифрование с "прозрачным" ключом.

gazlan · 17 фев 2009

Как-то тихо ... подолью масла в огонь ... шарик под левым наперстком - следите за руками

На самом деле, я совершенно серьезен в отношении избыточности. Напомню исходное положение:

Простой мысленный эксперимент: Алиса посылает Бобу текстовое сообщение, сжав его архиватором, удалившим всю избыточность. Боб получает сообщение и разархировав его, получает копию оригинального сообщения со всей его избыточностью. По каналу связи "избыточность" не передавалась. В сжатом сообщении ее не было по определению. Вопрос: откуда она взялась в восстановленном сообщении?

Stiver пишет:

Потому что ответ тривиален: избыточность внес разархиватор.
Нажмите, чтобы раскрыть...

Легко показать абсурдность этого утверждения.

Пусть сжатое сообщение на сколько-то бит короче исходного. С точки зрения декодера (декомпрессора) на вход ему поступило "испорченное" исходное сообщение, требующее восстановления: часть бит искажена и часть - утеряна. Используя (остаточную) избыточность сжатого сообщения, декодер восстанавливает исходное: корректирует присутствующие биты и дописывает отсутствующие. Иными словами, из этого следует, что избыточность сжатого сообщения больше избыточности оригинального.

asd · 17 фев 2009

gazlan
Фиговый из тебя провокатор за 11 дней всего на 3 страницы тема.

gazlan · 17 фев 2009

Фиговый из тебя провокатор
Нажмите, чтобы раскрыть...

На самом деле - никакой провокации. Просто побочный результат размышлений на темы компрессии, шифрования и, если так выразиться, "физической" сущности информации.

Одно только (со)существование нескольких дюжин "теорий информации" - симптом неблагополучия. Количественные оценки не имеют ничего общего с качественными (приходится вводить понятие "новой" информации итп), а вероятностные методы (как указывал Колмогоров) большей частью совершенно неприменимы на практике.

Имей я готовые ответы на все вопросы - не было бы нужды заводить топик. Однако, возникло некоторое иное понимание привычных ранее вещей - и открытая дискуссия кажется мне лучшим методом оценки его правильности.

asd · 17 фев 2009

gazlan
Ну представьте уже что-то кроме

Иными словами, из этого следует,...
Нажмите, чтобы раскрыть...

желательно в виде формул, основанных на математике.

PS О да!! 4-ая страница. Мы это сделали

leo · 17 фев 2009

gazlan

По каналу связи "избыточность" не передавалась. В сжатом сообщении ее не было по определению. Вопрос: откуда она взялась в восстановленном сообщении?
Нажмите, чтобы раскрыть...

Или ты туп как дерево или прикидываешься
Избыточность незачем передавать по каналу связи, т.к. ее можно заложить в "модель системы", т.е. перевести в разряд априорного "знания", заранее известного архиватору (передатчику) и разархиватору (приемнику).
Примеров - масса. В дельта-кодировании избыточность устраняется\восстанавливается за счет априорного знания коррелированности передаваемых числовых значений, что позволяет передавать не каждое число, а только их приращения (аналогичная ситуация и с синхронизацией часов - если часы достаточно стабильны, то можно периодически "подкручивать" только секунды\миллисекунды\и т.д. и не передавать каждый раз всю эпоху). В RLE юзается априорное знание наличия в сообщении длинных серий повторяющихся символов\чисел. В классическом коде Хаффмана юзается различие вероятностей и соотв-но разное кол-во бит представления символов. В твоей интерпретации - юзается особое "преобразование координат многомерноо вектора" и соотв-но избыточность переходит в знание алгоритма этого преобразования. Если декодер\разархиватор обладает этим знанием, то он может восстановить исходное "сырое" сообщение, добавив в него избыточность по известному алгоритму. А ежели не знает, то для него закодированное без-избыточное сообщение будет выглядеть набором случайных символов

Иными словами, из этого следует, что избыточность сжатого сообщения больше избыточности оригинального
Нажмите, чтобы раскрыть...

С какой стати ?! Из этого следует, что избыточность исходного текста "настолько велика", что ее урезание до некого предела позволяет тем не менее устранять ошибки при передаче. Просто чем больше избыточность, тем больше случайных ошибок может быть устранено и наоборот - не более того.

gazlan · 17 фев 2009

в виде формул, основанных на математике
Нажмите, чтобы раскрыть...

Формулы - это просто вид стенографической записи. Не вижу нужды в греческих буквах там, где достаточно связного русского текста.

избыточность переходит в знание алгоритма этого преобразования
Нажмите, чтобы раскрыть...

Выше мы установили, что "преобразование" является простым переименованием. В таком случае, "избыточность" - некая фиктивная
характеристика, зависящая от текущей системы координат (способа наименования). Или, лучше - не является инвариантной характеристикой сообщения. Тоже для случая, когда избыточность "прячется" в кодере/декодере.

Из этого следует, что избыточность исходного текста "настолько велика", что ее урезание до некого предела позволяет тем не менее устранять ошибки при передаче
Нажмите, чтобы раскрыть...

Избыточность исходного текста не имеет никакого значения. Мы говорим о восстановлении исходного текста из сжатого. Исключая тривиальный случай простого копирования, избыточность сжатого текста в этом случае _обязана_ быть больше избыточности исходного.

GoldFinch · 17 фев 2009

Формулы - это просто вид стенографической записи. Не вижу нужды в греческих буквах там, где достаточно связного русского текста.
Нажмите, чтобы раскрыть...

это говорит о том что там где достаточно страницы текста - все можно описать несколькими формулами , только обычно необходимы несколько страниц формул чтобы чтото полностью описать

GoldFinch · 17 фев 2009

алсо ТС - или тролль или глуп

Войти или зарегистрироваться

Архиваторы: Избыточности не существует.

GoldFinch New Member

_DEN_ DEN

gazlan Member

GoldFinch New Member

int2e New Member

leo Active Member

GoldFinch New Member

gazlan Member

cppasm New Member

gazlan Member

cppasm New Member

gazlan Member

gazlan Member

asd New Member

gazlan Member

asd New Member

leo Active Member

gazlan Member

GoldFinch New Member

GoldFinch New Member

Войти или зарегистрироваться

Архиваторы: Избыточности не существует.

GoldFinch New Member

_DEN_ DEN

gazlan Member

GoldFinch New Member

int2e New Member

leo Active Member

GoldFinch New Member

gazlan Member

cppasm New Member

gazlan Member

cppasm New Member

gazlan Member

gazlan Member

asd New Member

gazlan Member

asd New Member

leo Active Member

gazlan Member

GoldFinch New Member

GoldFinch New Member

Быстрый поиск