gazlan, ваша "теория" - это не теория а просто набор пустых фраз. Хотите выдвинуть теорию - сначала узнайте что означает термин "теория" а потом уже пишите свои домыслы. 1. что такое информация в контексте вашей теории? что такое источник информации? что такое приемник информации? что такое канал связи? 2. почему игнорируются? 3. какой системы? какой критерий идентичности? 4. как информация может использоваться для синхронизации? зачем нужна синхронизация? ... "Рассматривая Сообщение как многомерный вектор (объект с i степенями свободы)" какому множеству принадлежит i? сдвиг и поворот - это аффинные преобразования, у вас вектор в каком пространстве? "Шифрование также является" это называется не шифрование а кодирование и только для цифрового представления сообщений.
Хы) Берем гигабайтный архив rar, создаем свой архиватор и добавляем этот архив в словарь. Имеем архиватор, пакующий гигабайтный рар в несколько байт
1. Начну с "системы". Объект характеризуемый набором состояний (т.е. их количеством и возможностью перехода из одного в другое) и набором связей (ограничений). Скажем, правила русского языка запрещают некоторые буквы, как начальные буквы слов. Совокупность всех использумых правил будем называть моделью системы. Две системы могут быть (слабо) связаны между сосбой. Изменение состояния одной из них влекут изменение состояния другой. Если такая связь существует, мы говорим об информационном обмене. Термин "информационный" в данном контексте означает, что связь настолько слаба, что энергетикой переноса можно пренебречь. Для простоты, рассматриваем процесс влияния как однонаправленный (довольно частый случай на практике), при этом задающая система является источником сигнала, а ведомая - приемником. Каналом связи будем называть все что угодно, что служит целям такого обмена (электрическая линия, мировой эфир, компрессор-декомпрессор) - любую "проводящую прокладку" между двумя взаимодействующими системами. Для простоты, считаем канал идеальным (нет шумов, нет потерь). 2. Реальные процессы переноса всегда сводятся к переносу массы/энергии. Однако, при информационном обмене этот перенос (поток управления) настолько незначителен по сравнению с общей энергетикой управляемой системы (для управления используется другой источник энергии - сравните, например, с управлением автомобилем), что энергетикой обмена можно пренебречь (как это всегда делалось в Теории Информации). 3. Речь идет о модели из п.1 Идентичность означает, что оба - источник и приемник - используют ту же самую модель. На практике, подмена модели означает, по сути, дезинформацию: корректные сообщения некорректно интерпретируются. Множество литературных произведений построено именно на этом. 4. Вообще говоря, (авто)синхронизация фундаментальное свойство реальных физических систем (резонанс планет; аплодисменты, переходящие в овации итд.), вероятно отвечающее критерию энергетической устойчивости (потенциальной яме). Практически, имеется бесчисленное количество примеров, где требуется синхронизация двух моделей - от сверки часов до управления армиями. По сути, информирование - это просто синоним для синхронизации моделей. 5. Считайте, для простоты, что речь идет о счетном множестве. Все реальные объекты конечны. 6. Термины "сдвиг и поворот" употребляются только как аналогия. Не принимайте их слишком всерьез. Реальные преобразования (таже компресиия) - нелинейны. 7. Разумеется, есть разница между шифрованием и кодированием, но в данном случае я хочу подчеркнуть общие аспекты преобразования.
Может и не бред, а философские измышлизмы, не имеющие отношения к классической шенноновской теории. Но главная неувязочка в том, что об избыточности можно говорить только в случае определения некой меры информации и некой меры затраты неких ресурсов, на передачу единицы информации. У Шеннона это все четко определено, а у философа gazlan-а нет ни того, ни другого - поэтому и понятия избыточности нет
Спасибо за высокую оценку На самом деле, понятие модели введено в теорию Компрессии еще в 80-х годах прошлого века и давно стало общепризнанным. Представление дискретных нелинейных преобразований как движения в многомерном криволинейном пространстве (я использовал метафору "Сдвиг и поворот") восходит к 20-м годам прошлого века (работы Г.Крона), Теория Синхронизации - вполне разработанный раздел Прикладной Математики (интересные результаты можно найти в работах И. Блехмана). Что еще осталось? Нематериальность информации - следует из самого факта пренебрежения материальными аспектами переноса. Указание на то, что информационный обмен суть синхронизация? С удовольствием ознакомлюсь с вашей точкой зрения. Желательно кроме эмоций, привести и какие-либо доводы.
gazlan какой смысл парить себе и другим мозги? Для начала: static Huffman - это НЕ переименование. За счёт переименования ты избыточность не уберёш. Основная суть в том, что кодирование исходного сообщения рассчитано на случайные равновероятные данные. А кодирование "сжатого" - это кодирование с учётом специфики конкретного сообщения. Т.е. если кодировать в ANSI любой текст, получаем 256 вариантов, или 8 бит/символ. Но если кодировать конктретное сообщение, в котором символы не равновероятны - ты получиш для часто повторяющихся символов код короче 8 бит, для редко встречающихся - возможно больше 8 бит. Длина кода будет разная. Так что кодирование по Хаффману это не простое переименование. Простое переименование - это табличная замена, и никого сжатия она не даст.
Ознакомьтесь, для начала с алгоритмом. Это именно табличная замена. Как именно инициализированна таблица, для данного обсуждения неважно.
С алгоритмом я знаком, а вот ты похоже нет. У Хаффмана переменная длина кода, а у табличной замены постоянная.
?? У static Huffman ни коды ни их длины НЕ изменяются после инициализации таблицы и, в общем случае, не связаны с заданным входным потоком (таблица строится заранее для некоторого класса сообщений). Я даже больше скажу: Любой алгоритм lossless компресии суть табличная подстановка. Всего возможны три варианта: 1. замена блоков равной длины на блоки неравной длины (ex. Huffman). 2. замена блоков неравной длины на блоки равной длины (ex. LZ). 3. комбинация двух первых (ex. LZH). В статических методах таблица (S-box) инициализирована статически, в адаптивных - обновляется. При шифровании, в инициализации и обновлении участвует также секретный ключ. Оставляя в стороне детали реализации, компрессия - это шифрование с "прозрачным" ключом.
Как-то тихо ... подолью масла в огонь ... шарик под левым наперстком - следите за руками На самом деле, я совершенно серьезен в отношении избыточности. Напомню исходное положение: Простой мысленный эксперимент: Алиса посылает Бобу текстовое сообщение, сжав его архиватором, удалившим всю избыточность. Боб получает сообщение и разархировав его, получает копию оригинального сообщения со всей его избыточностью. По каналу связи "избыточность" не передавалась. В сжатом сообщении ее не было по определению. Вопрос: откуда она взялась в восстановленном сообщении? Stiver пишет: Легко показать абсурдность этого утверждения. Пусть сжатое сообщение на сколько-то бит короче исходного. С точки зрения декодера (декомпрессора) на вход ему поступило "испорченное" исходное сообщение, требующее восстановления: часть бит искажена и часть - утеряна. Используя (остаточную) избыточность сжатого сообщения, декодер восстанавливает исходное: корректирует присутствующие биты и дописывает отсутствующие. Иными словами, из этого следует, что избыточность сжатого сообщения больше избыточности оригинального.
На самом деле - никакой провокации. Просто побочный результат размышлений на темы компрессии, шифрования и, если так выразиться, "физической" сущности информации. Одно только (со)существование нескольких дюжин "теорий информации" - симптом неблагополучия. Количественные оценки не имеют ничего общего с качественными (приходится вводить понятие "новой" информации итп), а вероятностные методы (как указывал Колмогоров) большей частью совершенно неприменимы на практике. Имей я готовые ответы на все вопросы - не было бы нужды заводить топик. Однако, возникло некоторое иное понимание привычных ранее вещей - и открытая дискуссия кажется мне лучшим методом оценки его правильности.
gazlan Ну представьте уже что-то кроме желательно в виде формул, основанных на математике. PS О да!! 4-ая страница. Мы это сделали
gazlan Или ты туп как дерево или прикидываешься Избыточность незачем передавать по каналу связи, т.к. ее можно заложить в "модель системы", т.е. перевести в разряд априорного "знания", заранее известного архиватору (передатчику) и разархиватору (приемнику). Примеров - масса. В дельта-кодировании избыточность устраняется\восстанавливается за счет априорного знания коррелированности передаваемых числовых значений, что позволяет передавать не каждое число, а только их приращения (аналогичная ситуация и с синхронизацией часов - если часы достаточно стабильны, то можно периодически "подкручивать" только секунды\миллисекунды\и т.д. и не передавать каждый раз всю эпоху). В RLE юзается априорное знание наличия в сообщении длинных серий повторяющихся символов\чисел. В классическом коде Хаффмана юзается различие вероятностей и соотв-но разное кол-во бит представления символов. В твоей интерпретации - юзается особое "преобразование координат многомерноо вектора" и соотв-но избыточность переходит в знание алгоритма этого преобразования. Если декодер\разархиватор обладает этим знанием, то он может восстановить исходное "сырое" сообщение, добавив в него избыточность по известному алгоритму. А ежели не знает, то для него закодированное без-избыточное сообщение будет выглядеть набором случайных символов С какой стати ?! Из этого следует, что избыточность исходного текста "настолько велика", что ее урезание до некого предела позволяет тем не менее устранять ошибки при передаче. Просто чем больше избыточность, тем больше случайных ошибок может быть устранено и наоборот - не более того.
Формулы - это просто вид стенографической записи. Не вижу нужды в греческих буквах там, где достаточно связного русского текста. Выше мы установили, что "преобразование" является простым переименованием. В таком случае, "избыточность" - некая фиктивная характеристика, зависящая от текущей системы координат (способа наименования). Или, лучше - не является инвариантной характеристикой сообщения. Тоже для случая, когда избыточность "прячется" в кодере/декодере. Избыточность исходного текста не имеет никакого значения. Мы говорим о восстановлении исходного текста из сжатого. Исключая тривиальный случай простого копирования, избыточность сжатого текста в этом случае _обязана_ быть больше избыточности исходного.
это говорит о том что там где достаточно страницы текста - все можно описать несколькими формулами , только обычно необходимы несколько страниц формул чтобы чтото полностью описать