Обсуждение статьи SadKo "Кодирование Хаффмана"

SadKo · 20 авг 2017

статья в разделе "Публикации"

yashechka · 20 авг 2017

Ого, какой ты краусаучик, завтра прочитаю обязательно. Это нужно перенести в статьи!!!
Призываю всех написать по одной статье как Садко!!!

SadKo · 20 авг 2017

На самом деле, это давнишние статьи, Mikl___ запросил разрешения на публикацию их здесь.
Вообще, я планирую цикл статей по SIMD написать, но чуть позже.

yashechka · 20 авг 2017

Все правильно, так и надо
Наш ресурс должен стать самым посещаемым, а чтобы он был таким нужен годный контент.

Мановар · 21 авг 2017

SadKo сказал(а): ↑

Вообще, я планирую цикл статей по SIMD написать, но чуть позже.
Нажмите, чтобы раскрыть...

Жду с нетерпением. Инфа есть, но как то вся разбросана, не систематизирована. Думаю будет очень актуально.

gazlan · 21 авг 2017

> Здесь должно быть какое-нибудь заумное высказывание
Размышления. Трансформатор Хаффмана
http://www.proza.ru/2017/06/14/138

Мановар · 22 авг 2017

yashechka сказал(а): ↑

Призываю всех написать по одной статье как Садко!!!
Нажмите, чтобы раскрыть...

Это надо оформить как ежегодные членские взносы. А кто не будет писать отключим от сайта.
Шутка, шуткой, а предложение хорошее. Ведь каждый где то, в чем то, что то да сможет интересное или полезное написать. Получится может и не много, но в нескольких разных областях, что для контента не плохо. Поддерживаю.
yashechka, но в таких статьях, на мой взгляд, не должно быть посторонних от тематики, тем. Все обсуждения должны быть конкретно только по теме, без всякого отступления и лирики. Так что кое что из выше написанного предлагаю или в отдельную тему, или вообще убрать. А то люди будут про кодирование Хоффмана читать, а тут наши философские рассуждения о сайте.

sniper · 24 авг 2017

Мановар сказал(а): ↑

Шутка, шуткой, а предложение хорошее. Ведь каждый где то, в чем то, что то да сможет интересное или полезное написать.
Нажмите, чтобы раскрыть...

Не факт, уважаемый, не факт.
То есть Вы считаете, что среднестатистический пользователь ветки WASM.BEGINNERS сможет написать интересную статью?

Мановар · 24 авг 2017

Там еще есть слово - полезное.

TermoSINteZ · 24 авг 2017

Мановар, ок, предлагаю вам начать с себя. А то на словах все Львы ТОлстые....

Мановар · 24 авг 2017

TermoSINteZ сказал(а): ↑

А то на словах все Львы ТОлстые....
Нажмите, чтобы раскрыть...

При чем тут Лев Николаевич? Я по моему себя с ним не сравнивал, да и вообще ни с кем. yashechka, предложил, я поддержал. Может и написал чего нибудь, да только не знаю чего надо, опыта то у меня по сравнению с другими пользователями почти никакого.

TermoSINteZ · 24 авг 2017

Мановар сказал(а): ↑

опыта то у меня по сравнению с другими пользователями почти никакого.
Нажмите, чтобы раскрыть...

Об этом и речь, что перед тем, как задвигать предложения, наподобие этого:

Мановар сказал(а): ↑

Это надо оформить как ежегодные членские взносы. А кто не будет писать отключим от сайта.
Нажмите, чтобы раскрыть...

нужно прикинуть, как вы почувствуете себя, на месте тех, кто не будет писать. Яшечка предлагал совсем другое.
А Лев Николаевич хоть и не причем, но фраза очень даже в тему.

Мановар · 24 авг 2017

TermoSINteZ, у Вас что, с чувством юмора туго или его вообще нет?

Мановар сказал(а): ↑

Шутка, шуткой, а предложение хорошее.
Нажмите, чтобы раскрыть...

TermoSINteZ сказал(а): ↑

нужно прикинуть, как вы почувствуете себя, на месте тех, кто не будет писать.
Нажмите, чтобы раскрыть...

Можете отключить.

TermoSINteZ сказал(а): ↑

Яшечка предлагал совсем другое.
Нажмите, чтобы раскрыть...

Я прекрасно понял что он предлагал, поэтому и написал что поддерживаю. Вы сообщения в теме читаете?

TermoSINteZ · 24 авг 2017

Ну если вы поддерживаете его, так возьмите и напишите.

Mikl___ · 25 авг 2017

Мановар,
предложение хорошее. В конце концов не боги горшки обжигают. Но если, по какой-то причине, нельзя написать статью самостоятельно, то можно выкладывать ссылки на статьи других авторов, контент которых попадает под низкоуровневое программирование или будет интересен другим. Сайт необходимо наполнять статьями, идеями и т.д.

gazlan · 13 ноя 2017

Решил добавить в двух словах основные тезисы

Трансформатор Хаффмана - теоретическая часть

Алгоритм компрессии данных Давида Хаффмана ("Трансформатор Хаффмана") описан в сотнях (если не тысячах) статей, но я не знаю ни одной, где это было бы сделано правильно

Во-первых, алгоритм Хаффмана связывают исключительно с текстом. Между тем, текст - один из вариантов представления фрактала (для простоты не будем различать истинные - бесконечные фракталы и конечные предфракталы). То, что текст - фрактальный объект следует, например, из его эквивалентного представления другим классическим фрактальным объектом - деревом.

Трансформация Хаффмана применима к произвольному фрактальному объекту. Такой объект может быть отображен на другой (в том числе, двойственный) фрактальный объект с иным правилом разбиения. Выбор минимального набора элементов (например, минимального числа разновесов при взвешивании) отвечает оптимальной стратегии разбиения и эквивалентен алгоритму Хаффмана.

Во-вторых, при описании алгоритма Хаффмана умалчивается, что вторая фаза алгоритма является инверсией построенного на первом шаге дерева максимальной высоты.

Это затемняет тот факт, что с инверсией дерева связано понятие инварианта трансформации - в терминологии Клода Шеннона "количество информации" в сообщении.

Два экстремальных (двойственных) варианта полностью сбалансированного дерева - это симметричное дерево минимальной высоты, обычно, называемое просто "сбалансированным деревом", высота которого есть (двоичный) логарифм от числа терминальных узлов ("дерево Хартли") и дерево максимальной высоты ("дерево Фибоначчи").

Инверсия Хаффмана заключается в сопоставлении каждому терминальному узлу построенного в первой фазе алгоритма дерева максимальной высоты (в пределе - дерева Фибоначчи) инцидентной к нему ветви. При этом каждому терминальному узлу ставится в соответствие код этой ветви таким образом, что узел с наибольшим весом (самый частый символ) получает наиболее короткий код. В результате, код этого узла имеет наименьшую долю в полном кодовом пространстве и, наоборот, код с наименьшим весом (самый редкий символ) получает наибольшую долю. В результате такого выравнивания происходит симметрирование кодового дерева и, в пределе, инверсии дерева Фибоначчи соответствует двойственное ему дерево Хартли.

Энтропия Шеннона описывает "насыпную" (фрактальную) плотность текста, который можно "утрамбовать" до энтропийного предела. В результате "сжатия" сообщения (термин неверный, но общепринятый) его размер уменьшается, при этом энтропия на символ текста растет, и, в результате, "количество информации" остается неизменным. Таким образом, на плоскости параметров (размер сообщения, энтропия на символ) сжатие текста отвечает гиперболическому повороту (лоренц-сжатие) и преобразования текста могут быть описаны в терминах, используемых в теории относительности.

rmn · 13 ноя 2017

gazlan сказал(а): ↑

узел с наибольшим весом (самый частый символ) получает наиболее короткий код. В результате, код этого узла имеет наименьшую долю в полном кодовом пространстве и, наоборот, код с наименьшим весом (самый редкий символ) получает наибольшую долю.
Нажмите, чтобы раскрыть...

Как по мне, это простое и понятное описание кодирования Хаффмана и нет никакой необходимости дополнять его какой-то выдуманной фрактальной шизотерикой

gazlan · 13 ноя 2017

Это "качественное" описание, не отражающее инвариантность преобразования. Оно верно, но недостаточно для понимания того, почему преобразование Хаффмана биективно (исходный и сжатый код есть два эквивалентных представления того же самого объекта в различных кодовых системах (системах отсчета)).

rmn · 13 ноя 2017

gazlan,
Все там достаточно. Исходное сообщение переписывается другим алфавитом (наименее избыточным), созданным специально для этого сообщения.

gazlan · 13 ноя 2017

На самом деле, понятие Инверсии очень упрощает понимание. Это ключик ко многим проблемам. В теории графов понятие двойственности хорошо разработано. И бывает, что решение двойственной задачи проще, чем исходной. Тогда решают двойственную задачу, а потом просто инвертируют решение. Скажем, минимуму в двойственной задаче будет соответствовать максимум в исходной итд.

Применительно к компрессии, зная, что исходный код соответствует минимуму дисперсии размеров кодов, можно без вычислений сказать, что сжатый код будет соответствовать минимуму дисперсии кратностей символов.

В этом можно легко убедиться, посмотрев таблицы частот символов до сжатия архиватором и после.

Например, таблицы частотностей для текста этой заметки - хорошо заметно выравнивание частот. Для файлов большого размера результат будет еще лучше.

Войти или зарегистрироваться

Обсуждение статьи SadKo "Кодирование Хаффмана"

SadKo Владимир Садовников

Вложения:

00.gif

01.gif

00.png

01.png

02.gif

03.gif

04.gif

05.gif

06.gif

07.gif

descriptor.gif

selector.gif

yashechka Ростовский фанат Нарвахи

SadKo Владимир Садовников

yashechka Ростовский фанат Нарвахи

Мановар Active Member

gazlan Member

Мановар Active Member

sniper Member

Мановар Active Member

TermoSINteZ Синоби даоса Команда форума

Мановар Active Member

TermoSINteZ Синоби даоса Команда форума

Мановар Active Member

TermoSINteZ Синоби даоса Команда форума

Mikl___ Супермодератор Команда форума

gazlan Member

rmn Well-Known Member

gazlan Member

rmn Well-Known Member

gazlan Member

Обсуждение статьи SadKo "Кодирование Хаффмана"

SadKo Владимир Садовников

Вложения:

yashechka Ростовский фанат Нарвахи

SadKo Владимир Садовников

yashechka Ростовский фанат Нарвахи

Мановар Active Member

gazlan Member

Мановар Active Member

sniper Member

Мановар Active Member

TermoSINteZ Синоби даоса Команда форума

Мановар Active Member

TermoSINteZ Синоби даоса Команда форума

Мановар Active Member

TermoSINteZ Синоби даоса Команда форума

Mikl___ Супермодератор Команда форума

gazlan Member

rmn Well-Known Member

gazlan Member

rmn Well-Known Member

gazlan Member

Быстрый поиск