ded_maxim: (Gottfried Wilhelm von Leibnitz)
ded_maxim ([personal profile] ded_maxim) wrote2007-04-19 03:33 pm

кто о чем, а я о сжатии последовательностей

Известно, что алгоритм Лемпеля-Зива обладает свойством универсальности по сравнению с классом всех конечных автоматов: любую достаточно длинную последовательность символов, принимающих конечное число значений, алгоритм Лемпеля-Зива может сжать почти настолько же, насколько это можно сделать при помощи любого конечного автомата (включая любые КА, которые можно построить, зная последовательность наперед). Недавно появилась статья, в которой утверждается, что алгоритм Лемпеля-Зива не универсален по отношению к классу магазинных автоматов: авторы статьи построили последовательность, которую алгоритм Лемпеля-Зива практически не может сжать, но которая сжимается по крайней мере наполовину с помощью магазинного автомата.

[identity profile] ygam.livejournal.com 2007-04-19 08:54 pm (UTC)(link)
Забавно. Ты об этом узнал из какого-то блога?

[identity profile] ded-maxim.livejournal.com 2007-04-19 08:58 pm (UTC)(link)
Нет, просто я ежедневно слежу за постингами в http://arxiv.org/list/cs.IT/recent и http://arxiv.org/list/cs.LG/recent. Должен же я интересоваться, чем мои коллеги занимаются.

[identity profile] juan-gandhi.livejournal.com 2007-04-19 10:30 pm (UTC)(link)
Wow! How obvious, and how refreshing!

[identity profile] spamsink.livejournal.com 2007-04-19 11:14 pm (UTC)(link)
Ну да, а если LZ модифицировать так, чтобы он мог ссылаться и на строки задом наперед?

Например,

abcdcba обычным LZ совсем не сжимается, а модифицированным - abcd(1,-3). Здесь первое число в паре - отступ назад, а второе - длина. Отрицательные числа используются для "задом наперед".

[identity profile] ded-maxim.livejournal.com 2007-04-20 12:49 am (UTC)(link)
Верите ли, я уже обсуждал нечто подобное с разными людьми, вроде бы какие-то работы в этом направлении ведутся, но конкретных результатов вроде бы либо нет, либо очень мало.

[identity profile] spamsink.livejournal.com 2007-04-20 01:05 am (UTC)(link)
Да кого бы сейчас LZ интересовал, особенно для таких источников, для которых описанное улучшение будет существенным? Хардверный LZ обычно вообще не 77, а 78 (LZW), а относительно нового софтвера, использующего LZ77, я и не назову...

[identity profile] ded-maxim.livejournal.com 2007-04-22 04:24 am (UTC)(link)
Теоретики до сих пор живо интересуются LZ. Во-первых, он поддается анализу, и на его основе изучают другие задачи -- была статья, например, где на основе LZ строился алгоритм для сжатия с потерями, причем обладающий свойством универсальности не только по отношению к статистической природе источника, но и по отношению к функции потерь. Во-вторых, LZ важен концептуально: идея вероятностного моделирования, в основе которой лежит контекстный парсинг последовательностей, распространяется на такие задачи, как оптимальное управление.

[identity profile] occuserpens.livejournal.com 2007-04-22 01:53 am (UTC)(link)
wow!