Для воспроизводимости экспериментов может быть проще - "в качестве N-го числа взял разряды N*10-9:N*10 числа Pi". Чем писать, какой версией какого генератора и с каким параметром и так далее...
должно быть достаточно эффективно, несмотря на фактор случайности - хотя бы потому, что каждый байт может принимать одно из 10 значений. щас скачаю один файл, посмотрю :)
Скачал и посмотрел. 123 000 000 байт упакованы в 57 289 198. Внутри файла - ASCII-цифирки, сгруппированные по 10 через пробел, по 100 цифирок в строчке, строки тоже пронумерованы. В файле встречается 14 различных символов (включая CRLF), и по два символа в байт можно было бы упаковать даже без применения особых алгоритмов сжатия. Ан вот сжато аж на 53%. Наверно, 3% дают пробелы и номера строк :)
no subject
Date: 2009-06-25 09:50 am (UTC)no subject
Date: 2009-06-25 10:15 am (UTC)no subject
Date: 2009-06-25 11:17 am (UTC)no subject
Date: 2009-06-25 11:21 am (UTC)no subject
Date: 2009-06-25 11:31 am (UTC)Чем писать, какой версией какого генератора и с каким параметром и так далее...
no subject
Date: 2009-06-25 11:39 am (UTC)no subject
Date: 2009-06-25 12:10 pm (UTC)no subject
Date: 2009-06-25 12:31 pm (UTC)no subject
Date: 2009-06-25 12:45 pm (UTC)щас скачаю один файл, посмотрю :)
no subject
Date: 2009-06-25 12:57 pm (UTC)no subject
Date: 2009-06-25 12:57 pm (UTC)