Целочисленное кодирование переменной длины

Я пытаюсь перепроектировать алгоритм декомпрессии LZ1/LZ77. Длина выводимой области буфера/окна декодирования кодируется в файле как целое число переменной длины. Я прочитал все, что мог, о целочисленном кодировании переменной длины, и метод, используемый в этом случае, не похож ни на один другой, который я видел. Возможно, чтобы избежать проблем с патентами или, может быть, просто чтобы запутать. Включенный код может быть не совсем полным, но на данный момент он работает как минимум с несколькими файлами.

Я не понимаю, как, если вообще возможно, формулы, используемые ниже, могут быть сведены к чему-то более простому. Большинство алгоритмов целочисленного кодирования переменной длины используют какой-то цикл, но для этого я не смог этого сделать, потому что формула просто не кажется последовательной при оценке каждого полубайта.

Предложения приветствуются.

private static int getLength(BitReader bitStream)
{
    const int minSize = 2;

    int length = 0;

    byte nibble3, nibble2, nibble1;

    nibble3 = bitStream.ReadNibble();

    if (nibble3 >= 0xc)
    {
        nibble2 = bitStream.ReadNibble();
        nibble1 = bitStream.ReadNibble();

        if (nibble3 == 0xF & nibble2 == 0xF & nibble1 == 0xF) return -1;

        if ((nibble3 & 2) != 0)
        {
            length = (((((nibble3 & 7) + 3) << 6) + 8)) + 
                ((nibble2 & 7) << 3) + nibble1 + minSize;
        }
        else if ((nibble3 & 1) != 0)
        {
            length = (((nibble3 & 7) << 6) + 8) + 
                ((((nibble2 & 7)) + 1) << 3) + nibble1 + minSize;
        }
        else
        {
            length = ((((nibble3 & 7) << 4) + 8)) + 
                ((nibble2 & 7) << 4) + nibble1 + minSize;
        }
    }
    else if ((nibble3 & 8) != 0)
    {
        nibble1 = bitStream.ReadNibble();

        length = ((((nibble3 & 7) << 1) + 1) << 3) + nibble1 + minSize;
    }
    else
    {
        length = nibble3 + minSize;
    }

    return length;
}

person Richard Collette    schedule 01.03.2010    source источник
comment
Вам разрешено реконструировать это?   -  person TFD    schedule 01.03.2010
comment
Да. Это мои данные в моей базе данных. Я не дизассемблирую исходное приложение, а просто работаю со своими данными.   -  person Richard Collette    schedule 01.03.2010


Ответы (1)


Оказывается, используемый алгоритм целочисленного кодирования переменной длины очень похож на целое число переменной длины Длугоша. Метод кодирования. Действительно, требуется несколько расчетов, а не одна формула.

Исходя из этого, я переписал код следующим образом. Я все еще пытаюсь выяснить точный формат механизма, в котором используется начальный 0xFFF.

    private static int getLength(BitReader bitStream)
    {
        const int minSize = 2;
        int length = 0;
        byte nibble3, nibble2, nibble1;
        byte nibble;
        nibble = bitStream.ReadNibble();
        if (nibble == 0xF)
        {
            nibble2 = bitStream.ReadNibble();
            nibble1 = bitStream.ReadNibble();
            if (nibble2 == 0xf && nibble1 == 0xF)
            {
                //The next nibble specifies the number of nibbles to be read, maybe.
                byte nibblesToRead = (byte) (bitStream.ReadNibble()) ;
                //The Dlugosz' mechanism would use a mask on the value but that doesn't appear to be the case here.
                //nibblesToRead &= 7;
                //switch (nibblesToRead & 7){
                //    case 0: nibblesToRead = 5; break;
                //    case 1: nibblesToRead = 8; break;
                //    case 2: nibblesToRead = 16; break;                           
                //}
                byte value=0;
                byte[] values = new byte[nibblesToRead];
                bool c=true;
                for (int i = 0; i < nibblesToRead; i++)
                {
                    value = bitStream.ReadNibble();
                    //values[i] = value;
                    length += (((value << 1) | 1) << 3);
                }
                value = bitStream.ReadNibble();
                length += value;
            }
        }
        else if((nibble >= 0xC)){
           nibble2 = bitStream.ReadNibble();
           nibble1 = bitStream.ReadNibble();
           length = ((((((nibble & 1) <<1)|1))<< 3) + ((nibble2<<1)|1)<<3)+nibble1;
        }
        else if ((nibble & 8)!=0){
            nibble1 = bitStream.ReadNibble();
            length = ((((nibble & 3)<<1) | 1) << 3) + nibble1;
        }
        else{
            length=nibble;
        }
        return length + minSize;
      };
person Richard Collette    schedule 03.03.2010