User:Acap92/sandbox

Компримовани суфикс низа

From Wikipedia, the free encyclopedia

У рачунарству, компримовани суфикс ниѕа је компримована структура података за проналажење модела. Имајући у виду текст Т од н карактера из Σ азбуке, компримовани суфикс низа подршку потрази за произвољне образаца у Т. П за улаз образац м карактера, тражи време је једнака н пута вишег реда ентропија текста Т, плус неки екстра бита меморисања емпиријску статистичког модела плус О (н).

Оригинални примеру од компресованог суфиксом низ решен дугогодишњи проблем отворено показујући да брза Хватање било могуће коришћењем само линеарно-простор структуре података, наиме, један пропорционалну са величином текста Т, која је О (н лог | Е |) бита.Конвенционална Суфикс и суфикс низа бита користе дрво, што је знатно већи.Основа за структуром података је рекурзивна распадање користећи функцију "комшију", који омогућава да се суфикс низа представља један од пола његове дужине. Конструкција се понавља више пута док се не доводи суфикс низ користи линеарну број битова. Следећи рад је показао да је стварни простор за складиштење је био везан за нулти реда ентропије и да индекс подржава само-индексирање.

The memory accesses made by compressed suffix arrays and other compressed data structures for pattern matching are typically not localized, and thus these data structures have been notoriously hard to design efficiently for use in external memory. Recent progress using geometric duality takes advantage of the block access provided by disks to speed up the I/O time significantly[5]