12.11. Ограничения

Текущая реализация текстового поиска в Postgres Pro имеет следующие ограничения:

  • Длина лексемы не может превышать 2 килобайта

  • Длина значения tsvector (лексемы и их позиции) не может превышать 1 мегабайт

  • Число лексем должно быть меньше 264

  • Значения позиций в tsvector должны быть от 0 до 16383

  • Не больше 256 позиций для одной лексемы

  • Число узлов (лексемы + операторы) в значении tsquery должно быть меньше 32768

Для сравнения, документация PostgreSQL 8.1 содержала 335 420 слов, из них 10 441 уникальных, а наиболее часто употребляющееся в ней слово «postgresql» встречается 6 127 раз в 655 документах.

Другой пример — архивы списков рассылки PostgreSQL содержали 910 989 уникальных слов в 57 491 343 лексемах в 461 020 сообщениях.