| Документация по PostgreSQL 9.4.1 | |||
|---|---|---|---|
| Пред. | Уровень выше | Глава 12. Полнотекстовый поиск | След. |
12.11. Ограничения
Текущая реализация текстового поиска в PostgreSQL имеет следующие ограничения:
Длина лексемы не может превышать 2 килобайта
Длина значения tsvector (лексемы и их позиции) не может превышать 1 мегабайт
Число лексем должно быть меньше 264
Значения позиций в tsvector должны быть от 0 до 16383
Не больше 256 позиций для одной лексемы
Число узлов (лексемы + операторы) в значении tsquery должно быть меньше 32768
Для сравнения, документация PostgreSQL 8.1 содержала 335 420 слов, из них 10 441 уникальных, а наиболее часто употребляющееся в ней слово "postgresql" встречается 6 127 раз в 655 документах.
Другой пример — архивы списков рассылки PostgreSQL содержали 910 989 уникальных слов в 57 491 343 лексемах в 461 020 сообщениях.
| Пред. | Начало | След. |
| Поддержка psql | Уровень выше | Миграция с реализации текстового поиска в версиях до 8.3 |
| PostgreSQL 9.4.1 Documentation | |||
|---|---|---|---|
| Prev | Up | Chapter 12. Full Text Search | Next |
12.11. Limitations
The current limitations of PostgreSQL's text search features are:
The length of each lexeme must be less than 2K bytes
The length of a tsvector (lexemes + positions) must be less than 1 megabyte
The number of lexemes must be less than 264
Position values in tsvector must be greater than 0 and no more than 16,383
No more than 256 positions per lexeme
The number of nodes (lexemes + operators) in a tsquery must be less than 32,768
For comparison, the PostgreSQL 8.1 documentation contained 10,441 unique words, a total of 335,420 words, and the most frequent word "postgresql" was mentioned 6,127 times in 655 documents.
Another example — the PostgreSQL mailing list archives contained 910,989 unique words with 57,491,343 lexemes in 461,020 messages.