| От | Tom Lane |
|---|---|
| Тема | Re: tsvector limitations |
| Дата | |
| Msg-id | 14751.1308194046@sss.pgh.pa.us обсуждение |
| Ответ на | Re: tsvector limitations (Tim <elatllat@gmail.com>) |
| Список | pgsql-admin |
Tim <elatllat@gmail.com> writes:
> My limited testing indicates tsvector size has an approximately linear
> (binomial) correlation with "number of unique words", and "word count".
Yes, it would be linear in the number of unique words (assuming the
average word length stays constant). It's not linear in word count,
because tsvector only keeps track of distinct word positions for the
first 16K words in the text. So for large documents only the number of
unique words is really going to matter, and that grows *much* less than
linearly with document size for real-world documents.
regards, tom lane
В списке pgsql-admin по дате отправления:
Сайт использует файлы cookie для корректной работы и повышения удобства. Нажимая кнопку «Принять» или продолжая пользоваться сайтом, вы соглашаетесь на их использование в соответствии с Политикой в отношении обработки cookie ООО «ППГ», в том числе на передачу данных из файлов cookie сторонним статистическим и рекламным службам. Вы можете управлять настройками cookie через параметры вашего браузера