Re: Proposal: q-gram GIN and GiST indexes

Поиск
Список
Период
Сортировка
От Alexander Korotkov
Тема Re: Proposal: q-gram GIN and GiST indexes
Дата
Msg-id BANLkTik7VZc=2mVQMPwukti3R_EveD_5=g@mail.gmail.com
обсуждение исходный текст
Ответ на Re: Proposal: q-gram GIN and GiST indexes  (Alexander Korotkov <aekorotkov@gmail.com>)
Ответы Re: Proposal: q-gram GIN and GiST indexes  (Robert Haas <robertmhaas@gmail.com>)
Список pgsql-hackers
For example, here is distribution of q-grams count in 120 Mb of dblp paper titles (pretty large dataset).
q   count
2    7218
3  115107
4  589428
5 1648453
6 3336685
Number of 5-grams if about 15x larger than number of 3-grams. But most part of index space will be occupied by links to the rows(about 120 millions of links), while size of q-grams itself will be almost ignorable in comparison with it.

----
With best regards,
Alexander Korotkov.

В списке pgsql-hackers по дате отправления:

Предыдущее
От: Alexander Korotkov
Дата:
Сообщение: Re: Proposal: q-gram GIN and GiST indexes
Следующее
От: Robert Haas
Дата:
Сообщение: Re: Proposal: q-gram GIN and GiST indexes