| От | Todd A. Cook |
|---|---|
| Тема | Re: scoring differences between bitmasks |
| Дата | |
| Msg-id | 43401FF0.9020907@blackducksoftware.com обсуждение исходный текст |
| Ответ на | Re: scoring differences between bitmasks (Ben <bench@silentmedia.com>) |
| Список | pgsql-general |
Hi, Try breaking the vector into 4 bigint columns and building a multi-column index, with index columns going from the most evenly distributed to the least. Depending on the distribution of your data, you may only need 2 or 3 columns in the index. If you can cluster the table in that order, it should be really fast. (This structure is a tabular form of a linked trie.) -- todd Ben wrote: > Yes, that's the straightforward way to do it. But given that my vectors > are 256 bits in length, and that I'm going to eventually have about 4 > million of them to search through, I was hoping greater minds than mine > had figured out how to do it faster, or how compute some kind of > indexing....... somehow.
В списке pgsql-general по дате отправления:
Сайт использует файлы cookie для корректной работы и повышения удобства. Нажимая кнопку «Принять» или продолжая пользоваться сайтом, вы соглашаетесь на их использование в соответствии с Политикой в отношении обработки cookie ООО «ППГ», в том числе на передачу данных из файлов cookie сторонним статистическим и рекламным службам. Вы можете управлять настройками cookie через параметры вашего браузера