Re: Netflix Prize data

Поиск

Список

Период

Сортировка

От	Heikki Linnakangas
Тема	Re: Netflix Prize data
Дата	5 октября 2006 г. 05:35:17
Msg-id	4524C3B5.8030206@enterprisedb.com обсуждение исходный текст
Ответ на	Netflix Prize data ("Mark Woodward" <pgsql@mohawksoft.com>)
Список	pgsql-hackers

Дерево обсуждения

Mark Woodward wrote:
> 
> I tried to cluster the data along a particular index but had to cancel it
> after 3 hours.

If the data is in random order, it's faster to do

SELECT * INTO foo_sorted FROM foo ORDER BY bar

then CREATE INDEX, than to run CLUSTER.

That's because CLUSTER does a full index scan of the table, which is 
slower than a seqscan + sort if the table is not already clustered.

--   Heikki Linnakangas  EnterpriseDB   http://www.enterprisedb.com

В списке pgsql-hackers по дате отправления:

Сайт использует файлы cookie для корректной работы и повышения удобства. Нажимая кнопку «Принять» или продолжая пользоваться сайтом, вы соглашаетесь на их использование в соответствии с Политикой в отношении обработки cookie ООО «ППГ», в том числе на передачу данных из файлов cookie сторонним статистическим и рекламным службам. Вы можете управлять настройками cookie через параметры вашего браузера

Вход в личный кабинет

Восстановление пароля

Подтверждение аккаунта

Изменение пароля

Re: Netflix Prize data