Re:

Поиск
Список
Период
Сортировка
От Konstantin Gerasimenko
Тема Re:
Дата
Msg-id 55008879.9050804@gmx.net
обсуждение исходный текст
Ответ на  (Aln Kapa <alnkapa@gmail.com>)
Ответы Re:  ("Dmitry E. Oboukhov" <unera@debian.org>)
Список pgsql-ru-general
11.03.2015 05:56, Dmitry E. Oboukhov пишет:
> очень сомнительный совет. если на постгре такая задача отлично
> решается, то хадуп потребует где-то x20 ресурсов железных при том что
> только теоретически будет масштабируем. PS: у нас подобная задача:
> собираем координаты с тысяч устройств, но передают они их не раз в
> секунду а раз в 10 секунд (разница непринципиальная). поставили перед
> постгрисом аггрегатор (демончик) который либо ждет 10 секунд и
> сбрасывает данные в постгрис либо ждет накопления 1000 точек и так же
> льет. в итоге сейчас постгриска в контейнере OpenVZ на одном CPU
> вполне собирает за день где-то 2-4гига точек и при этом отвечает
> быстро на вопрос "дай мне ближайших к заданной" и отвечает
> относительно быстро на вопрос "дай мне трек машинки XXX со времени A
> по время B" партицируем тупо по датам: новый день - новая партиция.

Дмитрий у вас записей по максимуму 1000*6*60*24*365*3=9.460.800.000 (9.5
миллиарда.)

 >Есть 5000 устройств присылающих информация примерное 1 раз в секунду.
 >Хранить информацию в доступном резерве надо около 3-х лет.

5000*1*24*60*60*365*3 = 473.040.000.000 (473 миллиарда.)

Мне кажется разница видна не вооруженным взглядом.
К тому же предположение что потребуется х20 ресурсов как то ... слишком
пессимистически  рассчитано.
На хадуп понадобиться минимум три сервера остальное точно по желанию, в
варианте с постгрестом
понадобиться минимум два мощных сервера или мы все надеемся что один
сервак никогда не сломается ?

Вы привели только два запроса к данным и сразу намекая что такой то
запрос "отвечает относительно быстро", а
сколько у вас рассчитываюся более сложные запросы ?  а есть какая то
аналитика по данным или она не входит в задачу ?

Думаю дальше обсуждать не стоит.

ЗЫ делайте кластеризацию Ваших партиций по индексу "машинки_ид" и тогда
Ваш последний запрос тоже будет мухой рассчитываться.


В списке pgsql-ru-general по дате отправления:

Предыдущее
От: "Dmitry E. Oboukhov"
Дата:
Сообщение: Re:
Следующее
От: "Dmitry E. Oboukhov"
Дата:
Сообщение: Re: