F.11. cube — тип данных для представления многомерных кубов #
Этот модуль реализует тип данных cube
для представления многомерных кубов.
Данный модуль считается «доверенным», то есть его могут устанавливать обычные пользователи, имеющие право CREATE
в текущей базе данных.
F.11.1. Синтаксис #
В Таблице F.5 показаны внешние представления типа cube
. Буквы x
, y
и т. д. обозначают числа с плавающей точкой.
Таблица F.5. Внешние представления кубов
Внешний синтаксис | Значение |
---|---|
| Одномерная точка (или одномерный интервал нулевой длины) |
( | То же, что и выше |
| Точка в n-мерном пространстве, представленная внутри как куб нулевого объёма |
( | То же, что и выше |
( | Одномерный интервал, начинающийся в точке x и заканчивающийся в y , либо наоборот; порядок значения не имеет |
[( | То же, что и выше |
( | N-мерный куб, представленный парой диагонально противоположных углов |
[( | То же, что и выше |
В каком порядке вводятся противоположные углы куба, не имеет значения. Функции, принимающие тип cube
, автоматически меняют углы местами, чтобы получить единое внутреннее представление «левый нижний — правый верхний». Когда эти углы совмещаются, в cube
для экономии пространства хранится только один угол с флагом «является точкой».
Пробельные символы игнорируются, так что [(
не отличается от x
),(y
)][ (
.x
), ( y
) ]
F.11.2. Точность #
Значения хранятся внутри как 64-битные числа с плавающей точкой. Это значит, что числа с более чем 16 значащими цифрами будут усекаться.
F.11.3. Использование #
В Таблице F.6 показаны операторы, предназначенные специально для работы с типом cube
.
Таблица F.6. Операторы для кубов
Оператор Описание |
---|
Кубы пересекаются? |
Первый куб содержит второй? |
Первый куб содержится во втором? |
Выдаёт |
Выдаёт |
Вычисляет евклидово расстояние между двумя кубами. |
Вычисляет расстояние городских кварталов (метрику L-1) между двумя кубами. |
Вычисляет расстояние Чебышева (метрику L-бесконечность) между двумя кубами. |
Помимо показанных выше операторов, для типа cube
имеются обычные операторы сравнения, показанные в Таблице 9.1. Эти операторы сначала сравнивают первые координаты и если они равны, сравнивают вторые и т. д. Они предназначены в основном для поддержки класса операторов индекса-B-дерева для типа cube
, который может быть полезен, например, если вы хотите создать ограничение UNIQUE для столбца типа cube
. Для других практических применений реализуемая ими сортировка не очень полезна.
Модуль cube
также предоставляет класс операторов индекса GiST для значений cube
. Индекс GiST для cube
может применяться для поиска значений в выражениях с операторами =
, &&
, @>
и <@
в предложениях WHERE
.
GiST-индекс для cube
может быть полезен и для поиска ближайших соседей с использованием операторов метрики <->
, <#>
и <=>
в предложениях ORDER BY
. Например, ближайшего соседа точки в трёхмерном пространстве (0.5, 0.5, 0.5) можно эффективно найти так:
SELECT c FROM test ORDER BY c <-> cube(array[0.5,0.5,0.5]) LIMIT 1;
Оператор ~>
может также использоваться таким образом, чтобы эффективно выдавать первые несколько значений, отсортированных по выбранной координате. Например, чтобы получить первые несколько кубов, упорядоченных по возрастанию первой координаты (левого нижнего угла), можно использовать следующий запрос:
SELECT c FROM test ORDER BY c ~> 1 LIMIT 5;
А чтобы получить двумерные кубы, отсортированные по убыванию первой координаты правого верхнего угла:
SELECT c FROM test ORDER BY c ~> 3 DESC LIMIT 5;
В Таблице F.7 перечислены все доступные функции.
Таблица F.7. Функции для работы с кубами
Функция Описание Примеры |
---|
Создаёт одномерный куб, у которого обе координаты равны.
|
Создаёт одномерный куб.
|
Создаёт куб нулевого объёма по координатам, определяемым массивом.
|
Создаёт куб с координатами правого верхнего и левого нижнего углов, определяемыми двумя массивами, которые должны быть одинаковой длины.
|
Создаёт новый куб, добавляя размерность к существующему кубу с одинаковым значением новой координаты для обеих углов. Это бывает полезно, когда нужно построить кубы поэтапно из вычисляемых значений.
|
Создаёт новый куб, добавляя размерность к существующему кубу. Это бывает полезно, когда нужно построить кубы поэтапно из вычисляемых значений.
|
Возвращает число размерностей куба.
|
Выдаёт значение
|
Выдаёт значение
|
Возвращает true, если куб является точкой, то есть если два определяющих его угла совпадают.
|
Возвращает расстояние между двумя кубами. Если оба куба являются точками, вычисляется обычная функция расстояния.
|
Создаёт новый куб из существующего, используя список размерностей из массива. Может применяться для получения координат углов в одном измерении, для удаления измерений и изменения их порядка.
|
Создаёт объединение двух кубов.
|
Создаёт пересечение двух кубов.
|
Увеличивает размер куба на заданный радиус
|
F.11.4. Поведение по умолчанию #
Это объединение:
select cube_union('(0,5,2),(2,3,1)', '0'); cube_union ------------------- (0, 0, 0),(2, 5, 2) (1 row)
не противоречит здравому смыслу, как и это пересечение:
select cube_inter('(0,-1),(1,1)', '(-2),(2)'); cube_inter ------------- (0, 0),(1, 0) (1 row)
Во всех бинарных операциях с кубами разных размерностей предполагается, что куб с меньшей размерностью является декартовой проекцией; то есть в опущенных в строковом представлении координатах предполагаются нули. Таким образом, показанные выше вызовы равнозначны следующим:
cube_union('(0,5,2),(2,3,1)','(0,0,0),(0,0,0)'); cube_inter('(0,-1),(1,1)','(-2,0),(2,0)');
В следующем предикате включения применяется синтаксис точек, хотя фактически второй аргумент представляется внутри кубом. Этот синтаксис избавляет от необходимости определять отдельный тип точек и функции для предикатов (cube,point).
select cube_contains('(0,0),(1,1)', '0.5,0.5'); cube_contains -------------- t (1 row)
F.11.5. Примечания #
Примеры использования можно увидеть в регрессионном тесте sql/cube.sql
.
Во избежание некорректного применения этого типа, число размерностей кубов искусственно ограничено значением 100. Если это ограничение вас не устраивает, его можно изменить в cubedata.h
.
F.11.6. Благодарности #
Первый автор: Джин Селков мл. <selkovjr@mcs.anl.gov>
, Аргоннская национальная лаборатория, Отдел математики и компьютерных наук
Я очень благодарен в первую очередь профессору Джо Геллерштейну (https://dsf.berkeley.edu/jmh/) за пояснение сути GiST (http://gist.cs.berkeley.edu/) и его бывшему студенту, Энди Донгу, за пример, написанный для Illustra. Я также признателен всем разработчикам Postgres в настоящем и прошлом за возможность создать свой собственный мир и спокойно жить в нём. Ещё я хотел бы выразить признательность Аргоннской лаборатории и Министерству энергетики США за годы постоянной поддержки моих исследований в области баз данных.
Небольшие изменения в этот пакет внёс Бруно Вольф III <bruno@wolff.to>
в августе/сентябре 2002 г. В том числе он перешёл от одинарной к двойной точности и добавил несколько новых функций.
Дополнительные изменения внёс Джошуа Рейх <josh@root.net>
в июле 2006 г. В частности, он добавил cube(float8[], float8[])
, подчистил код и перевёл его на протокол вызовов версии V1 с устаревшего протокола V0.