F.12. cube — тип данных для представления многомерных кубов #

Этот модуль реализует тип данных cube для представления многомерных кубов.

Данный модуль считается «доверенным», то есть его могут устанавливать обычные пользователи, имеющие право CREATE в текущей базе данных.

F.12.1. Синтаксис #

В Таблице F.6 показаны внешние представления типа cube. Буквы x, y и т. д. обозначают числа с плавающей точкой.

Таблица F.6. Внешние представления кубов

Внешний синтаксисЗначение
xОдномерная точка (или одномерный интервал нулевой длины)
(x)То же, что и выше
x1,x2,...,xnТочка в n-мерном пространстве, представленная внутри как куб нулевого объёма
(x1,x2,...,xn)То же, что и выше
(x),(y)Одномерный интервал, начинающийся в точке x и заканчивающийся в y, либо наоборот; порядок значения не имеет
[(x),(y)]То же, что и выше
(x1,...,xn),(y1,...,yn)N-мерный куб, представленный парой диагонально противоположных углов
[(x1,...,xn),(y1,...,yn)]То же, что и выше

В каком порядке вводятся противоположные углы куба, не имеет значения. Функции, принимающие тип cube, автоматически меняют углы местами, чтобы получить единое внутреннее представление «левый нижний — правый верхний». Когда эти углы совмещаются, в cube для экономии пространства хранится только один угол с флагом «является точкой».

Пробельные символы игнорируются, так что [(x),(y)] не отличается от [ ( x ), ( y ) ].

F.12.2. Точность #

Значения хранятся внутри как 64-битные числа с плавающей точкой. Это значит, что числа с более чем 16 значащими цифрами будут усекаться.

F.12.3. Использование #

В Таблице F.7 показаны операторы, предназначенные специально для работы с типом cube.

Таблица F.7. Операторы для кубов

Оператор

Описание

cube && cubeboolean

Кубы пересекаются?

cube @> cubeboolean

Первый куб содержит второй?

cube <@ cubeboolean

Первый куб содержится во втором?

cube -> integerfloat8

Выдаёт n-ю координату куба (считая с 1).

cube ~> integerfloat8

Выдаёт n-ю координату куба, применяя следующую нумерацию: n = 2 * k - 1 обозначает нижнюю границу k-й размерности, а n = 2 * k обозначает верхнюю границу k-й размерности. Отрицательные n обозначают обратное значение соответствующей положительной координаты. Этот оператор предназначен для поддержки KNN-GiST.

cube <-> cubefloat8

Вычисляет евклидово расстояние между двумя кубами.

cube <#> cubefloat8

Вычисляет расстояние городских кварталов (метрику L-1) между двумя кубами.

cube <=> cubefloat8

Вычисляет расстояние Чебышева (метрику L-бесконечность) между двумя кубами.


Помимо показанных выше операторов, для типа cube имеются обычные операторы сравнения, показанные в Таблице 9.1. Эти операторы сначала сравнивают первые координаты и если они равны, сравнивают вторые и т. д. Они предназначены в основном для поддержки класса операторов индекса-B-дерева для типа cube, который может быть полезен, например, если вы хотите создать ограничение UNIQUE для столбца типа cube. Для других практических применений реализуемая ими сортировка не очень полезна.

Модуль cube также предоставляет класс операторов индекса GiST для значений cube. Индекс GiST для cube может применяться для поиска значений в выражениях с операторами =, &&, @> и <@ в предложениях WHERE.

GiST-индекс для cube может быть полезен и для поиска ближайших соседей с использованием операторов метрики <->, <#> и <=> в предложениях ORDER BY. Например, ближайшего соседа точки в трёхмерном пространстве (0.5, 0.5, 0.5) можно эффективно найти так:

SELECT c FROM test ORDER BY c <-> cube(array[0.5,0.5,0.5]) LIMIT 1;

Оператор ~> может также использоваться таким образом, чтобы эффективно выдавать первые несколько значений, отсортированных по выбранной координате. Например, чтобы получить первые несколько кубов, упорядоченных по возрастанию первой координаты (левого нижнего угла), можно использовать следующий запрос:

SELECT c FROM test ORDER BY c ~> 1 LIMIT 5;

А чтобы получить двумерные кубы, отсортированные по убыванию первой координаты правого верхнего угла:

SELECT c FROM test ORDER BY c ~> 3 DESC LIMIT 5;

В Таблице F.8 перечислены все доступные функции.

Таблица F.8. Функции для работы с кубами

Функция

Описание

Примеры

cube ( float8 ) → cube

Создаёт одномерный куб, у которого обе координаты равны.

cube(1)(1)

cube ( float8, float8 ) → cube

Создаёт одномерный куб.

cube(1, 2)(1),(2)

cube ( float8[] ) → cube

Создаёт куб нулевого объёма по координатам, определяемым массивом.

cube(ARRAY[1,2,3])(1, 2, 3)

cube ( float8[], float8[] ) → cube

Создаёт куб с координатами правого верхнего и левого нижнего углов, определяемыми двумя массивами, которые должны быть одинаковой длины.

cube(ARRAY[1,2], ARRAY[3,4])(1, 2),(3, 4)

cube ( cube, float8 ) → cube

Создаёт новый куб, добавляя размерность к существующему кубу с одинаковым значением новой координаты для обеих углов. Это бывает полезно, когда нужно построить кубы поэтапно из вычисляемых значений.

cube('(1,2),(3,4)'::cube, 5)(1, 2, 5),(3, 4, 5)

cube ( cube, float8, float8 ) → cube

Создаёт новый куб, добавляя размерность к существующему кубу. Это бывает полезно, когда нужно построить кубы поэтапно из вычисляемых значений.

cube('(1,2),(3,4)'::cube, 5, 6)(1, 2, 5),(3, 4, 6)

cube_dim ( cube ) → integer

Возвращает число размерностей куба.

cube_dim('(1,2),(3,4)')2

cube_ll_coord ( cube, integer ) → float8

Выдаёт значение n-й координаты левого нижнего угла куба.

cube_ll_coord('(1,2),(3,4)', 2)2

cube_ur_coord ( cube, integer ) → float8

Выдаёт значение n-й координаты правого верхнего угла куба.

cube_ur_coord('(1,2),(3,4)', 2)4

cube_is_point ( cube ) → boolean

Возвращает true, если куб является точкой, то есть если два определяющих его угла совпадают.

cube_is_point(cube(1,1))t

cube_distance ( cube, cube ) → float8

Возвращает расстояние между двумя кубами. Если оба куба являются точками, вычисляется обычная функция расстояния.

cube_distance('(1,2)', '(3,4)')2.8284271247461903

cube_subset ( cube, integer[] ) → cube

Создаёт новый куб из существующего, используя список размерностей из массива. Может применяться для получения координат углов в одном измерении, для удаления измерений и изменения их порядка.

cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[2])(3),(7)

cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[3,2,1,1])(5, 3, 1, 1),(8, 7, 6, 6)

cube_union ( cube, cube ) → cube

Создаёт объединение двух кубов.

cube_union('(1,2)', '(3,4)')(1, 2),(3, 4)

cube_inter ( cube, cube ) → cube

Создаёт пересечение двух кубов.

cube_inter('(1,2)', '(3,4)')(3, 4),(1, 2)

cube_enlarge ( c cube, r double, n integer ) → cube

Увеличивает размер куба на заданный радиус r как минимум в n измерениях. Если радиус отрицательный, куб, наоборот, уменьшается. Все определённые измерения изменяются на величину радиуса r. Координаты левого нижнего угла уменьшаются на r, а координаты правого верхнего увеличиваются на r. Если координата левого нижнего угла становится больше соответствующей координаты правого верхнего (это возможно, только когда r < 0), обоим координатам присваивается их среднее значение. Если n превышает число определённых измерений и куб увеличивается (r > 0), добавляются дополнительные размерности, недостающие до n; начальным значением для дополнительных координат считается ноль. Эта функция полезна для создания окружающих точку прямоугольников для поиска ближайших точек.

cube_enlarge('(1,2),(3,4)', 0.5, 3)(0.5, 1.5, -0.5),(3.5, 4.5, 0.5)


F.12.4. Поведение по умолчанию #

Это объединение:

select cube_union('(0,5,2),(2,3,1)', '0');
cube_union
-------------------
(0, 0, 0),(2, 5, 2)
(1 row)

не противоречит здравому смыслу, как и это пересечение:

select cube_inter('(0,-1),(1,1)', '(-2),(2)');
cube_inter
-------------
(0, 0),(1, 0)
(1 row)

Во всех бинарных операциях с кубами разных размерностей предполагается, что куб с меньшей размерностью является декартовой проекцией; то есть в опущенных в строковом представлении координатах предполагаются нули. Таким образом, показанные выше вызовы равнозначны следующим:

cube_union('(0,5,2),(2,3,1)','(0,0,0),(0,0,0)');
cube_inter('(0,-1),(1,1)','(-2,0),(2,0)');

В следующем предикате включения применяется синтаксис точек, хотя фактически второй аргумент представляется внутри кубом. Этот синтаксис избавляет от необходимости определять отдельный тип точек и функции для предикатов (cube,point).

select cube_contains('(0,0),(1,1)', '0.5,0.5');
cube_contains
--------------
t
(1 row)

F.12.5. Примечания #

Примеры использования можно увидеть в регрессионном тесте sql/cube.sql.

Во избежание некорректного применения этого типа, число размерностей кубов искусственно ограничено значением 100. Если это ограничение вас не устраивает, его можно изменить в cubedata.h.

F.12.6. Благодарности #

Первый автор: Джин Селков мл. , Аргоннская национальная лаборатория, Отдел математики и компьютерных наук

Я очень благодарен в первую очередь профессору Джо Геллерштейну (https://dsf.berkeley.edu/jmh/) за пояснение сути GiST (http://gist.cs.berkeley.edu/) и его бывшему студенту, Энди Донгу, за пример, написанный для Illustra. Я также признателен всем разработчикам Postgres в настоящем и прошлом за возможность создать свой собственный мир и спокойно жить в нём. Ещё я хотел бы выразить признательность Аргоннской лаборатории и Министерству энергетики США за годы постоянной поддержки моих исследований в области баз данных.

Небольшие изменения в этот пакет внёс Бруно Вольф III в августе/сентябре 2002 г. В том числе он перешёл от одинарной к двойной точности и добавил несколько новых функций.

Дополнительные изменения внёс Джошуа Рейх в июле 2006 г. В частности, он добавил cube(float8[], float8[]), подчистил код и перевёл его на протокол вызовов версии V1 с устаревшего протокола V0.