E.8. cube

Этот модуль реализует тип данных cube для представления многомерных кубов.

E.8.1. Синтаксис

В Таблице E-1 показаны внешние представления типа cube. Буквы x, y и т. д. обозначают числа с плавающей точкой.

Таблица E-1. Внешние представления кубов

x Одномерная точка (или одномерный интервал нулевой длины)
(x)То же, что и выше
x1,x2,...,xnТочка в n-мерном пространстве, представленная внутри как куб нулевого объёма
(x1,x2,...,xn)То же, что и выше
(x),(y)Одномерный интервал, начинающийся в точке x и заканчивающийся в y, либо наоборот; порядок значения не имеет
[(x),(y)]То же, что и выше
(x1,...,xn),(y1,...,yn)N-мерный куб, представленный парой диагонально противоположных углов
[(x1,...,xn),(y1,...,yn)]То же, что и выше

В каком порядке вводятся противоположные углы куба, не имеет значения. Функции, принимающие тип cube, автоматически меняют углы местами, чтобы получить единое внутреннее представление "левый нижний — правый верхний".

Пробельные символы игнорируются, так что [(x),(y)] не отличается от [ ( x ), ( y ) ].

E.8.2. Точность

Значения хранятся внутри как 64-битные числа с плавающей точкой. Это значит, что числа с более чем 16 значащими цифрами будут усекаться.

E.8.3. Usage

Модуль cube включает класс операторов индекса GiST для значений cube. Операторы, поддерживаемые этим классом операторов, перечислены в Таблице E-2.

Таблица E-2. Операторы GiST для кубов

ОператорОписание
a = bКубы a и b идентичны.
a && bКубы a и b пересекаются.
a @> bКуб a включает куб b.
a <@ bКуб a включён в куб b.

(До версии PostgreSQL 8.2 операторы включения @> и <@ обозначались соответственно как @ и ~. Эти имена по-прежнему действуют, но считаются устаревшими и в конце концов будут упразднены. Заметьте, что старые имена произошли из соглашения, которому раньше следовали ключевые геометрические типы данных!)

Также поддерживаются стандартные операторы для B-дерева, например:

ОператорОписание
[a, b] < [c, d]Меньше
[a, b] > [c, d]Больше

Эти операторы не имеют большого смысла ни для какой практической цели, кроме сортировки. Эти операторы сначала сравнивают (a) с (c), и если они равны, сравнивают (b) с (d). Результат сравнения позволяет упорядочить значения образом, подходящим для большинства случаев, что полезно, если вы хотите применять ORDER BY с этим типом.

В Таблице E-3 перечислены все доступные функции.

Таблица E-3. Функции для работы с кубами

cube(float8) returns cubeСоздаёт одномерный куб, у которого обе координаты равны. cube(1) == '(1)'
cube(float8, float8) returns cubeСоздаёт одномерный куб. cube(1,2) == '(1),(2)'
cube(float8[]) returns cubeСоздаёт куб нулевого объёма по координатам, определяемым массивом. cube(ARRAY[1,2]) == '(1,2)'
cube(float8[], float8[]) returns cubeСоздаёт куб с координатами правого верхнего и левого нижнего углов, определяемыми двумя массивами, которые должны быть одинаковой длины. cube('{1,2}'::float[], '{3,4}'::float[]) == '(1,2),(3,4)'
cube(cube, float8) returns cubeСоздаёт новый куб, добавляя размерность к существующему кубу с одинаковым значением для обеих частей новой координаты. Это бывает полезно, когда нужно построить кубы поэтапно из вычисляемых значений. cube('(1)',2) == '(1,2),(1,2)'
cube(cube, float8, float8) returns cubeСоздаёт новый куб, добавляя размерность к существующему кубу. Это бывает полезно, когда нужно построить кубы поэтапно из вычисляемых значений. cube('(1,2)',3,4) == '(1,3),(2,4)'
cube_dim(cube) returns intВозвращает число размерностей куба
cube_ll_coord(cube, int) returns doubleВозвращает значение n-ной координаты левого нижнего угла куба
cube_ur_coord(cube, int) returns doubleВозвращает значение n-ной координаты правого верхнего угла куба
cube_is_point(cube) returns boolВозвращает true, если куб является точкой, то есть если два определяющих его угла совпадают.
cube_distance(cube, cube) returns doubleВозвращает расстояние между двумя кубами. Если оба куба являются точками, вычисляется обычная функция расстояния.
cube_subset(cube, int[]) returns cubeСоздаёт новый куб из существующего, используя список размерностей из массива. Может применяться для нахождения координат углов в одном измерении, например cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[2]) = '(3),(7)'. Также может применяться для удаления измерений или изменения их порядка, например так: cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[3,2,1,1]) = '(5, 3, 1, 1),(8, 7, 6, 6)'.
cube_union(cube, cube) returns cubeСоздаёт объединение двух кубов
cube_inter(cube, cube) returns cubeСоздаёт пересечение двух кубов
cube_enlarge(cube c, double r, int n) returns cubeУвеличивает размер куба на заданный радиус как минимум в n измерениях. Если радиус отрицательный, куб, наоборот, уменьшается. Это помогает создавать описанные вокруг точки кубы, полезные для поиска соседних точек. Все определённые измерения изменяются на величину радиуса r. Координаты левого нижнего угла уменьшаются на r, а координаты правого верхнего — увеличиваются. Если координата левого нижнего угла становится больше соответствующей координаты правого верхнего (это возможно, только когда r < 0), обоим координатам присваивается среднее значение. Если n превышает число определённых измерений и куб увеличивается (r >= 0), базой для дополнительных координат считается 0.

E.8.4. Поведение по умолчанию

Я полагаю, что это объединение:

select cube_union('(0,5,2),(2,3,1)', '0');
cube_union
-------------------
(0, 0, 0),(2, 5, 2)
(1 row)

не противоречит здравому смыслу, как и это пересечение

select cube_inter('(0,-1),(1,1)', '(-2),(2)');
cube_inter
-------------
(0, 0),(1, 0)
(1 row)

Во всех бинарных операциях с кубами разных размерностей, я полагаю, что куб с меньшей размерностью является декартовой проекцией; то есть в опущенных в строковом представлении координатах предполагаются нули. Таким образом, показанные выше вызовы равнозначны следующим:

cube_union('(0,5,2),(2,3,1)','(0,0,0),(0,0,0)');
cube_inter('(0,-1),(1,1)','(-2,0),(2,0)');

В следующем предикате включения применяется синтаксис точек, хотя фактически второй аргумент представляется внутри кубом. Этот синтаксис избавляет от необходимости определять отдельный тип точек и функции для предикатов (cube,point).

select cube_contains('(0,0),(1,1)', '0.5,0.5');
cube_contains
--------------
t
(1 row)

E.8.5. Замечания

Примеры использования можно увидеть в регрессионном тесте sql/cube.sql.

Во избежание некорректного применения этого типа, число размерностей кубов искусственно ограничено значением 100. Если это ограничение вас не устраивает, его можно изменить в cubedata.h.

E.8.6. Благодарности

Первый автор: Джин Селков мл. , Аргоннская национальная лаборатория, Отдел математики и компьютерных наук

Я очень благодарен в первую очередь профессору Джо Геллерштейну (http://db.cs.berkeley.edu/jmh/) за пояснение сути GiST (http://gist.cs.berkeley.edu/) и его бывшему студенту, Энди Донгу (http://best.me.berkeley.edu/~adong/), за его пример, написанный для Illustra, http://best.berkeley.edu/~adong/rtree/index.html. Я также признателен всем разработчикам Postgres в настоящем и прошлом за возможность создать свой собственный мир и спокойно жить в нём. Ещё я хотел бы выразить признательность Аргоннской лаборатории и Министерству энергетики США за годы постоянной поддержки моих исследований в области баз данных.

Небольшие изменения в этот пакет внёс Бруно Вольф III в августе/сентябре 2002 г. В том числе он перешёл от одинарной к двойной точности и добавил несколько новых функций.

Дополнительные изменения внёс Джошуа Рейх в июле 2006 г. В частности, он добавил cube(float8[], float8[]), подчистил код и перевёл его на протокол вызовов версии V1 с устаревшего протокола V0.