F.10. cube
Этот модуль реализует тип данных cube
для представления многомерных кубов.
F.10.1. Синтаксис
В Таблице F.6 показаны внешние представления типа cube
. Буквы x
, y
и т. д. обозначают числа с плавающей точкой.
Таблица F.6. Внешние представления кубов
Внешний синтаксис | Значение |
---|---|
| Одномерная точка (или одномерный интервал нулевой длины) |
( | То же, что и выше |
| Точка в n-мерном пространстве, представленная внутри как куб нулевого объёма |
( | То же, что и выше |
( | Одномерный интервал, начинающийся в точке x и заканчивающийся в y , либо наоборот; порядок значения не имеет |
[( | То же, что и выше |
( | N-мерный куб, представленный парой диагонально противоположных углов |
[( | То же, что и выше |
В каком порядке вводятся противоположные углы куба, не имеет значения. Функции, принимающие тип cube
, автоматически меняют углы местами, чтобы получить единое внутреннее представление «левый нижний — правый верхний». Когда эти углы совмещаются, в cube
для экономии пространства хранится только один угол с флагом «является точкой».
Пробельные символы игнорируются, так что [(
не отличается от x
),(y
)][ (
.x
), ( y
) ]
F.10.2. Точность
Значения хранятся внутри как 64-битные числа с плавающей точкой. Это значит, что числа с более чем 16 значащими цифрами будут усекаться.
F.10.3. Использование
В Таблице F.7 показаны операторы, предназначенные для работы с типом cube
.
Таблица F.7. Операторы для кубов
Оператор | Результат | Описание |
---|---|---|
a = b | boolean | Кубы a и b идентичны. |
a && b | boolean | Кубы a и b пересекаются. |
a @> b | boolean | Куб a включает куб b. |
a <@ b | boolean | Куб a включён в куб b. |
a < b | boolean | Куб a меньше куба b. |
a <= b | boolean | Куб a меньше или равен кубу b. |
a > b | boolean | Куб a больше куба b. |
a >= b | boolean | Куб a больше или равен кубу b. |
a <> b | boolean | Куб a не равен кубу b. |
a -> n | float8 | Выдаёт n -ную координату куба (считая с 1). |
a ~> n | float8 | Выдаёт n -ную координату куба следующим образом: n = 2 * k - 1 обозначает нижнюю границу k -той размерности, n = 2 * k обозначает верхнюю границу k -той размерности. Отрицательные n обозначают обратное значение соответствующей положительной координаты. Этот оператор предназначен для поддержки KNN-GiST. |
a <-> b | float8 | Евклидово расстояние между a и b. |
a <#> b | float8 | Расстояние городских кварталов (метрика L-1) между a и b. |
a <=> b | float8 | Расстояние Чебышева (метрика L-inf) между a и b. |
(До версии PostgreSQL 8.2 операторы включения @>
и <@
обозначались соответственно как @
и ~
. Эти имена по-прежнему действуют, но считаются устаревшими и в конце концов будут упразднены. Заметьте, что старые имена произошли из соглашения, которому раньше следовали ключевые геометрические типы данных!)
Скалярные операторы упорядочивания (<
, >=
и т. д.) не имеют большого смысла ни для каких практических целей, кроме сортировки. Эти операторы сначала сравнивают первые координаты и если они равны, сравнивают вторые и т. д. Они предназначены в основном для поддержки класса операторов индекса-B-дерева для типа cube
, который может быть полезен, например, если вы хотите создать ограничение UNIQUE для столбца типа cube
.
Модуль cube
также предоставляет класс операторов индекса GiST для значений cube
. Индекс GiST для cube
может применяться для поиска значений в выражениях с операторами =
, &&
, @>
и <@
в предложениях WHERE
.
GiST-индекс для cube
может быть полезен и для поиска ближайших соседей с использованием операторов метрики <->
, <#>
и <=>
в предложениях ORDER BY
. Например, ближайшего соседа точки в трёхмерном пространстве (0.5, 0.5, 0.5) можно эффективно найти так:
SELECT c FROM test ORDER BY c <-> cube(array[0.5,0.5,0.5]) LIMIT 1;
Оператор ~>
может также использоваться таким образом, чтобы эффективно выдавать первые несколько значений, отсортированных по выбранной координате. Например, чтобы получить первые несколько кубов, упорядоченных по возрастанию первой координаты (левого нижнего угла), можно использовать следующий запрос:
SELECT c FROM test ORDER BY c ~> 1 LIMIT 5;
А чтобы получить двумерные кубы, отсортированные по убыванию первой координаты правого верхнего угла:
SELECT c FROM test ORDER BY c ~> 3 DESC LIMIT 5;
В Таблице F.8 перечислены все доступные функции.
Таблица F.8. Функции для работы с кубами
Функция | Результат | Описание | Пример |
---|---|---|---|
cube(float8) | cube | Создаёт одномерный куб, у которого обе координаты равны. | cube(1) == '(1)' |
cube(float8, float8) | cube | Создаёт одномерный куб. | cube(1,2) == '(1),(2)' |
cube(float8[]) | cube | Создаёт куб нулевого объёма по координатам, определяемым массивом. | cube(ARRAY[1,2]) == '(1,2)' |
cube(float8[], float8[]) | cube | Создаёт куб с координатами правого верхнего и левого нижнего углов, определяемыми двумя массивами, которые должны быть одинаковой длины. | cube(ARRAY[1,2], ARRAY[3,4]) == '(1,2),(3,4)' |
cube(cube, float8) | cube | Создаёт новый куб, добавляя размерность к существующему кубу с одинаковым значением новой координаты для обеих углов. Это бывает полезно, когда нужно построить кубы поэтапно из вычисляемых значений. | cube('(1,2),(3,4)'::cube, 5) == '(1,2,5),(3,4,5)' |
cube(cube, float8, float8) | cube | Создаёт новый куб, добавляя размерность к существующему кубу. Это бывает полезно, когда нужно построить кубы поэтапно из вычисляемых значений. | cube('(1,2),(3,4)'::cube, 5, 6) == '(1,2,5),(3,4,6)' |
cube_dim(cube) | integer | Возвращает число размерностей куба. | cube_dim('(1,2),(3,4)') == '2' |
cube_ll_coord(cube, integer) | float8 | Возвращает значение n -ной координаты левого нижнего угла куба. | cube_ll_coord('(1,2),(3,4)', 2) == '2' |
cube_ur_coord(cube, integer) | float8 | Возвращает значение n -ной координаты правого верхнего угла куба. | cube_ur_coord('(1,2),(3,4)', 2) == '4' |
cube_is_point(cube) | boolean | Возвращает true, если куб является точкой, то есть если два определяющих его угла совпадают. | |
cube_distance(cube, cube) | float8 | Возвращает расстояние между двумя кубами. Если оба куба являются точками, вычисляется обычная функция расстояния. | |
cube_subset(cube, integer[]) | cube | Создаёт новый куб из существующего, используя список размерностей из массива. Может применяться для получения координат углов в одном измерении, для удаления измерений и изменения их порядка. | cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[2]) == '(3),(7)' cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[3,2,1,1]) == '(5,3,1,1),(8,7,6,6)' |
cube_union(cube, cube) | cube | Создаёт объединение двух кубов. | |
cube_inter(cube, cube) | cube | Создаёт пересечение двух кубов. | |
cube_enlarge(c cube, r double, n integer) | cube | Увеличивает размер куба на заданный радиус r как минимум в n измерениях. Если радиус отрицательный, куб, наоборот, уменьшается. Все определённые измерения изменяются на величину радиуса r . Координаты левого нижнего угла уменьшаются на r , а координаты правого верхнего увеличиваются на r . Если координата левого нижнего угла становится больше соответствующей координаты правого верхнего (это возможно, только когда r < 0), обоим координатам присваивается их среднее значение. Если n превышает число определённых измерений и куб увеличивается (r > 0), добавляются дополнительные размерности, недостающие до n ; начальным значением для дополнительных координат считается ноль. Эта функция полезна для создания окружающих точку прямоугольников для поиска ближайших точек. | cube_enlarge('(1,2),(3,4)', 0.5, 3) == '(0.5,1.5,-0.5),(3.5,4.5,0.5)' |
F.10.4. Поведение по умолчанию
Я полагаю, что это объединение:
select cube_union('(0,5,2),(2,3,1)', '0'); cube_union ------------------- (0, 0, 0),(2, 5, 2) (1 row)
не противоречит здравому смыслу, как и это пересечение
select cube_inter('(0,-1),(1,1)', '(-2),(2)'); cube_inter ------------- (0, 0),(1, 0) (1 row)
Во всех бинарных операциях с кубами разных размерностей, я полагаю, что куб с меньшей размерностью является декартовой проекцией; то есть в опущенных в строковом представлении координатах предполагаются нули. Таким образом, показанные выше вызовы равнозначны следующим:
cube_union('(0,5,2),(2,3,1)','(0,0,0),(0,0,0)'); cube_inter('(0,-1),(1,1)','(-2,0),(2,0)');
В следующем предикате включения применяется синтаксис точек, хотя фактически второй аргумент представляется внутри кубом. Этот синтаксис избавляет от необходимости определять отдельный тип точек и функции для предикатов (cube,point).
select cube_contains('(0,0),(1,1)', '0.5,0.5'); cube_contains -------------- t (1 row)
F.10.5. Примечания
Примеры использования можно увидеть в регрессионном тесте sql/cube.sql
.
Во избежание некорректного применения этого типа, число размерностей кубов искусственно ограничено значением 100. Если это ограничение вас не устраивает, его можно изменить в cubedata.h
.
F.10.6. Благодарности
Первый автор: Джин Селков мл. <selkovjr@mcs.anl.gov>
, Аргоннская национальная лаборатория, Отдел математики и компьютерных наук
Я очень благодарен в первую очередь профессору Джо Геллерштейну (https://dsf.berkeley.edu/jmh/) за пояснение сути GiST (http://gist.cs.berkeley.edu/) и его бывшему студенту, Энди Донгу, за пример, написанный для Illustra. Я также признателен всем разработчикам Postgres в настоящем и прошлом за возможность создать свой собственный мир и спокойно жить в нём. Ещё я хотел бы выразить признательность Аргоннской лаборатории и Министерству энергетики США за годы постоянной поддержки моих исследований в области баз данных.
Небольшие изменения в этот пакет внёс Бруно Вольф III <bruno@wolff.to>
в августе/сентябре 2002 г. В том числе он перешёл от одинарной к двойной точности и добавил несколько новых функций.
Дополнительные изменения внёс Джошуа Рейх <josh@root.net>
в июле 2006 г. В частности, он добавил cube(float8[], float8[])
, подчистил код и перевёл его на протокол вызовов версии V1 с устаревшего протокола V0.