9.18. Функции и операторы для работы с массивами

В Таблице 9.47 показаны операторы, предназначенные для работы с массивами.

Таблица 9.47. Операторы для работы с массивами

ОператорОписаниеПримерРезультат
=равноARRAY[1.1,2.1,3.1]::int[] = ARRAY[1,2,3]t
<>не равноARRAY[1,2,3] <> ARRAY[1,2,4]t
<меньшеARRAY[1,2,3] < ARRAY[1,2,4]t
>большеARRAY[1,4,3] > ARRAY[1,2,4]t
<=меньше или равноARRAY[1,2,3] <= ARRAY[1,2,3]t
>=больше или равноARRAY[1,4,3] >= ARRAY[1,4,3]t
@>содержитARRAY[1,4,3] @> ARRAY[3,1,3]t
<@содержится вARRAY[2,2,7] <@ ARRAY[1,7,4,2,6]t
&&пересечение (есть общие элементы)ARRAY[1,4,3] && ARRAY[2,1]t
||соединение массива с массивомARRAY[1,2,3] || ARRAY[4,5,6]{1,2,3,4,5,6}
||соединение массива с массивомARRAY[1,2,3] || ARRAY[[4,5,6], [7,8,9]]{{1,2,3},{4,5,6},{7,8,9}}
||соединение элемента с массивом3 || ARRAY[4,5,6]{3,4,5,6}
||соединение массива с элементомARRAY[4,5,6] || 7{4,5,6,7}

Операторы упорядочивания массивов (<, >= и т. д.) сравнивают содержимое массивов по элементам, используя при этом функцию сравнения для B-дерева, определённую для типа данного элемента по умолчанию, и сортируют их по первому различию. В многомерных массивах элементы просматриваются по строкам (индекс последней размерности меняется в первую очередь). Если содержимое двух массивов совпадает, а размерности различаются, результат их сравнения будет определяться первым отличием в размерностях. (В PostgreSQL до версии 8.2 поведение было другим: два массива с одинаковым содержимом считались одинаковыми, даже если число их размерностей и границы индексов различались.)

Операторы вложенности массивов (<@ и @>) считают один массив вложенным в другой, если каждый элемент первого встречается во втором. Повторяющиеся элементы рассматриваются на общих основаниях, поэтому массивы ARRAY[1] и ARRAY[1,1] считаются вложенным друг в друга.

Подробнее поведение операторов с массивами описано в Разделе 8.15. За дополнительными сведениями об операторах, поддерживающих индексы, обратитесь к Разделу 11.2.

В Таблице 9.48 перечислены функции, предназначенные для работы с массивами. Дополнительная информация о них и примеры использования приведены в Разделе 8.15.

Таблица 9.48. Функции для работы с массивами

ФункцияТип результатаОписаниеПримерРезультат
array_append(anyarray, anyelement)anyarrayдобавляет элемент в конец массиваarray_append(ARRAY[1,2], 3){1,2,3}
array_cat(anyarray, anyarray)anyarrayсоединяет два массиваarray_cat(ARRAY[1,2,3], ARRAY[4,5]){1,2,3,4,5}
array_ndims(anyarray)intвозвращает число размерностей массиваarray_ndims(ARRAY[[1,2,3], [4,5,6]])2
array_dims(anyarray)textвозвращает текстовое представление размерностей массиваarray_dims(ARRAY[[1,2,3], [4,5,6]])[1:2][1:3]
array_fill(anyelement, int[] [, int[]])anyarrayвозвращает массив, заполненный заданным значением и имеющий указанные размерности, в которых нижняя граница может быть отлична от 1array_fill(7, ARRAY[3], ARRAY[2])[2:4]={7,7,7}
array_length(anyarray, int)intвозвращает длину указанной размерности массиваarray_length(array[1,2,3], 1)3
array_lower(anyarray, int)intвозвращает нижнюю границу указанной размерности массиваarray_lower('[0:2]=​{1,2,3}'::int[], 1)0
array_position(anyarray, anyelement [, int])intвозвращает позицию первого вхождения второго аргумента в массиве, начиная с элемента, выбираемого третьим аргументом, либо с первого элемента (массив должен быть одномерным)array_position(ARRAY['sun','mon','tue','wed','thu','fri','sat'], 'mon')2
array_positions(anyarray, anyelement)int[]возвращает массив с позициями всех вхождений второго аргумента в массиве, задаваемым первым аргументом (массив должен быть одномерным)array_positions(ARRAY['A','A','B','A'], 'A'){1,2,4}
array_prepend(anyelement, anyarray)anyarrayвставляет элемент в начало массиваarray_prepend(1, ARRAY[2,3]){1,2,3}
array_remove(anyarray, anyelement)anyarrayудаляет из массива все элементы, равные заданному значению (массив должен быть одномерным)array_remove(ARRAY[1,2,3,2], 2){1,3}
array_replace(anyarray, anyelement, anyelement)anyarrayзаменяет в массиве все элементы, равные заданному значению, другим значениемarray_replace(ARRAY[1,2,5,4], 5, 3){1,2,3,4}
array_to_string(anyarray, text [, text])textвыводит элементы массива через заданный разделитель и позволяет определить замену для значения NULLarray_to_string(ARRAY[1, 2, 3, NULL, 5], ',', '*')1,2,3,*,5
array_upper(anyarray, int)intвозвращает верхнюю границу указанной размерности массиваarray_upper(ARRAY[1,8,3,7], 1)4
cardinality(anyarray)intвозвращает общее число элементов в массиве, либо 0, если массив пустcardinality(ARRAY[[1,2],[3,4]])4
string_to_array(text, text [, text])text[]разбивает строку на элементы массива, используя заданный разделитель и, возможно, замену для значений NULLstring_to_array('xx~^~yy~​^~zz', '~^~', 'yy'){xx,NULL,zz}
unnest(anyarray)setof anyelementразворачивает массив в набор строкunnest(ARRAY[1,2])
1
2
(2 строки)
unnest(anyarray, anyarray [, ...])setof anyelement, anyelement [, ...]разворачивает массивы (возможно разных типов) в набор строк. Это допускается только в предложении FROM; см. Подраздел 7.2.1.4unnest(ARRAY[1,2],ARRAY['foo','bar','baz'])
1    foo
2    bar
NULL baz
(3 строки)

В функциях array_position и array_positions каждый элемент массива сравнивается с искомым значением по принципу IS NOT DISTINCT FROM.

Функция array_position возвращает NULL, если искомое значение не находится.

Функция array_positions возвращает NULL, только если в качестве массива передаётся NULL; если же в массиве не находится значение, она возвращает пустой массив.

Если для функции string_to_array в качестве разделителя задан NULL, каждый символ входной строки станет отдельным элементом в полученном массиве. Если разделитель пустая строка, строка будет возвращена целиком в массиве из одного элемента. В противном случае входная строка разбивается по вхождениям подстроки, указанной в качестве разделителя.

Если для функции string_to_array параметр замены значения NULL опущен или равен NULL, никакие подстроки во входных данных не будут заменяться на NULL. Если же параметр замены NULL опущен или равен NULL для функции array_to_string, все значения NULL просто пропускаются и никак не представляются в выходной строке.

Примечание

В поведении string_to_array по сравнению с PostgreSQL версий до 9.1 произошли два изменения. Во-первых, эта функция возвращает пустой массив (содержащий 0 элементов), а не NULL, когда входная строка имеет нулевую длину. Во-вторых, если в качестве разделителя задан NULL, эта функция разбивает строку по символам, а не просто возвращает NULL, как было раньше.

Вы также можете узнать об агрегатной функции, работающей с массивами, array_agg в Разделе 9.20.

F.68. uuid-ossp

The uuid-ossp module provides functions to generate universally unique identifiers (UUIDs) using one of several standard algorithms. There are also functions to produce certain special UUID constants. This module is only necessary for special requirements beyond what is available in core PostgreSQL. See Section 9.14 for built-in ways to generate UUIDs.

This module is considered trusted, that is, it can be installed by non-superusers who have CREATE privilege on the current database.

F.68.1. uuid-ossp Functions

Table F.42 shows the functions available to generate UUIDs. The relevant standards ITU-T Rec. X.667, ISO/IEC 9834-8:2005, and RFC 4122 specify four algorithms for generating UUIDs, identified by the version numbers 1, 3, 4, and 5. (There is no version 2 algorithm.) Each of these algorithms could be suitable for a different set of applications.

Table F.42. Functions for UUID Generation

Function

Description

uuid_generate_v1 () → uuid

Generates a version 1 UUID. This involves the MAC address of the computer and a time stamp. Note that UUIDs of this kind reveal the identity of the computer that created the identifier and the time at which it did so, which might make it unsuitable for certain security-sensitive applications.

uuid_generate_v1mc () → uuid

Generates a version 1 UUID, but uses a random multicast MAC address instead of the real MAC address of the computer.

uuid_generate_v3 ( namespace uuid, name text ) → uuid

Generates a version 3 UUID in the given namespace using the specified input name. The namespace should be one of the special constants produced by the uuid_ns_*() functions shown in Table F.43. (It could be any UUID in theory.) The name is an identifier in the selected namespace.

For example:

SELECT uuid_generate_v3(uuid_ns_url(), 'http://www.postgresql.org');

The name parameter will be MD5-hashed, so the cleartext cannot be derived from the generated UUID. The generation of UUIDs by this method has no random or environment-dependent element and is therefore reproducible.

uuid_generate_v4 () → uuid

Generates a version 4 UUID, which is derived entirely from random numbers.

uuid_generate_v5 ( namespace uuid, name text ) → uuid

Generates a version 5 UUID, which works like a version 3 UUID except that SHA-1 is used as a hashing method. Version 5 should be preferred over version 3 because SHA-1 is thought to be more secure than MD5.


Table F.43. Functions Returning UUID Constants

Function

Description

uuid_nil () → uuid

Returns a nil UUID constant, which does not occur as a real UUID.

uuid_ns_dns () → uuid

Returns a constant designating the DNS namespace for UUIDs.

uuid_ns_url () → uuid

Returns a constant designating the URL namespace for UUIDs.

uuid_ns_oid () → uuid

Returns a constant designating the ISO object identifier (OID) namespace for UUIDs. (This pertains to ASN.1 OIDs, which are unrelated to the OIDs used in Postgres Pro.)

uuid_ns_x500 () → uuid

Returns a constant designating the X.500 distinguished name (DN) namespace for UUIDs.


F.68.2. Building uuid-ossp

Historically this module depended on the OSSP UUID library, which accounts for the module's name. While the OSSP UUID library can still be found at http://www.ossp.org/pkg/lib/uuid/, it is not well maintained, and is becoming increasingly difficult to port to newer platforms. uuid-ossp can now be built without the OSSP library on some platforms. On FreeBSD and some other BSD-derived platforms, suitable UUID creation functions are included in the core libc library. On Linux, macOS, and some other platforms, suitable functions are provided in the libuuid library, which originally came from the e2fsprogs project (though on modern Linux it is considered part of util-linux-ng). When invoking configure, specify --with-uuid=bsd to use the BSD functions, or --with-uuid=e2fs to use e2fsprogs' libuuid, or --with-uuid=ossp to use the OSSP UUID library. More than one of these libraries might be available on a particular machine, so configure does not automatically choose one.

F.68.3. Author

Peter Eisentraut