CREATE TYPE
CREATE TYPE — создать новый тип данных
Синтаксис
CREATE TYPEимя
AS ( [имя_атрибута
тип_данных
[ COLLATEправило_сортировки
] [, ... ] ] ) CREATE TYPEимя
AS ENUM ( [ 'метка
' [, ... ] ] ) CREATE TYPEимя
AS RANGE ( SUBTYPE =подтип
[ , SUBTYPE_OPCLASS =класс_оператора_подтипа
] [ , COLLATION =правило_сортировки
] [ , CANONICAL =функция_нормализации
] [ , SUBTYPE_DIFF =функция_разницы_подтипа
] [ , MULTIRANGE_TYPE_NAME =имя_мультидиапазонного_типа
] ) CREATE TYPEимя
( INPUT =функция_ввода
, OUTPUT =функция_вывода
[ , RECEIVE =функция_получения
] [ , SEND =функция_отправки
] [ , TYPMOD_IN =функция_ввода_модификатора_типа
] [ , TYPMOD_OUT =функция_вывода_модификатора_типа
] [ , ANALYZE =функция_анализа
] [ , SUBSCRIPT =функция_обращения_по_индексу
] [ , INTERNALLENGTH = {внутр_длина
| VARIABLE } ] [ , PASSEDBYVALUE ] [ , ALIGNMENT =выравнивание
] [ , STORAGE =хранение
] [ , LIKE =тип_образец
] [ , CATEGORY =категория
] [ , PREFERRED =предпочитаемый
] [ , DEFAULT =default
] [ , ELEMENT =элемент
] [ , DELIMITER =разделитель
] [ , COLLATABLE =сортируемый
] ) CREATE TYPEимя
Описание
CREATE TYPE
регистрирует новый тип данных для использования в текущей базе данных. Владельцем типа становится создавший его пользователь.
Если указано имя схемы, тип создаётся в указанной схеме. В противном случае он создаётся в текущей схеме. Имя типа должно отличаться от имён любых других существующих типов или доменов в той же схеме. (А так как с таблицами связываются типы данных, имя типа должно также отличаться и от имён существующих таблиц в этой схеме.)
Команда CREATE TYPE
имеет пять форм, показанных выше в сводке синтаксиса. Они создают соответственно составной тип, перечисление, диапазон, базовый тип или тип-пустышку. Первые четыре эти типа рассматриваются по порядку ниже. Тип-пустышка представляет собой просто заготовку для типа, который будет определён позже; он создаётся командой CREATE TYPE
с одним именем, без параметров. Типы-пустышки необходимы для определения прямых ссылок при создании базовых типов и типов-диапазонов, как описывается в соответствующих разделах.
Составные типы
Первая форма CREATE TYPE
создаёт составной тип. Составной тип задаётся списком имён и типами данных атрибутов. Если тип данных является сортируемым, то для атрибута можно также задать правило сортировки. Составной тип по сути не отличается от типа строки таблицы, но CREATE TYPE
избавляет от необходимости создавать таблицу, когда всё, что нужно, это создать тип. Отдельный составной тип может быть полезен, например, для передачи аргументов или результатов функции.
Чтобы создать составной тип, необходимо иметь право USAGE
для типов всех его атрибутов.
Типы перечислений
Вторая форма CREATE TYPE
создаёт тип-перечисление (такие типы описываются в Разделе 8.7). Перечисления принимают список меток в кавычках. Максимальная длина каждой метки — NAMEDATALEN
байт (64 байта в стандартной сборке Postgres Pro). (Также возможно создать перечисляемый тип без меток, но этот тип нельзя будет использовать для хранения значений, пока командой ALTER TYPE
не будет добавлена хотя бы одна метка.)
Диапазонные типы
Третья форма CREATE TYPE
создаёт тип-диапазон (такие типы описываются в Разделе 8.17).
Задаваемый для диапазона подтип
может быть любым типом со связанным классом операторов B-дерева (что позволяет определить порядок значений в диапазоне). Обычно порядок элементов определяет класс операторов B-дерева по умолчанию, но его можно изменить, задав имя другого класса в параметре класс_операторов_подтипа
. Если подтип поддерживает сортировку и требуется, чтобы значения упорядочивались с нестандартным правилом сортировки, его имя можно задать в параметре правило_сортировки
.
Необязательная функция_нормализации
должна принимать один аргумент определяемого типа диапазона и возвращать значение того же типа. Она используется для преобразования значений диапазона в нормализованную форму, когда это уместно. За дополнительными сведениями обратитесь к Подразделу 8.17.8. Создаётся функция_нормализации
несколько нетривиально, так как она должна быть уже определена, прежде чем можно будет объявить тип-диапазон. Для этого нужно сначала создать тип-пустышку, который будет заготовкой типа, не имеющей никаких свойств, кроме имени и владельца. Это можно сделать, выполнив команду CREATE TYPE
без дополнительных параметров. Затем можно объявить функцию, для которой тип-пустышка будет типом аргумента и результата, и, наконец, объявить тип-диапазон с тем же именем. При этом тип-пустышка автоматически заменится полноценным типом-диапазоном.имя
Необязательная функция_разницы_подтипа
должна принимать в аргументах два значения типа подтип
и возвращать значение double precision
, представляющее разницу между двумя данными значениями. Хотя эту функцию можно не использовать, она позволяет кардинально увеличить эффективность индексов GiST для столбцов с типом-диапазоном. За дополнительными сведениями обратитесь к Подразделу 8.17.8.
В необязательном параметре имя_мультидиапазонного_типа
задаётся имя соответствующего типа. В отсутствие данного параметра имя этого типа выбирается автоматически следующим образом. Если имя диапазонного типа содержит подстроку range
, в имени мультидиапазонного типа она заменяется подстрокой multirange
. В противном случае к имени диапазонного типа добавляется окончание _multirange
.
Базовые типы
Четвёртая форма CREATE TYPE
создаёт новый базовый тип (скалярный тип). Чтобы создать новый базовый тип, нужно быть суперпользователем. (Это ограничение введено потому, что ошибочное определение типа может вызвать нарушения или даже сбой в работе сервера.)
Эти параметры могут перечисляться в любом порядке, не только в показанном выше, и большинство из них необязательные. Прежде чем создавать тип, необходимо зарегистрировать две или более функций (с помощью CREATE FUNCTION
). Обязательными являются функции функция_ввода
и функция_вывода
, тогда как функция_получения
, функция_отправки
, функция_модификатора_типа
, функция_вывода_модификатора_типа
, функция_анализа
и функция_обращения_по_индексу
могут отсутствовать. Обычно эти функции разрабатываются на C или другом низкоуровневом языке.
Функция_ввода
преобразует внешнее текстовое представление типа во внутреннее, с которым работают операторы и функции, определённые для этого типа. Функция_вывода
выполняет обратное преобразование. Функцию ввода можно объявить как принимающую один аргумент типа cstring
, либо как принимающую три аргумента типов cstring
, oid
и integer
. В первом аргументе передаётся вводимый текст в виде строки в стиле C, во втором аргументе — собственный OID типа (кроме типов массивов, для которых передаётся OID типа элемента), а в третьем — модификатор_типа
для целевого столбца, если он определён (или -1 в противном случае). Функция ввода должна возвращать значение нового типа данных. Обычно функция ввода должна быть строгой (STRICT); если это не так, при получении на вход значения NULL она будет вызываться с первым параметром NULL. Функция может в этом случае сама вернуть NULL или вызвать ошибку. (Это полезно в основном для поддержки функций ввода доменных типов, которые не должны принимать данные NULL.) Функция вывода должна принимать один аргумент нового типа данных, а возвращать она должна cstring
. Для значений NULL функции вывода не вызываются.
Необязательная функция_получения
преобразует двоичное внешнее представление типа во внутреннее представление. Если эта функция отсутствует, новый тип не сможет участвовать в двоичном вводе. Двоичное представление следует выбирать таким, чтобы оно легко переводилось во внутреннюю форму и при этом было переносимым до разумной степени. (Например, для стандартных целочисленных типов данных во внешнем двоичном представлении выбран сетевой порядок байтов, тогда как внутреннее представление определяется порядком байтов в процессоре.) Функция получения должна выполнить проверку вводимого значения на допустимость. Функция получения может быть объявлена как принимающая один аргумент типа internal
, либо как принимающая три аргумента типов internal
, oid
и integer
. В первом аргументе передаётся указатель на буфер StringInfo
, содержащий полученную байтовую строку, а дополнительные аргументы такие же, как и для функции ввода текста. Функция получения должна возвращать значение нового типа данных. Обычно функция получения должна быть строгой (STRICT); если это не так, при получении на вход значения NULL, она будет вызываться с первым параметром NULL. Функция может в этом случае сама вернуть NULL или вызывать ошибку. (Это полезно в основном для поддержки функций получения доменных типов, которые не должны принимать значения NULL.) Подобным образом, необязательная функция_отправки
преобразует данные из внутреннего во внешнее двоичное представление. Если эта функция не определена, новый тип не может участвовать в двоичном выводе. Функция отправки должна принимать один аргумент нового типа данных, а возвращать она должна bytea
. Для значений NULL функции отправки не вызываются.
Здесь у вас может возникнуть вопрос, как функции ввода и вывода могут быть объявлены принимающими или возвращающими значения нового типа, если они должны быть созданы до объявления нового типа. Ответ довольно прост: сначала нужно создать тип-пустышку, который будет заготовкой типа, не имеющей никаких свойств, кроме имени и владельца. Это можно сделать, выполнив команду CREATE TYPE
без дополнительных параметров. Затем можно будет определить функции ввода/вывода на C, ссылающиеся на этот тип. И наконец, команда имя
CREATE TYPE
с полным определением заменит тип-пустышку окончательным и полноценным определением, после чего новый тип можно будет использовать как обычно.
Необязательные функция_ввода_модификатора_типа
и функция_вывода_модификатора_типа
требуются, только если типы поддерживают модификаторы, или, другими словами, дополнительные ограничения, связываемые с объявлением типа, например char(5)
или numeric(30,2)
. В Postgres Pro типы могут принимать в качестве модификаторов одну или несколько простых констант или идентификаторов. Однако эти данные должны упаковываться в единственное неотрицательное целочисленное значение, которое и будет храниться в системных каталогах. Функция_ввода_модификатора_типа
получает объявленные модификаторы в виде строки cstring
. Она должна проверить значения на допустимость (и вызвать ошибку, если они неверны), а затем выдать неотрицательное значение integer
, которое будет сохранено в столбце «typmod». Если для типа не определена функция_ввода_модификатора_типа
, модификаторы типа приниматься не будут. Функция_вывода_модификатора_типа
преобразует внутреннее целочисленное значение typmod обратно, в форму, понятную пользователю. Она должна вернуть значение cstring
, которое именно в этом виде будет добавлено к имени типа; например, функция для numeric
должна вернуть (30,2)
. Функция_вывода_модификатора_типа
может быть опущена, в этом случае сохранённое целочисленное значение typmod по умолчанию будет выводиться просто в виде числа, заключённого в скобки.
Необязательная функция_анализа
выполняет сбор специфической для этого типа статистики в столбцах с таким типом данных. По умолчанию ANALYZE
пытается собрать статистику, используя операторы «равно» и «меньше», если для этого типа определён класс операторов B-дерева по умолчанию. Для нескалярных типов это поведение скорее всего не подойдёт, поэтому его можно переопределить, задав собственную функцию анализа. Эта функция должна принимать единственный аргумент типа internal
и возвращать результат boolean
.
Необязательное указание функции_обращения_по_индексу
позволяет добавить для типа возможность обращения по индексу в SQL-командах. Указание этой функции не делает тип «настоящим» массивом; например, такой тип не будет рассматриваться как возможный тип результата конструкций ARRAY[]
. Но если извлечение значений при обращении по индексу для некоторого типа выглядит естественным, заданная функция_обращения_по_индексу
позволяет определить, что именно подразумевается под таким обращением. Данная функция должна объявляться как принимающая один аргумент типа internal
и возвращающая результат типа internal
, в котором передаётся указатель на структуру с методами (функциями), реализующими обращение по индексу. В деталях API этих методов описывается в src/include/nodes/subscripting.h
. Дополнительная информация приведена в Типы массивов ниже.
Если особенности внутреннего представления нового типа известны функциям ввода/вывода и другим функциям, созданным специально для работы с этим типом, необходимо определить ряд характеристик внутреннего представления, о которых должен знать Postgres Pro. В первую очередь это internallength
(внутренняя длина). Если базовый тип данных имеет фиксированную длину, в internallength
указывается эта длина в виде положительного числа, а если длина переменная, в internallength
задаётся значение VARIABLE
. (Внутри при этом typlen
принимает значение -1.) Внутреннее представление всех типов переменной длины должно начинаться с 4-байтового целого, задающего общую длину значения этого типа. (Заметьте, что поле длины часто кодируется, как описано в Разделе 73.2; обращаться к нему напрямую неразумно.)
Необязательный флаг PASSEDBYVALUE
указывает, что значения этого типа данных передаются по значению, а не по ссылке. Типы, передаваемые по значению, должны быть фиксированной длины и их внутреннее представление не может быть больше размера типа Datum
(4 байта на одних машинах, 8 — на других).
Параметр выравнивание
определяет, как требуется выравнивать данные этого типа. Допускается выравнивание по границам 1, 2, 4 или 8 байт. Заметьте, что типы переменной длины должны быть выровнены как минимум по границе 4 байт, так как их первым компонентом обязательно должен быть int4
.
Параметр хранение
позволяет выбрать стратегию хранения для типов данных переменной длины. (Для типов с фиксированной длиной поддерживается только вариант plain
.) Если выбрана стратегия plain
, данные этого типа всегда хранятся внутри, без сжатия. Со стратегией extended
система сначала попытается сжать большое значение, а затем выносит его из строки основной таблицы, если оно всё же окажется слишком большим. С external
значение может быть вынесено из основной таблицы, но система не будет пытаться сжать его. Стратегия main
позволяет сжать данные, но не стремится вынести их из основной таблицы. (Элементы данных с этой стратегией хранения тем не менее могут быть вынесены из основной таблицы, если другого способа уместить их в строке нет, но всё же она отдаёт большее предпочтение основной таблице, по сравнению со стратегиями extended
и external
.)
Значения параметра хранение
, отличные от plain
, подразумевают, что функции типа данных могут принимать значения в формате toast, описанном в Разделе 73.2 и Подразделе 40.13.1. Эти значения просто определяют стратегию хранения TOAST по умолчанию для столбцов отделяемого в TOAST типа данных; пользователи могут выбирать другие стратегии для отдельных столбцов, применяя команду ALTER TABLE SET STORAGE
.
Параметр тип_образец
позволяет задать основные свойства представления типа другим способом: скопировать их из существующего типа. В частности, из указанного типа будут скопированы свойства internallength
, passedbyvalue
, alignment
и storage
. (Также возможно, хотя обычно это не требуется, переопределить некоторые из этих значений, указав их вместе с предложением LIKE
.) Определять представление типа таким образом особенно удобно, когда низкоуровневая реализация нового типа некоторым образом опирается на существующий тип.
Параметры категория
и предпочитаемый
позволяют определять, какое неявное приведение будет применяться в неоднозначных ситуациях. Каждый тип данных принадлежит к некоторой категории, обозначаемой одним символом ASCII, при этом он может быть, либо не быть «предпочитаемым» в этой категории. Анализатор запроса по возможности выберет приведение к предпочитаемому типу (но только среди других типов той же категории), когда это может помочь разрешить имя перегруженной функции или оператора. За дополнительными подробностями обратитесь к Главе 10. Если для типа не определено неявное приведение к какому-либо другому типу или обратное, для этих параметров достаточно оставить значения по умолчанию. Однако если есть группа связанных типов, для которых определены неявные приведения, часто бывает полезно пометить их все как принадлежащие некоторой категории и назначить один или два «наиболее общих» предпочитаемыми в этой категории. Параметр категория
особенно полезен при добавлении типа, определённого пользователем, в существующую встроенную категорию, например, в категорию числовых или строковых типов. Однако так же возможно создать категории типов, полностью определённые пользователем. В качестве имени такой категории можно выбрать любой ASCII-символ, кроме латинской заглавной буквы.
Если пользователь хочет назначить столбцам с этим типом данных значение по умолчанию, отличное от NULL, он может задать его в этой команде, указав его после ключевого слова DEFAULT
. (Такое значение по умолчанию можно переопределить явным предложением DEFAULT
, добавленным при создании столбца.)
Чтобы обозначить, что тип является массивом фиксированной длины, укажите тип элементов массива, воспользовавшись ключевым словом ELEMENT
. Например, чтобы определить массив из четырёхбайтовых целых (int4
), укажите ELEMENT = int4
. За подробностями обратитесь к Типы массивов.
Параметр delimiter
позволяет задать разделитель, который будет вставляться между значениями во внешнем представлении массива с элементами этого типа. По умолчанию разделителем является запятая (,
). Заметьте, что разделитель связывается с типом элементов массива, а не с типом самого массива.
Если необязательный логический параметр сортируемый
равен true, определения столбцов и выражения с этим типом могут включать указания о порядке сортировки, в предложении COLLATE
. Как именно будут использоваться эти указания, зависит от реализации функций, работающих с этим типом; эти указания не действуют автоматически просто от того, что тип помечен как сортируемый.
Типы массивов
При создании любого нового типа Postgres Pro автоматически создаёт соответствующий тип массива, имя которого он получает, добавляя подчёркивание перед именем типа элементов. Если полученное имя оказывается не короче NAMEDATALEN
байт, оно усекается. (Если полученное таким образом имя конфликтует с именем уже существующего типа, процесс повторяется, пока не будет получено уникальное имя.) Этот неявно создаваемый тип массива имеет переменную длину и использует встроенные функции ввода и вывода array_in
и array_out
. Более того, этот тип используется системой при обработке конструкций ARRAY[] с типом, созданным пользователем. Тип массива отражает любые изменения владельца или схемы связанного типа элемента и удаляется сам при удалении типа элемента.
Вы можете вполне резонно спросить, зачем нужен параметр ELEMENT
, если система создаёт правильный тип массива автоматически. В основном параметр ELEMENT
полезен в случае, когда вы создаёте тип фиксированной длины, который внутри оказывается массивом одинаковых элементов, и вы хотите, чтобы к этим элементам можно было обращаться по индексу, помимо того, что вы можете реализовать какие угодно операции с типом в целом. Например, тип point
представлен просто как два числа с плавающей точкой, к которым можно обратиться так: point[0]
и point[1]
. Заметьте, что это работает только с типами фиксированной длины, которые представляют собой в точности последовательность одинаковых полей фиксированной длины. По историческим причинам (т. е. это определённо некорректно, но менять уже слишком поздно), индексы в массивах фиксированной длины начинаются с нуля, а не с 1, как в массивах переменной длины.
Указание SUBSCRIPT
позволяет добавить для типа данных поддержку обращения по индексу, даже для типов, которые система не считает массивами. Поведение, описанное выше для массивов фиксированной длины, на самом деле реализуется функцией raw_array_subscript_handler
, заданной в качестве обработчика SUBSCRIPT
— она используется автоматически, если для типа фиксированной длины задан параметр ELEMENT
, но не задан SUBSCRIPT
.
Когда задаётся пользовательская функция SUBSCRIPT
, указывать также ELEMENT
обязательно, только если функция-обработчик SUBSCRIPT
должна узнать typelem
, чтобы определить возвращаемый тип. Учтите, что с указанием ELEMENT
система будет предполагать, что новый тип содержит тип элемента либо каким-либо образом физически зависит от него; например, изменить свойства типа элемента нельзя, если созданы какие-либо столбцы зависимого типа.
Параметры
имя
Имя создаваемого типа (возможно, дополненное схемой).
имя_атрибута
Имя атрибута (столбца) составного типа.
тип_данных
Имя существующего типа данных, который станет типом столбца составного типа.
правило_сортировки
Имя существующего правила сортировки, связываемого со столбцом составного типа или с типом-диапазоном.
метка
Строковая константа, представляющая текстовую метку, связанную с отдельным значением типа-перечисления.
подтип
Имя типа элемента, множество значений которого будет представлять тип-диапазон.
класс_оператора_подтипа
Имя класса операторов B-дерева для подтипа.
функция_нормализации
Имя функции нормализации для типа-диапазона.
функция_разницы_подтипа
Имя функции разницы для значений подтипа.
имя_мультидиапазонного_типа
Имя соответствующего мультидиапазонного типа.
функция_ввода
Имя функции, преобразующей данные из внешнего текстового представления типа во внутреннюю форму.
функция_вывода
Имя функции, преобразующей данные из внутренней формы во внешнее текстовое представление типа.
функция_получения
Имя функции, преобразующей данные из внешнего двоичного представления типа во внутреннюю форму.
функция_отправки
Имя функции, преобразующей данные из внутренней формы во внешнее двоичное представление типа.
функция_ввода_модификатора_типа
Имя функции, преобразующей массив модификаторов типа во внутреннюю форму.
функция_вывода_модификатора_типа
Имя функции, преобразующей внутреннюю форму модификаторов типа во внешнее текстовое представление.
функция_анализа
Имя функции, производящей статистический анализ типа данных.
функция_обращения_по_индексу
Имя функции, определяющей, как для типа данных работает извлечение значения по индексу.
внутр_длина
Числовая константа, задающая размер внутреннего представления нового типа в байтах. По умолчанию предполагается, что тип имеет переменную длину.
выравнивание
Требуемое выравнивание для типа данных. Допустимые значения этого параметра, если он указывается:
char
,int2
,int4
илиdouble
; по умолчанию подразумеваетсяint4
.хранение
Стратегия хранения для типа данных. Допустимые значения этого параметра, если он указывается:
plain
,external
,extended
илиmain
; по умолчанию подразумеваетсяplain
.тип_образец
Имя существующего типа данных, от которого новый тип получит свойства представления. Из этого типа будут скопированы значения параметров
internallength
,passedbyvalue
,alignment
иstorage
, если их не переопределят явные указания, заданные дополнительно в этой командеCREATE TYPE
.категория
Код категории (один символ ASCII) для этого типа. По умолчанию подразумевается
'U'
(что означает пользовательский тип, «User-defined»). Коды других стандартных категорий можно найти в Таблице 55.67. Для нестандартных категорий можно выбрать другие ASCII-символы.предпочитаемый
Если значение этого параметра равно true, создаваемый тип будет предпочитаемым в своей категории. По умолчанию подразумевается false. Будьте очень осторожны, создавая новый предпочитаемый тип в существующей категории, так как это может поменять поведение выражений неожиданным образом.
default
Значение по умолчанию для создаваемого типа данных. Если не указано, значением по умолчанию будет NULL.
элемент
Создаваемый тип будет массивом; этот параметр определяет тип элементов массива.
разделитель
Символ, разделяющий значения в массивах, образованных из значений создаваемого типа.
сортируемый
Если значение этого параметра равно true, в операциях с создаваемым типом может учитываться информация о правилах сортировки. По умолчанию подразумевается false.
Примечания
Так как на использование типа данных после создания не накладываются ограничения, объявление базового типа или типа-диапазона по сути даёт всем право на выполнение функций, упомянутых в определении типа. Обычно это не проблема для таких функций, какие бывают полезны в определении типов. Но прежде чем создать тип, преобразование которого во внешнюю форму и обратно будет использовать «секретную» информацию, стоит подумать дважды.
В PostgreSQL до версии 8.3 имя генерируемого типа-массива всегда образовалось из имени типа элемента и добавленного спереди символа подчёркивания (_
). (Таким образом, допустимая максимальная длина имени типа была на символ меньше, чем длины других имён.) Хотя и сейчас имя типа массива чаще всего образуется таким образом, оно может быть и другим в случае достижения максимальной длины или конфликтов с именами пользовательских типов, начинающихся с подчёркивания. Поэтому полагаться на это соглашение в коде не рекомендуется. Вместо этого, имя типа массива, связанного с данным типом, следует определять по значению pg_type
.typarray
.
Вообще же можно посоветовать не использовать имена типов и таблиц, начинающиеся с подчёркивания. Хотя сервер сможет сгенерировать другое имя, не конфликтующее с пользовательским, некоторая путаница всё же возможна, особенно со старыми клиентскими приложениями, которые могут полагать, что имя типа, начинающееся с подчёркивания, всегда относится к типу массива.
В PostgreSQL до версии 8.2 у CREATE TYPE
отсутствовала форма для создания типа-пустышки. Поэтому для создания нового базового типа требовалось сначала создать функцию ввода. При таком подходе Postgres Pro воспринимал тип возврата функции ввода как имя нового типа данных и неявно создавал тип-пустышку, на который затем можно было ссылаться в определениях остальных функций ввода/вывода. Этот подход по-прежнему работает, но считается устаревшим и может быть запрещён в будущих версиях. Кроме того, во избежание непреднамеренного заполнения каталогов типами-пустышками, появляющимися в результате простых опечаток в определении функций, тип-пустышка будет создаваться таким образом, только если функция ввода написана на C.имя
Примеры
В этом примере создаётся составной тип, а затем он используется в определении функции:
CREATE TYPE compfoo AS (f1 int, f2 text); CREATE FUNCTION getfoo() RETURNS SETOF compfoo AS $$ SELECT fooid, fooname FROM foo $$ LANGUAGE SQL;
В этом примере создаётся тип-перечисление, а затем он используется в определении таблицы:
CREATE TYPE bug_status AS ENUM ('new', 'open', 'closed'); CREATE TABLE bug ( id serial, description text, status bug_status );
В этом примере создаётся тип-диапазон:
CREATE TYPE float8_range AS RANGE (subtype = float8, subtype_diff = float8mi);
В следующем примере создаётся базовый тип данных box
, а затем он используется в определении таблицы:
CREATE TYPE box; CREATE FUNCTION my_box_in_function(cstring) RETURNS box AS ... ; CREATE FUNCTION my_box_out_function(box) RETURNS cstring AS ... ; CREATE TYPE box ( INTERNALLENGTH = 16, INPUT = my_box_in_function, OUTPUT = my_box_out_function ); CREATE TABLE myboxes ( id integer, description box );
Если бы внутренней структурой box
был массив из четырёх элементов float4
, вместо этого можно было бы использовать определение:
CREATE TYPE box ( INTERNALLENGTH = 16, INPUT = my_box_in_function, OUTPUT = my_box_out_function, ELEMENT = float4 );
В таком случае к числам, составляющим значение этого типа, можно было бы обращаться по индексу. В остальном поведение этого типа будет таким же.
В этом примере создаётся тип большого объекта, а затем он используется в определении таблицы:
CREATE TYPE bigobj ( INPUT = lo_filein, OUTPUT = lo_fileout, INTERNALLENGTH = VARIABLE ); CREATE TABLE big_objs ( id integer, obj bigobj );
Другие примеры, в том числе демонстрирующие подходящие функции ввода/вывода, можно найти в Разделе 40.13.
Совместимость
Первая форма команды CREATE TYPE
, создающая составной тип, соответствует стандарту SQL. Другие формы являются расширениями Postgres Pro. Для оператора CREATE TYPE
в стандарте SQL также определены другие формы, не реализованные в Postgres Pro.
Возможность создавать составной тип без атрибутов — специфическое отклонение Postgres Pro от стандарта (как и аналогичная особенность команды CREATE TABLE
).
См. также
ALTER TYPE, CREATE DOMAIN, CREATE FUNCTION, DROP TYPECREATE TYPE
CREATE TYPE — define a new data type
Synopsis
CREATE TYPEname
AS ( [attribute_name
data_type
[ COLLATEcollation
] [, ... ] ] ) CREATE TYPEname
AS ENUM ( [ 'label
' [, ... ] ] ) CREATE TYPEname
AS RANGE ( SUBTYPE =subtype
[ , SUBTYPE_OPCLASS =subtype_operator_class
] [ , COLLATION =collation
] [ , CANONICAL =canonical_function
] [ , SUBTYPE_DIFF =subtype_diff_function
] [ , MULTIRANGE_TYPE_NAME =multirange_type_name
] ) CREATE TYPEname
( INPUT =input_function
, OUTPUT =output_function
[ , RECEIVE =receive_function
] [ , SEND =send_function
] [ , TYPMOD_IN =type_modifier_input_function
] [ , TYPMOD_OUT =type_modifier_output_function
] [ , ANALYZE =analyze_function
] [ , SUBSCRIPT =subscript_function
] [ , INTERNALLENGTH = {internallength
| VARIABLE } ] [ , PASSEDBYVALUE ] [ , ALIGNMENT =alignment
] [ , STORAGE =storage
] [ , LIKE =like_type
] [ , CATEGORY =category
] [ , PREFERRED =preferred
] [ , DEFAULT =default
] [ , ELEMENT =element
] [ , DELIMITER =delimiter
] [ , COLLATABLE =collatable
] ) CREATE TYPEname
Description
CREATE TYPE
registers a new data type for use in the current database. The user who defines a type becomes its owner.
If a schema name is given then the type is created in the specified schema. Otherwise it is created in the current schema. The type name must be distinct from the name of any existing type or domain in the same schema. (Because tables have associated data types, the type name must also be distinct from the name of any existing table in the same schema.)
There are five forms of CREATE TYPE
, as shown in the syntax synopsis above. They respectively create a composite type, an enum type, a range type, a base type, or a shell type. The first four of these are discussed in turn below. A shell type is simply a placeholder for a type to be defined later; it is created by issuing CREATE TYPE
with no parameters except for the type name. Shell types are needed as forward references when creating range types and base types, as discussed in those sections.
Composite Types
The first form of CREATE TYPE
creates a composite type. The composite type is specified by a list of attribute names and data types. An attribute's collation can be specified too, if its data type is collatable. A composite type is essentially the same as the row type of a table, but using CREATE TYPE
avoids the need to create an actual table when all that is wanted is to define a type. A stand-alone composite type is useful, for example, as the argument or return type of a function.
To be able to create a composite type, you must have USAGE
privilege on all attribute types.
Enumerated Types
The second form of CREATE TYPE
creates an enumerated (enum) type, as described in Section 8.7. Enum types take a list of quoted labels, each of which must be less than NAMEDATALEN
bytes long (64 bytes in a standard Postgres Pro build). (It is possible to create an enumerated type with zero labels, but such a type cannot be used to hold values before at least one label is added using ALTER TYPE
.)
Range Types
The third form of CREATE TYPE
creates a new range type, as described in Section 8.17.
The range type's subtype
can be any type with an associated b-tree operator class (to determine the ordering of values for the range type). Normally the subtype's default b-tree operator class is used to determine ordering; to use a non-default operator class, specify its name with subtype_opclass
. If the subtype is collatable, and you want to use a non-default collation in the range's ordering, specify the desired collation with the collation
option.
The optional canonical
function must take one argument of the range type being defined, and return a value of the same type. This is used to convert range values to a canonical form, when applicable. See Section 8.17.8 for more information. Creating a canonical
function is a bit tricky, since it must be defined before the range type can be declared. To do this, you must first create a shell type, which is a placeholder type that has no properties except a name and an owner. This is done by issuing the command CREATE TYPE
, with no additional parameters. Then the function can be declared using the shell type as argument and result, and finally the range type can be declared using the same name. This automatically replaces the shell type entry with a valid range type. name
The optional subtype_diff
function must take two values of the subtype
type as argument, and return a double precision
value representing the difference between the two given values. While this is optional, providing it allows much greater efficiency of GiST indexes on columns of the range type. See Section 8.17.8 for more information.
The optional multirange_type_name
parameter specifies the name of the corresponding multirange type. If not specified, this name is chosen automatically as follows. If the range type name contains the substring range
, then the multirange type name is formed by replacement of the range
substring with multirange
in the range type name. Otherwise, the multirange type name is formed by appending a _multirange
suffix to the range type name.
Base Types
The fourth form of CREATE TYPE
creates a new base type (scalar type). To create a new base type, you must be a superuser. (This restriction is made because an erroneous type definition could confuse or even crash the server.)
The parameters can appear in any order, not only that illustrated above, and most are optional. You must register two or more functions (using CREATE FUNCTION
) before defining the type. The support functions input_function
and output_function
are required, while the functions receive_function
, send_function
, type_modifier_input_function
, type_modifier_output_function
, analyze_function
, and subscript_function
are optional. Generally these functions have to be coded in C or another low-level language.
The input_function
converts the type's external textual representation to the internal representation used by the operators and functions defined for the type. output_function
performs the reverse transformation. The input function can be declared as taking one argument of type cstring
, or as taking three arguments of types cstring
, oid
, integer
. The first argument is the input text as a C string, the second argument is the type's own OID (except for array types, which instead receive their element type's OID), and the third is the typmod
of the destination column, if known (-1 will be passed if not). The input function must return a value of the data type itself. Usually, an input function should be declared STRICT; if it is not, it will be called with a NULL first parameter when reading a NULL input value. The function must still return NULL in this case, unless it raises an error. (This case is mainly meant to support domain input functions, which might need to reject NULL inputs.) The output function must be declared as taking one argument of the new data type. The output function must return type cstring
. Output functions are not invoked for NULL values.
The optional receive_function
converts the type's external binary representation to the internal representation. If this function is not supplied, the type cannot participate in binary input. The binary representation should be chosen to be cheap to convert to internal form, while being reasonably portable. (For example, the standard integer data types use network byte order as the external binary representation, while the internal representation is in the machine's native byte order.) The receive function should perform adequate checking to ensure that the value is valid. The receive function can be declared as taking one argument of type internal
, or as taking three arguments of types internal
, oid
, integer
. The first argument is a pointer to a StringInfo
buffer holding the received byte string; the optional arguments are the same as for the text input function. The receive function must return a value of the data type itself. Usually, a receive function should be declared STRICT; if it is not, it will be called with a NULL first parameter when reading a NULL input value. The function must still return NULL in this case, unless it raises an error. (This case is mainly meant to support domain receive functions, which might need to reject NULL inputs.) Similarly, the optional send_function
converts from the internal representation to the external binary representation. If this function is not supplied, the type cannot participate in binary output. The send function must be declared as taking one argument of the new data type. The send function must return type bytea
. Send functions are not invoked for NULL values.
You should at this point be wondering how the input and output functions can be declared to have results or arguments of the new type, when they have to be created before the new type can be created. The answer is that the type should first be defined as a shell type, which is a placeholder type that has no properties except a name and an owner. This is done by issuing the command CREATE TYPE
, with no additional parameters. Then the C I/O functions can be defined referencing the shell type. Finally, name
CREATE TYPE
with a full definition replaces the shell entry with a complete, valid type definition, after which the new type can be used normally.
The optional type_modifier_input_function
and type_modifier_output_function
are needed if the type supports modifiers, that is optional constraints attached to a type declaration, such as char(5)
or numeric(30,2)
. Postgres Pro allows user-defined types to take one or more simple constants or identifiers as modifiers. However, this information must be capable of being packed into a single non-negative integer value for storage in the system catalogs. The type_modifier_input_function
is passed the declared modifier(s) in the form of a cstring
array. It must check the values for validity (throwing an error if they are wrong), and if they are correct, return a single non-negative integer
value that will be stored as the column “typmod”. Type modifiers will be rejected if the type does not have a type_modifier_input_function
. The type_modifier_output_function
converts the internal integer typmod value back to the correct form for user display. It must return a cstring
value that is the exact string to append to the type name; for example numeric
's function might return (30,2)
. It is allowed to omit the type_modifier_output_function
, in which case the default display format is just the stored typmod integer value enclosed in parentheses.
The optional analyze_function
performs type-specific statistics collection for columns of the data type. By default, ANALYZE
will attempt to gather statistics using the type's “equals” and “less-than” operators, if there is a default b-tree operator class for the type. For non-scalar types this behavior is likely to be unsuitable, so it can be overridden by specifying a custom analysis function. The analysis function must be declared to take a single argument of type internal
, and return a boolean
result.
The optional subscript_function
allows the data type to be subscripted in SQL commands. Specifying this function does not cause the type to be considered a “true” array type; for example, it will not be a candidate for the result type of ARRAY[]
constructs. But if subscripting a value of the type is a natural notation for extracting data from it, then a subscript_function
can be written to define what that means. The subscript function must be declared to take a single argument of type internal
, and return an internal
result, which is a pointer to a struct of methods (functions) that implement subscripting. The detailed API for subscript functions appears in src/include/nodes/subscripting.h
. Additional information appears in Array Types below.
While the details of the new type's internal representation are only known to the I/O functions and other functions you create to work with the type, there are several properties of the internal representation that must be declared to Postgres Pro. Foremost of these is internallength
. Base data types can be fixed-length, in which case internallength
is a positive integer, or variable-length, indicated by setting internallength
to VARIABLE
. (Internally, this is represented by setting typlen
to -1.) The internal representation of all variable-length types must start with a 4-byte integer giving the total length of this value of the type. (Note that the length field is often encoded, as described in Section 73.2; it's unwise to access it directly.)
The optional flag PASSEDBYVALUE
indicates that values of this data type are passed by value, rather than by reference. Types passed by value must be fixed-length, and their internal representation cannot be larger than the size of the Datum
type (4 bytes on some machines, 8 bytes on others).
The alignment
parameter specifies the storage alignment required for the data type. The allowed values equate to alignment on 1, 2, 4, or 8 byte boundaries. Note that variable-length types must have an alignment of at least 4, since they necessarily contain an int4
as their first component.
The storage
parameter allows selection of storage strategies for variable-length data types. (Only plain
is allowed for fixed-length types.) plain
specifies that data of the type will always be stored in-line and not compressed. extended
specifies that the system will first try to compress a long data value, and will move the value out of the main table row if it's still too long. external
allows the value to be moved out of the main table, but the system will not try to compress it. main
allows compression, but discourages moving the value out of the main table. (Data items with this storage strategy might still be moved out of the main table if there is no other way to make a row fit, but they will be kept in the main table preferentially over extended
and external
items.)
All storage
values other than plain
imply that the functions of the data type can handle values that have been toasted, as described in Section 73.2 and Section 40.13.1. The specific other value given merely determines the default TOAST storage strategy for columns of a toastable data type; users can pick other strategies for individual columns using ALTER TABLE SET STORAGE
.
The like_type
parameter provides an alternative method for specifying the basic representation properties of a data type: copy them from some existing type. The values of internallength
, passedbyvalue
, alignment
, and storage
are copied from the named type. (It is possible, though usually undesirable, to override some of these values by specifying them along with the LIKE
clause.) Specifying representation this way is especially useful when the low-level implementation of the new type “piggybacks” on an existing type in some fashion.
The category
and preferred
parameters can be used to help control which implicit cast will be applied in ambiguous situations. Each data type belongs to a category named by a single ASCII character, and each type is either “preferred” or not within its category. The parser will prefer casting to preferred types (but only from other types within the same category) when this rule is helpful in resolving overloaded functions or operators. For more details see Chapter 10. For types that have no implicit casts to or from any other types, it is sufficient to leave these settings at the defaults. However, for a group of related types that have implicit casts, it is often helpful to mark them all as belonging to a category and select one or two of the “most general” types as being preferred within the category. The category
parameter is especially useful when adding a user-defined type to an existing built-in category, such as the numeric or string types. However, it is also possible to create new entirely-user-defined type categories. Select any ASCII character other than an upper-case letter to name such a category.
A default value can be specified, in case a user wants columns of the data type to default to something other than the null value. Specify the default with the DEFAULT
key word. (Such a default can be overridden by an explicit DEFAULT
clause attached to a particular column.)
To indicate that a type is a fixed-length array type, specify the type of the array elements using the ELEMENT
key word. For example, to define an array of 4-byte integers (int4
), specify ELEMENT = int4
. For more details, see Array Types below.
To indicate the delimiter to be used between values in the external representation of arrays of this type, delimiter
can be set to a specific character. The default delimiter is the comma (,
). Note that the delimiter is associated with the array element type, not the array type itself.
If the optional Boolean parameter collatable
is true, column definitions and expressions of the type may carry collation information through use of the COLLATE
clause. It is up to the implementations of the functions operating on the type to actually make use of the collation information; this does not happen automatically merely by marking the type collatable.
Array Types
Whenever a user-defined type is created, Postgres Pro automatically creates an associated array type, whose name consists of the element type's name prepended with an underscore, and truncated if necessary to keep it less than NAMEDATALEN
bytes long. (If the name so generated collides with an existing type name, the process is repeated until a non-colliding name is found.) This implicitly-created array type is variable length and uses the built-in input and output functions array_in
and array_out
. Furthermore, this type is what the system uses for constructs such as ARRAY[]
over the user-defined type. The array type tracks any changes in its element type's owner or schema, and is dropped if the element type is.
You might reasonably ask why there is an ELEMENT
option, if the system makes the correct array type automatically. The main case where it's useful to use ELEMENT
is when you are making a fixed-length type that happens to be internally an array of a number of identical things, and you want to allow these things to be accessed directly by subscripting, in addition to whatever operations you plan to provide for the type as a whole. For example, type point
is represented as just two floating-point numbers, which can be accessed using point[0]
and point[1]
. Note that this facility only works for fixed-length types whose internal form is exactly a sequence of identical fixed-length fields. For historical reasons (i.e., this is clearly wrong but it's far too late to change it), subscripting of fixed-length array types starts from zero, rather than from one as for variable-length arrays.
Specifying the SUBSCRIPT
option allows a data type to be subscripted, even though the system does not otherwise regard it as an array type. The behavior just described for fixed-length arrays is actually implemented by the SUBSCRIPT
handler function raw_array_subscript_handler
, which is used automatically if you specify ELEMENT
for a fixed-length type without also writing SUBSCRIPT
.
When specifying a custom SUBSCRIPT
function, it is not necessary to specify ELEMENT
unless the SUBSCRIPT
handler function needs to consult typelem
to find out what to return. Be aware that specifying ELEMENT
causes the system to assume that the new type contains, or is somehow physically dependent on, the element type; thus for example changing properties of the element type won't be allowed if there are any columns of the dependent type.
Parameters
name
The name (optionally schema-qualified) of a type to be created.
attribute_name
The name of an attribute (column) for the composite type.
data_type
The name of an existing data type to become a column of the composite type.
collation
The name of an existing collation to be associated with a column of a composite type, or with a range type.
label
A string literal representing the textual label associated with one value of an enum type.
subtype
The name of the element type that the range type will represent ranges of.
subtype_operator_class
The name of a b-tree operator class for the subtype.
canonical_function
The name of the canonicalization function for the range type.
subtype_diff_function
The name of a difference function for the subtype.
multirange_type_name
The name of the corresponding multirange type.
input_function
The name of a function that converts data from the type's external textual form to its internal form.
output_function
The name of a function that converts data from the type's internal form to its external textual form.
receive_function
The name of a function that converts data from the type's external binary form to its internal form.
send_function
The name of a function that converts data from the type's internal form to its external binary form.
type_modifier_input_function
The name of a function that converts an array of modifier(s) for the type into internal form.
type_modifier_output_function
The name of a function that converts the internal form of the type's modifier(s) to external textual form.
analyze_function
The name of a function that performs statistical analysis for the data type.
subscript_function
The name of a function that defines what subscripting a value of the data type does.
internallength
A numeric constant that specifies the length in bytes of the new type's internal representation. The default assumption is that it is variable-length.
alignment
The storage alignment requirement of the data type. If specified, it must be
char
,int2
,int4
, ordouble
; the default isint4
.storage
The storage strategy for the data type. If specified, must be
plain
,external
,extended
, ormain
; the default isplain
.like_type
The name of an existing data type that the new type will have the same representation as. The values of
internallength
,passedbyvalue
,alignment
, andstorage
are copied from that type, unless overridden by explicit specification elsewhere in thisCREATE TYPE
command.category
The category code (a single ASCII character) for this type. The default is
'U'
for “user-defined type”. Other standard category codes can be found in Table 55.67. You may also choose other ASCII characters in order to create custom categories.preferred
True if this type is a preferred type within its type category, else false. The default is false. Be very careful about creating a new preferred type within an existing type category, as this could cause surprising changes in behavior.
default
The default value for the data type. If this is omitted, the default is null.
element
The type being created is an array; this specifies the type of the array elements.
delimiter
The delimiter character to be used between values in arrays made of this type.
collatable
True if this type's operations can use collation information. The default is false.
Notes
Because there are no restrictions on use of a data type once it's been created, creating a base type or range type is tantamount to granting public execute permission on the functions mentioned in the type definition. This is usually not an issue for the sorts of functions that are useful in a type definition. But you might want to think twice before designing a type in a way that would require “secret” information to be used while converting it to or from external form.
Before PostgreSQL version 8.3, the name of a generated array type was always exactly the element type's name with one underscore character (_
) prepended. (Type names were therefore restricted in length to one fewer character than other names.) While this is still usually the case, the array type name may vary from this in case of maximum-length names or collisions with user type names that begin with underscore. Writing code that depends on this convention is therefore deprecated. Instead, use pg_type
.typarray
to locate the array type associated with a given type.
It may be advisable to avoid using type and table names that begin with underscore. While the server will change generated array type names to avoid collisions with user-given names, there is still risk of confusion, particularly with old client software that may assume that type names beginning with underscores always represent arrays.
Before PostgreSQL version 8.2, the shell-type creation syntax CREATE TYPE
did not exist. The way to create a new base type was to create its input function first. In this approach, Postgres Pro will first see the name of the new data type as the return type of the input function. The shell type is implicitly created in this situation, and then it can be referenced in the definitions of the remaining I/O functions. This approach still works, but is deprecated and might be disallowed in some future release. Also, to avoid accidentally cluttering the catalogs with shell types as a result of simple typos in function definitions, a shell type will only be made this way when the input function is written in C. name
Examples
This example creates a composite type and uses it in a function definition:
CREATE TYPE compfoo AS (f1 int, f2 text); CREATE FUNCTION getfoo() RETURNS SETOF compfoo AS $$ SELECT fooid, fooname FROM foo $$ LANGUAGE SQL;
This example creates an enumerated type and uses it in a table definition:
CREATE TYPE bug_status AS ENUM ('new', 'open', 'closed'); CREATE TABLE bug ( id serial, description text, status bug_status );
This example creates a range type:
CREATE TYPE float8_range AS RANGE (subtype = float8, subtype_diff = float8mi);
This example creates the base data type box
and then uses the type in a table definition:
CREATE TYPE box; CREATE FUNCTION my_box_in_function(cstring) RETURNS box AS ... ; CREATE FUNCTION my_box_out_function(box) RETURNS cstring AS ... ; CREATE TYPE box ( INTERNALLENGTH = 16, INPUT = my_box_in_function, OUTPUT = my_box_out_function ); CREATE TABLE myboxes ( id integer, description box );
If the internal structure of box
were an array of four float4
elements, we might instead use:
CREATE TYPE box ( INTERNALLENGTH = 16, INPUT = my_box_in_function, OUTPUT = my_box_out_function, ELEMENT = float4 );
which would allow a box value's component numbers to be accessed by subscripting. Otherwise the type behaves the same as before.
This example creates a large object type and uses it in a table definition:
CREATE TYPE bigobj ( INPUT = lo_filein, OUTPUT = lo_fileout, INTERNALLENGTH = VARIABLE ); CREATE TABLE big_objs ( id integer, obj bigobj );
More examples, including suitable input and output functions, are in Section 40.13.
Compatibility
The first form of the CREATE TYPE
command, which creates a composite type, conforms to the SQL standard. The other forms are Postgres Pro extensions. The CREATE TYPE
statement in the SQL standard also defines other forms that are not implemented in Postgres Pro.
The ability to create a composite type with zero attributes is a Postgres Pro-specific deviation from the standard (analogous to the same case in CREATE TABLE
).