55.7. Форматы сообщений
В этом разделе подробно описывается формат каждого сообщения. Все сообщения помечены символами, обозначающими, какая сторона может их передавать: клиент (F), сервер (B) или обе стороны (F & B). Заметьте, что хотя каждое сообщение включает счётчик байт в начале, формат сообщения разработан так, чтобы конец сообщения можно было найти, не обращаясь к счётчику байт. Это помогает проверять корректность сообщений. (Исключением является сообщение CopyData, так как оно образует часть потока данных; содержимое любого отдельного сообщения CopyData нельзя интерпретировать само по себе.)
- AuthenticationOk (B)
- Byte1('R')
Указывает, что это сообщение представляет запрос аутентификации.
- Int32(8)
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(0)
Показывает, что проверка подлинности прошла успешно.
- AuthenticationKerberosV5 (B)
- Byte1('R')
Указывает, что это сообщение представляет запрос аутентификации.
- Int32(8)
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(2)
Указывает, что требуется проверка подлинности по протоколу Kerberos V5.
- AuthenticationCleartextPassword (B)
- Byte1('R')
Указывает, что это сообщение представляет запрос аутентификации.
- Int32(8)
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(3)
Указывает, что требуется пароль, передаваемый открытым текстом.
- AuthenticationMD5Password (B)
- Byte1('R')
Указывает, что это сообщение представляет запрос аутентификации.
- Int32(12)
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(5)
Указывает, что требуется пароль, преобразованный в хеш MD5.
- Byte4
Значение соли, с которым должен хешироваться пароль.
- AuthenticationSCMCredential (B)
- Byte1('R')
Указывает, что это сообщение представляет запрос аутентификации.
- Int32(8)
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(6)
Указывает, что требуется сообщение с учётными данными SCM.
- AuthenticationGSS (B)
- Byte1('R')
Указывает, что это сообщение представляет запрос аутентификации.
- Int32(8)
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(7)
Указывает, что требуется проверка подлинности на базе GSSAPI.
- AuthenticationGSSContinue (B)
- Byte1('R')
Указывает, что это сообщение представляет запрос аутентификации.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(8)
Указывает, что это сообщение содержит данные GSSAPI или SSPI.
- Byte
n
Данные аутентификации для GSSAPI или SSPI.
- AuthenticationSSPI (B)
- Byte1('R')
Указывает, что это сообщение представляет запрос аутентификации.
- Int32(8)
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(9)
Указывает, что требуется проверка подлинности на базе SSPI.
- AuthenticationSASL (B)
- Byte1('R')
Указывает, что это сообщение представляет запрос аутентификации.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(10)
Указывает, что требуется проверка подлинности на базе SASL.
Тело сообщения содержит список механизмов аутентификации SASL в порядке предпочтений сервера. За последним именем механизма аутентификации должен идти завершающий нулевой байт. Для каждого механизма передаётся:
- String
Имя механизма аутентификации SASL.
- AuthenticationSASLContinue (B)
- Byte1('R')
Указывает, что это сообщение представляет запрос аутентификации.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(11)
Указывает, что это сообщение содержит данные вызова SASL.
- Byte
n
Данные SASL, специфичные для применяемого механизма SASL.
- AuthenticationSASLFinal (B)
- Byte1('R')
Указывает, что это сообщение представляет запрос аутентификации.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(12)
Указывает, что аутентификация SASL завершена.
- Byte
n
«Дополнительные данные» результата SASL, специфичные для применяемого механизма SASL.
- BackendKeyData (B)
- Byte1('K')
Указывает, что это сообщение содержит ключевые данные для отмены запросов. Клиент должен сохранить эти данные, если ему нужна возможность впоследствии выдавать сообщения CancelRequest.
- Int32(12)
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32
PID обслуживающего процесса.
- Int32
Секретный ключ обслуживающего процесса.
- Bind (F)
- Byte1('B')
Указывает, что это сообщение представляет команду Bind.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- String
Имя целевого портала (пустая строка выбирает безымянный портал).
- String
Имя исходного подготовленного оператора (пустая строка выбирает безымянный подготовленный оператор).
- Int16
Количество кодов форматов следующих параметров (обозначается ниже символом
C
). Может быть нулевым, что показывает, что параметры отсутствуют или все параметры передаются в формате по умолчанию (текстовом); либо равняться одному, в этом случае указанный один код формата применяется ко всем параметрам; либо может равняться действительному количеству параметров.- Int16[
C
] Коды форматов параметров. В настоящее время допускаются коды ноль (текстовый формат) и один (двоичный).
- Int16
Количество следующих значений параметров (может быть нулевым). Оно должно совпадать с количеством параметров, требующихся для запроса.
Затем для каждого параметра идёт следующая пара полей:
- Int32
Длина значения параметра, в байтах (само поле длины не считается). Может быть нулевой. В качестве особого значения, -1 представляет значение NULL. В случае с NULL никакие байты значений далее не следуют.
- Byte
n
Значение параметра в формате, определённом соответствующим кодом формата. Переменная
n
задаёт длину значения.
За последним параметром идёт следующее поле:
- Int16
Количество кодов формата для следующих столбцов результата (обозначается ниже символом
R
). Может быть нулевым, что показывает, что столбцы результата отсутствуют или для всех столбцов должен использоваться формат по умолчанию (текстовый), либо равняться одному, в этом случае указанный один код формата применяется ко всем столбцам (если они есть), либо может равняться действительному количеству столбцов результата запроса.- Int16[
R
] Коды форматов столбцов результата. В настоящее время допускаются коды ноль (текстовый формат) и один (двоичный).
- BindComplete (B)
- Byte1('2')
Указывает, что это сообщение, сигнализирующее о завершении Bind.
- Int32(4)
Длина содержимого сообщения в байтах, включая само поле длины.
- CancelRequest (F)
- Int32(16)
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(80877102)
Код запроса отмены. Это специально выбранное значение содержит
1234
в старших 16 битах и5678
в младших 16 битах. (Во избежание неоднозначности этот код не должен совпадать с номером версии протокола.)- Int32
PID целевого обслуживающего процесса.
- Int32
Секретный ключ целевого обслуживающего процесса.
- Close (F)
- Byte1('C')
Указывает, что это сообщение представляет команду Close.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Byte1
'
S
' для закрытия подготовленного оператора, 'P
' для закрытия портала.- String
Имя подготовленного оператора или портала, который должен быть закрыт (пустая строка выбирает безымянный подготовленный оператор или портал).
- CloseComplete (B)
- Byte1('3')
Указывает, что это сообщение, сигнализирующее о завершении Close.
- Int32(4)
Длина содержимого сообщения в байтах, включая само поле длины.
- CommandComplete (B)
- Byte1('C')
Указывает, что это сообщение об успешном завершении команды.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- String
Тег команды. Обычно это одно слово, обозначающее завершённую команду SQL.
Для команды
INSERT
в качестве тега передаётсяINSERT
, гдеoid
число_строк
число_строк
— количество вставленных строк. В полеoid
передавался идентификатор объекта вставленной строки, когдачисло_строк
было равно 1 и в целевой таблице содержались OID; таким образом, сейчасoid
всегда равняется 0.Для команды
DELETE
в качестве тега передаётсяDELETE
, гдечисло_строк
число_строк
— количество удалённых строк.Для команды
UPDATE
в качестве тега передаётсяUPDATE
, гдечисло_строк
число_строк
— количество изменённых строк.Для команды
MERGE
в качестве тега передаётсяMERGE
, гдечисло_строк
число_строк
— количество вставленных, изменённых или удалённых строк.Для команды
SELECT
илиCREATE TABLE AS
в качестве тега передаётсяSELECT
, гдечисло_строк
число_строк
— число полученных строк.Для команды
MOVE
в качестве тега передаётсяMOVE
, гдечисло_строк
число_строк
— количество строк, на которое изменилась позиция курсора.Для команды
FETCH
в качестве тега передаётсяFETCH
, гдечисло_строк
число_строк
— количество строк, полученное через курсор.Для команды
COPY
в качестве тега передаётсяCOPY
, гдечисло_строк
число_строк
— количество скопированных строк. (Заметьте: число строк выводится, начиная только с PostgreSQL 8.2.)
- CopyData (F & B)
- Byte1('d')
Указывает, что в этом сообщении передаются данные
COPY
.- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Byte
n
Данные, образующие часть информационного потока
COPY
. Сообщения от сервера всегда соответствуют отдельным строкам данных, но сообщения, передаваемые клиентами, могут разделять поток произвольным образом.
- CopyDone (F & B)
- Byte1('c')
Указывает, что это сообщение, сигнализирующее о завершении
COPY
.- Int32(4)
Длина содержимого сообщения в байтах, включая само поле длины.
- CopyFail (F)
- Byte1('f')
Указывает, что это сообщение, сигнализирующее об ошибке операции
COPY
.- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- String
Сообщение об ошибке, описывающее причину сбоя операции.
- CopyInResponse (B)
- Byte1('G')
Указывает, что это сообщение является ответом на запуск входящего копирования. Получив его, клиент начинает передавать данные на вход операции копирования (если клиент не готов к этому, он передаёт сообщение CopyFail).
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int8
Значение 0 указывает, что для всей операции
COPY
применяется текстовый формат (строки разделяются символами новой строки, столбцы разделяются символами-разделителями и т. д.). Значение 1 указывает, что для всей операции копирования применяется двоичный формат (подобный формату DataRow). За дополнительными сведениями обратитесь к COPY.- Int16
Количество столбцов в копируемых данных (ниже обозначается символом
N
).- Int16[
N
] Коды формата для каждого столбца. В настоящее время допускаются коды ноль (текстовый формат) и один (двоичный). Если общий формат копирования — текстовый, все эти коды должны быть нулевыми.
- CopyOutResponse (B)
- Byte1('H')
Указывает, что это сообщение является ответом на запуск исходящего копирования. За этим сообщением следуют данные, исходящие со стороны сервера.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int8
Значение 0 указывает, что для всей операции
COPY
применяется текстовый формат (строки разделяются символами новой строки, столбцы разделяются символами-разделителями и т. д.). Значение 1 указывает, что для всей операции копирования применяется двоичный формат (подобный формату DataRow). За дополнительными сведениями обратитесь к COPY.- Int16
Количество столбцов в копируемых данных (ниже обозначается символом
N
).- Int16[
N
] Коды формата для каждого столбца. В настоящее время допускаются коды ноль (текстовый формат) и один (двоичный). Если общий формат копирования — текстовый, все эти коды должны быть нулевыми.
- CopyBothResponse (B)
- Byte1('W')
Указывает, что это сообщение является ответом на запуск двустороннего копирования. Это сообщение используется только для потоковой репликации.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int8
Значение 0 указывает, что для всей операции
COPY
применяется текстовый формат (строки разделяются символами новой строки, столбцы разделяются символами-разделителями и т. д.). Значение 1 указывает, что для всей операции копирования применяется двоичный формат (подобный формату DataRow). За дополнительными сведениями обратитесь к COPY.- Int16
Количество столбцов в копируемых данных (ниже обозначается символом
N
).- Int16[
N
] Коды формата для каждого столбца. В настоящее время допускаются коды ноль (текстовый формат) и один (двоичный). Если общий формат копирования — текстовый, все эти коды должны быть нулевыми.
- DataRow (B)
- Byte1('D')
Указывает, что в этом сообщении передаётся строка данных.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int16
Количество последующих значений столбцов (может быть нулевым).
Затем для каждого столбца идёт следующая пара полей:
- Int32
Длина значения столбца, в байтах (само поле длины не считается). Может быть нулевой. В качестве особого значения, -1 представляет значение NULL. В случае с NULL никакие байты значений далее не следуют.
- Byte
n
Значение столбца в формате, определённом соответствующим кодом формата. Переменная
n
задаёт длину значения.
- Describe (F)
- Byte1('D')
Указывает, что это сообщение представляет команду Describe.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Byte1
'
S
' для получения описания подготовленного оператора, 'P
' — портала.- String
Имя подготовленного оператора или портала, описание которого запрашивается (пустая строка выбирает безымянный подготовленный оператор или портал).
- EmptyQueryResponse (B)
- Byte1('I')
Указывает, что это сообщение является ответом на пустую строку запроса. (Это сообщение заменяет CommandComplete.)
- Int32(4)
Длина содержимого сообщения в байтах, включая само поле длины.
- ErrorResponse (B)
- Byte1('E')
Указывает, что это сообщение ошибки.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
Тело сообщения состоит из одного или нескольких определённых полей, за которыми в качестве завершающего следует нулевой байт. Поля могут идти в любом порядке. Для каждого поля передаётся:
- Byte1
Код, задающий тип поля; ноль обозначает конец сообщения, после которого ничего нет. Типы полей, определённые в настоящее время, перечислены в Разделе 55.8. Так как в будущем могут появиться другие типы полей, клиенты должны просто игнорировать поля нераспознанного типа.
- String
Значение поля.
- Execute (F)
- Byte1('E')
Указывает, что это сообщение представляет команду Execute.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- String
Имя портала, подлежащего выполнению (пустая строка выбирает безымянный портал).
- Int32
Максимальное число строк, которое должно быть возвращено, если портал содержит запрос, возвращающий строки (в противном случае игнорируется). Ноль означает «без ограничения».
- Flush (F)
- Byte1('H')
Указывает, что это сообщение представляет команду Flush.
- Int32(4)
Длина содержимого сообщения в байтах, включая само поле длины.
- FunctionCall (F)
- Byte1('F')
Указывает, что это сообщение представляет вызов функции.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32
Задаёт идентификатор объекта вызываемой функции.
- Int16
Количество кодов форматов следующих аргументов (обозначается ниже символом
C
). Может быть нулевым, что показывает, что аргументы отсутствуют или все аргументы передаются в формате по умолчанию (текстовом); либо равняться одному, в этом случае указанный один код формата применяется ко всем аргументами, либо может равняться действительному количеству аргументов.- Int16[
C
] Коды форматов аргументов. В настоящее время допускаются коды ноль (текстовый формат) и один (двоичный).
- Int16
Задаёт число аргументов, передаваемых функции.
Затем для каждого аргумента идёт следующая пара полей:
- Int32
Длина значения аргумента, в байтах (само поле длины не считается). Может быть нулевой. В качестве особого значения, -1 представляет значение NULL. В случае с NULL никакие байты значений далее не следуют.
- Byte
n
Значение аргумента, в формате, определённом соответствующим кодом формата. Переменная
n
задаёт длину значения.
За последним аргументом идёт следующее поле:
- Int16
Код формата результата функции. В настоящее время допускается код ноль (текстовый формат) и один (двоичный).
- FunctionCallResponse (B)
- Byte1('V')
Указывает, что в этом сообщении передаётся результат вызова функции.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32
Длина значения результата функции, в байтах (само поле длины не считается). Может быть нулевой. В качестве особого значения, -1 представляет значение NULL. В случае с NULL никакие байты значения далее не следуют.
- Byte
n
Значение результата функции в формате, определённом соответствующим кодом формата. Переменная
n
задаёт длину значения.
- GSSENCRequest (F)
- Int32(8)
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(80877104)
Код запроса GSSAPI Encryption. Это специально выбранное значение содержит
1234
в старших 16 битах и5680
в младших 16 битах. (Во избежание неоднозначности этот код не должен совпадать с номером версии протокола.)
- GSSResponse (F)
- Byte1('p')
Обозначает это сообщение как ответ GSSAPI или SSPI. Заметьте, что оно также применяется для ответов SASL и при аутентификации по паролю. Точный тип сообщения можно определить из контекста.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Byte
n
Данные сообщения, специфичные для GSSAPI/SSPI.
- NegotiateProtocolVersion (B)
- Byte1('v')
Указывает, что это сообщение согласования версии протокола.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32
Новейшая младшая версия протокола, поддерживаемая сервером, для запрошенной клиентом старшей версии.
- Int32
Число параметров протокола, не принятых сервером.
Затем для параметров протокола, не принятых сервером, передаётся:
- String
Имя параметра.
- NoData (B)
- Byte1('n')
Указывает, что это сообщение сигнализирует об отсутствии данных.
- Int32(4)
Длина содержимого сообщения в байтах, включая само поле длины.
- NoticeResponse (B)
- Byte1('N')
Указывает, что это сообщение представляет замечание.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
Тело сообщения состоит из одного или нескольких определённых полей, за которыми в качестве завершающего следует нулевой байт. Поля могут идти в любом порядке. Для каждого поля передаётся:
- Byte1
Код, задающий тип поля; ноль обозначает конец сообщения, после которого ничего нет. Типы полей, определённые в настоящее время, перечислены в Разделе 55.8. Так как в будущем могут появиться другие типы полей, клиенты должны просто игнорировать поля нераспознанного типа.
- String
Значение поля.
- NotificationResponse (B)
- Byte1('A')
Указывает, что это сообщение представляет уведомление.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32
PID обслуживающего процесса, отправляющего уведомление.
- String
Имя канала, для которого было выдано уведомление.
- String
Строка «сообщения», сопровождающего уведомление.
- ParameterDescription (B)
- Byte1('t')
Указывает, что это сообщение представляет описание параметра.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int16
Количество параметров для оператора (может быть нулевым).
Затем для каждого параметра передаётся:
- Int32
Задаёт идентификатор объекта типа данных параметра.
- ParameterStatus (B)
- Byte1('S')
Указывает, что в этом сообщении передаётся состояние параметра времени выполнения.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- String
Имя параметра времени выполнения, состояние которого передаётся.
- String
Текущее значение параметра.
- Parse (F)
- Byte1('P')
Указывает, что это сообщение представляет команду Parse.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- String
Имя целевого подготовленного оператора (пустая строка выбирает безымянный подготовленный оператор).
- String
Строка запроса, которая должна быть разобрана.
- Int16
Количество типов параметров (может быть нулевым). Заметьте, что это значение представляет не число параметров, которые могут фигурировать в строке запроса, а число параметров, для которых клиент хочет предопределить типы.
Затем для каждого параметра передаётся:
- Int32
Задаёт идентификатор объекта типа данных параметра. Указание нулевого значения равносильно отсутствию указания типа.
- ParseComplete (B)
- Byte1('1')
Указывает, что это сообщение, сигнализирующее о завершении Parse.
- Int32(4)
Длина содержимого сообщения в байтах, включая само поле длины.
- PasswordMessage (F)
- Byte1('p')
Обозначает это сообщение как ответ SASL. Заметьте, что оно также применяется для ответов GSSAPI, SSPI и SASL. Точный тип сообщения можно определить из контекста.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- String
Пароль (зашифрованный, если требуется).
- PortalSuspended (B)
- Byte1('s')
Указывает, что это сообщение сигнализирует о приостановке портала. Заметьте, что оно выдаётся только при достижении ограничения числа строк, заданного в сообщении Execute.
- Int32(4)
Длина содержимого сообщения в байтах, включая само поле длины.
- Query (F)
- Byte1('Q')
Указывает, что это сообщение представляет простой протокол запросов.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- String
Собственно строка запроса.
- ReadyForQuery (B)
- Byte1('Z')
Определяет тип сообщения. Сообщение ReadyForQuery передаётся, когда сервер готов к новому циклу запросов.
- Int32(5)
Длина содержимого сообщения в байтах, включая само поле длины.
- Byte1
Индикатор текущего состояния транзакции на сервере. Возможные значения: '
I
', транзакция неактивна (вне блока транзакции), 'T
' в блоке транзакции, либо 'E
' в блоке прерванной транзакции (запросы не будут обрабатываться до завершения блока).
- RowDescription (B)
- Byte1('T')
Указывает, что это сообщение представляет описание строки.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int16
Задаёт количество полей в строке (может быть нулевым).
Затем для каждого поля передаётся:
- String
Имя поля.
- Int32
Если поле связано со столбцом определённой таблицы, идентификатор объекта этой таблицы; в противном случае — ноль.
- Int16
Если поле связано со столбцом определённой таблицы, номер атрибута для этого столбца; в противном случае — ноль.
- Int32
Идентификатор объекта типа данных поля.
- Int16
Размер типа данных (см.
pg_type.typlen
). Заметьте, что отрицательные значения показывают, что тип имеет переменную длину.- Int32
Модификатор типа (см.
pg_attribute.atttypmod
). Смысл этого модификатора зависит от типа.- Int16
Код формата, используемого для поля. В настоящее время допускаются коды ноль (текстовый формат) и один (двоичный). В сообщении RowDescription, возвращаемом вариацией Describe для оператора, код формата ещё не известен и всегда будет нулевым.
- SASLInitialResponse (F)
- Byte1('p')
Обозначает это сообщение как начальный ответ SASL. Заметьте, что оно также применяется для ответов GSSAPI, SSPI и при аутентификации по паролю. Точный тип сообщения определяется из контекста.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- String
Имя механизма аутентификации SASL, выбранного клиентом.
- Int32
Длина последующего сообщения «Начальный ответ клиента», специфичного для механизма SASL, или -1, если начального ответа нет.
- Byte
n
«Начальный ответ», специфичный для механизма SASL.
- SASLResponse (F)
- Byte1('p')
Обозначает это сообщение как ответ SASL. Заметьте, что оно также применяется для ответов GSSAPI, SSPI и при аутентификации по паролю. Точный тип сообщения можно определить из контекста.
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Byte
n
Данные сообщения, специфичные для механизма SASL.
- SSLRequest (F)
- Int32(8)
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(80877103)
Код запроса SSL. Это специально выбранное значение содержит
1234
в старших 16 битах и5679
в младших 16 битах. (Во избежание неоднозначности этот код не должен совпадать с номером версии протокола.)
- StartupMessage (F)
- Int32
Длина содержимого сообщения в байтах, включая само поле длины.
- Int32(196608)
Номер версии протокола. В старших 16 битах задаётся старший номер версии (3 для протокола, описываемого здесь). В младших 16 битах задаётся младший номер версии (0 для протокола, описываемого здесь).
За номером версии протокола следует одна или несколько пар из имени параметра и строки значения. За последней парой имя/значение должен следовать нулевой байт. Передаваться параметры могут в любом порядке. Обязательным является только параметр
user
, остальные могут отсутствовать. Каждый параметр задаётся так:- String
Имя параметра. В настоящее время принимаются имена:
user
Имя пользователя баз данных, с которым выполняется подключение. Является обязательным, значения по умолчанию нет.
database
База данных, к которой выполняется подключение. По умолчанию подставляется имя пользователя.
options
Аргументы командной строки для обслуживающего процесса. (Этот способ считается устаревшим; теперь следует устанавливать отдельные параметры времени выполнения.) Пробелы в этой строке воспринимаются как разделяющие аргументы, если перед ними нет обратной косой черты (
\
); чтобы представить обратную косую черту буквально, продублируйте её (\\
).replication
Используется для подключения в режиме потоковой репликации, в котором вместо операторов SQL может выполняться небольшой набор команд репликации. Допустимые значения:
true
,false
(по умолчанию) иdatabase
. За подробностями обратитесь к Разделу 55.4.
В дополнение к ним могут задаваться и другие параметры. Имена параметров, начинающиеся с
_pq_.
, резервируются для использования в расширениях протокола, а остальные воспринимаются как параметры времени выполнения, передаваемые во время запуска серверному процессу. Такие параметры будут применяться при запуске серверного процесса (после разбора аргументов командной строки, если они есть) и будут действовать как параметры сеанса по умолчанию.- String
Значение параметра.
- Sync (F)
- Byte1('S')
Указывает, что это сообщение представляет команду Sync.
- Int32(4)
Длина содержимого сообщения в байтах, включая само поле длины.
- Terminate (F)
- Byte1('X')
Указывает, что это сообщение завершает сеанс.
- Int32(4)
Длина содержимого сообщения в байтах, включая само поле длины.
F.30. ltree — hierarchical tree-like data type #
This module implements a data type ltree
for representing labels of data stored in a hierarchical tree-like structure. Extensive facilities for searching through label trees are provided.
This module is considered “trusted”, that is, it can be installed by non-superusers who have CREATE
privilege on the current database.
F.30.1. Definitions #
A label is a sequence of alphanumeric characters, underscores, and hyphens. Valid alphanumeric character ranges are dependent on the database locale. For example, in C locale, the characters A-Za-z0-9_-
are allowed. Labels must be no more than 1000 characters long.
Examples: 42
, Personal_Services
A label path is a sequence of zero or more labels separated by dots, for example L1.L2.L3
, representing a path from the root of a hierarchical tree to a particular node. The length of a label path cannot exceed 65535 labels.
Example: Top.Countries.Europe.Russia
The ltree
module provides several data types:
ltree
stores a label path.lquery
represents a regular-expression-like pattern for matchingltree
values. A simple word matches that label within a path. A star symbol (*
) matches zero or more labels. These can be joined with dots to form a pattern that must match the whole label path. For example:foo Match the exact label path
foo
*.foo.* Match any label path containing the labelfoo
*.foo Match any label path whose last label isfoo
Both star symbols and simple words can be quantified to restrict how many labels they can match:
*{
n
} Match exactlyn
labels *{n
,} Match at leastn
labels *{n
,m
} Match at leastn
but not more thanm
labels *{,m
} Match at mostm
labels — same as *{0,m
} foo{n
,m
} Match at leastn
but not more thanm
occurrences offoo
foo{,} Match any number of occurrences offoo
, including zeroIn the absence of any explicit quantifier, the default for a star symbol is to match any number of labels (that is,
{,}
) while the default for a non-star item is to match exactly once (that is,{1}
).There are several modifiers that can be put at the end of a non-star
lquery
item to make it match more than just the exact match:@ Match case-insensitively, for example
a@
matchesA
* Match any label with this prefix, for examplefoo*
matchesfoobar
% Match initial underscore-separated wordsThe behavior of
%
is a bit complicated. It tries to match words rather than the entire label. For examplefoo_bar%
matchesfoo_bar_baz
but notfoo_barbaz
. If combined with*
, prefix matching applies to each word separately, for examplefoo_bar%*
matchesfoo1_bar2_baz
but notfoo1_br2_baz
.Also, you can write several possibly-modified non-star items separated with
|
(OR) to match any of those items, and you can put!
(NOT) at the start of a non-star group to match any label that doesn't match any of the alternatives. A quantifier, if any, goes at the end of the group; it means some number of matches for the group as a whole (that is, some number of labels matching or not matching any of the alternatives).Here's an annotated example of
lquery
:Top.*{0,2}.sport*@.!football|tennis{1,}.Russ*|Spain a. b. c. d. e.
This query will match any label path that:
begins with the label
Top
and next has zero to two labels before
a label beginning with the case-insensitive prefix
sport
then has one or more labels, none of which match
football
nortennis
and then ends with a label beginning with
Russ
or exactly matchingSpain
.
ltxtquery
represents a full-text-search-like pattern for matchingltree
values. Anltxtquery
value contains words, possibly with the modifiers@
,*
,%
at the end; the modifiers have the same meanings as inlquery
. Words can be combined with&
(AND),|
(OR),!
(NOT), and parentheses. The key difference fromlquery
is thatltxtquery
matches words without regard to their position in the label path.Here's an example
ltxtquery
:Europe & Russia*@ & !Transportation
This will match paths that contain the label
Europe
and any label beginning withRussia
(case-insensitive), but not paths containing the labelTransportation
. The location of these words within the path is not important. Also, when%
is used, the word can be matched to any underscore-separated word within a label, regardless of position.
Note: ltxtquery
allows whitespace between symbols, but ltree
and lquery
do not.
F.30.2. Operators and Functions #
Type ltree
has the usual comparison operators =
, <>
, <
, >
, <=
, >=
. Comparison sorts in the order of a tree traversal, with the children of a node sorted by label text. In addition, the specialized operators shown in Table F.17 are available.
Table F.17. ltree
Operators
Operator Description |
---|
Is left argument an ancestor of right (or equal)? |
Is left argument a descendant of right (or equal)? |
Does |
Does |
Does |
Concatenates |
Converts text to |
Does array contain an ancestor of |
Does array contain a descendant of |
Does array contain any path matching |
Does |
Does array contain any path matching |
Returns first array entry that is an ancestor of |
Returns first array entry that is a descendant of |
Returns first array entry that matches |
Returns first array entry that matches |
The operators <@
, @>
, @
and ~
have analogues ^<@
, ^@>
, ^@
, ^~
, which are the same except they do not use indexes. These are useful only for testing purposes.
The available functions are shown in Table F.18.
Table F.18. ltree
Functions
F.30.3. Indexes #
ltree
supports several types of indexes that can speed up the indicated operators:
B-tree index over
ltree
:<
,<=
,=
,>=
,>
Hash index over
ltree
:=
GiST index over
ltree
(gist_ltree_ops
opclass):<
,<=
,=
,>=
,>
,@>
,<@
,@
,~
,?
gist_ltree_ops
GiST opclass approximates a set of path labels as a bitmap signature. Its optional integer parametersiglen
determines the signature length in bytes. The default signature length is 8 bytes. The length must be a positive multiple ofint
alignment (4 bytes on most machines)) up to 2024. Longer signatures lead to a more precise search (scanning a smaller fraction of the index and fewer heap pages), at the cost of a larger index.Example of creating such an index with the default signature length of 8 bytes:
CREATE INDEX path_gist_idx ON test USING GIST (path);
Example of creating such an index with a signature length of 100 bytes:
CREATE INDEX path_gist_idx ON test USING GIST (path gist_ltree_ops(siglen=100));
GiST index over
ltree[]
(gist__ltree_ops
opclass):ltree[] <@ ltree
,ltree @> ltree[]
,@
,~
,?
gist__ltree_ops
GiST opclass works similarly togist_ltree_ops
and also takes signature length as a parameter. The default value ofsiglen
ingist__ltree_ops
is 28 bytes.Example of creating such an index with the default signature length of 28 bytes:
CREATE INDEX path_gist_idx ON test USING GIST (array_path);
Example of creating such an index with a signature length of 100 bytes:
CREATE INDEX path_gist_idx ON test USING GIST (array_path gist__ltree_ops(siglen=100));
Note: This index type is lossy.
F.30.4. Example #
This example uses the following data (also available in file contrib/ltree/ltreetest.sql
in the source distribution):
CREATE TABLE test (path ltree); INSERT INTO test VALUES ('Top'); INSERT INTO test VALUES ('Top.Science'); INSERT INTO test VALUES ('Top.Science.Astronomy'); INSERT INTO test VALUES ('Top.Science.Astronomy.Astrophysics'); INSERT INTO test VALUES ('Top.Science.Astronomy.Cosmology'); INSERT INTO test VALUES ('Top.Hobbies'); INSERT INTO test VALUES ('Top.Hobbies.Amateurs_Astronomy'); INSERT INTO test VALUES ('Top.Collections'); INSERT INTO test VALUES ('Top.Collections.Pictures'); INSERT INTO test VALUES ('Top.Collections.Pictures.Astronomy'); INSERT INTO test VALUES ('Top.Collections.Pictures.Astronomy.Stars'); INSERT INTO test VALUES ('Top.Collections.Pictures.Astronomy.Galaxies'); INSERT INTO test VALUES ('Top.Collections.Pictures.Astronomy.Astronauts'); CREATE INDEX path_gist_idx ON test USING GIST (path); CREATE INDEX path_idx ON test USING BTREE (path); CREATE INDEX path_hash_idx ON test USING HASH (path);
Now, we have a table test
populated with data describing the hierarchy shown below:
Top / | \ Science Hobbies Collections / | \ Astronomy Amateurs_Astronomy Pictures / \ | Astrophysics Cosmology Astronomy / | \ Galaxies Stars Astronauts
We can do inheritance:
ltreetest=> SELECT path FROM test WHERE path <@ 'Top.Science'; path ------------------------------------ Top.Science Top.Science.Astronomy Top.Science.Astronomy.Astrophysics Top.Science.Astronomy.Cosmology (4 rows)
Here are some examples of path matching:
ltreetest=> SELECT path FROM test WHERE path ~ '*.Astronomy.*'; path ----------------------------------------------- Top.Science.Astronomy Top.Science.Astronomy.Astrophysics Top.Science.Astronomy.Cosmology Top.Collections.Pictures.Astronomy Top.Collections.Pictures.Astronomy.Stars Top.Collections.Pictures.Astronomy.Galaxies Top.Collections.Pictures.Astronomy.Astronauts (7 rows) ltreetest=> SELECT path FROM test WHERE path ~ '*.!pictures@.Astronomy.*'; path ------------------------------------ Top.Science.Astronomy Top.Science.Astronomy.Astrophysics Top.Science.Astronomy.Cosmology (3 rows)
Here are some examples of full text search:
ltreetest=> SELECT path FROM test WHERE path @ 'Astro*% & !pictures@'; path ------------------------------------ Top.Science.Astronomy Top.Science.Astronomy.Astrophysics Top.Science.Astronomy.Cosmology Top.Hobbies.Amateurs_Astronomy (4 rows) ltreetest=> SELECT path FROM test WHERE path @ 'Astro* & !pictures@'; path ------------------------------------ Top.Science.Astronomy Top.Science.Astronomy.Astrophysics Top.Science.Astronomy.Cosmology (3 rows)
Path construction using functions:
ltreetest=> SELECT subpath(path,0,2)||'Space'||subpath(path,2) FROM test WHERE path <@ 'Top.Science.Astronomy'; ?column? ------------------------------------------ Top.Science.Space.Astronomy Top.Science.Space.Astronomy.Astrophysics Top.Science.Space.Astronomy.Cosmology (3 rows)
We could simplify this by creating an SQL function that inserts a label at a specified position in a path:
CREATE FUNCTION ins_label(ltree, int, text) RETURNS ltree AS 'select subpath($1,0,$2) || $3 || subpath($1,$2);' LANGUAGE SQL IMMUTABLE; ltreetest=> SELECT ins_label(path,2,'Space') FROM test WHERE path <@ 'Top.Science.Astronomy'; ins_label ------------------------------------------ Top.Science.Space.Astronomy Top.Science.Space.Astronomy.Astrophysics Top.Science.Space.Astronomy.Cosmology (3 rows)
F.30.5. Transforms #
The ltree_plpython3u
extension implements transforms for the ltree
type for PL/Python. If installed and specified when creating a function, ltree
values are mapped to Python lists. (The reverse is currently not supported, however.)
Caution
It is strongly recommended that the transform extension be installed in the same schema as ltree
. Otherwise there are installation-time security hazards if a transform extension's schema contains objects defined by a hostile user.
F.30.6. Authors #
All work was done by Teodor Sigaev (<teodor@stack.net>
) and Oleg Bartunov (<oleg@sai.msu.su>
). See http://www.sai.msu.su/~megera/postgres/gist/ for additional information. Authors would like to thank Eugeny Rodichev for helpful discussions. Comments and bug reports are welcome.