9.5. Функции и операторы двоичных строк

В этом разделе описываются функции и операторы для работы с данными типа bytea.

В SQL определены несколько строковых функций, в которых аргументы разделяются не запятыми, а ключевыми словами. Подробнее это описано в Таблице 9-9. PostgreSQL также предоставляет варианты этих функций с синтаксисом, обычным для функций (см. Таблицу 9-10).

Замечание: В примерах, приведённых на этой странице, подразумевается, что параметр сервера bytea_output равен escape (выбран традиционный формат PostgreSQL).

Таблица 9-9. SQL-функции и операторы для работы с двоичными строками

ФункцияТип результатаОписаниеПримерРезультат
string || stringbyteaКонкатенация строк E'\\\\Post'::bytea || E'\\047gres​\\000'::bytea\\Post'gres​\000
octet_length(string)intЧисло байт в двоичной строкеoctet_length(E'jo\\000se'::bytea)5
overlay(string placing string from int [for int])byteaЗаменяет подстрокуoverlay(E'Th\\000​omas'::bytea placing E'\\002\\003'::bytea from 2 for 3)T\\002​\\003​mas
position(substring in string)intПоложение указанной подстрокиposition(E'\\000om'::bytea in E'Th\\000​omas'::bytea)3
substring(string [from int] [for int])byteaИзвлекает подстрокуsubstring(E'Th\\000​omas'::bytea from 2 for 3)h\000o
trim([both] bytes from string)byteaУдаляет наибольшую подстроку, содержащую только байты bytes, с начала и с конца строки stringtrim(E'\\000'::bytea from E'\\000Tom​\\000'::bytea)Tom

В PostgreSQL есть и другие функции для работы с двоичными строками, перечисленные в Таблице 9-10. Некоторые из них используются в качестве внутренней реализации стандартных функций SQL, приведённых в Таблице 9-9.

Таблица 9-10. Другие функции для работы с двоичными строками

ФункцияТип результатаОписаниеПримерРезультат
btrim(string bytea, bytes bytea)byteaУдаляет наибольшую подстроку, состоящую только из байт bytes, с начала и с конца строки stringbtrim(E'\\000trim​\\000'::bytea, E'\\000'::bytea)trim
decode(string text, format text)byteaПолучает двоичные данные из текстового представления в string. Значения параметра format те же, что и для функции encode.decode(E'123​\\000456', 'escape')123\000456
encode(data bytea, format text)textПереводит двоичные данные в текстовое представление в одном из форматов: base64, hex, escape. Формат escape преобразует нулевые байты и байты с 1 в старшем бите в восьмеричные последовательности \nnn и дублирует обратную косую черту.encode(E'123​\\000456'::bytea, 'escape')123\000456
get_bit(string, offset)intИзвлекает бит из строкиget_bit(E'Th\\000​omas'::bytea, 45)1
get_byte(string, offset)intИзвлекает байт из строкиget_byte(E'Th\\000​omas'::bytea, 4)109
length(string)intДлина двоичной строки length(E'jo\\000se'::bytea)5
md5(string)textВычисляет MD5-хеш строки string и возвращает результат в 16-ричном видеmd5(E'Th\\000​omas'::bytea)8ab2d3c9​689aaf18 b4958c33​4c82d8b1
set_bit(string, offset, newvalue)byteaУстанавливает значение бита в строкеset_bit(E'Th\\000​omas'::bytea, 45, 0)Th\000omAs
set_byte(string, offset, newvalue)byteaУстанавливает значение байта в строкеset_byte(E'Th\\000​omas'::bytea, 4, 64)Th\000o@as

Для функций get_byte и set_byte байты нумеруется с 0. Функции get_bit и set_bit нумеруют биты справа налево; например, бит 0 будет меньшим значащим битом первого байта, а бит 15 — большим значащим битом второго байта.

См. также агрегатную функцию string_agg в Разделе 9.20 и функции для работы с большими объектами в Разделе 32.4.