9.5. Функции и операторы двоичных строк
В этом разделе описываются функции и операторы для работы с данными типа bytea.
В SQL определены несколько строковых функций, в которых аргументы разделяются не запятыми, а ключевыми словами. Подробнее это описано в Таблице 9.12. Postgres Pro также предоставляет варианты этих функций с синтаксисом, обычным для функций (см. Таблицу 9.13).
Примечание
В примерах, приведённых на этой странице, подразумевается, что параметр сервера bytea_output равен escape (выбран традиционный формат Postgres Pro).
Таблица 9.12. SQL-функции и операторы для работы с двоичными строками
| Функция | Тип результата | Описание | Пример | Результат |
|---|
string || string | bytea | Конкатенация строк | '\\Post'::bytea || '\047gres\000'::bytea | \\Post'gres\000 |
octet_length(string) | int | Число байт в двоичной строке | octet_length('jo\000se'::bytea) | 5 |
overlay(string placing string from int [for int]) | bytea | Заменяет подстроку | overlay('Th\000omas'::bytea placing '\002\003'::bytea from 2 for 3) | T\\002\\003mas |
position(substring in string) | int | Положение указанной подстроки | position('\000om'::bytea in 'Th\000omas'::bytea) | 3 |
substring(string [from int] [for int]) | bytea | Извлекает подстроку | substring('Th\000omas'::bytea from 2 for 3) | h\000o |
trim([both] bytes from string) | bytea | Удаляет наибольшую строку, содержащую только байты, заданные в параметре bytes, с начала и с конца строки string | trim('\000\001'::bytea from '\000Tom\001'::bytea) | Tom |
В PostgreSQL есть и другие функции для работы с двоичными строками, перечисленные в Таблице 9.13. Некоторые из них используются в качестве внутренней реализации стандартных функций SQL, приведённых в Таблице 9.12.
Таблица 9.13. Другие функции для работы с двоичными строками
| Функция | Тип результата | Описание | Пример | Результат |
|---|
btrim(string bytea, bytes bytea) | bytea | Удаляет наибольшую строку, содержащую только байты, заданные в параметре bytes, с начала и с конца строки string | btrim('\000trim\001'::bytea, '\000\001'::bytea) | trim |
decode(string text, format text) | bytea | Получает двоичные данные из текстового представления в string. Значения параметра format те же, что и для функции encode. | decode('123\000456', 'escape') | 123\000456 |
encode(data bytea, format text) | text | Переводит двоичные данные в текстовое представление в одном из форматов: base64, hex, escape. Формат escape преобразует нулевые байты и байты с 1 в старшем бите в восьмеричные последовательности \nnn и дублирует обратную косую черту. | encode('123\000456'::bytea, 'escape') | 123\000456 |
get_bit(string, offset) | int | Извлекает бит из строки | get_bit('Th\000omas'::bytea, 45) | 1 |
get_byte(string, offset) | int | Извлекает байт из строки | get_byte('Th\000omas'::bytea, 4) | 109 |
length(string) | int | Длина двоичной строки | length('jo\000se'::bytea) | 5 |
md5(string) | text | Вычисляет MD5-хеш строки string и возвращает результат в 16-ричном виде | md5('Th\000omas'::bytea) | 8ab2d3c9689aaf18b4958c334c82d8b1 |
set_bit(string, offset, newvalue) | bytea | Устанавливает значение бита в строке | set_bit('Th\000omas'::bytea, 45, 0) | Th\000omAs |
set_byte(string, offset, newvalue) | bytea | Устанавливает значение байта в строке | set_byte('Th\000omas'::bytea, 4, 64) | Th\000o@as |
sha224(bytea) | bytea | Хеш SHA-224 | sha224('abc') | \x23097d223405d8228642a477bda255b32aadbce4bda0b3f7e36c9da7 |
sha256(bytea) | bytea | Хеш SHA-256 | sha256('abc') | \xba7816bf8f01cfea414140de5dae2223b00361a396177a9cb410ff61f20015ad |
sha384(bytea) | bytea | Хеш SHA-384 | sha384('abc') | \xcb00753f45a35e8bb5a03d699ac65007272c32ab0eded1631a8b605a43ff5bed8086072ba1e7cc2358baeca134c825a7 |
sha512(bytea) | bytea | Хеш SHA-512 | sha512('abc') | \xddaf35a193617abacc417349ae20413112e6fa4e89a97ea20a9eeee64b55d39a2192992a274fc1a836ba3c23a3feebbd454d4423643ce80e2a9ac94fa54ca49f |
Для функций get_byte и set_byte байты нумеруется с 0. Функции get_bit и set_bit нумеруют биты справа налево; например, бит 0 будет меньшим значащим битом первого байта, а бит 15 — большим значащим битом второго байта.
Заметьте, что по историческим причинам функция md5 возвращает значение в шестнадцатеричном виде в типе text, тогда как функции SHA-2 возвращают тип bytea. Используйте функции encode и decode для преобразования значений из одного представления в другое. Например, вызвав encode(sha256('abc'), 'hex'), вы получите значение в шестнадцатеричном виде в строке.
См. также агрегатную функцию string_agg в Разделе 9.20 и функции для работы с большими объектами в Разделе 36.4.