65.3. Расширяемость
Интерфейс BRIN характеризуется высоким уровнем абстракции и таким образом требует от разработчика метода доступа реализовать только смысловое наполнение обрабатываемого типа данных. Уровень BRIN берёт на себя заботу о параллельном доступе, поддержке журнала и поиске в структуре индекса.
Всё, что нужно, чтобы получить работающий метод доступа BRIN — это реализовать несколько пользовательских методов, определяющих поведение сводных значений, хранящихся в индексе, и их взаимоотношения с ключами сканирования. Словом, BRIN сочетает расширяемость с универсальностью, повторным использованием кода и аккуратным интерфейсом.
Класс операторов для BRIN должен предоставлять четыре метода:
BrinOpcInfo *opcInfo(Oid type_oid)
Возвращает внутреннюю информацию о сводных данных индексированных столбцов. Возвращаемое значение должно указывать на
BrinOpcInfo
(в памяти palloc) со следующим определением:typedef struct BrinOpcInfo { /* Число полей, хранящихся в столбце индекса этого класса операторов */ uint16 oi_nstored; /* Непрозрачный указатель для внутреннего использования классом операторов */ void *oi_opaque; /* Элементы кеша типов для сохранённых столбцов */ TypeCacheEntry *oi_typcache[FLEXIBLE_ARRAY_MEMBER]; } BrinOpcInfo;
Поле
BrinOpcInfo
.oi_opaque
могут использовать подпрограммы класса операторов для передачи информации опорным процедурам при сканировании индекса.bool consistent(BrinDesc *bdesc, BrinValues *column, ScanKey key)
Показывает, соответствует ли значение ScanKey заданным индексированным значениям некоторой зоны. Номер целевого атрибута передаётся в составе ключа сканирования.
bool addValue(BrinDesc *bdesc, BrinValues *column, Datum newval, bool isnull)
Для заданного кортежа индекса и индексируемого значения изменяет выбранный атрибут кортежа, чтобы он дополнительно охватывал новое значение. Если в кортеж вносятся какие-либо изменения, возвращается
true
.bool unionTuples(BrinDesc *bdesc, BrinValues *a, BrinValues *b)
Консолидирует два кортежа индекса. Получая два кортежа, изменяет выбранный атрибут первого из них, что он охватывал оба кортежа. Второй кортеж не изменяется.
Основной дистрибутив включает поддержку двух типов классов операторов: minmax и inclusion. Определения классов операторов, использующие их, представлены для встроенных типов данных, насколько это уместно. Пользователь может определить дополнительные классы операторов для других типов данных, применяя аналогичные определения, и обойтись таким образом без написания кода; достаточно будет объявить нужные записи в каталоге. Заметьте, что предположения о семантике стратегий операторов зашиты в исходном коде опорных процедур.
Также возможно создать классы операторов, воплощающие полностью другую семантику, разработав реализации четырёх основных опорных процедур, описанных выше. Заметьте, что обратная совместимость между разными основными версиями не гарантируется: к примеру, в следующих выпусках могут потребоваться дополнительные опорные процедуры.
При написании класса операторов для типа данных, представляющего полностью упорядоченное множество, можно использовать опорные процедуры minmax вместе с соответствующими операторами, как показано в Таблице 65.2. Все члены класса операторов (процедуры и операторы) являются обязательными.
Таблица 65.2. Номера стратегий и опорных процедур для классов операторов minmax
Член класса операторов | Объект |
---|---|
Опорная процедура 1 | внутренняя функция brin_minmax_opcinfo() |
Опорная процедура 2 | внутренняя функция brin_minmax_add_value() |
Опорная процедура 3 | внутренняя функция brin_minmax_consistent() |
Опорная процедура 4 | внутренняя функция brin_minmax_union() |
Стратегия оператора 1 | оператор меньше |
Стратегия оператора 2 | оператор меньше-или-равно |
Стратегия оператора 3 | оператор равно |
Стратегия оператора 4 | оператор больше-или-равно |
Стратегия оператора 5 | оператор больше |
При написании класса операторов для сложного типа данных, значения которого включаются в другой тип, можно использовать опорные процедуры inclusion вместе с соответствующими операторами, как показано в Таблице 65.3. Для этого требуется одна дополнительная функция, которую можно написать на любом языке. Для расширенной функциональности можно определить другие функции. Все операторы являются необязательными. Некоторые из них требует наличия других, что показано в таблице как зависимости.
Таблица 65.3. Номера стратегий и опорных процедур для классов операторов inclusion
Член класса операторов | Объект | Зависимость |
---|---|---|
Опорная процедура 1 | внутренняя функция brin_inclusion_opcinfo() | |
Опорная процедура 2 | внутренняя функция brin_inclusion_add_value() | |
Опорная процедура 3 | внутренняя функция brin_inclusion_consistent() | |
Опорная процедура 4 | внутренняя функция brin_inclusion_union() | |
Опорная процедура 11 | функция для слияния двух элементов | |
Опорная процедура 12 | необязательная функция для проверки возможности слияния двух элементов | |
Опорная процедура 13 | необязательная функция для проверки, содержится ли один элемент в другом | |
Опорная процедура 14 | необязательная функция для проверки, является ли элемент пустым | |
Стратегия оператора 1 | оператор левее | Стратегия оператора 4 |
Стратегия оператора 2 | оператор не-простирается-правее | Стратегия оператора 5 |
Стратегия оператора 3 | оператор перекрывается | |
Стратегия оператора 4 | оператор не-простирается-левее | Стратегия оператора 1 |
Стратегия оператора 5 | оператор правее | Стратегия оператора 2 |
Стратегия оператора 6, 18 | оператор то-же-или-равно | Стратегия оператора 7 |
Стратегия оператора 7, 13, 16, 24, 25 | оператор содержит-или-равно | |
Стратегия оператора 8, 14, 26, 27 | оператор содержится-в-или-равно | Стратегия оператора 3 |
Стратегия оператора 9 | оператор не-простирается-выше | Стратегия оператора 11 |
Стратегия оператора 10 | оператор ниже | Стратегия оператора 12 |
Стратегия оператора 11 | оператор выше | Стратегия оператора 9 |
Стратегия оператора 12 | оператор не-простирается-ниже | Стратегия оператора 10 |
Стратегия оператора 20 | оператор меньше | Стратегия оператора 5 |
Стратегия оператора 21 | оператор меньше-или-равно | Стратегия оператора 5 |
Стратегия оператора 22 | оператор больше | Стратегия оператора 1 |
Стратегия оператора 23 | оператор больше-или-равно | Стратегия оператора 1 |
Номера опорных процедур 1-10 зарезервированы для внутренних функций BRIN, так что функции уровня SQL начинаются с номера 11. Опорная функция номер 11 является основной, необходимой для построения индекса. Она должна принимать два аргумента того же типа данных, что и целевой тип класса, и возвращать их объединение. Класс операторов inclusion может сохранять значения объединения в различных типах данных, в зависимости от параметра STORAGE
. Возвращаемое функцией объединения значение должно соответствовать типу данных STORAGE
.
Опорные процедуры под номерами 12 и 14 предоставляются для поддержки нерегулярностей встроенных типов данных. Процедура номер 12 применяется для поддержки работы с сетевыми адресами из различных семейств, которые нельзя объединять. Процедура номер 14 применяется для поддержки зон с пустыми значениями. Процедура номер 13 является необязательной, но рекомендуемой; она проверяет новое значение, прежде чем оно будет передано функции объединения. Так как инфраструктура BRIN может соптимизировать некоторые операции, когда объединение не меняется, то применяя эту функцию, можно увеличить быстродействие индекса.
Классы операторов minmax и inclusion поддерживают операторы с разными типами, хотя с ними зависимости становятся более сложными. Класс minmax требует, чтобы для двух аргументов одного типа определялся полный набор операторов. Это позволяет поддерживать дополнительные типы данных, определяя дополнительные наборы операторов. Стратегии операторов класса inclusion могут зависеть от других стратегий, как показано в Таблице 65.3, или от своих собственных стратегий. Для них требуется, чтобы был определён необходимый оператор с типом данных STORAGE
для левого аргумента и другим поддерживаемым типом для правого аргумента реализуемого оператора. См. определение float4_minmax_ops
в качестве примера для minmax и box_inclusion_ops
в качестве примера для inclusion.
44.3. Built-in Functions
44.3.1. Database Access from PL/Perl
Access to the database itself from your Perl function can be done via the following functions:
-
spi_exec_query
(query
[,max-rows
]) spi_exec_query
executes an SQL command and returns the entire row set as a reference to an array of hash references. You should only use this command when you know that the result set will be relatively small. Here is an example of a query (SELECT
command) with the optional maximum number of rows:$rv = spi_exec_query('SELECT * FROM my_table', 5);
This returns up to 5 rows from the table
my_table
. Ifmy_table
has a columnmy_column
, you can get that value from row$i
of the result like this:$foo = $rv->{rows}[$i]->{my_column};
The total number of rows returned from a
SELECT
query can be accessed like this:$nrows = $rv->{processed}
Here is an example using a different command type:
$query = "INSERT INTO my_table VALUES (1, 'test')"; $rv = spi_exec_query($query);
You can then access the command status (e.g.,
SPI_OK_INSERT
) like this:$res = $rv->{status};
To get the number of rows affected, do:
$nrows = $rv->{processed};
Here is a complete example:
CREATE TABLE test ( i int, v varchar ); INSERT INTO test (i, v) VALUES (1, 'first line'); INSERT INTO test (i, v) VALUES (2, 'second line'); INSERT INTO test (i, v) VALUES (3, 'third line'); INSERT INTO test (i, v) VALUES (4, 'immortal'); CREATE OR REPLACE FUNCTION test_munge() RETURNS SETOF test AS $$ my $rv = spi_exec_query('select i, v from test;'); my $status = $rv->{status}; my $nrows = $rv->{processed}; foreach my $rn (0 .. $nrows - 1) { my $row = $rv->{rows}[$rn]; $row->{i} += 200 if defined($row->{i}); $row->{v} =~ tr/A-Za-z/a-zA-Z/ if (defined($row->{v})); return_next($row); } return undef; $$ LANGUAGE plperl; SELECT * FROM test_munge();
-
spi_query(
command
)
spi_fetchrow(
cursor
)
spi_cursor_close(
cursor
) spi_query
andspi_fetchrow
work together as a pair for row sets which might be large, or for cases where you wish to return rows as they arrive.spi_fetchrow
works only withspi_query
. The following example illustrates how you use them together:CREATE TYPE foo_type AS (the_num INTEGER, the_text TEXT); CREATE OR REPLACE FUNCTION lotsa_md5 (INTEGER) RETURNS SETOF foo_type AS $$ use Digest::MD5 qw(md5_hex); my $file = '/usr/share/dict/words'; my $t = localtime; elog(NOTICE, "opening file $file at $t" ); open my $fh, '<', $file # ooh, it's a file access! or elog(ERROR, "cannot open $file for reading: $!"); my @words = <$fh>; close $fh; $t = localtime; elog(NOTICE, "closed file $file at $t"); chomp(@words); my $row; my $sth = spi_query("SELECT * FROM generate_series(1,$_[0]) AS b(a)"); while (defined ($row = spi_fetchrow($sth))) { return_next({ the_num => $row->{a}, the_text => md5_hex($words[rand @words]) }); } return; $$ LANGUAGE plperlu; SELECT * from lotsa_md5(500);
Normally,
spi_fetchrow
should be repeated until it returnsundef
, indicating that there are no more rows to read. The cursor returned byspi_query
is automatically freed whenspi_fetchrow
returnsundef
. If you do not wish to read all the rows, instead callspi_cursor_close
to free the cursor. Failure to do so will result in memory leaks.-
spi_prepare(
command
,argument types
)
spi_query_prepared(
plan
,arguments
)
spi_exec_prepared(
plan
[,attributes
],arguments
)
spi_freeplan(
plan
) spi_prepare
,spi_query_prepared
,spi_exec_prepared
, andspi_freeplan
implement the same functionality but for prepared queries.spi_prepare
accepts a query string with numbered argument placeholders ($1, $2, etc) and a string list of argument types:$plan = spi_prepare('SELECT * FROM test WHERE id > $1 AND name = $2', 'INTEGER', 'TEXT');
Once a query plan is prepared by a call to
spi_prepare
, the plan can be used instead of the string query, either inspi_exec_prepared
, where the result is the same as returned byspi_exec_query
, or inspi_query_prepared
which returns a cursor exactly asspi_query
does, which can be later passed tospi_fetchrow
. The optional second parameter tospi_exec_prepared
is a hash reference of attributes; the only attribute currently supported islimit
, which sets the maximum number of rows returned by a query.The advantage of prepared queries is that is it possible to use one prepared plan for more than one query execution. After the plan is not needed anymore, it can be freed with
spi_freeplan
:CREATE OR REPLACE FUNCTION init() RETURNS VOID AS $$ $_SHARED{my_plan} = spi_prepare('SELECT (now() + $1)::date AS now', 'INTERVAL'); $$ LANGUAGE plperl; CREATE OR REPLACE FUNCTION add_time( INTERVAL ) RETURNS TEXT AS $$ return spi_exec_prepared( $_SHARED{my_plan}, $_[0] )->{rows}->[0]->{now}; $$ LANGUAGE plperl; CREATE OR REPLACE FUNCTION done() RETURNS VOID AS $$ spi_freeplan( $_SHARED{my_plan}); undef $_SHARED{my_plan}; $$ LANGUAGE plperl; SELECT init(); SELECT add_time('1 day'), add_time('2 days'), add_time('3 days'); SELECT done(); add_time | add_time | add_time ------------+------------+------------ 2005-12-10 | 2005-12-11 | 2005-12-12
Note that the parameter subscript in
spi_prepare
is defined via $1, $2, $3, etc, so avoid declaring query strings in double quotes that might easily lead to hard-to-catch bugs.Another example illustrates usage of an optional parameter in
spi_exec_prepared
:CREATE TABLE hosts AS SELECT id, ('192.168.1.'||id)::inet AS address FROM generate_series(1,3) AS id; CREATE OR REPLACE FUNCTION init_hosts_query() RETURNS VOID AS $$ $_SHARED{plan} = spi_prepare('SELECT * FROM hosts WHERE address << $1', 'inet'); $$ LANGUAGE plperl; CREATE OR REPLACE FUNCTION query_hosts(inet) RETURNS SETOF hosts AS $$ return spi_exec_prepared( $_SHARED{plan}, {limit => 2}, $_[0] )->{rows}; $$ LANGUAGE plperl; CREATE OR REPLACE FUNCTION release_hosts_query() RETURNS VOID AS $$ spi_freeplan($_SHARED{plan}); undef $_SHARED{plan}; $$ LANGUAGE plperl; SELECT init_hosts_query(); SELECT query_hosts('192.168.1.0/30'); SELECT release_hosts_query(); query_hosts ----------------- (1,192.168.1.1) (2,192.168.1.2) (2 rows)
44.3.2. Utility Functions in PL/Perl
-
elog(
level
,msg
) Emit a log or error message. Possible levels are
DEBUG
,LOG
,INFO
,NOTICE
,WARNING
, andERROR
.ERROR
raises an error condition; if this is not trapped by the surrounding Perl code, the error propagates out to the calling query, causing the current transaction or subtransaction to be aborted. This is effectively the same as the Perldie
command. The other levels only generate messages of different priority levels. Whether messages of a particular priority are reported to the client, written to the server log, or both is controlled by the log_min_messages and client_min_messages configuration variables. See Chapter 19 for more information.-
quote_literal(
string
) Return the given string suitably quoted to be used as a string literal in an SQL statement string. Embedded single-quotes and backslashes are properly doubled. Note that
quote_literal
returns undef on undef input; if the argument might be undef,quote_nullable
is often more suitable.-
quote_nullable(
string
) Return the given string suitably quoted to be used as a string literal in an SQL statement string; or, if the argument is undef, return the unquoted string "NULL". Embedded single-quotes and backslashes are properly doubled.
-
quote_ident(
string
) Return the given string suitably quoted to be used as an identifier in an SQL statement string. Quotes are added only if necessary (i.e., if the string contains non-identifier characters or would be case-folded). Embedded quotes are properly doubled.
-
decode_bytea(
string
) Return the unescaped binary data represented by the contents of the given string, which should be
bytea
encoded.-
encode_bytea(
string
) Return the
bytea
encoded form of the binary data contents of the given string.-
encode_array_literal(
array
)
encode_array_literal(
array
,delimiter
) Returns the contents of the referenced array as a string in array literal format (see Section 8.15.2). Returns the argument value unaltered if it's not a reference to an array. The delimiter used between elements of the array literal defaults to "
,
" if a delimiter is not specified or is undef.-
encode_typed_literal(
value
,typename
) Converts a Perl variable to the value of the data type passed as a second argument and returns a string representation of this value. Correctly handles nested arrays and values of composite types.
-
encode_array_constructor(
array
) Returns the contents of the referenced array as a string in array constructor format (see Section 4.2.12). Individual values are quoted using
quote_nullable
. Returns the argument value, quoted usingquote_nullable
, if it's not a reference to an array.-
looks_like_number(
string
) Returns a true value if the content of the given string looks like a number, according to Perl, returns false otherwise. Returns undef if the argument is undef. Leading and trailing space is ignored.
Inf
andInfinity
are regarded as numbers.-
is_array_ref(
argument
) Returns a true value if the given argument may be treated as an array reference, that is, if ref of the argument is
ARRAY
orPostgreSQL::InServer::ARRAY
. Returns false otherwise.