11.10. Семейства и классы операторов
В определении индекса можно указать класс операторов для каждого столбца индекса.
CREATE INDEXимя
ONтаблица
(столбец
класс_оп
[ (параметры_класса_оп
) ] [параметры сортировки
] [, ...]);
Класс операторов определяет, какие операторы будет использовать индекс для этого столбца. Например, индекс-B-дерево по столбцу int4
будет использовать класс int4_ops
; этот класс операторов включает операции со значениями типа int4
. На практике часто достаточно принять класс операторов, назначенный для типа столбца классом по умолчанию. Однако для некоторых типов данных могут иметь смысл несколько разных вариантов индексирования и реализовать их как раз позволяют разные классы операторов. Например, комплексные числа можно сортировать как по вещественной части, так и по модулю. Получить два варианта индексов для них можно, определив два класса операторов для данного типа и выбрав соответствующий класс при создании индекса. Выбранный класс операторов задаст основной порядок сортировки данных (его можно уточнить, добавив параметры COLLATE
, ASC
/DESC
и/или NULLS FIRST
/NULLS LAST
).
Помимо классов операторов по умолчанию есть ещё несколько встроенных:
Классы операторов
text_pattern_ops
,varchar_pattern_ops
иbpchar_pattern_ops
поддерживают индексы-B-деревья для типовtext
,varchar
иchar
, соответственно. От стандартных классов операторов они отличаются тем, что сравнивают значения по символам, не применяя правила сортировки, определённые локалью. Благодаря этому они подходят для запросов с поиском по шаблону (сLIKE
и регулярными выражениями POSIX), когда локаль базы данных не стандартная «C». Например, вы можете проиндексировать столбецvarchar
так:CREATE INDEX test_index ON test_table (col varchar_pattern_ops);
Заметьте, что при этом также следует создать индекс с классом операторов по умолчанию, если вы хотите ускорить запросы с обычными сравнениями
<
,<=
,>
и>=
за счёт применения индексов. Классы операторов
не подходят для таких сравнений. (Однако для проверки равенств эти классы операторов вполне пригодны.) В подобных случаях для одного столбца можно создать несколько индексов с разными классами операторов. Если же вы используете локаль C, классы операторовxxx
_pattern_ops
вам не нужны, так как для поиска по шаблону в локали C будет достаточно индексов с классом операторов по умолчанию.xxx
_pattern_ops
Следующий запрос выводит список всех существующих классов операторов:
SELECT am.amname AS index_method, opc.opcname AS opclass_name, opc.opcintype::regtype AS indexed_type, opc.opcdefault AS is_default FROM pg_am am, pg_opclass opc WHERE opc.opcmethod = am.oid ORDER BY index_method, opclass_name;
Класс операторов на самом деле является всего лишь подмножеством большой структуры, называемой семейством операторов. В случаях, когда несколько типов данных ведут себя одинаково, часто имеет смысл определить операторы так, чтобы они могли использоваться с индексами сразу нескольких типов. Сделать это можно, сгруппировав классы операторов для этих типов в одном семействе операторов. Такие многоцелевые операторы, являясь членами семейства, не будут связаны с каким-либо одним его классом.
Расширенная версия предыдущего запроса показывает семейство операторов, к которому принадлежит каждый класс операторов:
SELECT am.amname AS index_method, opc.opcname AS opclass_name, opf.opfname AS opfamily_name, opc.opcintype::regtype AS indexed_type, opc.opcdefault AS is_default FROM pg_am am, pg_opclass opc, pg_opfamily opf WHERE opc.opcmethod = am.oid AND opc.opcfamily = opf.oid ORDER BY index_method, opclass_name;
Этот запрос выводит все существующие семейства операторов и все операторы, включённые в эти семейства:
SELECT am.amname AS index_method, opf.opfname AS opfamily_name, amop.amopopr::regoperator AS opfamily_operator FROM pg_am am, pg_opfamily opf, pg_amop amop WHERE opf.opfmethod = am.oid AND amop.amopfamily = opf.oid ORDER BY index_method, opfamily_name, opfamily_operator;
Подсказка
В psql есть команды \dAc
, \dAf
и \dAo
, которые выводят более усовершенствованные версии этих запросов.
11.10. Operator Classes and Operator Families
An index definition can specify an operator class for each column of an index.
CREATE INDEXname
ONtable
(column
opclass
[ (opclass_options
) ] [sort options
] [, ...]);
The operator class identifies the operators to be used by the index for that column. For example, a B-tree index on the type int4
would use the int4_ops
class; this operator class includes comparison functions for values of type int4
. In practice the default operator class for the column's data type is usually sufficient. The main reason for having operator classes is that for some data types, there could be more than one meaningful index behavior. For example, we might want to sort a complex-number data type either by absolute value or by real part. We could do this by defining two operator classes for the data type and then selecting the proper class when making an index. The operator class determines the basic sort ordering (which can then be modified by adding sort options COLLATE
, ASC
/DESC
and/or NULLS FIRST
/NULLS LAST
).
There are also some built-in operator classes besides the default ones:
The operator classes
text_pattern_ops
,varchar_pattern_ops
, andbpchar_pattern_ops
support B-tree indexes on the typestext
,varchar
, andchar
respectively. The difference from the default operator classes is that the values are compared strictly character by character rather than according to the locale-specific collation rules. This makes these operator classes suitable for use by queries involving pattern matching expressions (LIKE
or POSIX regular expressions) when the database does not use the standard “C” locale. As an example, you might index avarchar
column like this:CREATE INDEX test_index ON test_table (col varchar_pattern_ops);
Note that you should also create an index with the default operator class if you want queries involving ordinary
<
,<=
,>
, or>=
comparisons to use an index. Such queries cannot use the
operator classes. (Ordinary equality comparisons can use these operator classes, however.) It is possible to create multiple indexes on the same column with different operator classes. If you do use the C locale, you do not need thexxx
_pattern_ops
operator classes, because an index with the default operator class is usable for pattern-matching queries in the C locale.xxx
_pattern_ops
The following query shows all defined operator classes:
SELECT am.amname AS index_method, opc.opcname AS opclass_name, opc.opcintype::regtype AS indexed_type, opc.opcdefault AS is_default FROM pg_am am, pg_opclass opc WHERE opc.opcmethod = am.oid ORDER BY index_method, opclass_name;
An operator class is actually just a subset of a larger structure called an operator family. In cases where several data types have similar behaviors, it is frequently useful to define cross-data-type operators and allow these to work with indexes. To do this, the operator classes for each of the types must be grouped into the same operator family. The cross-type operators are members of the family, but are not associated with any single class within the family.
This expanded version of the previous query shows the operator family each operator class belongs to:
SELECT am.amname AS index_method, opc.opcname AS opclass_name, opf.opfname AS opfamily_name, opc.opcintype::regtype AS indexed_type, opc.opcdefault AS is_default FROM pg_am am, pg_opclass opc, pg_opfamily opf WHERE opc.opcmethod = am.oid AND opc.opcfamily = opf.oid ORDER BY index_method, opclass_name;
This query shows all defined operator families and all the operators included in each family:
SELECT am.amname AS index_method, opf.opfname AS opfamily_name, amop.amopopr::regoperator AS opfamily_operator FROM pg_am am, pg_opfamily opf, pg_amop amop WHERE opf.opfmethod = am.oid AND amop.amopfamily = opf.oid ORDER BY index_method, opfamily_name, opfamily_operator;
Tip
psql has commands \dAc
, \dAf
, and \dAo
, which provide slightly more sophisticated versions of these queries.