48.44. pg_statistic

В каталоге pg_statistic хранится статистическая информация о содержимом базы данных. Записи в нём создаются командой ANALYZE, а затем используются планировщиком запросов. Заметьте, что все эти данные по природе своей неточные, даже если предполагается, что они актуальны.

Обычно для каждой колонки, подлежащей анализу, в этом каталоге есть одна запись со значением stainherit = false. Если у таблицы имеются потомки в иерархии наследования, также создаётся вторая запись с stainherit = true. Эта строка представляет статистику по колонке в дереве наследования, то есть статистику по данным, которые возвратит запрос SELECT колонка FROM table*, тогда как строка с stainherit = false представляет результаты запроса SELECT колонка FROM ONLY таблица.

В pg_statistic также хранится статистическая информация о значениях выражений индексов. Она описывается так же, как если бы это были колонки данных; в частности, starelid ссылается на индекс. Однако для колонок, задействуемых в индексе без выражений, дополнительная запись не добавляется, так как она повторяла бы запись для нижележащей колонки таблицы. В настоящее время во всех записях для выражений индексов stainherit = false.

Так как для различных типов данных могут быть уместны различные типы статистики, в каталоге pg_statistic не делается конкретных предположений о том, какая статистика в нём хранится. Отдельные колонки в pg_statistic выделены только для самых общих свойств (например, доля NULL). Всё остальное хранится в "слотах", представляющих собой группы связанных колонок, содержимое которых определяется кодовым числом в одной из колонок слотов. За подробностями обратитесь к src/include/catalog/pg_statistic.h.

Каталог pg_statistic не должен быть доступен на чтение всем, так как даже статистическая информация о содержимом таблицы может считаться конфиденциальной. (Например, довольно интересны могут быть минимальные и максимальные значения в колонке зарплаты.) Поэтому существует pg_stats — доступное всем для чтения представление на базе pg_statistic, в котором выдаётся информация только по тем таблицам, которые может читать текущий пользователь.

Таблица 48-44. Колонки pg_statistic

ИмяТипСсылкиОписание
starelidoidpg_class.oidТаблица (или индекс), к которой принадлежит описываемая колонка
staattnumint2pg_attribute.attnumНомер описываемой колонки
stainheritbool Если true, в статистике учитываются значения в дочерних колонках, а не только в указанном отношении
stanullfracfloat4 Доля записей, в которых эта колонка содержит NULL
stawidthint4 Средний размер хранения элементов не-NULL, в байтах
stadistinctfloat4 Число различных и отличных от NULL значений в колонке. Число, большее нуля, представляет фактическое количество различных значений. Если это число меньше нуля, его модуль представляет множитель для общего количества строк в таблице; например, для колонки, значения в которой в среднем повторяются дважды, можно задать stadistinct = -0.5. Ноль означает, что количество различных значений неизвестно.
stakindNint2 Кодовое число, определяющее род статистики, хранящейся в N-ном "слоте" строки pg_statistic row.
staopNoidpg_operator.oidОператор, с которым была получена статистика, хранящаяся в N-ном "слоте". Например, для слота гистограммы это будет оператор <, определяющий порядок сортировки данных.
stanumbersNfloat4[] Численная статистика соответствующего рода для N-ного "слота", либо NULL, если с этим родом слота не связаны числовые значения
stavaluesNanyarray Значения колонок соответствующего рода для N-го "слота", либо NULL, если для этого рода слота не хранятся никакие значения. Все значения элементов массива фактически имеют тип данных колонки или связанный тип, например, тип элемента массива, так что определить типы эти колонок более конкретно, чем anyarray, нельзя.