VACUUM

VACUUM — провести сборку мусора и, возможно, проанализировать базу данных

Синтаксис

VACUUM [ ( параметр [, ...] ) ] [ таблица_и_столбцы [, ...] ]

Здесь допускается параметр:

    FULL [ boolean ]
    FREEZE [ boolean ]
    VERBOSE [ boolean ]
    ANALYZE [ boolean ]
    DISABLE_PAGE_SKIPPING [ boolean ]
    SKIP_LOCKED [ boolean ]
    INDEX_CLEANUP { AUTO | ON | OFF }
    PROCESS_MAIN [ boolean ]
    PROCESS_TOAST [ boolean ]
    TRUNCATE [ boolean ]
    PARALLEL integer
    SKIP_DATABASE_STATS [ boolean ]
    ONLY_DATABASE_STATS [ boolean ]
    BUFFER_USAGE_LIMIT размер

и таблица_и_столбцы:

    имя_таблицы [ ( имя_столбца [, ...] ) ]

Описание

VACUUM высвобождает пространство, занимаемое «мёртвыми» кортежами. При обычных операциях Postgres Pro кортежи, удалённые или устаревшие в результате обновления, физически не удаляются из таблицы; они сохраняются в ней, пока не будет выполнена команда VACUUM. Таким образом, периодически необходимо выполнять VACUUM, особенно для часто изменяемых таблиц.

Без списка таблица_и_столбцы команда VACUUM обрабатывает все таблицы и материализованные представления в текущей базе данных, на очистку которых текущий пользователь имеет право. С этим списком VACUUM обрабатывает только указанную таблицу(ы).

VACUUM ANALYZE выполняет очистку (VACUUM), а затем анализ (ANALYZE) всех указанных таблиц. Это удобная комбинация для регулярного обслуживания БД. За дополнительной информацией об анализе обратитесь к описанию ANALYZE.

Простая команда VACUUM (без FULL) только высвобождает пространство и делает его доступным для повторного использования. Эта форма команды может работать параллельно с обычными операциями чтения и записи таблицы, так она не требует исключительной блокировки. Однако освобождённое место не возвращается операционной системе (в большинстве случаев); оно просто остаётся доступным для размещения данных этой же таблицы. Она также позволяет задействовать для обработки несколько процессоров. Этот режим называется параллельной очисткой. Для отключения этого режима можно воспользоваться указанием PARALLEL и задать нулевое количество параллельных рабочих процессов. VACUUM FULL переписывает всё содержимое таблицы в новый файл на диске, не содержащий ничего лишнего, что позволяет возвратить неиспользованное пространство операционной системе. Эта форма работает намного медленнее и запрашивает блокировку в режиме ACCESS EXCLUSIVE для каждой обрабатываемой таблицы.

Параметры

FULL

Выбирает режим «полной» очистки, который может освободить больше пространства, но выполняется гораздо дольше и запрашивает исключительную блокировку таблицы. Этот режим также требует дополнительное место на диске, так как он записывает новую копию таблицы и не освобождает старую до завершения операции. Обычно это следует использовать, только когда требуется высвободить значительный объём пространства, выделенного таблице.

FREEZE

Выбирает агрессивную «заморозку» кортежей. Добавление указания FREEZE равносильно выполнению команды VACUUM с параметрами vacuum_freeze_min_age и vacuum_freeze_table_age, равными нулю. Агрессивная заморозка всегда выполняется при перезаписи таблицы, поэтому в режиме FULL это указание избыточно.

VERBOSE

Выводит подробный отчёт об очистке для каждой таблицы.

ANALYZE

Обновляет статистику, которую использует планировщик для выбора наиболее эффективного способа выполнения запроса.

DISABLE_PAGE_SKIPPING

Обычно VACUUM пропускает страницы, учитывая карту видимости. Страницы, на которых, судя по карте, все кортежи заморожены, можно пропускать всегда, а страницы, в которых все кортежи видны всем транзакциям, могут обрабатываться только при агрессивной очистке. Более того, за исключением агрессивной очистки, некоторые страницы можно пропускать, чтобы не ждать, пока другие сеансы закончат их использовать. Этот параметр отключает пропуск страниц и предназначен для использования только когда целостность карты видимости вызывает подозрения, что возможно при аппаратных или программных сбоях, приводящих к разрушению БД.

SKIP_LOCKED

Указывает, что команда VACUUM не должна ждать освобождения никаких конфликтующих блокировок, начиная обработку отношения: если отношение не удаётся заблокировать сразу, без ожидания, оно пропускается. Заметьте, что даже с этим указанием VACUUM может заблокироваться, открывая индексы отношения. Кроме того, VACUUM ANALYZE может заблокироваться и при получении выборки строк из секций, потомков в иерархии наследования или некоторых видов сторонних таблиц. Учтите также, что при наличии конфликтующей блокировки в секционированной таблице команда VACUUM с этим указанием пропускает все её секции, тогда как обычно все они обрабатываются.

INDEX_CLEANUP

Обычно VACUUM пропускает очистку индекса, когда в таблице имеется всего несколько мёртвых кортежей. В подобных ситуациях стоимость обработки всех индексов таблицы может значительно превышать выгоду от удаления из индекса мёртвых кортежей. Данное указание можно использовать, чтобы в ходе VACUUM индексы обрабатывались принудительно при любом ненулевом количестве мёртвых кортежей. Со значением AUTO (действующим по умолчанию) VACUUM может пропускать очистку индексов, когда она видится нецелесообразной. Если для INDEX_CLEANUP задано значение ON, VACUUM будет безусловно удалять все мёртвые кортежи из индексов. Это может быть полезно для обеспечения обратной совместимости с предыдущими версиями PostgreSQL, где такое поведение было стандартным.

Для указания INDEX_CLEANUP можно также задать значение OFF, чтобы в ходе VACUUM всегда пропускалась очистка индексов, даже при наличии в таблице множества мёртвых кортежей. Это может быть полезно, когда нужно выполнить очистку как можно быстрее для предотвращения надвигающейся угрозы зацикливания идентификаторов транзакций (см. Подраздел 23.1.5). Однако предпочтительнее положиться на механизм защиты от такого зацикливания, управляемый параметром vacuum_failsafe_age, который обычно срабатывает автоматически. Если очистка индекса не производится регулярно, производительность может ухудшаться, так как по мере внесения изменений в таблицу индексы будут накапливать мёртвые кортежи, а сама таблица будет накапливать мёртвые указатели, которые могут быть удалены только после очистки индекса.

Это указание не действует на таблицы, в которых нет индексов, и игнорируется в случае использования указания FULL. Также оно не влияет на работу механизма защиты от зацикливания идентификаторов транзакций. Когда он включается, очистка индексов пропускается, даже если для INDEX_CLEANUP задано значение ON.

PROCESS_MAIN

Указывает, что команда VACUUM должна попытаться обработать основное отношение. Обычно это желательная операция и она выполняется по умолчанию. Отключать эту операцию может быть полезно, если требуется провести очистку только TOAST-таблицы отношения.

PROCESS_TOAST

Указывает, что команда VACUUM должна попытаться обработать соответствующую TOAST-таблицу для каждого отношения, если таковая существует. Обычно это желательная операция и она выполняется по умолчанию. Отключать эту операцию может быть полезно, если требуется провести очистку только основного отношения. Это указание игнорируется в случае использования указания FULL.

TRUNCATE

Указывает, что команда VACUUM должна попытаться обрезать пустые страницы в конце таблицы, чтобы освободившееся место было возвращено операционной системе. Обычно это желательная операция и она выполняется по умолчанию, если только для таблицы, подлежащей очистке, не сброшен параметр vacuum_truncate. Отключать эту операцию может иметь смысл, чтобы избежать блокировки ACCESS EXCLUSIVE для таблицы, подлежащей очистке. Это указание игнорируется в случае использования указания FULL.

PARALLEL

Управляет этапами очистки и уборки индексов в ходе параллельного выполнения VACUUM, определяя целое_число фоновых рабочих процессов (более подробно каждый этап очистки описан в Таблице 26.46). Число рабочих процессов, используемых для этой операции, равняется числу индексов в отношении, подходящих для параллельной очистки, и может ограничиваться сверху количеством, заданным указанием PARALLEL, а также дополнительно ограничивается параметром max_parallel_maintenance_workers. Индекс может обрабатываться в режиме параллельной очистки тогда и только тогда, когда его размер превышает min_parallel_index_scan_size. Заметьте, что при этом не гарантируется, что во время очистки будет задействоваться столько параллельных исполнителей, сколько задаёт параметр целое_число. В ходе очистки рабочие процессы могут использоваться в меньшем количестве или не использоваться вовсе. Для обработки одного индекса может быть использован только один рабочий процесс. Поэтому параллельные исполнители будут запускаться, только если в таблице есть минимум 2 индекса. Рабочие процессы очистки запускаются перед началом каждого этапа и завершаются после его окончания. В будущих выпусках это поведение может измениться. В режиме FULL это указание не поддерживается.

SKIP_DATABASE_STATS

Указывает, что команда VACUUM должна пропускать обновление статистики о самых старых незамороженных значениях XID на уровне базы данных. Как правило, команда VACUUM обновляет эту статистику по окончании выполнения. Однако в базе данных с очень большим количеством таблиц это может занять некоторое время и не привести ни к какому результату (если среди очищенных таблиц не было таблицы с самыми старыми незамороженными значениями XID). Кроме того, если запустить несколько команд VACUUM параллельно, они будут обновлять статистику по очереди. Таким образом, если приложение выполняет серию команд VACUUM, может быть полезно задать этот параметр для всех команд, кроме последней, или задать его для всех команд и после их выполнения отдельно запустить VACUUM (ONLY_DATABASE_STATS).

ONLY_DATABASE_STATS

Указывает, что команда VACUUM должна только обновить статистику о самых старых незамороженных значениях XID на уровне базы данных. Если этот параметр задан, список таблица_и_столбцы должен быть пустым, а из других параметров должен быть задан только VERBOSE.

BUFFER_USAGE_LIMIT

Указывает размер кольцевого буфера стратегии доступа к буферам (Buffer Access Strategy) для VACUUM. Этот размер используется для расчёта количества общих буферов, переиспользуемых в рамках этой стратегии. С значением 0 использование стратегии доступа к буферам отключается. Если параметр ANALYZE также задан, значение BUFFER_USAGE_LIMIT используется как на этапе анализа, так и на этапе очистки. Этот параметр не может использоваться в режиме FULL, если не задан параметр ANALYZE. Если не задать этот параметр, VACUUM использует значение из vacuum_buffer_usage_limit. С большим значением параметра VACUUM может выполняться быстрее, но при слишком большом значении многие полезные страницы могут вытесняться из общих буферов. Минимальное значение — 128 kB, максимальное — 16 GB.

boolean

Включает или отключает заданный параметр. Для включения параметра можно написать TRUE, ON или 1, а для отключения — FALSE, OFF или 0. Значение boolean можно опустить, в этом случае подразумевается TRUE.

integer

Задаёт неотрицательное целое значение, передаваемое выбранному параметру.

размер

Задаёт объём памяти в килобайтах. Можно также указать в виде строки, содержащей числовой размер, за которым следует одна из следующих единиц информации: B (байты), kB (килобайты), MB (мегабайты), GB (гигабайты) или TB (терабайты).

имя_таблицы

Имя (возможно, дополненное схемой) определённой таблицы или материализованного представления, подлежащего очистке. Если указанная таблица является секционированной, очистке подвергаются все её конечные секции.

имя_столбца

Имя столбца, подлежащего анализу. По умолчанию анализируются все столбцы. Если указывается список столбцов, также должно присутствовать указание ANALYZE.

Выводимая информация

С указанием VERBOSE команда VACUUM выдаёт сообщения о процессе очистки, отмечая текущую обрабатываемую таблицу. Также она выводит различные статистические сведения о таблицах.

Примечания

Чтобы очистить таблицу, обычно нужно иметь право MAINTAIN для таблицы. Однако владельцам баз данных также разрешено очищать все таблицы в своих базах, за исключением общих каталогов. VACUUM при обработке пропускает все таблицы, на очистку которых текущий пользователь не имеет прав.

На время выполнения команды VACUUM search_path временно меняется на pg_catalog, pg_temp.

VACUUM нельзя выполнять внутри блока транзакции.

Для таблиц с индексами GIN, VACUUM (в любой форме) также завершает все ожидающие операции добавления в индекс, перемещая записи индекса из очереди в соответствующие места в основной структуре индекса GIN. За подробностями обратитесь к Подразделу 62.4.4.1.

Мы рекомендуем проводить очистку всех баз данных на постоянной основе, чтобы происходило удаление мёртвых строк. Postgres Pro включает средство «автоочистки», которое позволяет автоматизировать регулярную очистку. Чтобы узнать больше об автоматической и ручной очистке, обратитесь к Разделу 23.1.

Режим FULL не рекомендуется для обычного применения, но в некоторых случаях он бывает полезен. Например, когда были удалены или изменены почти все строки таблицы, может возникнуть желание физически сжать её, чтобы освободить место на диске и ускорить сканирование этой таблицы. Чаще всего VACUUM FULL сжимает таблицу более эффективно, чем обычный VACUUM.

Режим PARALLEL используется только для очистки. Если это указание задаётся вместе с ANALYZE, на работу ANALYZE оно не влияет.

VACUUM создаёт значительную нагрузку на подсистему ввода/вывода, что может отрицательно сказаться на производительности других активных сеансов. Поэтому иногда полезно использовать возможность задержки очистки с учётом её стоимости. При параллельной очистке каждый рабочий процесс приостанавливается на время, пропорциональное объёму произведённой им работы. За подробностями обратитесь к Подразделу 18.4.4.

Каждый процесс, выполняющий операцию VACUUM без указания FULL будет выдавать информацию о ходе её выполнения в представлении pg_stat_progress_vacuum. Процессы же, выполняющие VACUUM FULL, будут выдавать аналогичную информацию в представлении pg_stat_progress_cluster. За подробностями обратитесь к Подразделу 26.4.5 и Подразделу 26.4.2.

Примеры

Очистка одной таблицы onek, проведение её анализа для оптимизатора и печать подробного отчёта о действиях операции очистки:

VACUUM (VERBOSE, ANALYZE) onek;

Совместимость

Оператор VACUUM отсутствует в стандарте SQL.

До версии PostgreSQL 9.0 использовался и по-прежнему поддерживается следующий синтаксис:

VACUUM [ FULL ] [ FREEZE ] [ VERBOSE ] [ ANALYZE ] [ таблица_и_столбцы [, ...] ]

Заметьте, что в этом синтаксисе параметры должны идти строго в указанном порядке.