VACUUM
VACUUM — провести сборку мусора и, возможно, проанализировать базу данных
Синтаксис
VACUUM [ (параметр
[, ...] ) ] [таблица_и_столбцы
[, ...] ] Здесь допускаетсяпараметр
: FULL [boolean
] FREEZE [boolean
] VERBOSE [boolean
] ANALYZE [boolean
] DISABLE_PAGE_SKIPPING [boolean
] SKIP_LOCKED [boolean
] INDEX_CLEANUP { AUTO | ON | OFF } PROCESS_MAIN [boolean
] PROCESS_TOAST [boolean
] TRUNCATE [boolean
] PARALLELinteger
SKIP_DATABASE_STATS [boolean
] ONLY_DATABASE_STATS [boolean
] BUFFER_USAGE_LIMITразмер
итаблица_и_столбцы
:имя_таблицы
[ (имя_столбца
[, ...] ) ]
Описание
VACUUM
высвобождает пространство, занимаемое «мёртвыми» кортежами. При обычных операциях PostgreSQL кортежи, удалённые или устаревшие в результате обновления, физически не удаляются из таблицы; они сохраняются в ней, пока не будет выполнена команда VACUUM
. Таким образом, периодически необходимо выполнять VACUUM
, особенно для часто изменяемых таблиц.
Без списка таблица_и_столбцы
команда VACUUM
обрабатывает все таблицы и материализованные представления в текущей базе данных, на очистку которых текущий пользователь имеет право. С этим списком VACUUM
обрабатывает только указанную таблицу(ы).
VACUUM ANALYZE
выполняет очистку (VACUUM
), а затем анализ (ANALYZE
) всех указанных таблиц. Это удобная комбинация для регулярного обслуживания БД. За дополнительной информацией об анализе обратитесь к описанию ANALYZE.
Простая команда VACUUM
(без FULL
) только высвобождает пространство и делает его доступным для повторного использования. Эта форма команды может работать параллельно с обычными операциями чтения и записи таблицы, так она не требует исключительной блокировки. Однако освобождённое место не возвращается операционной системе (в большинстве случаев); оно просто остаётся доступным для размещения данных этой же таблицы. Она также позволяет задействовать для обработки несколько процессоров. Этот режим называется параллельной очисткой. Для отключения этого режима можно воспользоваться указанием PARALLEL
и задать нулевое количество параллельных рабочих процессов. VACUUM FULL
переписывает всё содержимое таблицы в новый файл на диске, не содержащий ничего лишнего, что позволяет возвратить неиспользованное пространство операционной системе. Эта форма работает намного медленнее и запрашивает блокировку в режиме ACCESS EXCLUSIVE
для каждой обрабатываемой таблицы.
Параметры
FULL
Выбирает режим «полной» очистки, который может освободить больше пространства, но выполняется гораздо дольше и запрашивает исключительную блокировку таблицы. Этот режим также требует дополнительное место на диске, так как он записывает новую копию таблицы и не освобождает старую до завершения операции. Обычно это следует использовать, только когда требуется высвободить значительный объём пространства, выделенного таблице.
FREEZE
Выбирает агрессивную «заморозку» кортежей. Добавление указания
FREEZE
равносильно выполнению командыVACUUM
с параметрами vacuum_freeze_min_age и vacuum_freeze_table_age, равными нулю. Агрессивная заморозка всегда выполняется при перезаписи таблицы, поэтому в режимеFULL
это указание избыточно.VERBOSE
Выводит подробный отчёт об очистке для каждой таблицы.
ANALYZE
Обновляет статистику, которую использует планировщик для выбора наиболее эффективного способа выполнения запроса.
DISABLE_PAGE_SKIPPING
Обычно
VACUUM
пропускает страницы, учитывая карту видимости. Страницы, на которых, судя по карте, все кортежи заморожены, можно пропускать всегда, а страницы, в которых все кортежи видны всем транзакциям, могут обрабатываться только при агрессивной очистке. Более того, за исключением агрессивной очистки, некоторые страницы можно пропускать, чтобы не ждать, пока другие сеансы закончат их использовать. Этот параметр отключает пропуск страниц и предназначен для использования только когда целостность карты видимости вызывает подозрения, что возможно при аппаратных или программных сбоях, приводящих к разрушению БД.SKIP_LOCKED
Указывает, что команда
VACUUM
не должна ждать освобождения никаких конфликтующих блокировок, начиная обработку отношения: если отношение не удаётся заблокировать сразу, без ожидания, оно пропускается. Заметьте, что даже с этим указаниемVACUUM
может заблокироваться, открывая индексы отношения. Кроме того,VACUUM ANALYZE
может заблокироваться и при получении выборки строк из секций, потомков в иерархии наследования или некоторых видов сторонних таблиц. Учтите также, что при наличии конфликтующей блокировки в секционированной таблице командаVACUUM
с этим указанием пропускает все её секции, тогда как обычно все они обрабатываются.INDEX_CLEANUP
Обычно
VACUUM
пропускает очистку индекса, когда в таблице имеется всего несколько мёртвых кортежей. В подобных ситуациях стоимость обработки всех индексов таблицы может значительно превышать выгоду от удаления из индекса мёртвых кортежей. Данное указание можно использовать, чтобы в ходеVACUUM
индексы обрабатывались принудительно при любом ненулевом количестве мёртвых кортежей. Со значениемAUTO
(действующим по умолчанию)VACUUM
может пропускать очистку индексов, когда она видится нецелесообразной. Если дляINDEX_CLEANUP
задано значениеON
,VACUUM
будет безусловно удалять все мёртвые кортежи из индексов. Это может быть полезно для обеспечения обратной совместимости с предыдущими версиями PostgreSQL, где такое поведение было стандартным.Для указания
INDEX_CLEANUP
можно также задать значениеOFF
, чтобы в ходеVACUUM
всегда пропускалась очистка индексов, даже при наличии в таблице множества мёртвых кортежей. Это может быть полезно, когда нужно выполнить очистку как можно быстрее для предотвращения надвигающейся угрозы зацикливания идентификаторов транзакций (см. Подраздел 24.1.5). Однако предпочтительнее положиться на механизм защиты от такого зацикливания, управляемый параметром vacuum_failsafe_age, который обычно срабатывает автоматически. Если очистка индекса не производится регулярно, производительность может ухудшаться, так как по мере внесения изменений в таблицу индексы будут накапливать мёртвые кортежи, а сама таблица будет накапливать мёртвые указатели, которые могут быть удалены только после очистки индекса.Это указание не действует на таблицы, в которых нет индексов, и игнорируется в случае использования указания
FULL
. Также оно не влияет на работу механизма защиты от зацикливания идентификаторов транзакций. Когда он включается, очистка индексов пропускается, даже если дляINDEX_CLEANUP
задано значениеON
.PROCESS_MAIN
Указывает, что команда
VACUUM
должна попытаться обработать основное отношение. Обычно это желательная операция и она выполняется по умолчанию. Отключать эту операцию может быть полезно, если требуется провести очистку толькоTOAST
-таблицы отношения.PROCESS_TOAST
Указывает, что команда
VACUUM
должна попытаться обработать соответствующуюTOAST
-таблицу для каждого отношения, если таковая существует. Обычно это желательная операция и она выполняется по умолчанию. Отключать эту операцию может быть полезно, если требуется провести очистку только основного отношения. Это указание игнорируется в случае использования указанияFULL
.TRUNCATE
Указывает, что команда
VACUUM
должна попытаться обрезать пустые страницы в конце таблицы, чтобы освободившееся место было возвращено операционной системе. Обычно это желательная операция и она выполняется по умолчанию, если только для таблицы, подлежащей очистке, не сброшен параметрvacuum_truncate
. Отключать эту операцию может иметь смысл, чтобы избежать блокировкиACCESS EXCLUSIVE
для таблицы, подлежащей очистке. Это указание игнорируется в случае использования указанияFULL
.PARALLEL
Управляет этапами очистки и уборки индексов в ходе параллельного выполнения
VACUUM
, определяяцелое_число
фоновых рабочих процессов (более подробно каждый этап очистки описан в Таблице 27.46). Число рабочих процессов, используемых для этой операции, равняется числу индексов в отношении, подходящих для параллельной очистки, и может ограничиваться сверху количеством, заданным указаниемPARALLEL
, а также дополнительно ограничивается параметром max_parallel_maintenance_workers. Индекс может обрабатываться в режиме параллельной очистки тогда и только тогда, когда его размер превышает min_parallel_index_scan_size. Заметьте, что при этом не гарантируется, что во время очистки будет задействоваться столько параллельных исполнителей, сколько задаёт параметрцелое_число
. В ходе очистки рабочие процессы могут использоваться в меньшем количестве или не использоваться вовсе. Для обработки одного индекса может быть использован только один рабочий процесс. Поэтому параллельные исполнители будут запускаться, только если в таблице есть минимум2
индекса. Рабочие процессы очистки запускаются перед началом каждого этапа и завершаются после его окончания. В будущих выпусках это поведение может измениться. В режимеFULL
это указание не поддерживается.SKIP_DATABASE_STATS
Указывает, что команда
VACUUM
должна пропускать обновление статистики о самых старых незамороженных значениях XID на уровне базы данных. Как правило, командаVACUUM
обновляет эту статистику по окончании выполнения. Однако в базе данных с очень большим количеством таблиц это может занять некоторое время и не привести ни к какому результату (если среди очищенных таблиц не было таблицы с самыми старыми незамороженными значениями XID). Кроме того, если запустить несколько командVACUUM
параллельно, они будут обновлять статистику по очереди. Таким образом, если приложение выполняет серию командVACUUM
, может быть полезно задать этот параметр для всех команд, кроме последней, или задать его для всех команд и после их выполнения отдельно запуститьVACUUM (ONLY_DATABASE_STATS)
.ONLY_DATABASE_STATS
Указывает, что команда
VACUUM
должна только обновить статистику о самых старых незамороженных значениях XID на уровне базы данных. Если этот параметр задан, списоктаблица_и_столбцы
должен быть пустым, а из других параметров должен быть задан толькоVERBOSE
.BUFFER_USAGE_LIMIT
Указывает размер кольцевого буфера стратегии доступа к буферам (Buffer Access Strategy) для
VACUUM
. Этот размер используется для расчёта количества общих буферов, переиспользуемых в рамках этой стратегии. С значением0
использование стратегии доступа к буферам отключается. Если параметрANALYZE
также задан, значениеBUFFER_USAGE_LIMIT
используется как на этапе анализа, так и на этапе очистки. Этот параметр не может использоваться в режимеFULL
, если не задан параметрANALYZE
. Если не задать этот параметр,VACUUM
использует значение из vacuum_buffer_usage_limit. С большим значением параметраVACUUM
может выполняться быстрее, но при слишком большом значении многие полезные страницы могут вытесняться из общих буферов. Минимальное значение —128 kB
, максимальное —16 GB
.boolean
Включает или отключает заданный параметр. Для включения параметра можно написать
TRUE
,ON
или1
, а для отключения —FALSE
,OFF
или0
. Значениеboolean
можно опустить, в этом случае подразумеваетсяTRUE
.integer
Задаёт неотрицательное целое значение, передаваемое выбранному параметру.
размер
Задаёт объём памяти в килобайтах. Можно также указать в виде строки, содержащей числовой размер, за которым следует одна из следующих единиц информации:
B
(байты),kB
(килобайты),MB
(мегабайты),GB
(гигабайты) илиTB
(терабайты).имя_таблицы
Имя (возможно, дополненное схемой) определённой таблицы или материализованного представления, подлежащего очистке. Если указанная таблица является секционированной, очистке подвергаются все её конечные секции.
имя_столбца
Имя столбца, подлежащего анализу. По умолчанию анализируются все столбцы. Если указывается список столбцов, также должно присутствовать указание
ANALYZE
.
Выводимая информация
С указанием VERBOSE
команда VACUUM
выдаёт сообщения о процессе очистки, отмечая текущую обрабатываемую таблицу. Также она выводит различные статистические сведения о таблицах.
Примечания
Чтобы очистить таблицу, обычно нужно иметь право MAINTAIN
для таблицы. Однако владельцам баз данных также разрешено очищать все таблицы в своих базах, за исключением общих каталогов. VACUUM
при обработке пропускает все таблицы, на очистку которых текущий пользователь не имеет прав.
На время выполнения команды VACUUM
search_path временно меняется на pg_catalog, pg_temp
.
VACUUM
нельзя выполнять внутри блока транзакции.
Для таблиц с индексами GIN, VACUUM
(в любой форме) также завершает все ожидающие операции добавления в индекс, перемещая записи индекса из очереди в соответствующие места в основной структуре индекса GIN. За подробностями обратитесь к Подразделу 64.4.4.1.
Мы рекомендуем проводить очистку всех баз данных на постоянной основе, чтобы происходило удаление мёртвых строк. PostgreSQL включает средство «автоочистки», которое позволяет автоматизировать регулярную очистку. Чтобы узнать больше об автоматической и ручной очистке, обратитесь к Разделу 24.1.
Режим FULL
не рекомендуется для обычного применения, но в некоторых случаях он бывает полезен. Например, когда были удалены или изменены почти все строки таблицы, может возникнуть желание физически сжать её, чтобы освободить место на диске и ускорить сканирование этой таблицы. Чаще всего VACUUM FULL
сжимает таблицу более эффективно, чем обычный VACUUM
.
Режим PARALLEL
используется только для очистки. Если это указание задаётся вместе с ANALYZE
, на работу ANALYZE
оно не влияет.
VACUUM
создаёт значительную нагрузку на подсистему ввода/вывода, что может отрицательно сказаться на производительности других активных сеансов. Поэтому иногда полезно использовать возможность задержки очистки с учётом её стоимости. При параллельной очистке каждый рабочий процесс приостанавливается на время, пропорциональное объёму произведённой им работы. За подробностями обратитесь к Подразделу 19.4.4.
Каждый процесс, выполняющий операцию VACUUM
без указания FULL
будет выдавать информацию о ходе её выполнения в представлении pg_stat_progress_vacuum
. Процессы же, выполняющие VACUUM FULL
, будут выдавать аналогичную информацию в представлении pg_stat_progress_cluster
. За подробностями обратитесь к Подразделу 27.4.5 и Подразделу 27.4.2.
Примеры
Очистка одной таблицы onek
, проведение её анализа для оптимизатора и печать подробного отчёта о действиях операции очистки:
VACUUM (VERBOSE, ANALYZE) onek;
Совместимость
Оператор VACUUM
отсутствует в стандарте SQL.
До версии PostgreSQL 9.0 использовался и по-прежнему поддерживается следующий синтаксис:
VACUUM [ FULL ] [ FREEZE ] [ VERBOSE ] [ ANALYZE ] [ таблица_и_столбцы
[, ...] ]
Заметьте, что в этом синтаксисе параметры должны идти строго в указанном порядке.