F.72. tsm_system_time
Модуль tsm_system_time
предоставляет метод извлечения выборки SYSTEM_TIME
, который можно использовать в предложении TABLESAMPLE
команды SELECT
.
Этот метод извлечения выборки принимает в единственном аргументе число с плавающей точкой, задающее максимальное время (в миллисекундах), которое отводится на чтение таблицы. Это даёт возможность непосредственно управлять длительностью выполнения запроса, ценой того, что размер выборки оказывается трудно предсказуемым. Результирующая выборка будет содержать столько строк, сколько удастся прочитать за отведённое время, если только быстрее не будет прочитана вся таблица.
Как и встроенный метод извлечения выборки SYSTEM
, SYSTEM_TIME
производит выборку на уровне блоков, так что выборка будет не полностью случайной, а может подвергаться эффектам кластеризации, особенно когда выбирается небольшое число строк.
SYSTEM_TIME
не поддерживает предложение REPEATABLE
.
Данный модуль считается «доверенным», то есть его могут устанавливать обычные пользователи, имеющие право CREATE
в текущей базе данных.
F.72.1. Примеры
Пример получения выборки из таблицы с применением метода SYSTEM_TIME
. Сначала нужно установить расширение:
CREATE EXTENSION tsm_system_time;
Затем вы можете использовать его в команде SELECT
, например так:
SELECT * FROM my_table TABLESAMPLE SYSTEM_TIME(1000);
Эта команда выдаст настолько большую выборку из my_table
, насколько много строк она успеет прочитать за 1 секунду (1000 миллисекунд). Разумеется, если за 1 секунду удастся прочитать всю таблицу, будут возвращены все её строки.
F.72. tsm_system_time
The tsm_system_time
module provides the table sampling method SYSTEM_TIME
, which can be used in the TABLESAMPLE
clause of a SELECT
command.
This table sampling method accepts a single floating-point argument that is the maximum number of milliseconds to spend reading the table. This gives you direct control over how long the query takes, at the price that the size of the sample becomes hard to predict. The resulting sample will contain as many rows as could be read in the specified time, unless the whole table has been read first.
Like the built-in SYSTEM
sampling method, SYSTEM_TIME
performs block-level sampling, so that the sample is not completely random but may be subject to clustering effects, especially if only a small number of rows are selected.
SYSTEM_TIME
does not support the REPEATABLE
clause.
This module is considered “trusted”, that is, it can be installed by non-superusers who have CREATE
privilege on the current database.
F.72.1. Examples
Here is an example of selecting a sample of a table with SYSTEM_TIME
. First install the extension:
CREATE EXTENSION tsm_system_time;
Then you can use it in a SELECT
command, for instance:
SELECT * FROM my_table TABLESAMPLE SYSTEM_TIME(1000);
This command will return as large a sample of my_table
as it can read in 1 second (1000 milliseconds). Of course, if the whole table can be read in under 1 second, all its rows will be returned.