8.1. Числовые типы
Числовые типы включают двух-, четырёх- и восьмибайтные целые, четырёх- и восьмибайтные числа с плавающей точкой, а также десятичные числа с задаваемой точностью. Все эти типы перечислены в Таблице 8.2.
Таблица 8.2. Числовые типы
Имя | Размер | Описание | Диапазон |
---|---|---|---|
smallint | 2 байта | целое в небольшом диапазоне | -32768 .. +32767 |
integer | 4 байта | типичный выбор для целых чисел | -2147483648 .. +2147483647 |
bigint | 8 байт | целое в большом диапазоне | -9223372036854775808 .. 9223372036854775807 |
decimal | переменный | вещественное число с указанной точностью | до 131072 цифр до десятичной точки и до 16383 — после |
numeric | переменный | вещественное число с указанной точностью | до 131072 цифр до десятичной точки и до 16383 — после |
real | 4 байта | вещественное число с переменной точностью | точность в пределах 6 десятичных цифр |
double precision | 8 байт | вещественное число с переменной точностью | точность в пределах 15 десятичных цифр |
smallserial | 2 байта | небольшое целое с автоувеличением | 1 .. 32767 |
serial | 4 байта | целое с автоувеличением | 1 .. 2147483647 |
bigserial | 8 байт | большое целое с автоувеличением | 1 .. 9223372036854775807 |
Синтаксис констант числовых типов описан в Подразделе 4.1.2. Для этих типов определён полный набор соответствующих арифметических операторов и функций. За дополнительными сведениями обратитесь к Главе 9. Подробнее эти типы описаны в следующих разделах.
8.1.1. Целочисленные типы
Типы smallint
, integer
и bigint
хранят целые числа, то есть числа без дробной части, имеющие разные допустимые диапазоны. Попытка сохранить значение, выходящее за рамки диапазона, приведёт к ошибке.
Чаще всего используется тип integer
, как наиболее сбалансированный выбор ширины диапазона, размера и быстродействия. Тип smallint
обычно применяется, только когда крайне важно уменьшить размер данных на диске. Тип bigint
предназначен для тех случаев, когда числа не умещаются в диапазон типа integer
.
В SQL определены только типы integer
(или int
), smallint
и bigint
. Имена типов int2
, int4
и int8
выходят за рамки стандарта, хотя могут работать и в некоторых других СУБД.
8.1.2. Числа с произвольной точностью
Тип numeric
позволяет хранить числа с очень большим количеством цифр. Он особенно рекомендуется для хранения денежных сумм и других величин, где важна точность. Вычисления с типом numeric
дают точные результаты, где это возможно, например, при сложении, вычитании и умножении. Однако операции со значениями numeric
выполняются гораздо медленнее, чем с целыми числами или с типами с плавающей точкой, описанными в следующем разделе.
Ниже мы используем следующие термины: масштаб значения numeric
определяет количество десятичных цифр в дробной части, справа от десятичной точки, а точность — общее количество значимых цифр в числе, т. е. количество цифр по обе стороны десятичной точки. Например, число 23.5141 имеет точность 6 и масштаб 4. Целочисленные значения можно считать числами с масштабом 0.
Для столбца типа numeric
можно настроить и максимальную точность, и максимальный масштаб. Столбец типа numeric
объявляется следующим образом:
NUMERIC(точность
,масштаб
)
Точность должна быть положительной, а масштаб положительным или равным нулю. Альтернативный вариант
NUMERIC(точность
)
устанавливает масштаб 0. Форма:
NUMERIC
без указания точности и масштаба создаёт столбец, в котором можно сохранять числовые значения любой точности и масштаба в пределах, поддерживаемых системой. В столбце этого типа входные значения не будут приводиться к какому-либо масштабу, тогда как в столбцах numeric
с явно заданным масштабом значения подгоняются под этот масштаб. (Стандарт SQL утверждает, что по умолчанию должен устанавливаться масштаб 0, т. е. значения должны приводиться к целым числам. Однако мы считаем это не очень полезным. Если для вас важна переносимость, всегда указывайте точность и масштаб явно.)
Примечание
Максимально допустимая точность, которую можно указать в объявлении типа, равна 1000; если же использовать NUMERIC
без указания точности, действуют ограничения, описанные в Таблице 8.2.
Если масштаб значения, которое нужно сохранить, превышает объявленный масштаб столбца, система округлит его до заданного количества цифр после точки. Если же после этого количество цифр слева в сумме с масштабом превысит объявленную точность, произойдёт ошибка.
Числовые значения физически хранятся без каких-либо дополняющих нулей слева или справа. Таким образом, объявляемые точность и масштаб столбца определяют максимальный, а не фиксированный размер хранения. (В этом смысле тип numeric
больше похож на тип varchar(
, чем на n
)char(
.) Действительный размер хранения такого значения складывается из двух байт для каждой группы из четырёх цифр и дополнительных трёх-восьми байт.n
)
Помимо обычных чисел тип numeric
позволяет сохранить специальное значение NaN
, что означает «not-a-number» (не число). Любая операция c NaN
выдаёт в результате тоже NaN
. Записывая это значение в виде константы в команде SQL, его нужно заключать в апострофы, например так: UPDATE table SET x = 'NaN'
. Регистр символов в строке NaN
не важен.
Примечание
В большинстве реализаций «не число» (NaN
) считается не равным любому другому значению (в том числе и самому NaN
). Чтобы значения numeric
можно было сортировать и использовать в древовидных индексах, Postgres Pro считает, что значения NaN
равны друг другу и при этом больше любых числовых значений (не NaN
).
Типы decimal
и numeric
равнозначны. Оба эти типа описаны в стандарте SQL.
При округлении значений тип numeric
выдаёт число, большее по модулю, тогда как (на большинстве платформ) типы real
и double precision
выдают ближайшее чётное число. Например:
SELECT x, round(x::numeric) AS num_round, round(x::double precision) AS dbl_round FROM generate_series(-3.5, 3.5, 1) as x; x | num_round | dbl_round ------+-----------+----------- -3.5 | -4 | -4 -2.5 | -3 | -2 -1.5 | -2 | -2 -0.5 | -1 | -0 0.5 | 1 | 0 1.5 | 2 | 2 2.5 | 3 | 2 3.5 | 4 | 4 (8 rows)
8.1.3. Типы с плавающей точкой
Типы данных real
и double precision
хранят приближённые числовые значения с переменной точностью. На всех поддерживаемых в настоящее время платформах эти типы реализуют стандарт IEEE 754 для двоичной арифметики с плавающей точкой (с одинарной и двойной точностью соответственно), в той мере, в какой его поддерживают процессор, операционная система и компилятор.
Неточность здесь выражается в том, что некоторые значения, которые нельзя преобразовать во внутренний формат, сохраняются приближённо, так что полученное значение может несколько отличаться от записанного. Управление подобными ошибками и их распространение в процессе вычислений является предметом изучения целого раздела математики и компьютерной науки, и здесь не рассматривается. Мы отметим только следующее:
Если вам нужна точность при хранении и вычислениях (например, для денежных сумм), используйте вместо этого тип
numeric
.Если вы хотите выполнять с этими типами сложные вычисления, имеющие большую важность, тщательно изучите реализацию операций в вашей среде и особенно поведение в крайних случаях (бесконечность, антипереполнение).
Проверка равенства двух чисел с плавающей точкой может не всегда давать ожидаемый результат.
На всех поддерживаемых сейчас платформах тип real
может сохранить значения примерно от 1E-37 до 1E+37 с точностью не меньше 6 десятичных цифр. Тип double precision
предлагает значения в диапазоне приблизительно от 1E-307 до 1E+308 и с точностью не меньше 15 цифр. Попытка сохранить слишком большие или слишком маленькие значения приведёт к ошибке. Если точность вводимого числа слишком велика, оно будет округлено. При попытке сохранить число, близкое к 0, но непредставимое как отличное от 0, произойдёт ошибка антипереполнения.
По умолчанию числа с плавающей точкой выводятся в текстовом виде в кратчайшем точном десятичном представлении; выводимое десятичное значение оказывается более близким к изначальному двоичному числу, чем любое другое значение, представимое с той же двоичной точностью. (Однако выводимое значение в текущей реализации никогда не находится точно посередине между двумя представимыми двоичными значениями, во избежание распространённой ошибки с функциями ввода, не учитывающими корректно правило округления до ближайшего чётного.) Выводимое значение может занимать не больше 17 значащих десятичных цифр для типа float8
и не больше 9 цифр для типа float4
.
Примечание
Преобразование в кратчайший точный вид производится гораздо быстрее, чем в традиционное представление с округлением.
Для совместимости с результатами, выдаваемыми старыми версиями Postgres Pro, и уменьшения точности выводимых чисел, когда это требуется, в параметре extra_float_digits можно выбрать также вариант округлённого десятичного вывода. Со значением 0 восстанавливается действовавшее ранее по умолчанию округление числа до 6 (для типа float4
) или 15 (для float8
) значащих десятичных цифр. При отрицательных значениях число значащих цифр уменьшается дополнительно; например, при -2 результат будет округлён до 4 или 13 цифр, соответственно.
При любом значении extra_float_digits, большем 0, выбирается кратчайшее точное представление.
Примечание
Приложения, которым были нужны точные числовые значения, раньше задавали для параметра extra_float_digits значение 3, чтобы получить их. Они могут продолжать использовать это значение для максимальной совместимости с разными версиями.
В дополнение к обычным числовым значениям типы с плавающей точкой принимают следующие специальные значения:
Infinity
-Infinity
NaN
Они представляют особые значения, описанные в IEEE 754, соответственно «бесконечность», «минус бесконечность» и «не число». Записывая эти значения в виде констант в команде SQL, их нужно заключать в апострофы, например так: UPDATE table SET x = '-Infinity'
. Регистр символов в этих строках не важен.
Примечание
Согласно IEEE754, NaN
не должно считаться равным любому другому значению с плавающей точкой (в том числе и самому NaN
). Чтобы значения с плавающей точкой можно было сортировать и использовать в древовидных индексах, Postgres Pro считает, что значения NaN
равны друг другу, и при этом больше любых числовых значений (не NaN
).
Postgres Pro также поддерживает форматы float
и float(
, оговорённые в стандарте SQL, для указания неточных числовых типов. Здесь p
)p
определяет минимально допустимую точность в двоичных цифрах. Postgres Pro воспринимает запись от float(1)
до float(24)
как выбор типа real
, а запись от float(25)
до float(53)
как выбор типа double precision
. Значения p
вне допустимого диапазона вызывают ошибку. Если float
указывается без точности, подразумевается тип double precision
.
8.1.4. Последовательные типы
Примечание
В этом разделе описывается специфичный для Postgres Pro способ создания столбца с автоувеличением. Другой способ, соответствующий стандарту SQL, заключается в использовании столбцов идентификации и рассматривается в описании CREATE TABLE.
Типы данных smallserial
, serial
и bigserial
не являются настоящими типами, а представляют собой просто удобное средство для создания столбцов с уникальными идентификаторами (подобное свойству AUTO_INCREMENT
в некоторых СУБД). В текущей реализации запись:
CREATE TABLEимя_таблицы
(имя_столбца
SERIAL );
равнозначна следующим командам:
CREATE SEQUENCEимя_таблицы
_имя_столбца
_seq AS integer; CREATE TABLEимя_таблицы
(имя_столбца
integer NOT NULL DEFAULT nextval('имя_таблицы
_имя_столбца
_seq') ); ALTER SEQUENCEимя_таблицы
_имя_столбца
_seq OWNED BYимя_таблицы
.имя_столбца
;
То есть при определении такого типа создаётся целочисленный столбец со значением по умолчанию, извлекаемым из генератора последовательности. Чтобы в столбец нельзя было вставить NULL, в его определение добавляется ограничение NOT NULL
. (Во многих случаях также имеет смысл добавить для этого столбца ограничения UNIQUE
или PRIMARY KEY
для защиты от ошибочного добавления дублирующихся значений, но автоматически это не происходит.) Последняя команда определяет, что последовательность «принадлежит» столбцу, так что она будет удалена при удалении столбца или таблицы.
Примечание
Так как типы smallserial
, serial
и bigserial
реализованы через последовательности, в числовом ряду значений столбца могут образовываться пропуски (или «дыры»), даже если никакие строки не удалялись. Значение, выделенное из последовательности, считается «задействованным», даже если строку с этим значением не удалось вставить в таблицу. Это может произойти, например, при откате транзакции, добавляющей данные. См. описание nextval()
в Разделе 9.17.
Чтобы вставить в столбец serial
следующее значение последовательности, ему нужно присвоить значение по умолчанию. Это можно сделать, либо исключив его из списка столбцов в операторе INSERT
, либо с помощью ключевого слова DEFAULT
.
Имена типов serial
и serial4
равнозначны: они создают столбцы integer
. Так же являются синонимами имена bigserial
и serial8
, но они создают столбцы bigint
. Тип bigserial
следует использовать, если за всё время жизни таблицы планируется использовать больше чем 231 значений. И наконец, синонимами являются имена типов smallserial
и serial2
, но они создают столбец smallint
.
Последовательность, созданная для столбца serial
, автоматически удаляется при удалении связанного столбца. Последовательность можно удалить и отдельно от столбца, но при этом также будет удалено определение значения по умолчанию.
8.1. Numeric Types
Numeric types consist of two-, four-, and eight-byte integers, four- and eight-byte floating-point numbers, and selectable-precision decimals. Table 8.2 lists the available types.
Table 8.2. Numeric Types
Name | Storage Size | Description | Range |
---|---|---|---|
smallint | 2 bytes | small-range integer | -32768 to +32767 |
integer | 4 bytes | typical choice for integer | -2147483648 to +2147483647 |
bigint | 8 bytes | large-range integer | -9223372036854775808 to +9223372036854775807 |
decimal | variable | user-specified precision, exact | up to 131072 digits before the decimal point; up to 16383 digits after the decimal point |
numeric | variable | user-specified precision, exact | up to 131072 digits before the decimal point; up to 16383 digits after the decimal point |
real | 4 bytes | variable-precision, inexact | 6 decimal digits precision |
double precision | 8 bytes | variable-precision, inexact | 15 decimal digits precision |
smallserial | 2 bytes | small autoincrementing integer | 1 to 32767 |
serial | 4 bytes | autoincrementing integer | 1 to 2147483647 |
bigserial | 8 bytes | large autoincrementing integer | 1 to 9223372036854775807 |
The syntax of constants for the numeric types is described in Section 4.1.2. The numeric types have a full set of corresponding arithmetic operators and functions. Refer to Chapter 9 for more information. The following sections describe the types in detail.
8.1.1. Integer Types
The types smallint
, integer
, and bigint
store whole numbers, that is, numbers without fractional components, of various ranges. Attempts to store values outside of the allowed range will result in an error.
The type integer
is the common choice, as it offers the best balance between range, storage size, and performance. The smallint
type is generally only used if disk space is at a premium. The bigint
type is designed to be used when the range of the integer
type is insufficient.
SQL only specifies the integer types integer
(or int
), smallint
, and bigint
. The type names int2
, int4
, and int8
are extensions, which are also used by some other SQL database systems.
8.1.2. Arbitrary Precision Numbers
The type numeric
can store numbers with a very large number of digits. It is especially recommended for storing monetary amounts and other quantities where exactness is required. Calculations with numeric
values yield exact results where possible, e.g., addition, subtraction, multiplication. However, calculations on numeric
values are very slow compared to the integer types, or to the floating-point types described in the next section.
We use the following terms below: The precision of a numeric
is the total count of significant digits in the whole number, that is, the number of digits to both sides of the decimal point. The scale of a numeric
is the count of decimal digits in the fractional part, to the right of the decimal point. So the number 23.5141 has a precision of 6 and a scale of 4. Integers can be considered to have a scale of zero.
Both the maximum precision and the maximum scale of a numeric
column can be configured. To declare a column of type numeric
use the syntax:
NUMERIC(precision
,scale
)
The precision must be positive, the scale zero or positive. Alternatively:
NUMERIC(precision
)
selects a scale of 0. Specifying:
NUMERIC
without any precision or scale creates a column in which numeric values of any precision and scale can be stored, up to the implementation limit on precision. A column of this kind will not coerce input values to any particular scale, whereas numeric
columns with a declared scale will coerce input values to that scale. (The SQL standard requires a default scale of 0, i.e., coercion to integer precision. We find this a bit useless. If you're concerned about portability, always specify the precision and scale explicitly.)
Note
The maximum allowed precision when explicitly specified in the type declaration is 1000; NUMERIC
without a specified precision is subject to the limits described in Table 8.2.
If the scale of a value to be stored is greater than the declared scale of the column, the system will round the value to the specified number of fractional digits. Then, if the number of digits to the left of the decimal point exceeds the declared precision minus the declared scale, an error is raised.
Numeric values are physically stored without any extra leading or trailing zeroes. Thus, the declared precision and scale of a column are maximums, not fixed allocations. (In this sense the numeric
type is more akin to varchar(
than to n
)char(
.) The actual storage requirement is two bytes for each group of four decimal digits, plus three to eight bytes overhead. n
)
In addition to ordinary numeric values, the numeric
type allows the special value NaN
, meaning “not-a-number”. Any operation on NaN
yields another NaN
. When writing this value as a constant in an SQL command, you must put quotes around it, for example UPDATE table SET x = 'NaN'
. On input, the string NaN
is recognized in a case-insensitive manner.
Note
In most implementations of the “not-a-number” concept, NaN
is not considered equal to any other numeric value (including NaN
). In order to allow numeric
values to be sorted and used in tree-based indexes, Postgres Pro treats NaN
values as equal, and greater than all non-NaN
values.
The types decimal
and numeric
are equivalent. Both types are part of the SQL standard.
When rounding values, the numeric
type rounds ties away from zero, while (on most machines) the real
and double precision
types round ties to the nearest even number. For example:
SELECT x, round(x::numeric) AS num_round, round(x::double precision) AS dbl_round FROM generate_series(-3.5, 3.5, 1) as x; x | num_round | dbl_round ------+-----------+----------- -3.5 | -4 | -4 -2.5 | -3 | -2 -1.5 | -2 | -2 -0.5 | -1 | -0 0.5 | 1 | 0 1.5 | 2 | 2 2.5 | 3 | 2 3.5 | 4 | 4 (8 rows)
8.1.3. Floating-Point Types
The data types real
and double precision
are inexact, variable-precision numeric types. On all currently supported platforms, these types are implementations of IEEE Standard 754 for Binary Floating-Point Arithmetic (single and double precision, respectively), to the extent that the underlying processor, operating system, and compiler support it.
Inexact means that some values cannot be converted exactly to the internal format and are stored as approximations, so that storing and retrieving a value might show slight discrepancies. Managing these errors and how they propagate through calculations is the subject of an entire branch of mathematics and computer science and will not be discussed here, except for the following points:
If you require exact storage and calculations (such as for monetary amounts), use the
numeric
type instead.If you want to do complicated calculations with these types for anything important, especially if you rely on certain behavior in boundary cases (infinity, underflow), you should evaluate the implementation carefully.
Comparing two floating-point values for equality might not always work as expected.
On all currently supported platforms, the real
type has a range of around 1E-37 to 1E+37 with a precision of at least 6 decimal digits. The double precision
type has a range of around 1E-307 to 1E+308 with a precision of at least 15 digits. Values that are too large or too small will cause an error. Rounding might take place if the precision of an input number is too high. Numbers too close to zero that are not representable as distinct from zero will cause an underflow error.
By default, floating point values are output in text form in their shortest precise decimal representation; the decimal value produced is closer to the true stored binary value than to any other value representable in the same binary precision. (However, the output value is currently never exactly midway between two representable values, in order to avoid a widespread bug where input routines do not properly respect the round-to-nearest-even rule.) This value will use at most 17 significant decimal digits for float8
values, and at most 9 digits for float4
values.
Note
This shortest-precise output format is much faster to generate than the historical rounded format.
For compatibility with output generated by older versions of Postgres Pro, and to allow the output precision to be reduced, the extra_float_digits parameter can be used to select rounded decimal output instead. Setting a value of 0 restores the previous default of rounding the value to 6 (for float4
) or 15 (for float8
) significant decimal digits. Setting a negative value reduces the number of digits further; for example -2 would round output to 4 or 13 digits respectively.
Any value of extra_float_digits greater than 0 selects the shortest-precise format.
Note
Applications that wanted precise values have historically had to set extra_float_digits to 3 to obtain them. For maximum compatibility between versions, they should continue to do so.
In addition to ordinary numeric values, the floating-point types have several special values:
Infinity
-Infinity
NaN
These represent the IEEE 754 special values “infinity”, “negative infinity”, and “not-a-number”, respectively. When writing these values as constants in an SQL command, you must put quotes around them, for example UPDATE table SET x = '-Infinity'
. On input, these strings are recognized in a case-insensitive manner.
Note
IEEE754 specifies that NaN
should not compare equal to any other floating-point value (including NaN
). In order to allow floating-point values to be sorted and used in tree-based indexes, Postgres Pro treats NaN
values as equal, and greater than all non-NaN
values.
Postgres Pro also supports the SQL-standard notations float
and float(
for specifying inexact numeric types. Here, p
)p
specifies the minimum acceptable precision in binary digits. Postgres Pro accepts float(1)
to float(24)
as selecting the real
type, while float(25)
to float(53)
select double precision
. Values of p
outside the allowed range draw an error. float
with no precision specified is taken to mean double precision
.
8.1.4. Serial Types
Note
This section describes a Postgres Pro-specific way to create an autoincrementing column. Another way is to use the SQL-standard identity column feature, described at CREATE TABLE.
The data types smallserial
, serial
and bigserial
are not true types, but merely a notational convenience for creating unique identifier columns (similar to the AUTO_INCREMENT
property supported by some other databases). In the current implementation, specifying:
CREATE TABLEtablename
(colname
SERIAL );
is equivalent to specifying:
CREATE SEQUENCEtablename
_colname
_seq AS integer; CREATE TABLEtablename
(colname
integer NOT NULL DEFAULT nextval('tablename
_colname
_seq') ); ALTER SEQUENCEtablename
_colname
_seq OWNED BYtablename
.colname
;
Thus, we have created an integer column and arranged for its default values to be assigned from a sequence generator. A NOT NULL
constraint is applied to ensure that a null value cannot be inserted. (In most cases you would also want to attach a UNIQUE
or PRIMARY KEY
constraint to prevent duplicate values from being inserted by accident, but this is not automatic.) Lastly, the sequence is marked as “owned by” the column, so that it will be dropped if the column or table is dropped.
Note
Because smallserial
, serial
and bigserial
are implemented using sequences, there may be "holes" or gaps in the sequence of values which appears in the column, even if no rows are ever deleted. A value allocated from the sequence is still "used up" even if a row containing that value is never successfully inserted into the table column. This may happen, for example, if the inserting transaction rolls back. See nextval()
in Section 9.17 for details.
To insert the next value of the sequence into the serial
column, specify that the serial
column should be assigned its default value. This can be done either by excluding the column from the list of columns in the INSERT
statement, or through the use of the DEFAULT
key word.
The type names serial
and serial4
are equivalent: both create integer
columns. The type names bigserial
and serial8
work the same way, except that they create a bigint
column. bigserial
should be used if you anticipate the use of more than 231 identifiers over the lifetime of the table. The type names smallserial
and serial2
also work the same way, except that they create a smallint
column.
The sequence created for a serial
column is automatically dropped when the owning column is dropped. You can drop the sequence without dropping the column, but this will force removal of the column default expression.