32.9. Функции, связанные с командой COPY
Команда COPY в Postgres Pro имеет возможность читать и записывать данные через сетевое подключение, установленное libpq. Описанные в этом разделе функции позволяют приложениям воспользоваться этой возможностью для передачи или приёма копируемых данных.
Общая процедура такова: сначала приложение выдаёт SQL-команду COPY, вызывая PQexec или одну из подобных функций. В ответ оно должно получить (если не возникла ошибка) объект PGresult с кодом состояния PGRES_COPY_OUT или PGRES_COPY_IN (в зависимости от направления копирования). Затем приложение должно использовать функции, описанные в этом разделе, и принимать или передавать строки данных. По завершении передачи возвращается ещё один объект PGresult, сообщающий о состоянии завершения передачи. В случае успеха он содержит код состояния PGRES_COMMAND_OK, а если возникает какая-то проблема — PGRES_FATAL_ERROR. После этого можно продолжать выполнять SQL-команды через PQexec. (Пока операция COPY не завершена, выполнять другие SQL-команды через то же подключение нельзя.)
Если команда COPY была выполнена через PQexec в строке, содержащей дополнительные команды, приложение должно продолжать получать результаты через PQgetResult после завершения последовательности COPY. Только когда PQgetResult возвращает NULL, можно с уверенностью считать, что переданные PQexec команды выполнены полностью, и безопасно передавать другие команды.
Функции, описанные в этом разделе, должны выполняться только после получения кода состояния PGRES_COPY_OUT или PGRES_COPY_IN от функции PQexec или PQgetResult.
Объект PGresult с таким кодом состояния содержит дополнительные данные о начавшейся операции COPY. Эти данные можно получить функциями, также применяющимися при обработке результатов запроса:
PQnfieldsВозвращает число копируемых столбцов (полей).
PQbinaryTuplesЗначение 0 указывает, что для всей операции копирования применяется текстовый формат (строки разделяются символами новой строки, столбцы разделяются символами-разделителями и т. д.). Значение 1 указывает, что для всей операции копирования применяется двоичный формат. За дополнительными сведениями обратитесь к COPY.
PQfformatВозвращает код формата (0 — текстовый, 1 — двоичный), связанный с каждым копируемым столбцом. Коды форматов столбцов всегда будут нулевыми, если общий формат копирования — текстовый, но с двоичным форматом поддерживаются и текстовые, и двоичные столбцы. (Однако в текущей реализации
COPYпри двоичном копировании столбцы могут быть только двоичными, так что форматы столбцов должны всегда соответствовать общему формату.)
Примечание
Эти дополнительные значения данных доступны только при использовании протокола 3.0. С протоколом 2.0 все эти функции возвращают 0.
32.9.1. Функции для передачи данных COPY
Эти функции применяются для передачи данных при операции COPY FROM STDIN. Они не будут работать, если подключение находится не в состоянии COPY_IN.
PQputCopyDataОтправляет данные на сервер, когда активно состояние
COPY_IN.int PQputCopyData(PGconn *conn, const char *buffer, int nbytes);Передаёт серверу данные
COPYиз указанного буфера (buffer), длинойnbytesбайт. Она возвращает 1, если данные были переданы, 0, если они не попали в очередь, так как буферы были заполнены (это возможно только в неблокирующем режиме), или -1, если произошла ошибка. (Если возвращено -1, подробности ошибки можно узнать, вызвавPQerrorMessage. Если получен 0, дождитесь состояния готовности к записи и повторите попытку.)Приложение может разделять поток данных
COPYна буферизуемые блоки любого удобного размера. Границы буфера не имеют семантического значения при передаче. Содержимое потока данных должно соответствовать формату данных, ожидаемому командойCOPY; за подробностями обратитесь к COPY.PQputCopyEndОтправляет признак конца данных на сервер, когда активно состояние
COPY_IN.int PQputCopyEnd(PGconn *conn, const char *errormsg);Завершает операцию
COPY_INс успешным результатом, если вerrormsgпередаётсяNULL. ЕслиerrormsgнеNULL, командаCOPYбудет завершена с ошибкой, а сообщением об ошибке будет строка, переданная вerrormsg. (Однако не следует полагать, что именно это сообщение будет получено от сервера назад, так как сервер мог уже прервать операциюCOPYпо своим причинам. Также заметьте, что принудительный вызов ошибки не работает с соединениями по протоколу версии до 3.0.)Эта функция возвращает 1, если сообщение завершения было передано; в неблокирующем режиме это означает только, что сообщение завершения успешно поставлено в очередь. (Чтобы удостовериться, что данные были успешно отправлены в неблокирующем режиме, следует дождаться готовности к записи и вызывать
PQflushв цикле, пока она не вернёт ноль.) Нулевой результат означает, что функция не смогла поставить сообщение завершения в очередь по причине заполнения буферов; это возможно только в неблокирующем режиме. (В этом случае нужно дождаться готовности к записи и попытаться вызватьPQputCopyEndснова.) Если действительно происходит ошибка, возвращается -1; получить её подробности можно, вызвавPQerrorMessage.После успешного вызова
PQputCopyEndвызовитеPQgetResult, чтобы узнать окончательный результат командыCOPY. Ожидать появления этого результата можно обычным образом. Затем вернитесь к обычным операциям.
32.9.2. Функции для приёма данных COPY
Эти функции применяются для получения данных при операции COPY TO STDOUT. Они не будут работать, если подключение находится не в состоянии COPY_OUT.
PQgetCopyDataПринимает данные от сервера, когда активно состояние
COPY_OUT.int PQgetCopyData(PGconn *conn, char **buffer, int async);Запрашивает следующую строку данных с сервера в процессе операции
COPY. Данные всегда возвращаются строка за строкой; если поступила только часть строки, она не возвращается. Успешное получение строки данных подразумевает выделение блока памяти для этих данных. В параметреbufferей передаётся указатель, отличный отNULL. По адресу*bufferзаписывается указатель на выделенную память, либоNULL, когда буфер не возвращается. Если буфер результата отличен отNULL, его следует освободить, когда он станет не нужен, вызвавPQfreemem.Когда строка получена успешно, возвращается число байт данных в этой строке (это число всегда больше нуля). Возвращаемое строковое значение всегда завершается нулём, хотя это полезно, вероятно, только для текстовой
COPY. Нулевой результат означает, что операцияCOPYпродолжает выполняться, но строка ещё не готова (это возможно, только когда параметрasyncравен true). Возвращённое значение -1 означает, что командаCOPYзавершена, а -2 показывает, что произошла ошибка (её причину можно узнать с помощьюPQerrorMessage).Когда параметр
asyncотличен от нуля (признак установлен), функцияPQgetCopyDataне будет блокироваться, ожидая данных; она возвратит ноль, если выполнениеCOPYпродолжается, но полная строка ещё не получена. (В этом случае нужно дождаться готовности к чтению и затем вызватьPQconsumeInput, прежде чем вызыватьPQgetCopyDataещё раз.) Когдаasyncравен нулю (признак не установлен),PQgetCopyDataбудет заблокирована до поступления данных или окончания операции.Когда
PQgetCopyDataвозвращает -1, вызовитеPQgetResult, чтобы узнать окончательный результат командыCOPY. Ожидать появления этого результата можно обычным образом. Затем вернитесь к обычным операциям.
32.9.3. Устаревшие функции для COPY
Эти функции представляют старые методы выполнения операции COPY. Хотя они продолжают работать, они признаны устаревшими из-за плохой обработки ошибок, неудобных способов обнаружения конца данных и отсутствия поддержки двоичных или неблокирующих передач.
PQgetlineЧитает передаваемую сервером строку символов, завершающуюся символом новой строки, в буфер (buffer) размера
length.int PQgetline(PGconn *conn, char *buffer, int length);Эта функция копирует
length-1 символов в буфер и преобразует символ конца строки в нулевой байт.PQgetlineвозвращаетEOFв конце ввода, 0, если была прочитана вся строка, и 1, если буфер заполнен, но завершающий символ конца строки ещё не прочитан.Заметьте, что приложение должно проверить, не состоит ли новая строка в точности из двух символов
\., что будет означать, что сервер завершил передачу результатов командыCOPY. Если приложение может принимать строки длиннееlength-1 символов, необходимо позаботиться о том, чтобы оно корректно распознавало строку\.(а не воспринимало, например, конец длинной строки данных как завершающую строку).PQgetlineAsyncЧитает передаваемую сервером строку данных
COPYв буфер без блокировки.int PQgetlineAsync(PGconn *conn, char *buffer, int bufsize);Эта функция похожа на
PQgetline, но может применяться в приложениях, которые должны читать данныеCOPYасинхронно, то есть без блокировки. Запустив командуCOPYи получив ответPGRES_COPY_OUT, приложение должно вызыватьPQconsumeInputиPQgetlineAsync, пока не будет получен сигнал «конец данных».В отличие от
PQgetline, эта функция сама отвечает за обнаружение конца данных.При каждом вызове
PQgetlineAsyncбудет возвращать данные, если во входном буфере libpq оказывается полная строка данных. В противном случае никакие данные не возвращаются до поступления остального содержимого строки. Эта функция возвращает -1, если обнаруживается признак завершения копирования, или 0, если данные не получены, или положительное количество возвращённых байт данных. Если возвращается -1, вызывающий код должен затем вызватьPQendcopyи после этого перейти в обычный режим работы.Возвращаемые данные не будут пересекать границы строк данных. При этом может быть возвращена одна строка целиком. Но если буфер, выделенный вызывающим кодом, оказывается слишком мал для строки, передаваемой сервером, возвращена будет часть строки. Когда передаются текстовые данные, это можно выявить, проверив, содержит ли последний возвращаемый байт символ
\n. (ДляCOPYв двоичном формате потребуется собственно разобрать формат данныхCOPY, чтобы выявить подобную ситуацию.) Возвращаемая строка не завершается нулём. (Если вы хотите получить строку с нулём в конце, передайте вbufsizeчисло на единицу меньше фактического размера блока.)PQputlineПередаёт серверу строку, завершённую нулём. Возвращает 0 в случае успеха, либо
EOF, если передать строку не удаётся.int PQputline(PGconn *conn, const char *string);Поток данных
COPY, передаваемых последовательностью вызововPQputline, имеет тот же формат, что возвращаетPQgetlineAsync, за исключением того, что приложения не обязательно должны передавать по одной строке данных за вызовPQputline; они могут посылать части строк или сразу несколько строк.Примечание
До версии 3.0 протокола Postgres Pro приложение должно было явно отправлять два символа
\.последней строкой, чтобы сообщить серверу, что оно закончило передачу данныхCOPY. Хотя это по-прежнему работает, такое поведение считается устаревшим и ожидается, что особое значение\.будет исключено в будущих версиях. Сейчас, передав собственно данные, достаточно вызватьPQendcopy.PQputnbytesПередаёт серверу строку, не завершённую нулём. Возвращает 0 в случае успеха, либо
EOF, если передать строку не удаётся.int PQputnbytes(PGconn *conn, const char *buffer, int nbytes);Поведение этой функции не отличается от
PQputline, но её буфер данных не должен содержать завершающий ноль, так как для неё число передаваемых байт задаётся непосредственным образом. Используйте эту функцию для передачи двоичных данных.PQendcopyПроизводит синхронизацию с сервером.
int PQendcopy(PGconn *conn);
Эта функция ожидает завершения копирования сервером. Её следует вызывать, либо когда серверу была передана последняя строка функцией
PQputline, либо когда от сервера была получена последняя строка функциейPQgetline. Если её не вызвать, сервер «потеряет синхронизацию» с клиентом. После завершения этой функции сервер готов принимать следующую команду SQL. В случае успешного завершения возвращается 0, в противном случае — ненулевое значение. (Чтобы получить подробности ошибки при ненулевом значении, вызовитеPQerrorMessage.)Вызывая
PQgetResult, приложение должно обрабатывать результатPGRES_COPY_OUT, в цикле выполняяPQgetline, а обнаружив завершающую строку, вызватьPQendcopy. Затем оно должно вернуться к циклуPQgetResultи выйти из него, когдаPQgetResultвозвратит нулевой указатель. Подобным образом, получив результатPGRES_COPY_IN, приложение должно выполнить серию вызововPQputline, завершить её, вызвавPQendcopy, а затем вернуться к циклуPQgetResult. При такой организации обработки командаCOPYбудет корректно выполняться и в составе последовательности команд SQL.Старые приложения обычно передают команду
COPYчерезPQexecи рассчитывают, что транзакция будет завершена послеPQendcopy. Это будет работать, только если командаCOPYявляется единственной SQL-командой в строке запроса.
32.9. Functions Associated with the COPY Command
The COPY command in Postgres Pro has options to read from or write to the network connection used by libpq. The functions described in this section allow applications to take advantage of this capability by supplying or consuming copied data.
The overall process is that the application first issues the SQL COPY command via PQexec or one of the equivalent functions. The response to this (if there is no error in the command) will be a PGresult object bearing a status code of PGRES_COPY_OUT or PGRES_COPY_IN (depending on the specified copy direction). The application should then use the functions of this section to receive or transmit data rows. When the data transfer is complete, another PGresult object is returned to indicate success or failure of the transfer. Its status will be PGRES_COMMAND_OK for success or PGRES_FATAL_ERROR if some problem was encountered. At this point further SQL commands can be issued via PQexec. (It is not possible to execute other SQL commands using the same connection while the COPY operation is in progress.)
If a COPY command is issued via PQexec in a string that could contain additional commands, the application must continue fetching results via PQgetResult after completing the COPY sequence. Only when PQgetResult returns NULL is it certain that the PQexec command string is done and it is safe to issue more commands.
The functions of this section should be executed only after obtaining a result status of PGRES_COPY_OUT or PGRES_COPY_IN from PQexec or PQgetResult.
A PGresult object bearing one of these status values carries some additional data about the COPY operation that is starting. This additional data is available using functions that are also used in connection with query results:
PQnfieldsReturns the number of columns (fields) to be copied.
PQbinaryTuples0 indicates the overall copy format is textual (rows separated by newlines, columns separated by separator characters, etc). 1 indicates the overall copy format is binary. See COPY for more information.
PQfformatReturns the format code (0 for text, 1 for binary) associated with each column of the copy operation. The per-column format codes will always be zero when the overall copy format is textual, but the binary format can support both text and binary columns. (However, as of the current implementation of
COPY, only binary columns appear in a binary copy; so the per-column formats always match the overall format at present.)
Note
These additional data values are only available when using protocol 3.0. When using protocol 2.0, all these functions will return 0.
32.9.1. Functions for Sending COPY Data
These functions are used to send data during COPY FROM STDIN. They will fail if called when the connection is not in COPY_IN state.
PQputCopyDataSends data to the server during
COPY_INstate.int PQputCopyData(PGconn *conn, const char *buffer, int nbytes);Transmits the
COPYdata in the specifiedbuffer, of lengthnbytes, to the server. The result is 1 if the data was queued, zero if it was not queued because of full buffers (this will only happen in nonblocking mode), or -1 if an error occurred. (UsePQerrorMessageto retrieve details if the return value is -1. If the value is zero, wait for write-ready and try again.)The application can divide the
COPYdata stream into buffer loads of any convenient size. Buffer-load boundaries have no semantic significance when sending. The contents of the data stream must match the data format expected by theCOPYcommand; see COPY for details.PQputCopyEndSends end-of-data indication to the server during
COPY_INstate.int PQputCopyEnd(PGconn *conn, const char *errormsg);Ends the
COPY_INoperation successfully iferrormsgisNULL. Iferrormsgis notNULLthen theCOPYis forced to fail, with the string pointed to byerrormsgused as the error message. (One should not assume that this exact error message will come back from the server, however, as the server might have already failed theCOPYfor its own reasons. Also note that the option to force failure does not work when using pre-3.0-protocol connections.)The result is 1 if the termination message was sent; or in nonblocking mode, this may only indicate that the termination message was successfully queued. (In nonblocking mode, to be certain that the data has been sent, you should next wait for write-ready and call
PQflush, repeating until it returns zero.) Zero indicates that the function could not queue the termination message because of full buffers; this will only happen in nonblocking mode. (In this case, wait for write-ready and try thePQputCopyEndcall again.) If a hard error occurs, -1 is returned; you can usePQerrorMessageto retrieve details.After successfully calling
PQputCopyEnd, callPQgetResultto obtain the final result status of theCOPYcommand. One can wait for this result to be available in the usual way. Then return to normal operation.
32.9.2. Functions for Receiving COPY Data
These functions are used to receive data during COPY TO STDOUT. They will fail if called when the connection is not in COPY_OUT state.
PQgetCopyDataReceives data from the server during
COPY_OUTstate.int PQgetCopyData(PGconn *conn, char **buffer, int async);Attempts to obtain another row of data from the server during a
COPY. Data is always returned one data row at a time; if only a partial row is available, it is not returned. Successful return of a data row involves allocating a chunk of memory to hold the data. Thebufferparameter must be non-NULL.*bufferis set to point to the allocated memory, or toNULLin cases where no buffer is returned. A non-NULLresult buffer should be freed usingPQfreememwhen no longer needed.When a row is successfully returned, the return value is the number of data bytes in the row (this will always be greater than zero). The returned string is always null-terminated, though this is probably only useful for textual
COPY. A result of zero indicates that theCOPYis still in progress, but no row is yet available (this is only possible whenasyncis true). A result of -1 indicates that theCOPYis done. A result of -2 indicates that an error occurred (consultPQerrorMessagefor the reason).When
asyncis true (not zero),PQgetCopyDatawill not block waiting for input; it will return zero if theCOPYis still in progress but no complete row is available. (In this case wait for read-ready and then callPQconsumeInputbefore callingPQgetCopyDataagain.) Whenasyncis false (zero),PQgetCopyDatawill block until data is available or the operation completes.After
PQgetCopyDatareturns -1, callPQgetResultto obtain the final result status of theCOPYcommand. One can wait for this result to be available in the usual way. Then return to normal operation.
32.9.3. Obsolete Functions for COPY
These functions represent older methods of handling COPY. Although they still work, they are deprecated due to poor error handling, inconvenient methods of detecting end-of-data, and lack of support for binary or nonblocking transfers.
PQgetlineReads a newline-terminated line of characters (transmitted by the server) into a buffer string of size
length.int PQgetline(PGconn *conn, char *buffer, int length);This function copies up to
length-1 characters into the buffer and converts the terminating newline into a zero byte.PQgetlinereturnsEOFat the end of input, 0 if the entire line has been read, and 1 if the buffer is full but the terminating newline has not yet been read.Note that the application must check to see if a new line consists of the two characters
\., which indicates that the server has finished sending the results of theCOPYcommand. If the application might receive lines that are more thanlength-1 characters long, care is needed to be sure it recognizes the\.line correctly (and does not, for example, mistake the end of a long data line for a terminator line).PQgetlineAsyncReads a row of
COPYdata (transmitted by the server) into a buffer without blocking.int PQgetlineAsync(PGconn *conn, char *buffer, int bufsize);This function is similar to
PQgetline, but it can be used by applications that must readCOPYdata asynchronously, that is, without blocking. Having issued theCOPYcommand and gotten aPGRES_COPY_OUTresponse, the application should callPQconsumeInputandPQgetlineAsyncuntil the end-of-data signal is detected.Unlike
PQgetline, this function takes responsibility for detecting end-of-data.On each call,
PQgetlineAsyncwill return data if a complete data row is available in libpq's input buffer. Otherwise, no data is returned until the rest of the row arrives. The function returns -1 if the end-of-copy-data marker has been recognized, or 0 if no data is available, or a positive number giving the number of bytes of data returned. If -1 is returned, the caller must next callPQendcopy, and then return to normal processing.The data returned will not extend beyond a data-row boundary. If possible a whole row will be returned at one time. But if the buffer offered by the caller is too small to hold a row sent by the server, then a partial data row will be returned. With textual data this can be detected by testing whether the last returned byte is
\nor not. (In a binaryCOPY, actual parsing of theCOPYdata format will be needed to make the equivalent determination.) The returned string is not null-terminated. (If you want to add a terminating null, be sure to pass abufsizeone smaller than the room actually available.)PQputlineSends a null-terminated string to the server. Returns 0 if OK and
EOFif unable to send the string.int PQputline(PGconn *conn, const char *string);The
COPYdata stream sent by a series of calls toPQputlinehas the same format as that returned byPQgetlineAsync, except that applications are not obliged to send exactly one data row perPQputlinecall; it is okay to send a partial line or multiple lines per call.Note
Before Postgres Pro protocol 3.0, it was necessary for the application to explicitly send the two characters
\.as a final line to indicate to the server that it had finished sendingCOPYdata. While this still works, it is deprecated and the special meaning of\.can be expected to be removed in a future release. It is sufficient to callPQendcopyafter having sent the actual data.PQputnbytesSends a non-null-terminated string to the server. Returns 0 if OK and
EOFif unable to send the string.int PQputnbytes(PGconn *conn, const char *buffer, int nbytes);This is exactly like
PQputline, except that the data buffer need not be null-terminated since the number of bytes to send is specified directly. Use this procedure when sending binary data.PQendcopySynchronizes with the server.
int PQendcopy(PGconn *conn);
This function waits until the server has finished the copying. It should either be issued when the last string has been sent to the server using
PQputlineor when the last string has been received from the server usingPQgetline. It must be issued or the server will get “out of sync” with the client. Upon return from this function, the server is ready to receive the next SQL command. The return value is 0 on successful completion, nonzero otherwise. (UsePQerrorMessageto retrieve details if the return value is nonzero.)When using
PQgetResult, the application should respond to aPGRES_COPY_OUTresult by executingPQgetlinerepeatedly, followed byPQendcopyafter the terminator line is seen. It should then return to thePQgetResultloop untilPQgetResultreturns a null pointer. Similarly aPGRES_COPY_INresult is processed by a series ofPQputlinecalls followed byPQendcopy, then return to thePQgetResultloop. This arrangement will ensure that aCOPYcommand embedded in a series of SQL commands will be executed correctly.Older applications are likely to submit a
COPYviaPQexecand assume that the transaction is done afterPQendcopy. This will work correctly only if theCOPYis the only SQL command in the command string.