Re: Cluster seems broken after pg_basebackup

Поиск
Список
Период
Сортировка
От Guillaume Drolet
Тема Re: Cluster seems broken after pg_basebackup
Дата
Msg-id CAOkiyv6EmtvdUNBk67DM-XebA=-TMcpEpv=rT=_-ma8Pwvjbag@mail.gmail.com
обсуждение исходный текст
Ответ на Re: Cluster seems broken after pg_basebackup  (Adrian Klaver <adrian.klaver@aklaver.com>)
Ответы Re: Cluster seems broken after pg_basebackup  (Adrian Klaver <adrian.klaver@aklaver.com>)
Список pgsql-general

Adrian, in response to your question:
 
2015-02-06 07:11:38 EST FATAL:  le rôle « 208375PT$ » n'existe pas

So where is role 208375PT$ supposed to come from?

I found that when I stop/start/restart pgsql through the services.msc application in Windows, this message is issued in the log file. This makes sense since the account I use to start the services.msc application is my admin account, 208375PT\Admlocal.

If I use instead the command line with "pg_ctl restart -U postgres", I don't get this message in the log file.


2015-02-06 11:28 GMT-05:00 Adrian Klaver <adrian.klaver@aklaver.com>:
On 02/06/2015 05:03 AM, Guillaume Drolet wrote:
Hi,

Yesterday I ran a pg_basebackup of my cluster. Since it has completed,
my cluster doesn't work properly. I tried restarting the computer (or
service) a few times but I always get the same messages in my logs (it's
in French. If someone is willing to help me I can try to translate the
logs. Just ask):

Enter Google Translate:)

First some questions:

1) What Postgres version?

2) What OS(s)? I am assuming Windows from the log info below, but we all know what assuming gets you.

3) Where were you backing up from and to?

4) Which cluster does not start, the master or the child you created with pg_basebackup?


2015-02-06 07:11:38 EST LOG:  le système de bases de données a été
interrompu ; dernier lancement connu à 2015-02-06 07:05:05 EST
2015-02-06 07:11:38 EST LOG:  le système de bases de données n'a pas été
arrêté proprement ; restauration
     automatique en cours
2015-02-06 07:11:38 EST LOG:  record with zero length at 24B/2C000160
2015-02-06 07:11:38 EST LOG:  la ré-exécution n'est pas nécessaire
2015-02-06 07:11:38 EST LOG:  le système de bases de données est prêt
pour accepter les connexions
2015-02-06 07:11:38 EST LOG:  lancement du processus autovacuum
2015-02-06 07:11:38 EST FATAL:  le rôle « 208375PT$ » n'existe pas

So where is role 208375PT$ supposed to come from?


Then if I start pgAdmin I get a series of pop-ups I have to click OK to
to continue:

An error has ocurred: Column not found in pgSet: "datlastsysoid"
An error has ocurred: Column not found in pgSet: datlastsysoid
An error has ocurred: Column not found in pgSet: oid
An error has ocurred: Column not found in pgSet: encoding
An error has ocurred: Column not found in pgSet: Connection to database
broken

Not sure about that this, someone more versed in pgAdmin will have to answer.


And after that, I went back to the log file and there's new information
added:

2015-02-06 07:51:05 EST LOG:  processus serveur (PID 184) a été arrêté
par l'exception 0x80000004
2015-02-06 07:51:05 EST DÉTAIL:  Le processus qui a échoué exécutait :
SELECT version();
2015-02-06 07:51:05 EST ASTUCE :  Voir le fichier d'en-tête C «
ntstatus.h » pour une description de la valeur
     hexadécimale.

Well according to here:

https://msdn.microsoft.com/en-us/library/cc704588.aspx

0x80000004
STATUS_SINGLE_STEP
       

{EXCEPTION} Single Step A single step or trace operation has just been completed.

A developer is going to have explain what that means.


2015-02-06 07:51:05 EST LOG:  arrêt des autres processus serveur actifs
2015-02-06 07:51:05 EST ATTENTION:  arrêt de la connexion à cause de
l'arrêt brutal d'un autre processus serveur
2015-02-06 07:51:05 EST DÉTAIL:  Le postmaster a commandé à ce processus
serveur d'annuler la transaction
     courante et de quitter car un autre processus serveur a quitté
anormalement
     et qu'il existe probablement de la mémoire partagée corrompue.
2015-02-06 07:51:05 EST ASTUCE :  Dans un moment, vous devriez être
capable de vous reconnecter à la base de
     données et de relancer votre commande.
2015-02-06 07:51:05 EST LOG:  processus d'archivage (PID 692) quitte
avec le code de sortie 1
2015-02-06 07:51:05 EST LOG:  tous les processus serveur se sont
arrêtés, réinitialisation
2015-02-06 07:51:15 EST FATAL:  le bloc de mémoire partagé pré-existant
est toujours en cours d'utilisation
2015-02-06 07:51:15 EST ASTUCE :  Vérifier s'il n'y a pas de vieux
processus serveur en cours d'exécution. Si c'est le
     cas, fermez-les.

I was about to try restarting postgresql using the base backup I made
yesterday but since this means I'll have to copy my database again (700
GB takes a while...) I am looking for a better solution from more
experienced people.


My suspicion is you copied at least partly over a running server.



Thanks a lot for helping! Guillaume



--
Adrian Klaver
adrian.klaver@aklaver.com

В списке pgsql-general по дате отправления:

Предыдущее
От: Kai Groner
Дата:
Сообщение: Re: EXCLUDE constraint with not equals
Следующее
От: Xavier Stevens
Дата:
Сообщение: Re: Logical Decoding Callbacks