Re: Determining Cause of Crash

From: Martin Jost (Martin.Jost_at_siemens.com)
Date: 05/12/05


Date: Thu, 12 May 2005 12:29:01 +0200


<basis_consultant@hotmail.com> schrieb im Newsbeitrag news:1115820746.569377.110330@g44g2000cwa.googlegroups.com...
> I am trying to determine the cause of the crash. I checked
> the /var/adm/.. log files, as well as some others, and I see
> a lot of information indicating that various daemons started
> yesterday evening, but not much indicating what caused the
> server to crash.

Note: You didn't tell about the HPUX version, so I assume 10.20 ;-)

Besides having a look at the old log files (the ones before the crash) e.g. /var/adm/syslog/OLDsyslog.log as others suggested, you may want to have a look at a possible crash-dump.

These are stored (if you have sufficient swap-space to dump them in the first place) below
/var/adm/crash
Look for one with a matching date.

You then need "q4" from the OS-media installed. Check with swlist -l fileset|grep OS-Core.Q4.

The documentation is in
/usr/contrib/doc/Q4Docs.tar.Z

Sorry, my notes concerning this are in German (see below).

HTH (a bit)

Martin

P.S.:
My notes on q4, I once got from HP support:

Die Crashdump-Analyse unter HPUX 10.X wird typischerweise mit Q4
durchgefuehrt. Dafuer muss folgendes passieren:

1) Das Q4-Packet muss installiert sein. Das laesst sich ueberpruefen mit:

 swlist -l fileset|grep OS-Core.Q4

   Falls nicht vorhanden, kann man es von der CORE-OS-CD installieren.

2) Falls bis jetzt noch keine Q4-Analyse statt fand, muss man noch einige
   Installation-Schritte von Hand durchfuehren:

 cd /usr/contrib/lib
 uncompress Q4Lib.tar.Z
 tar xvf Q4Lib.tar
 [ Der ganze Tar-Ball muss entpackt werden - nicht nur sample.q4rc.pl !]
 cp q4lib/sample.q4rc.pl ~root/.q4rc.pl

3) Jetzt muss noch die Datei ~root/.q4rc.pl angepasst werden. Dort findet sich
   ein Kommentar:

 # Uncomment this to search a system-wide Q4 library.

   Das Kommentar-Zeichen vor der naechsten Zeile muss entfernt werden
   und diese ist zu aendern in:

 push(INC, "/usr/contrib/lib/q4lib");

[Im folgenden wird angenommen, dass dies der erste coredump ist und
damit in /var/adm/crash/core.0 steckt. Die aktuelle Nummer steht in
/var/adm/crash/bounds. core.x und bounds koennen nachher geloescht
werden !]

4) Stellen Sie sicher, dass Sie genuegend Platz haben um den crash zu
   bearbeiten. Ueblicherweise benoetigt man Platz in der Groessenordnung
   des Hauptspeichers der Maschine. Noetigenfalls kann man das
   core-Verzeichnis in /var/adm/crash auch auf ein anderes Datei-System
   kopieren. Fuer den Rest dieses "Kochbuchs" gehe ich davon aus, dass
   in /var/adm/crash ausreichend Platz ist und dass der Core in core.0
   untersucht werden muss. Anderenfalls aendern sich die Pfade/Dateinamen
   entsprechend.

5) Unter Umstaenden muss der Kernel noch mit q4pxdb vorbereitet werden.
   Dies ist nicht in jedem Fall noetig, schadet aber in aller Regel nicht.

 /usr/contrib/bin/q4pxdb /var/adm/crash/core.0/vmunix

[ Die Files sind zunaechst ge-gezippt und muessen entzipt werden.
Ein Hinweis beim Start von q4 scheint zwar darauf hinzuweisen, dass
sie "eigentlich" gegzippt sein sollten, aber das geht nicht !! ]

6) Q4 starten:

 cd /var/adm/crash/core.0
        # set_env: Neu mit Patch in 9.2000
 . /usr/contrib/Q4/bin/set_env
 q4 -p

7) Im Q4 folgende Kommandos absetzen:

 include analyze.pl
 run Analyze UA > /tmp/ana.out

   /tmp/ana.out enthaelt dann die wichtigsten Daten ueber den Crash. Diese
Datei senden Sie mir bitte als Mail zurueck (evtl. komprimiert).

Um auf die Schnelle noch an einige Infos zu kommen, kann man im Q4
noch folgende Kommandos absetzen:

 examine panicstr using s # Die Panic-Meldung
 examine &msgbuf+8 using s # Message-Buffer
 trace event 0 # Grund der Panic
 examine &time using Y # Wann ist's passiert?

8) Unter /usr/contrib/doc liegt die Doku als Postscript



Relevant Pages

  • Re: Datenstruktur als DB =?ISO-8859-1?Q?L=F6sung?=
    ... dann später noch ne Bewertung und ein Zähler hinzu. ... Die 'aktuellen' DB-Creates hab ich leider nicht mehr. ... Hab die creates noch von einem Ex-Kolegen bekommen: ...
    (de.comp.datenbanken.mysql)
  • Re: Trafficcops - biker
    ... blowout, accident, whatever. ... likely die. ... Bottom line is that if you crash a bike at 70mph, ... Travelling at 120 makes the crash more likely. ...
    (uk.rec.driving)
  • Re: Can looting be excused?
    ... > into our buildings.....and let thousands of people die along the Gulf. ... > Yeah. ... > country that did nothing to us, let 4 planes get hijacked and crash ...
    (alt.vacation.las-vegas)