|  | 		    
					
        
         
          
         
	
          | |  | lille problem med vpopmail/courier/qmail Fra : Sonni Skammelsen
 | 
 Dato :  16-06-04 17:33
 | 
 |  | Hej
 
 Jeg har min egen lille mailserver stående med ovenfor nævnte setup. Jeg kan
 pt. ikke tjekke mail på 2 ud af 15 domæner.
 
 Jeg kan se i processlisten at selv om jeg stopper courier så er det stadig x
 antal courier processer som ikke stoppes og ikke kan slås ned, har prøvet
 med sig 15 og sig 9, og kan se at hver gang jeg forsøger at tjekke på disse
 domæner kommer der en ny courier process som bliver hængende.
 
 Findes der en som kunne tænkes ud vide hvad der sker og hvorfor, så jeg kan
 afhjælpe problemet.
 
 /Sonni
 
 
 
 
 |  |  | 
  Claus Alboege (16-06-2004) 
 
	
          | |  | Kommentar Fra : Claus Alboege
 | 
 Dato :  16-06-04 17:55
 | 
 |  | "Sonni Skammelsen" <news@sonni.org> writes:
 
 > Hej
 >
 > Jeg har min egen lille mailserver stående med ovenfor nævnte setup. Jeg
 > kan pt. ikke tjekke mail på 2 ud af 15 domæner.
 >
 > Jeg kan se i processlisten at selv om jeg stopper courier så er det
 > stadig x antal courier processer som ikke stoppes og ikke kan slås ned,
 > har prøvet med sig 15 og sig 9, og kan se at hver gang jeg forsøger at
 > tjekke på disse domæner kommer der en ny courier process som bliver
 > hængende.
 >
 > Findes der en som kunne tænkes ud vide hvad der sker og hvorfor, så jeg
 > kan afhjælpe problemet.
 
 strace, truss, ktrace eller lignende kan maaske give lidt mere
 information om hvad der sker. Hvilken version af courier og vpopmail
 benytter du?
 
 
 /Claus A
 
 
 
 
 |  |  | 
  Sonni Skammelsen (16-06-2004) 
 
	
          | |  | Kommentar Fra : Sonni Skammelsen
 | 
 Dato :  16-06-04 18:31
 | 
 |  | Claus Alboege wrote:
 > "Sonni Skammelsen" <news@sonni.org> writes:
 >
 >> Hej
 >>
 >> Jeg har min egen lille mailserver stående med ovenfor nævnte setup.
 >> Jeg kan pt. ikke tjekke mail på 2 ud af 15 domæner.
 >>
 >> Jeg kan se i processlisten at selv om jeg stopper courier så er det
 >> stadig x antal courier processer som ikke stoppes og ikke kan slås
 >> ned, har prøvet med sig 15 og sig 9, og kan se at hver gang jeg
 >> forsøger at tjekke på disse domæner kommer der en ny courier process
 >> som bliver hængende.
 >>
 >> Findes der en som kunne tænkes ud vide hvad der sker og hvorfor, så
 >> jeg kan afhjælpe problemet.
 >
 > strace, truss, ktrace eller lignende kan maaske give lidt mere
 > information om hvad der sker. Hvilken version af courier og vpopmail
 > benytter du?
 
 Nu kender jeg ikke rigtigt til noget af det, så det bedste jeg kan gøre er
 at paste den information jeg tror/mener er det der fortæller fejlen og den
 er som følger:
 
 select(6, [5], NULL, NULL, NULL)        = 1 (in [5])
 rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
 rt_sigprocmask(SIG_SETMASK, [], [CHLD], 8) = 0
 accept(5, {sin_family=AF_INET, sin_port=htons(2312),
 sin_addr=inet_addr("10.10.100.101")}}, [16]) = 4
 fcntl(4, F_SETFD, 0)                    = 0
 fcntl(4, F_SETFL, O_RDONLY)             = 0
 setsockopt(4, SOL_SOCKET, SO_KEEPALIVE, [1], 4) = 0
 setsockopt(4, SOL_SOCKET, SO_LINGER, [0], 8) = 0
 rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
 fork()                                  = 10522
 close(4)                                = 0
 rt_sigprocmask(SIG_SETMASK, [], [CHLD], 8) = 0
 
 for den der fejler
 
 select(6, [5], NULL, NULL, NULL)        = 1 (in [5])
 rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
 rt_sigprocmask(SIG_SETMASK, [], [CHLD], 8) = 0
 accept(5, {sin_family=AF_INET, sin_port=htons(1025),
 sin_addr=inet_addr("101.10.100.101")}}, [16]) = 4
 fcntl(4, F_SETFD, 0)                    = 0
 fcntl(4, F_SETFL, O_RDONLY)             = 0
 setsockopt(4, SOL_SOCKET, SO_KEEPALIVE, [1], 4) = 0
 setsockopt(4, SOL_SOCKET, SO_LINGER, [0], 8) = 0
 rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
 fork()                                  = 10528
 close(4)                                = 0
 rt_sigprocmask(SIG_SETMASK, [], [CHLD], 8) = 0
 select(6, [5], NULL, NULL, NULL)        = ? ERESTARTNOHAND (To be restarted)
 --- SIGCHLD (Child exited) ---
 rt_sigprocmask(SIG_BLOCK, [CHLD], [CHLD], 8) = 0
 wait4(-1, [WIFEXITED(s) && WEXITSTATUS(s) == 0], WNOHANG, NULL) = 10528
 wait4(-1, 0xbffff468, WNOHANG, NULL)    = 0
 rt_sigaction(SIGCHLD, {0x804adcc, [], SA_RESTART|0x4000000}, {0x804adcc, [],
 SA_RESTART|0x4000000}, 8) = 0
 rt_sigprocmask(SIG_SETMASK, [], [CHLD], 8) = 0
 sigreturn()                             = ? (mask now [])
 
 en der virker
 
 Jeg kører med vpopmail version 5.3.6 og courier version 1.4.6
 
 Fejlen opstod forøvrigt uden fysisk indblanden af undertegnede. Virkede fint
 for alle domæner mandag aften inden jeg gik på køjen, tirsdag morgen da jeg
 stod op var fejlen der og ifølge loggen er har ingen været logget på
 maskinen i mellemtiden.
 
 /Sonni
 
 
 
 
 |  |  | 
   Sonni Skammelsen (16-06-2004) 
 
	
          | |  | Kommentar Fra : Sonni Skammelsen
 | 
 Dato :  16-06-04 19:03
 | 
 |  | Sonni Skammelsen wrote:
 > Claus Alboege wrote:
 >> "Sonni Skammelsen" <news@sonni.org> writes:
 >>
 >>> Hej
 >>>
 >>> Jeg har min egen lille mailserver stående med ovenfor nævnte setup.
 >>> Jeg kan pt. ikke tjekke mail på 2 ud af 15 domæner.
 >>>
 >>> Jeg kan se i processlisten at selv om jeg stopper courier så er det
 >>> stadig x antal courier processer som ikke stoppes og ikke kan slås
 >>> ned, har prøvet med sig 15 og sig 9, og kan se at hver gang jeg
 >>> forsøger at tjekke på disse domæner kommer der en ny courier process
 >>> som bliver hængende.
 >>>
 >>> Findes der en som kunne tænkes ud vide hvad der sker og hvorfor, så
 >>> jeg kan afhjælpe problemet.
 >>
 >> strace, truss, ktrace eller lignende kan maaske give lidt mere
 >> information om hvad der sker. Hvilken version af courier og vpopmail
 >> benytter du?
 >
 > Nu kender jeg ikke rigtigt til noget af det, så det bedste jeg kan
 > gøre er at paste den information jeg tror/mener er det der fortæller
 > fejlen og den er som følger:
 >
 > select(6, [5], NULL, NULL, NULL)        = 1 (in [5])
 > rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
 > rt_sigprocmask(SIG_SETMASK, [], [CHLD], 8) = 0
 > accept(5, {sin_family=AF_INET, sin_port=htons(2312),
 > sin_addr=inet_addr("10.10.100.101")}}, [16]) = 4
 > fcntl(4, F_SETFD, 0)                    = 0
 > fcntl(4, F_SETFL, O_RDONLY)             = 0
 > setsockopt(4, SOL_SOCKET, SO_KEEPALIVE, [1], 4) = 0
 > setsockopt(4, SOL_SOCKET, SO_LINGER, [0], 8) = 0
 > rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
 > fork()                                  = 10522
 > close(4)                                = 0
 > rt_sigprocmask(SIG_SETMASK, [], [CHLD], 8) = 0
 >
 > for den der fejler
 >
 > select(6, [5], NULL, NULL, NULL)        = 1 (in [5])
 > rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
 > rt_sigprocmask(SIG_SETMASK, [], [CHLD], 8) = 0
 > accept(5, {sin_family=AF_INET, sin_port=htons(1025),
 > sin_addr=inet_addr("101.10.100.101")}}, [16]) = 4
 > fcntl(4, F_SETFD, 0)                    = 0
 > fcntl(4, F_SETFL, O_RDONLY)             = 0
 > setsockopt(4, SOL_SOCKET, SO_KEEPALIVE, [1], 4) = 0
 > setsockopt(4, SOL_SOCKET, SO_LINGER, [0], 8) = 0
 > rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
 > fork()                                  = 10528
 > close(4)                                = 0
 > rt_sigprocmask(SIG_SETMASK, [], [CHLD], 8) = 0
 > select(6, [5], NULL, NULL, NULL)        = ? ERESTARTNOHAND (To be
 > restarted) --- SIGCHLD (Child exited) ---
 > rt_sigprocmask(SIG_BLOCK, [CHLD], [CHLD], 8) = 0
 > wait4(-1, [WIFEXITED(s) && WEXITSTATUS(s) == 0], WNOHANG, NULL) =
 > 10528 wait4(-1, 0xbffff468, WNOHANG, NULL)    = 0
 > rt_sigaction(SIGCHLD, {0x804adcc, [], SA_RESTART|0x4000000},
 > {0x804adcc, [], SA_RESTART|0x4000000}, 8) = 0
 > rt_sigprocmask(SIG_SETMASK, [], [CHLD], 8) = 0
 > sigreturn()                             = ? (mask now [])
 >
 > en der virker
 >
 > Jeg kører med vpopmail version 5.3.6 og courier version 1.4.6
 >
 > Fejlen opstod forøvrigt uden fysisk indblanden af undertegnede.
 > Virkede fint for alle domæner mandag aften inden jeg gik på køjen,
 > tirsdag morgen da jeg stod op var fejlen der og ifølge loggen er har
 > ingen været logget på maskinen i mellemtiden.
 >
 Glemte lige at det er output fra strace som er den eneste jeg har
 tilgængelig på maskinen.
 
 /Sonni
 
 
 
 
 |  |  | 
  Claus Alboege (16-06-2004) 
 
	
          | |  | Kommentar Fra : Claus Alboege
 | 
 Dato :  16-06-04 19:43
 | 
 |  | "Sonni Skammelsen" <news@sonni.org> writes:
 
 > Sonni Skammelsen wrote:
 >> Claus Alboege wrote:
 >>> "Sonni Skammelsen" <news@sonni.org> writes:
 >>>
 >>>> Hej
 >>>>
 >>>> Jeg har min egen lille mailserver stående med ovenfor nævnte setup.
 >>>> Jeg kan pt. ikke tjekke mail på 2 ud af 15 domæner.
 >>>>
 >>>> Jeg kan se i processlisten at selv om jeg stopper courier så er det
 >>>> stadig x antal courier processer som ikke stoppes og ikke kan slås
 >>>> ned, har prøvet med sig 15 og sig 9, og kan se at hver gang jeg
 >>>> forsøger at tjekke på disse domæner kommer der en ny courier process
 >>>> som bliver hængende.
 >>>>
 >>>> Findes der en som kunne tænkes ud vide hvad der sker og hvorfor, så
 >>>> jeg kan afhjælpe problemet.
 >>>
 >>> strace, truss, ktrace eller lignende kan maaske give lidt mere
 >>> information om hvad der sker. Hvilken version af courier og vpopmail
 >>> benytter du?
 >>
 >> Nu kender jeg ikke rigtigt til noget af det, så det bedste jeg kan
 >> gøre er at paste den information jeg tror/mener er det der fortæller
 >> fejlen og den er som følger:
 
 [snip output fra strace]
 
 Der skal nok lige en -f (og sikkert ogsaa -F) paa dit kald til
 strace. Altsaa noget ala:
 
 strace -o /tmp/strace.log -tfF -p <hanging-courier-pid>
 
 >> Jeg kører med vpopmail version 5.3.6
 
 Det var da en gammel sag du har der :) - Ikke at vpopmail burde have
 noget med naervaerende problem at goere, men der er rettet adskillige
 fejl i vpopmail de sidste 2 aar...
 
 >> og courier version 1.4.6
 
 Hmm, der er vist ogsaa en gammel sag - nyeste stable er 3.0.5!
 
 >> Fejlen opstod forøvrigt uden fysisk indblanden af undertegnede.
 >> Virkede fint for alle domæner mandag aften inden jeg gik på køjen,
 >> tirsdag morgen da jeg stod op var fejlen der og ifølge loggen er har
 >> ingen været logget på maskinen i mellemtiden.
 
 Kunne man taenke at en malformateret mail trigger en fejl i den version
 af courier-imap? Maaske en opgradering til seneste stable er den
 hurtigste loesning?
 
 
 /Claus A
 
 
 
 
 |  |  | 
   Sonni Skammelsen (16-06-2004) 
 
	
          | |  | Kommentar Fra : Sonni Skammelsen
 | 
 Dato :  16-06-04 22:12
 | 
 |  | Claus Alboege wrote:
 > [snip en masse]
 > Der skal nok lige en -f (og sikkert ogsaa -F) paa dit kald til
 > strace. Altsaa noget ala:
 >
 >   strace -o /tmp/strace.log -tfF -p <hanging-courier-pid>
 
 Takker der fandt jeg jo en fejl så stor så selv jeg kunne se det.
 der er en i/o error på lastauth for det/de pågældende domæne(r)
 Så er det bare hvordan jeg får den fikset, gerne uden at gerne starte
 maskinen, hvis det kan undgåes.
 
 >
 >>> Jeg kører med vpopmail version 5.3.6
 >
 > Det var da en gammel sag du har der :) - Ikke at vpopmail burde have
 > noget med naervaerende problem at goere, men der er rettet adskillige
 > fejl i vpopmail de sidste 2 aar...
 >
 >>> og courier version 1.4.6
 >
 > Hmm, der er vist ogsaa en gammel sag - nyeste stable er 3.0.5!
 >
 
 Systemet er sat op og installeret, i øvrigt på anbefaling og med lidt hjalp
 af dig, tilbage i februar 2001 og har kørt 24/7, med undtagelse af et lille
 strømafbrud når det nu var passende, siden der.
 Men måske man skulle kigge lidt på noget opdatering.
 I den forbindelse, hvis jeg nu vælger at lagre password mv. i database i
 stedet for filer, kan jeg så tage password fra filen og ligge direkte ind i
 mysql ?
 
 >>> Fejlen opstod forøvrigt uden fysisk indblanden af undertegnede.
 >>> Virkede fint for alle domæner mandag aften inden jeg gik på køjen,
 >>> tirsdag morgen da jeg stod op var fejlen der og ifølge loggen er har
 >>> ingen været logget på maskinen i mellemtiden.
 >
 > Kunne man taenke at en malformateret mail trigger en fejl i den
 > version af courier-imap? Maaske en opgradering til seneste stable er
 > den hurtigste loesning?
 
 Nu fandt jeg fejlen, kan dette være grund til det, eller vil en opdatering
 bare være mere fordi jeg kan nyere versionsnumre ?
 
 /Sonni
 
 
 
 
 |  |  | 
 |  |