Nous venons tout juste d'accueillir notre 300ième compte aujourd'hui! Cette étape symbolique arrive à un point tournant de l'histoire de nos services d'hébergement alors que nous nous apprêtons à ouvrir un deuxième cabinet pour déployer de nouveaux serveurs. Nous avons encore quelques retards dans le déploiement du système de redondance, mais nous allons bientôt engager du nouveau personnel pour nous permettre de faire avancer le tout plus rapidement.
jeudi 8 janvier 2009
300ième compte et nouveau cabinet!
Par anarcat le jeudi 8 janvier 2009, 16:37 - fr
300th account and new cabinet
Par anarcat le jeudi 8 janvier 2009, 16:29 - en
We have just welcome our 300th account today! This symbolic step comes at a turning point in the history of our hosting services as we are getting ready to open our second cabinet to deploy new servers. We're still having some delays in the deployment of our redundant infrastructure roadmap, but we're soon going to hire more personnel that should help further this faster.
jeudi 1 janvier 2009
Coupure de notre fournisseur de bande passante en amont le 1er janvier 2009 8h45-10h10 / Upstream bw blackout, January 1st 2009, 8h45-10h10
Par Mathieu le jeudi 1 janvier 2009, 15:21
Il y a une coupure imprévue en cours de la part de notre fournisseur de bande passante en amont (netelligent). Le fournisseur est en train d'enquêter le problème et nous donnera un estimé pour le temps de récupération d'ici peu. Meric de votre compréhension. -- Mathieu L, 9h15
Le problème a été résolu vers 10h10. Nous attendons toujours de nouvelles sur les détails de la panne. -- Mathieu L., 10h15
There is an ongoing unplanned interruption on behalf of our upstream bandwidth provider (netelligent). They are investigating the problem and will soon give us an estimated time to recuperation. Thank you for your understanding. -- Mathieu L, 9h15
The problem has been resolved around 10h10. We are still waiting for more information regarding the outage. -- Mathieu L,, 10h15
mardi 16 décembre 2008
Coupure de l'air climatisé 16 nov 2008
Par anarcat le mardi 16 décembre 2008, 07:32 - fr
À 7:15 ce matin, tous les services ont cessé dû à une coupure de l'air climatisé dans le centre de données. Cette unité a cessé de fonctionné il y a environ une heure, ce qui a progressivement fait monter la température de tous les serveurs et causé une coupure généralisée. Notre fournisseur a été mis au courant de la panne et travaille au rétablissement présentement, d'autres mises à jour suivront.
Mise à jour (7:57): je viens d'être informé d'un ETA de 30 minutes de l'équipe en place, tenez bon.
Mise à jour (8:03): tous les services sont de retour, désolé des inconvénients.
Air conditionning failure in main cabinet nov 16 2008
Par anarcat le mardi 16 décembre 2008, 07:31 - en
At 7:15 this morning, all core services went down due to a air conditionning unit failure in the datacenter. That unit failed about an hour ago, which raised the temperature of all server units in the datacenter and caused a cascading outage. Our provider is aware of the issue and is working on it right now, more updates to follow.
Update (7:57): I have just been informed of a "30 minutes" ETA from the remote team, hang in there.
Update (8:03): all services have been brought back up, sorry for the inconvenience.
mercredi 3 décembre 2008
Mise à jour à phpMyAdmin 3.1.0
Par anarcat le mercredi 3 décembre 2008, 18:56 - fr
Nous avons mis à jour le logiciel phpMyAdmin à la version 3.1.0, réglant les bugs "mbstring" rapportés à maintes reprises. Signalez tout problème à support@koumbit.org.
phpMyadmin upgraded to 3.1.0
Par anarcat le mercredi 3 décembre 2008, 18:55 - en
We have upgraded phpMyAdmin to the 3.1.0 version which fixes the "mbstring" issues that you have reported many times. Please report any problem to support@koumbit.org.
dimanche 9 novembre 2008
Coupure dans la nuit du samedi 8 novembre 2008: problème d'ampérage, problème de date sur mysql1
Par Mathieu le dimanche 9 novembre 2008, 19:51 - fr
Un disjoncteur du cabinet, où sont hébergés les principaux serveurs d'hébergement de Koumbit, a sauté dans la nuit du samedi 8 novembre 2008 en raison d'une surcharge. Une partie des serveurs étaient inaccessibles entre 23h15 et 0h30, suivi de quelques petites coupures entre 0h30 et 2h15.
De plus, suite à cette panne, le principal serveur web de l'hébergement partagé n'a pas correctement retrouvé la bonne heure et affichait 1970. Ceci a causé quelques problèmes sur des sites de gestion de contenu (Spip et Drupal). Le problème a été remarqué et résolu dimanche vers 11h00.
Koumbit est sur le point d'ouvrir un second cabinet dans un nouveau point de présence. Ceci fait partie du plan architectural 2008 pour augmenter la redondance et gérer la croissance. Ceci permettra, entre autres, d'éviter ce type de panne, puisque les serveurs d'hébergement partagés seront redondants entre les deux cabinets.
Pour toute question ou commentaire, vous pouvez commenter sur le blogue des administrateurs systèmes (offline.koumbit.net) ou nous écrire à support@koumbit.org.
Merci de votre compréhension.
Mise à jour, 16:47HNE: c'est le serveur web et non le serveur de bases de données qui avait une heure erronée.
Hosting outage Saturday November 8, 2008: electric problem, database time problem
Par Mathieu le dimanche 9 novembre 2008, 19:00 - en
A fuse in the cabinet, where most of the Koumbit hosting servers are located, was overloaded and failed, in the night of November 8, 2008. Part of the servers were not available between 23h15 and 0h30, followed by other minor disruptions between 0h30 and 2h15.
Following this, the main web server of the shared hosting accounts did not recover correctly its time and was displaying 1970. This caused a few problems on some sites running content management content systems (sush as Spip and Drupal). The problem was noticed and fixed Sunday around 11h00.
Koumbit is about to open a second cabinet in a new point of presence. This is part of our 2008 architectural plan to increase redundancy and to deal with the growth of the demand. This will allow us, amongst other benefits, to avoid this type of outage, since the main shared hosting servers will be redundant between the two cabinets.
For questions or comments, you can comment on the sysadmin blog (offline.koumbit.net) or write to us at support@koumbit.org.
Thank you for your understanding.
Update, 16:47EST: it's the webserver and not the database server that had a clock problem.
dimanche 2 novembre 2008
Defective disc replacement on the MySQL server
Par Patrick le dimanche 2 novembre 2008, 21:13 - en
Who's affected?
All virtual servers will be affected as well as all sites hosted on the shared server that use MySQL. Therefore, most of the sites hosted by Koumbit.
When?
* Anticipated START TIME: Sunday, November 2nd 2008 at 16:00:00 EST * Anticipated END TIME: Sunday, November 2nd 2008 at 17:00:00 EST
What will happen?
The database server will be temporarily stopped in order to replace a defective disc.
Why?
One of the components of our RAID demonstrated a defect last night. No data was lost but it is important to replace the defective component to prevent the possibility of data loss from taking place.
How?
A technical (Antoine) will visit the data center to affect the replacement.
Remplacement d'un disque défectueux sur le serveur MySQL
Par Patrick le dimanche 2 novembre 2008, 21:04 - fr
Qui est affecté
Tous les serveurs virtuels ainsi que les sites hébergés sur le serveur mutualisé qui utilisent mysql. Donc la plupart des personnes qui sont hébergé chez Koumbit.
Quand
* DATE DE DÉBUT: dimanche 2 novembre 2008 16:00:00 EST * DATE DE FIN: dimanche 2 novembre 2008 17:00:00 EST
Ce qui va arriver
Le serveur de base de données sera temporairement éteint pour pouvoir remplacer un disque défectueux.
Pourquoi
Une des composantes de la matrice RAID a montré une défectuosité la nuit dernière. Aucune donnée n'a été perdue, mais nous préférons remplacer préventivement la composante fautive.
Comment
Un technicien (Antoine) se rendra au centre de donnée pour faire le remplacement.
mercredi 15 octobre 2008
Nouveau serveur web prêt aux tests, AlternC 0.9.9 en ligne
Par anarcat le mercredi 15 octobre 2008, 14:49 - fr
Qui est affecté
Dès maintenant, cet avis concerne les développeurs web qui maintiennent des sites sur l'hébergement mutualisé.
À partir de la semaine prochaine, tous les utilisateurs de l'hébergement sont concernés.
Quand
Lundi 20 octobre à 13h.
Ce qui va arriver
Un nouveau serveur web a été mis en ligne et a passé avec succès la phase de tests interne. Nous invitons maintenant les développeurs web et autres personnes techniquement capables de faire des tests sur le serveur pour la fin de la semaine.
Lundi prochain, le nouveau serveur sera mis en ligne dans le setup de redondance.
Pourquoi
Le nouveau serveur va assurer une meilleure continuité de service et une plus grande rapidité à répondre aux requêtes.
Comment
Quand une coupure surviendra sur un serveur à cause d'une surcharge, le second serveur prendra rapidement le relai (le délai est présentement réglé à 5 secondes). Même s'il n'Y a pas de surcharge, les serveurs vont se distribuer la charge, améliorant de beaucoup la performance générale.
Afin de tester immédiatement le nouveau serveur, les testeurs intéressés peuvent modifier leur fichier "hosts" en suivant les instructions à cette page:
https://wiki.koumbit.net/DnsWithHostsFile
L'adresse du nouveau serveur est la suivante: 209.44.112.96
Signalez tout problème à support@koumbit.org en précisant que vous croyez le problème relié au nouveau serveur et votre configuration ci-haut.
Autres annonces
Nous voulons profiter de cette annonce pour souligner la sortie de AlternC 0.9.9, qui règle plusieurs bugs dans l'interface d'administration et permet le déploiement sur plusieurs serveurs plus facilement.
De plus, notez que les annonces envoyées sur la liste de discussion hag@ sont maintenant marqués avec la langue du message. Vous pouvez filtrer les annonces que vous voulez recevoir sur cette page:
https://listes.koumbit.net/cgi-bin/mailman/options/hag-koumbit.org
Je suis contre!
Si cette intervention est trop problématique pour vous ou votre organisation, veuillez nous le laisser savoir dans les 24h pour voir si nous pouvons prendre des arrangements.
New webserver ready for testing, alternc 0.9.9 online
Par anarcat le mercredi 15 octobre 2008, 14:47 - en
Who's affected
This notice affects all web developers maintaining sites on the shared hosting services.
Staring next week, all the users are also affected.
When
Monday october 20th at 13h.
What will happen
A new web server has been put online and has successfully passed a serie of internal tests. We now welcome all web developpers and other technically capable people to test the new webserver during the week.
Next monday, the new server will be added to the load balancing setup.
Why
The new server will ensure a better service continuity and a faster response.
How
When an outage will occur on a server, because of an overload or other, the second server will take over (the delay is currently set to 5 seconds). Even when not during an overload, both servers will share the load, greatly improving overall performance.
To test the new server immediatly, all interested testers should modify their "hosts" files by following the instructions in the page below:
https://wiki.koumbit.net/DnsWithHostsFile
The IP address of the new server is the following: 209.44.112.96
Please notify us of any anomaly at support@koumbit.org, mentionning that you believe the problem is related to the new server and your configuration below.
Other announcements
We want to profit from this announcement to emphasize on the release of AlternC 0.9.9, which fixes many bugs in the control panel and allows for deployment on multiple servers easily.
Additionnaly, note that the announcements sent to the mailing list are now marked with the language of the message. You can therefore filter the announcements you want to receive on the following page:
https://listes.koumbit.net/cgi-bin/mailman/options/hag-koumbit.org
I object!
If this intervention is too problematic for your or your organisation, please let us know within 24h to see if we can make other arrangements.
lundi 6 octobre 2008
Coupure réseau ce matin
Par anarcat le lundi 6 octobre 2008, 12:09 - fr
Nous avons eu une coupure réseau durant la matinée, entre 7:43 et 8:43 (HAE). Les symptômes étaient des coupures réseau complètes, des ralentissements, des pertes de paquets. Il n'y avait pas grand chose à faire de notre côté, et la situation est revenue à la normale vers 9:30. Le problème était dû à un déni de service distribué (DDOS).
Network outage at main datacenter
Par anarcat le lundi 6 octobre 2008, 08:05 - en
We had a complete outage between 7:43 and 7:52. Between 7:56 and 8:43, we had around 50% packet loss, and that situation has now returned again. There isn't much we can do as we depend on our upstream provider to resolve the situation.
Update (9:19): situation back to normal again. It seems that our provider had stopped announcing its addresses to teleglobe, its main bandwidth provider.
Update (12:00): situation has returned to normal during the morning. It seems our upstream provider was victim of a large-scale distributed denial of service attack.
jeudi 25 septembre 2008
Redémarrages de sécurité et nouveau serveur web le 30 septembre
Par anarcat le jeudi 25 septembre 2008, 14:46 - fr
Qui est affecté
Tous les serveurs virtuels ainsi que les sites hébergés sur le serveur mutualisé.
Spécifiquement, les serveurs suivants sont touchés:
-
- chronos.koumbit.net ce qui affecte les serveurs virtuels:
-
homere.koumbit.net (hébergement)
-
- marius.koumbit.net ce qui affecte les serveurs virtuels:
-
- metis.koumbit.net ce qui affecte les serveurs virtuels:
-
- romulus.koumbit.net ce qui affecte les serveurs virtuels:
-
demeter.koumbit.net (base de données)
Quand
Le 30 septembre entre 14h30 et 15h00, HAE (-0400).
Ce qui va arriver
Les serveurs seront redémarrés pour une mise à jour de sécurité. De plus, un nouveau serveur physique sera ajouté à la configuration du répartiteur de charge.
Pourquoi
Le noyau Linux a vu plusieurs vulnérabilités publiées récemment et nous allons mettre à jour les machines.
Pour ce qui est du répartiteur de charge, il s'agit de régler les problèmes de fiabilité du service web et permettre une maintenance plus facile du serveur.
Comment
Voir le RapportsIntervention/2008-09-30 complet. Les serveurs seront redémarrés à tour de rôle entre 14:30 et 15:00. Ceci va affecter tous les serveurs virtuels ainsi que l'hébergement mutualisé, chaque coupure durant environ 90 secondes.
Le nouveau serveur (hesiode.koumbit.net) sera mis en ligne mais ne sera pas activé avant une nouvelle période de test, car il est possible que sa mise en ligne brise quelques sites ayant des besoins particuliers.
Je suis contre!
Si cette intervention est trop problématique pour vous ou votre organisation, veuillez nous le laisser savoir dans les 24h pour voir si nous pouvons prendre des arrangements.
Security reboots and new webserver online on september 30th
Par anarcat le jeudi 25 septembre 2008, 14:44 - en
Who's affected
Every virtual server and sites hosted on the shared hosting server.
Specifically, the followin servers are affected:
-
homere.koumbit.net - hosting
-
- marius.koumbit.net - which will affect:
-
- metis.koumbit.net - which will affect
-
demeter.koumbit.net - database server
When
September 30th between 14:40 and 15:00, EDT (-0400).
What will happen
The servers will be rebooted for a security update. Furthermore, a new physical server will be added to the LoadBalancing configuration.
Why
The linux kernel has suffered multiple security vulnerabilities recently and we therefore need to upgrade with the newer kernels.
As for the load balancer, the goal is to resolve the recent reliability problems and allow for an easier maintenance of the services.
How
See the complete report (fr). Servers will be rebooted one after the other between 14:30 and 15:00. This will affect all virtual servers as the shared hosting, each outage lasting around 90 seconds.
The new server (hesiode.koumbit.net) will be put online but will not be activated before a new test period, as it is possible the new server breaks when displaying certain sites.
I object!
If this operation is too problematic for you or your organisation, please let us know within 24h to see if we can arrange otherwise.
mardi 16 septembre 2008
Coupure d'un serveur DNS récursif aujourd'hui
Par anarcat le mardi 16 septembre 2008, 13:19 - fr
Qui est affecté
Les serveurs hébergés en colocation, y compris, sans se limiter à: remus.koumbit.net, hesiode.koumbit.net, alexandria.koumbit.net et metis.koumbit.net.
Quand
Aujourd'hui 16 septembre, entre 17:45 et 18:15, HAE (-0400).
Ce qui va arriver
Le serveur hébergeant un des serveurs virtuel résolvant les noms de domaines pour le cabinet (209.44.112.71, recurse2.koumbit.net) sera remplacé, occasionnant une coupure d'environ 30 minutes de ce service. L'autre serveur DNS (209.44.112.70, recurse.koumbit.net) devrait continuer à effectuer le service normalement et nous croyons que ceci ne devrait pas occasionner de problème majeurs.
Pourquoi
Le serveur (remus.koumbit.net) est en fin de vie et doit être remplacé. Il sera transformé en serveur de sauvegarde massif (alexandria.koumbit.net).
Comment
Voir les détails du rapport d'intervention. À noter que remus.koumbit.net va maintenant s'appeler metis.koumbit.net. Nous allons également mettre en ligne un nouveau serveur, hesiode.koumbit.net.
recursive DNS service outage today
Par anarcat le mardi 16 septembre 2008, 13:17 - en
Who is affected
Colocated servers, especially remus.koumbit.net, hesiode.koumbit.net, alexandria.koumbit.net and metis.koumbit.net.
When
Today september 16th, between 17:45 and 18:15, EDT (-0400).
What will happen
The server hosting one the virtual servers resolving DNS for the cabinet (209.44.112.71, recurse2.koumbit.net) will be replaced, provoking a short outage of around 30 minutes of this service. The other server (209.44.112.70, recurse.koumbit.net) should continue to perform regular service and we therefore believe that this will have minimal impact on the infrastructure.
Why
The server (remus.koumbit.net) is approaching end of life and needs to be replaced. It will be transformed into a massive backup server (alexandria.koumbit.net).
How
Koumbit members can read the details of the operational report. Note that remus.koumbit.net will now be named metis.koumbit.net. We will also put a new web node online name, hesiode.koumbit.net.
jeudi 11 septembre 2008
Panne du serveur mysql
Par Patrick le jeudi 11 septembre 2008, 20:05 - fr
Le serveur mysql principal (demeter) de l'hébergement auto-géré est présentement hors-service. Nous travaillons présentement à son rétablissement.
Désolé pour les inconvénients reliés à cette coupure inhabituelle.
Update: la coupure a duré de 13:23 à 14:08. Tous les services web et mails ont été affectés, mais aucun mail ne devrait avoir été perdu. Le problème est relié à un autre crash serveur. Les membres de Koumbit peuvent consulter le rapport complet.
« billets précédents - page 2 de 5 - billets suivants »
