En el trabajo tenemos un cluster Asterisk formado por dos servidores Proliant y un foneBRIDGE2 de Redfone que controla las líneas RDSI. El servicio heartbeat está instalado en ambos servidores, y se encarga de monitorizarlos y alternar el servicio en caso de que el nodo principal caiga, migrando la IP principal y levantando todos los procesos necesarios. Voy a explicar brevemente nuestra configuración como referencia para otros usuarios que se estén empezando a pelear ahora con el foneBRIDGE.
Visión general
Como he comentado tenemos dos servidores Asterisk, llamados asterisk00 y asterisk01.example.com, siendo el primero de ellos el master del servicio. Cada uno tiene su dirección IP (10.10.10.1 y .2) y aparte hay otra IP “virtual” (.3) que va a “saltar” de un nodo al otro si el principal se queda colgado.
Nuestro foneBRIDGE2 es un modelo “quad” para 4 líneas RDSI, pero sólo usamos dos: una al proveedor de telefonía y la otra a una centralita antigua. Aparte de los conectores para las RDSI, el foneBRIDGE tiene dos puertos ethernet para conectarlo a los servidores, pero sólo admite comandos de configuración para inicializarlo, cambiar de servidor, etc. en uno de ellos (el primero). Normalmente lo que se haría es poner un switch en éste puerto ethernet y conectar ahí todos los servidores del cluster, para que todos puedan configurar el FB en caso de necesidad, pero mi jefe se empeñó en ver éste switch como un punto de fallo y se negó a usarlo, una opinión que no comparto ya que tiene otras desventajas que vamos a ver. Así que nuestra configuración es un tanto peculiar, ya que asterisk01 (el backup) está conectado al puerto principal del FB mientras que asterisk00 está conectado al secundario. La lógica detrás de ésta decisión es: asterisk00 va a estar en marcha el 99% del tiempo, y cuando se cuelgue, será asterisk01 quien se deberá encargar de reconfigurar el FB, así que es asterisk01 quien realmente va a controlar las caídas y reconfiguraciones del FB y necesita acceso al puerto de configuración. Pero por supuesto, ahora quien es un punto de fallo en nuestra configuración es asterisk01: si el servidor de backup se nos cae por cualquier motivo, nos arriesgamos a perder el control del FB dejando el cluster inutilizable.
Usamos el interfaz web FreePBX, que a su vez utiliza una base de datos mySQL para almacenar toda la configuración. Si no usas FreePBX, puedes ignorar cualquier mención tanto al mySQL como al Apache.
Sincronización de mySQL
El clustering nativo ndb de mySQL nos va a resultar muy útil aquí. Se configura, se mantiene el servicio en marcha en todo momento en ambos nodos, y el sistema de BD se encarga de la sincronización de forma automática a través de todos los servidores.
La configuración de un cluster mySQL se sale del ámbito de éste documento. Te recomiendo consultar la documentación oficial aquí o bien buscar algún howto en el Google. :)
Sincronización de ficheros
Tenemos que mantener sincronizados en todos los servidores del cluster todos los ficheros de configuración del Asterisk, librerías, módulos, los buzones del voicemail… Hay varias alternativas.
- Una SAN. Cara pero muy cómoda. Nosotros no tenemos una así que queda descartada. :)
- DRBD. Si no lo conoces, piensa en él como un RAID1 a nivel de partición pero por red. Funciona de maravilla, lo usamos en clusters de otros servicios y no nos ha dado ningún problema, pero no aquí. La única pega del DRBD es que la partición a sincronizar sólo puede estar montada en uno de los dos servidores, el activo en un momento dado, y nosotros queríamos la comodidad de tener todos los ficheros accesibles en ambos servidores para poder usar el backup como “banco de pruebas” de nuevas configuraciones o actualizaciones del software.
- csync2. Es un rsync con esteroides. Similar al unison, pero capaz de sincronizar ficheros entre más de dos servidores. Es la opción que usamos en nuestro cluster Asterisk.
Nuestro fichero csync2.conf tiene éste aspecto:
[code lang="bash"]
group asterisk
{
host asterisk00.example.com asterisk01.example.com;
key /etc/csync2.key_asterisk;
backup-directory /var/backups/csync2;
backup-generations 10;
auto none;
exclude *~ .* ok lock control;
include /etc/csync2.cfg;
include /etc/hosts;
include /etc/ha.d/ha.cf;
include /etc/ha.d/haresources;
include /etc/asterisk;
include /etc/redfone*;
include /var/www;
include /var/lib/asterisk;
include /var/spool/asterisk;
include /usr/lib/asterisk;
include /etc/amportal.conf;
include /var/log/asterisk;
}
[/code]
Lanzamos una sincronización cada cinco minutos. No hay necesidad de hacerlo tan a menudo, y de hecho podríamos lanzarla cada media hora o una hora, ya que en un sistema estable no va a haber tantos cambios (añadir alguna extensión cada X semanas) y rara vez usamos los buzones de voz. La sincronización se lanza desde un cron en /etc/cron.d/FB-csync2:
[code lang="bash"]
*/5 * * * * root [ -f /tmp/.FB-master ] && /usr/sbin/csync2 -xv
[/code]
Éste fichero /tmp/.FB-master es un fichero “centinela” que marca el servidor principal en cada momento, de forma que ésta sincronización sólo se lance desde ése nodo. En la sección del heartbeat veremos dónde y cómo se crea.
fonulator
fonulator es la utilidad de Redfone para configurar el foneBRIDGE. Como ya he comentado antes, en nuestra configuración sólo asterisk01 (el servidor de backup) tiene acceso al puerto de configuración del FB, y cada uno de los servidores está conectado a un puerto ethernet distinto. Así que cuando un servidor cae, tenemos que cambiar el servidor destino de las tramas TDMoE y TAMBIÉN el interfaz ethernet a través del cual las manda el FB.
Para ello tenemos preparados dos ficheros de configuración independientes, redfone_asterisk00.conf y redfone_asterisk01.conf. Son iguales salvo por los comandos “serverX” y “fbX” de cada “span”:
[code lang="bash"]
[globals]
fb1=00:50:C2:65:D0:68
fb2=00:50:C2:65:D0:69
# asterisk00.example.com
server1=00:80:5A:61:E7:FF
# asterisk01.example.com
server2=00:04:76:11:A3:EC
card=eth1,fb1
# Telco
[span1]
span=1,0,0,ccs,hdb3,crc4
server1
fb2
pri
# Legacy PBX
[span2]
span=2,0,0,ccs,hdb3,crc4
server1
fb2
pri
[/code]
Eso era redfone_asterisk00.conf. Configura el FB para mandar el tráfico RDSI a asterisk00 (server1) a través del segundo interfaz ethernet (fb2). El fichero redfone_asterisk01.conf usa server2 y fb1.
heartbeat
Sólo nos queda la pieza final que une al resto: heartbeat. Nuestro fichero haresources es así:
[code lang="bash"]
asterisk00.example.com MailTo::asterisk@example.com::Asterisk 10.10.10.3 FB_fonulator FB_master FB_asterisk apache2
[/code]
Que significa que:
- asterisk00.example.com es el master
- cada vez que se intercambie el servicio, se mandará un mail a asterisk@example.com
- la IP virtual del servicio es la 10.10.10.3
- arrancar (parar) los servicios FB_fonulator, FB_master, FB_asterisk y apache2 (recuerda eliminar el enlace al apache2 en /etc/rc2.d, no queremos que se lance en el inicio del sistema si no que heartbeat se encargará de manejarlo)
Veamos ahora los scripts. FB_fonulator ejecuta el programa fonulator para configurar el foneBRIDGE y dirigir el tráfico TDMoE al servidor que toque. Un detalle importante es que, aunque el script se lance en ambos servidores, sólo tendrá efecto cuando se lanza desde asterisk01 que es quien está conectado al puerto de configuración del FB:
[code lang="bash"]
#!/bin/sh
# Chech who I am and who the other host is
THISHOST="`hostname|cut -d. -f1`"
if [ "$THISHOST" == "asterisk00" ]
then
OTHERHOST="asterisk01"
else
OTHERHOST="asterisk00"
fi
# Bail out if there is no config file
F="/etc/redfone_$THISHOST.conf"
[ ! -f "$F" ] && exit 0
# Guess the appropiate interface card
export ETH=`grep -E "^card=" "$F" | cut -d= -f2 | cut -d, -f1`
case "$1" in
start)
echo "Fonulating..."
/usr/local/bin/fonulator -s -t 1 "/etc/redfone_$THISHOST.conf"
;;
stop)
/usr/local/bin/fonulator -s -t 1 "/etc/redfone_$OTHERHOST.conf"
;;
restart|status)
echo "Fonulator $1"
exit 0
;;
esac
exit 0
[/code]
FB_master crea el fichero “centinela” /tmp/.FB-master que ya habíamos mencionado, y fuerza una sincronización tanto en el arranque (para asegurarnos que ambos servidores están sincronizados en el inicio) como en la parada (para devolver al master cualquier cambio que haya podido haber mientras el servicio estaba en el backup):
[code lang="bash"]
#!/bin/sh
F=/tmp/.FB-master
case "$1" in
start)
touch "$F"
# Activate log rotation
ln -sf /etc/asterisk/asterisk.logrotate /etc/logrotate.d/asterisk
# Force sync of these dirs
csync2 -fr /var/
csync2 -fr /etc/asterisk/
csync2 -xv
;;
stop)
if [ -f "$F" ]
then
# De-activate log rotation
rm -f /etc/logrotate.d/asterisk
# Force a last minute sync to the new master
csync2 -fr /var/
csync2 -fr /etc/asterisk/
csync2 -xv
rm -f "$F"
fi
;;
esac
exit 0
[/code]
Por último, FB_asterisk lanza el servicio Asterisk en sí. Usamos mis scripts para manejar Asterisk con daemontools, así que básicamente lo único que tiene que hacer éste script es un “svc -u/-d /service/asterisk”:
[code lang="bash"]
#!/bin/sh
case "$1" in
start)
echo "Starting Asterisk..."
# Check if Asterisk is already running
if /usr/sbin/asterisk -r -x "quit"
then
echo "Already running"
exit 0
fi
# Just in case...
rm -f /service/*
# Link services and start them up
ln -sf /etc/asterisk/services/asterisk/ /service/asterisk
ln -sf /etc/asterisk/services/fopserver/ /service/fopserver
svc -u /service/*
;;
stop)
echo "Stopping Asterisk ..."
svc -d /service/*
rm -f /service/*
;;
restart)
echo "Restarting Astarisk ..."
svc -t /service/*
;;
reload)
echo "Reloading Asterisk ..."
/usr/sbin/asterisk -r -x "reload"
;;
status)
echo "Checking Asterisk's status ..."
/usr/sbin/asterisk -r -x "quit" && exit 0 || exit 1
;;
esac
exit 0
[/code]
Descargas
Todos los scripts y ficheros de configuración comentados están disponibles aquí. Piensa en ellos como una base sobre la que empezar a hacer pruebas y construir tu propia configuración. Y agradeceré si alguien me envía mejoras, errores que hayáis podido encontrar, etc. :)
Comentarios