csic - tareas #5937 - proyectos.softwarelibre.edu.uy · como se estaba manejando la opción de...

4
CSIC - Tareas #5937 Problemas central telefónica CSIC 03/01/2018 11:50 AM - Sebastián Sasías Status: En curso Start date: 02/23/2018 Priority: Inmediata Due date: Assignee: CSIC - Informática y redes % Done: 90% Category: Estimated time: 0.00 hour Target version: Spent time: 27.80 hours Description Luego de un reinicio la central telefónica dejó de funcionar. History #1 - 03/01/2018 12:01 PM - Sebastián Sasías - Status changed from Nueva to En curso - % Done changed from 0 to 10 A las 3:00 AM del día 23/02 reinicié la central ya que no se podía acceder a la interfaz web. El problema lo había detectado hacía un par de semanas y no se solucionaba reiniciando el servicio apache por terminal. A raíz de necesitar el jueves 22/02 hacer cambios decidí hacer un reinicio del servidor en el correr de la madrugada del viernes. #2 - 03/01/2018 04:04 PM - Sebastián Sasías - % Done changed from 10 to 20 Lo primero que veo en la mañana del viernes 23/02 es que ningún teléfono está registrado, pruebo ingresar a la interfaz web de administración y sigue con los mismos problemas (presenta una página totalmente en blanco). Reinicio nuevamente el servidor por ssh. Al volver a encender los problemas persisten, ningún teléfono registrado, interfaz web inaccesible. Acá noto que a través de la ip sí puedo acceder a la interfaz y me logueo sin problemas. Lo primero que sospecho es algún problema de resolución DNS con ipv6 así que desactivo ipv6 en el servidor y verifico nuevamente el ingreso por nombre de dominio pero sin éxito. Esto pasa a ser un problema secundario así que sigo investigando el problema de los teléfonos. Luego de ciertos minutos vuelvo a perder el acceso web a través de la ip y recupero el acceso por nombre de dominio después de haber estado varias semanas sin funcionar, todo muy raro. Pido colaboración al grupo de informáticos para resolver el problema, Andrés detecta que la pestaña de administración PBX no es accesible (página en blanco o error 500 según navegador). Viendo los logs, el último es un warning con la base de datos pero es de marzo de 2017, el resto o está vacío o tiene fecha similar, parece coincidir con la fecha de actualización de la central con "yum update" por problemas funcionales en aquella oportunidad. También le otorgo acceso ssh y permiso sudo pero no logra ver nada. La consola de "rasterisk" no genera reportes en pantalla en tiempo real, al no estar los teléfonos registrados debería mostrar intentos de conexión continuos fallidos al menos. Esto es muy raro, murió asterisk? El último intento de revivir la central es actualizarla nuevamente con "yum update" pero fallan los repositorios, siguiendo una recomendación de Victor Alem con la central cucel (tarea #5711), procedo a hacer algo similar. 09/27/2018 1/4

Upload: dangthuy

Post on 27-Sep-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CSIC - Tareas #5937 - proyectos.softwarelibre.edu.uy · Como se estaba manejando la opción de migrar a FreePBX opto por realizar una instalación de la misma pero en el medio se

CSIC - Tareas #5937

Problemas central telefónica CSIC

03/01/2018 11:50 AM - Sebastián Sasías

Status: En curso Start date: 02/23/2018

Priority: Inmediata Due date:

Assignee: CSIC - Informática y redes % Done: 90%

Category: Estimated time: 0.00 hour

Target version: Spent time: 27.80 hours

Description

Luego de un reinicio la central telefónica dejó de funcionar.

History

#1 - 03/01/2018 12:01 PM - Sebastián Sasías

- Status changed from Nueva to En curso

- % Done changed from 0 to 10

A las 3:00 AM del día 23/02 reinicié la central ya que no se podía acceder a la interfaz web. El problema lo había detectado hacía un par de semanas y no

se solucionaba reiniciando el servicio apache por terminal.

A raíz de necesitar el jueves 22/02 hacer cambios decidí hacer un reinicio del servidor en el correr de la madrugada del viernes.

#2 - 03/01/2018 04:04 PM - Sebastián Sasías

- % Done changed from 10 to 20

Lo primero que veo en la mañana del viernes 23/02 es que ningún teléfono está registrado, pruebo ingresar a la interfaz web de administración y sigue con

los mismos problemas (presenta una página totalmente en blanco).

Reinicio nuevamente el servidor por ssh.

Al volver a encender los problemas persisten, ningún teléfono registrado, interfaz web inaccesible. Acá noto que a través de la ip sí puedo acceder a la

interfaz y me logueo sin problemas. Lo primero que sospecho es algún problema de resolución DNS con ipv6 así que desactivo ipv6 en el servidor y

verifico nuevamente el ingreso por nombre de dominio pero sin éxito. Esto pasa a ser un problema secundario así que sigo investigando el problema de los

teléfonos.

Luego de ciertos minutos vuelvo a perder el acceso web a través de la ip y recupero el acceso por nombre de dominio después de haber estado varias

semanas sin funcionar, todo muy raro.

Pido colaboración al grupo de informáticos para resolver el problema, Andrés detecta que la pestaña de administración PBX no es accesible (página en

blanco o error 500 según navegador).

Viendo los logs, el último es un warning con la base de datos pero es de marzo de 2017, el resto o está vacío o tiene fecha similar, parece coincidir con la

fecha de actualización de la central con "yum update" por problemas funcionales en aquella oportunidad.

También le otorgo acceso ssh y permiso sudo pero no logra ver nada.

La consola de "rasterisk" no genera reportes en pantalla en tiempo real, al no estar los teléfonos registrados debería mostrar intentos de conexión

continuos fallidos al menos. Esto es muy raro, murió asterisk?

El último intento de revivir la central es actualizarla nuevamente con "yum update" pero fallan los repositorios, siguiendo una recomendación de Victor Alem

con la central cucel (tarea #5711), procedo a hacer algo similar.

09/27/2018 1/4

Page 2: CSIC - Tareas #5937 - proyectos.softwarelibre.edu.uy · Como se estaba manejando la opción de migrar a FreePBX opto por realizar una instalación de la misma pero en el medio se

Como allí se menciona quito los repos de CentOS y dejo solo los de elastix y epel pero esto da problemas, así que vuelvo a colocar los de CentOS y quito

los de epel. En esta ocasión corre una gran actualización sin problemas pero al final de la misma el problema con la central persiste, todo se encuentra

exactamente en la misma situación que al inicio.

En este punto doy por perdida la central y me inclino por instalar un nuevo servidor.

#3 - 03/01/2018 05:02 PM - Sebastián Sasías

- % Done changed from 20 to 30

Como se estaba manejando la opción de migrar a FreePBX opto por realizar una instalación de la misma pero en el medio se me presenta la opción de

que paquetes instalar y hay gran variedad de opciones, si bien la opción de FreePBX con GUI parece la mas acertada tampoco creo que sea la única

viable y suponiendo que mas adelante se puedan presentar dificultades al momento de la configuración opto por descartar esta opción y estudiarla con

tiempo mas adelante. En este momento es de urgencia dejar la central nuevamente funcional.

Como segunda opción descargo la última versión de Elastix que es la 5.0, en este caso finaliza todo correctamente sin ningún tipo de dudas pero al

ingresar por web exige un registro en 3CX, así que vuelvo a descartar esta opción.

La opción definitiva es utilizar la versión de Elastix 4.0 que es la que estaba funcionando hasta estos días, nuevamente finaliza sin problemas.

Al finalizar el viernes (y luego de transcurrir la totalidad del día sin teléfonos) queda pronta la nueva central para ser configurada, aprovecho el fin de

semana para trabajar con mas tranquilidad.

#4 - 03/01/2018 05:10 PM - Sebastián Sasías

- % Done changed from 30 to 50

Una vez dentro procedo a configurar todo de acuerdo a la tarea #5223. El único problema que se me presenta es que luego de encender el servidor y

cada vez que se reinicia hay que bajar y volver a subir la placa eth1 que es la que tiene la ip de ANTEL si no la comunicación no se establece. Esto es

extraño, en el servidor anterior no pasaba, fuera de eso todo fue simple.

Aquí las llamadas desde afuera hacia la central vuelven a funcionar.

Se vuelven a configurar todos los internos uno por uno y se empiezan a registrar sin problemas. Las rutas entrantes y salientes, las condiciones de

tiempo, el IVR y grupos y colas de timbrado se vuelven a pensar y configurar desde cero ya que la página web de admin del apartado de PBX de la vieja

central muestra una página en blanco.

La otra opción sería copiar los archivos de asterisk de la vieja central y migrarlos a la nueva pero estoy seguro de cuales serían puntualmente y en

principio me inclino por reconfigurar todo nuevamente.

Lo único que respaldo de la anterior central y subo a la nueva son los archivos de autoaprovisionamiento, el firewall (aunque está protegida por planck) y

los audios de la IVR (los tengo que subir a través de la interfaz web ya que copiándolos a mano dentro del directorio y aún teniendo los permisos y

propietario correspondiente no se visualizan).

#5 - 03/01/2018 05:15 PM - Sebastián Sasías

- % Done changed from 50 to 60

El día domingo ya tengo configurado todo a grandes razgos, solo ajusto algunas pequeñas cosas y hago llamadas de prueba, logro hablar con Pablo y me

comenta que ha utilizado el servicio las últimas horas sin problemas. El día lunes estando en CSIC probaré todo con mas precisión.

09/27/2018 2/4

Page 3: CSIC - Tareas #5937 - proyectos.softwarelibre.edu.uy · Como se estaba manejando la opción de migrar a FreePBX opto por realizar una instalación de la misma pero en el medio se

#6 - 03/01/2018 05:24 PM - Sebastián Sasías

- % Done changed from 60 to 70

Estando en CSIC no veo problemas, solo realizar algún pequeño ajuste como el sonido de timbrado del portero y no mucho mas. Las llamadas entran y

salen sin problemas y todo cae en las colas correspondientes.

#7 - 03/01/2018 05:36 PM - Sebastián Sasías

En el correr del lunes Sergio me comenta que tuvo problemas para hablar con Judith, los teléfonos suenan pero no se oye audio, al parecer hay algunos

teléfonos que presentan este problema.

Esto es muy similar al problema de comunicación entre internos que tuvimos cercano a marzo de 2017 por un par de meses y no esperaba encontrarme

con esto en una instalación limpia. En aquella ocasión lo único que lo solucionó fue realizar un "yum update" a la central pero en consecuencia quedó con

ciertos problemas de lentitud que se veían claramente al ingresar por web, al aplicar cambios, en las colas de llamada y al momento de lanzar una

grabación manual en una llamada.

Tomando en cuenta esto decido hacer un "yum update" para intentar corregir el problema pero en esta ocasión, y como realizó Víctor en la tarea #5711,

solo de los repositorios de elastix para comprometer lo menos posible la estabilidad del sistema. De todas formas voy a hacer una clonación del servidor y

trabajar sobre ella, si algo falla no tengo tiempo para empezar desde cero nuevamente ya que tengo que trabajar luego de las 22hs porque necesito

apagar la central y comprometer lo menos posible el servicio a los usuarios.

#8 - 03/01/2018 05:51 PM - Sebastián Sasías

- % Done changed from 70 to 80

cercano a las 22:30hs apago la central y pruebo realizar una clonación, lamentablemente en el servidor no hay espacio y luego de algún esfuerzo me

resigno a borrar a Bell roto. Con el viejo Bell borrado queda espacio suficiente para la clonación.

Luego de finalizada el único problema es que tengo que cambiar la MAC address en los archivos cfg.eth0 y cfg.eth1 por las nuevas, con eso hecho el

servidor funciona sin inconvenientes.

Quito los repositorios de CentOS y epel e intento lanzar una actualización solo con los de elastix pero da problemas de dependencias así que vuelvo a

colocar los de CentOS y lanzo nuevamente la actualización. En esta ocasión avanza mas pero igualmente da problemas por lo que al final vuelvo a

colocar todos los repositorios y lanzar la actualización (con la central anterior los repositorios epel daban problemas).

En esta oportunidad se descarga y aplica una gran actualización sin problemas y al finalizar compruebo al menos que la interfaz web no presenta ningún

problema de lentitud, los teléfonos siguen registrados y la llamada de prueba a CSIC funciona.

Queda comprobar al otro día si esto fue efectivo.

#9 - 03/01/2018 05:55 PM - Sebastián Sasías

Al finalizar el martes no parece haber problemas de comunicación entre internos.

Lo único que me comentan es que hay problemas para salir a teléfonos urbanos que empiezan con el 4, error mío no colocar el 4 como salida para dichas

líneas, lo hago.

#10 - 03/01/2018 06:01 PM - Sebastián Sasías

09/27/2018 3/4

Page 4: CSIC - Tareas #5937 - proyectos.softwarelibre.edu.uy · Como se estaba manejando la opción de migrar a FreePBX opto por realizar una instalación de la misma pero en el medio se

Con la central funcionando bien hasta el momento agrego los troncales con el resto de los CENURES. Con Rivera y Salto no se establece la

comunicación.

En este punto lo único que parece faltar es la ruta de marcación a números internacionales, pero para ello le tengo que pedir a Sergio el set de PINes que

le fue dado en su momento.

#11 - 03/01/2018 06:15 PM - Sebastián Sasías

- % Done changed from 80 to 90

Ahora quiero hacer el cambio de configuración que prentendía hacer inicialmente y no había podido y que concluyó con el reinicio del servidor y el

desastre.

El ex teléfono de Leroy lo instalé en la oficina de Cecilia Tomassini y Natalia Grass, es conveniente cambiar el número y la etiqueta de ese teléfono.

Acá me surge un problema extraño, hago los cambios en el archivo .cfg correspondiente y al aprovisionar el teléfono no los toma y sigue aprovisionándose

con los datos viejos. Parece en principio ser un problema de edición sobre el correcto archivo pero luego de verificado y reverificado esto queda

descartado, el archivo es el correcto... y no hay dos.

Reinicio el teléfono de fábrica y al aprovisionarse vuelve a hacerlo de la misma forma.

Pruebo con mi teléfono, cambio varios valores, reinicio de fábrica y también pasa lo mismo, siempre toma los valores viejos.

Pruebo borrar el archivo correspondiente de la carpeta /tftpboot y el resultado es el mismo, sospecho que la actualización habrá cambiado la carpeta de

autoprovisión y copiado los archivos a la nueva.

Dentro de /var/lib hay una carpeta tftpboot pero está vacía. Haciéndo una búsqueda por nombre de archivo en todo el sistema no encuentro otra ubicación

para ellos. Hasta ahora un misterio este comportamiento.

09/27/2018 4/4