Monitorización: la necesitas, ¿lo sabías?
- jogofus
- 28 mar
- 5 Min. de lectura

Una de las pocas cosas que no se puede permitir una empresa es la no continuidad del negocio, y nosotros como departamento de IT debemos estar alineados con esa necesidad.
Hay muchas cosas que se escapan a lo que podemos controlar, pero esta entrada va dirigida a todo aquello que está en nuestras manos.
No sé si os ha pasado alguna vez, pero voy a contaros una breve historia que a mí sí me sucedió:
Entré a trabajar a una empresa, sustituyendo a la persona que llevaba todo el tema de sistemas y redes en la empresa. Era una empresa "pequeña", por lo que el dueño consideraba que una única persona era más que suficiente (y estoy seguro de que en algún momento se planteó la idea de que eramos prescindibles).
Imaginadme a mí, todo nuevo en la empresa, tratando de crear buena impresión, cuando de repente se me acerca uno de los "altos cargos" de la empresa para decirme que tal servicio no funciona.
-¿Tú eres el nuevo de sistemas, no?
+Sí, ¿qué necesitas?
-Pues nada, el ERP no funciona y llevamos parados desde ayer.
De repente empezaron a correrme sudores fríos, me quedé blanco... Mi cara tuvo que ser un poema. Pero al parecer estaban acostumbrados en esa empresa a que los servicios dejaran de funcionar de repente y que, hasta que no saltara la liebre, no se solucionaba el problema (que generalmente, el anterior sysadmin solucionaba con un reinicio).
-¿Cómo había podido pasar? ¿Cuándo, exactamente? ¿Qué ha hecho que deje de funcionar?
Muchas incógnitas, pero solo una respuesta clara:
-Resuelve el maldito problema y monta un sistema de monitorización.
Tras resolver el problema, hablé con dirección para proponerles que durante un par de jornadas las tenía que dedicar a montar un sistema de monitorización.
-¿Realmente lo necesitamos?
+Rotundamente, sí.
-¿Por qué? Es perder tiempo en montar algo que no nos va a servir para nada.
+Si quieres que me pueda adelantar a lo que pueda pasar y actuar de forma proactiva para evitar que tengas a 30 personas paradas, con la pérdida de dinero que eso supone, necesito poder tener una visión global de lo que pasa en toda la infraestructura.
Dicho y hecho, se montó un sistema de monitorización que me avisaba en tiempo real de lo que pasaba, antes incluso de que el usuario se diera cuenta. Además, me adelanté y monté un sistema de gestión de logs centralizado para poder ver por qué pasaba lo que pasaba.
¿Por qué un sistema de monitorización?
Si pudieras evitar ir al taller y que te claven una factura de 3000€ porque has podido ver antes de que se rompiera algo y lo has solucionado, evitando así que pudiera romper algo más, ¿lo harías?
La monitorización, en su base más básica -valga la redundancia- te permite ver en tiempo real lo que está pasando y adelantarte antes de que la empresa se quede paralizada. Evidentemente, un sistema de alertas por sí solo no es efectivo 100%. Necesitas, además de los conocimientos técnicos, leer logs y ser previsor.
Te permite mandar alertas en base a unas necesidades, sacar métricas (esto es bueno si quieres reducir costes en infraestructura), y adelantarte a cualquier problema que pueda suceder.
Esto no solo garantiza la continuidad del negocio, sino que te evita una bronca por parte de tus jefes.
¿Qué sistemas de monitorización?
Bueno, aquí pasa como con las distros de Linux: hay sabores para todo tipo de gustos. Aunque bien es cierto que la gran mayoría tienen una base muy conocida: Nagios.

Cuando empecé con el tema de la monitorización me enamoré profundamente de Nagios, a pesar de su falta de gráficas, me permitía tener controlado todo lo que pasaba en la infraestructura: Si un servicio se caía, antes de oír el tipico "esto no funciona" yo ya lo había solucionado.
Pero los tiempos avanzan y tenemos más necesidades, sobretodo cuando la infraestructura (y la empresa) crece.
Ayer, en una charla entre colegas de un canal de telegram, un compañero mencionó que tenía unas 540 máquinas virtuales en Proxmox. ¿Os imagináis tener todo eso y no saber qué está pasando? O lo que es peor de todo, ¿que algo caiga y provoque un efecto dominó? Y que esto, además, repercuta en clientes, y por ende, en la reputación de tu empresa.
Es algo por lo que yo no quiero pasar, la verdad.
¿Qué sistemas de monitorización existen? Básicamente, los reduzco en dos tipos: los con agente y los agentless, siendo estos ultimos generalmente por SNMP.
Aquí dejo una pequeña lista, podéis utilizar el que más os guste o más se adapte a vuestras necesidades:
Nagios -> La vieja confiable, el precursor de todo.
Zabbix
Centreon
CheckMk
Icinga2
Cacti
Prometheus
PRTG
Observium
LibreNMS
SolarWinds
Y podría seguir, pero creo que os hacéis una idea, ¿verdad?
Mis imprescindibles
No podía terminar esta entrada sin poner los que más uso yo y con los que más cómodo me siento.
En primer lugar, para monitorización de infraestructura datacenter (servidores y servicios) uso Zabbix. Tiene una curva de aprendizaje bastante pronunciada, pero merece la pena, de verdad.

Para poder usarlo se necesita un agente en el servidor a monitorizar que se conecte con la consola principal.
Además de monitorizar el estado de los servicios, también te permite sacar métricas de uso de RAM y CPU (por ejemplo, tiene de muchas cosas más) y personalizar los dashboards al gusto.
Tiene integración para alertas de muchas variantes, entre ellas Telegram y correo (las imprescindibles).
Con esto no solo veo si hay algo que no funciona, sino que puedo ver si hay algo que está sobredimensionado y poder reducir costes. O ver si en algún momento ha habido un pico de CPU o RAM y poder estudiar el motivo.
Otra bondad que tiene es que el agente se puede conectar al servidor mediante una psk, asegurando así la conexión entre cliente-servidor.
Además, -y como muchos otros sistemas de monitorización- permite tener un sistema distribuido.
¿Cómo funciona esto? Tienes un servidor central que es el que recoge los datos y muestra los dashboards, pero si tuvieras 10 sedes distintas, cada servidor de cada sede mandaría sus datos a un servidor zabbix proxy, y este mandaría los datos comprimidos al central, ahorrando ancho de banda y capacidad de procesamiento en el servidor central.
Como he dicho antes, aquí va al gusto de la persona que lo vaya a montar y gestionar.
Para electrónica de red, para mí el esencial es Observium. Se conecta por SNMP a los switches, AP, firewall y te saca gráficas en tiempo real de tráfico, CRC, tablas ARP... Es una gozada, la verdad.

Cuando un usuario me dice que le va lenta la red lo primero que hago es mirar Observium. Quizá su puerto del switch tiene un problema, quizá el switch está saturado, quizá es el firewall...
Resumiendo.
Al final, cada uno maneja su infraestructura como quiere. Pero creo que todos coincidimos en que queremos dormir tranquilos por las noches, y para eso, aparte de ser proactivos, tenemos que disponer de un sistema de monitorización que nos avise de forma activa de lo que está pasando en nuestros sistemas para poder actuar lo más rápido posible.
Y para finalizar...
Me gustaría dedicar estas líneas para poder ayudar en una causa necesaria. Estamos recaudando fondos para ayudar a, Ellie una niña de 8 años con TEA, que necesita un perro de asistencia de la Asociación DogPoint.
Podéis colaborar dede el siguiente enlace: https://www.migranodearena.org/reto/un-amigo-para-ellie
Además, os podéis desgravar el 80% de lo que aportéis.
Animaros y colaborad por una buena causa.





Voy a darle una oportunidad a estas dos fantásticas "Zabbix y Observium" herramientas. Veo que has mencionado varias herramientas, hubiera estado bien una pequeña comparativa sobre que te ofrece cada una que no tenga otras.
Muy buen post Jose.