Dạo này bân quá ae ạ. Nay tôi mới có thể sx được thời gian ngồi viết nè ae. Để câu “like” tôi đặt cái chủ đề hơi kêu một tí “Comprehensive monitoring system” - Nói cho “đao to búa lớn” chứ đại loại ae hiểu là những chia sẻ nhỏ của tôi về xây dựng hệ thống monitoring - Đây là những kinh nghiệm “none tech” mà tôi gói gém được trong t/g cùng ae tham gia build hệ thống monitor của trung tâm.

Intro cpu

0. Thí chủ đã có “monitoring system” chưa?

Tôi không nói về tầm quan trọng của hệ thống monitor với các ace đã lâu năm trong ngành nữa =)) vì nó quá ư là hiển nhiên rồi. Với một cty nhỏ với 1 hệ thống nhỏ việc monitor có vẻ không được chú trọng nhưng tới thời điểm nhất định hệ thống ngày một phình to với hàng chục, hàng trăm service cùng với đó hệ thống đòi hỏi độ available cao thì hệ thống monitor là quan trọng và không thể thiếu. Hệ thống monitor tốt không những cho ta biết heath của hệ thống, phát hiện và xử lý kịp thời các vấn đề phát sinh trong quá trình hoạt động nhằm đảm bảo HA (High Available) mà còn giúp đỡ ta rất nhiều trong quá trình troubleshoot khi một vấn đề xảy ra.

Importance

Okey nếu vậy bạn chưa có 1 hệ thống monitor tử tế thì tôi nghĩ đây là lúc bạn cần phải nghiêm túc nhìn nhận và bắt tay vào build nó rồi đó.

1. Những điều cần “suy nghĩ” trước khi xây dựng “Monitoring system”?

Trước khi bắt tay vào build một monitor system tôi nghĩ bạn cần phải tính tới 1 số việc sau.

Bạn tính dùng hàng trả phí hay là opensource. Trả phí thì thường khá ngon và có lỗi hoặc yêu cầu gì thì có hãng support kiểu bày cõ tận bàn. Opensource thì free nhưng tự thân vận động và thỉnh thoảng lại thiếu cái nọ cái kia có thể phải code thêm.

Bạn sẽ cần phải tính là dịch vụ của bạn cần monitor là những gì (hardware, network, service, flow, ..)? mức độ monitor tới đâu? Điều này quyết định tới yêu cầu tính năng của hệ thống, là sản phẩm sẽ được lựa chọn để sử dụng. Tránh kiểu đầu tư tiền bạc và thời gian nhưng tới lúc làm lại thiếu cái lọ cái chai khổ vãi nhoái.

Tiếp đó là sizing cho hệ thống, cơ chế HA monitor chéo tránh t/h hệ thống monitor chết cmn cùng hệ thống thật mà bạn éo biết.

Cuối cùng là tính toán đến các phương án bảo mật để đảm bảo attacker không thể lợi dụng hệ thống monitor của bạn để exploit vào hệ thống chính :) Trong t/g đi làm tôi gặp nhiều trườn hợp attacker dùng chính hệ thống moniotor lợi dụng hack cmn vào hệ thống và phá hoại. Nản vc.

2. Làm sao để “monitoring system” thực sự Comprehensive?

Đây là góc nhìn cá nhân thôi. Theo quan điểm để monitor được toàn diện tôi chia nhỏ ra thành các layer (tư tưởng của Networking). Tôi tạm chia nhỏ ntn và ae tham khảo và bổ sung dần dần nha.

Object:

Importance

Others:

Arch

Bài viết hơi dài và có vẻ nhàm chán. Rất hy vọng ae đọc tới đây và nếu có ý kiến đóng góp cho mình để mình hoàn thiện hơn thì thật tuyệt vời.

Cảm ơn ae,