Trong khi các doanh nghiệp tập trung bảo vệ hệ thống khỏi các cuộc tấn công từ bên ngoài, luồng dữ liệu đi ra (egress) thường bị xem nhẹ, tạo ra một điểm mù bảo mật nghiêm trọng. Việc bỏ qua kiểm soát egress có thể dẫn đến rò rỉ dữ liệu nhạy cảm, dù là do cấu hình sai, quyền truy cập quá rộng, hay thậm chí là do các AI agent bị thao túng. AWS đã đưa ra một chiến lược bảo mật toàn diện, nhiều lớp để giúp doanh nghiệp kiểm soát chặt chẽ luồng dữ liệu đi ra, bảo vệ tài sản số trước các mối đe dọa ngày càng tinh vi.
Các sự cố thực tế cho thấy tầm quan trọng của việc kiểm soát egress, áp dụng cho cả các workload đám mây truyền thống và kiến trúc dựa trên AI mới nổi. Ví dụ, lỗ hổng React2Shell (CVE-2025-55182) được công bố vào tháng 12/2025 đã bị khai thác chỉ trong vài giờ để thực thi mã từ xa. Sau khi xâm nhập, kẻ tấn công thường thiết lập kênh chỉ huy và kiểm soát (command-and-control) hướng ra ngoài để lấy cắp dữ liệu. Tương tự, các hệ thống AI agent cũng mang đến rủi ro mới, như việc bị chiếm quyền điều khiển mục tiêu (Agent Goal Hijack) để âm thầm tuồn dữ liệu ra ngoài. Điểm chung của các kịch bản này là luồng traffic đi ra ngoài trái phép.
Bài viết này sẽ trình bày cách triển khai các lớp phát hiện và bảo vệ egress bằng các dịch vụ của AWS, giúp giảm thiểu rủi ro thất thoát dữ liệu từ cả ứng dụng bị xâm nhập và AI agent bị thao túng.
Tổng quan kiến trúc
Kiến trúc dưới đây minh họa một cách tiếp cận triển khai mô hình mạng hub-and-spoke cho môi trường AWS đa tài khoản. Các workload ứng dụng nằm trong các spoke virtual private clouds (VPC), kết nối với một AWS Transit Gateway đóng vai trò là trung tâm định tuyến. Luồng traffic đi ra Internet được định tuyến qua AWS Network Firewall để kiểm tra và lọc trước khi ra ngoài.

Các thành phần chính trong kiến trúc này bao gồm:
- Lớp phòng ngừa: Sử dụng AWS Network Firewall, Amazon Route 53 Resolver DNS Firewall, và các vành đai dữ liệu (Data Perimeters) để chặn các hành vi trái phép.
- Lớp phát hiện: Bao gồm Amazon GuardDuty, AWS Security Hub, và IAM Access Analyzer để liên tục giám sát và phát hiện các mối đe dọa.
- Lớp tích hợp và tự động hóa: Sử dụng Amazon EventBridge và AWS Lambda để tự động hóa các hành động khắc phục và gửi cảnh báo qua Amazon SNS.
- Lớp giám sát tập trung: Amazon CloudWatch Logs và CloudWatch dashboards thu thập log để phục vụ điều tra sự cố và báo cáo tuân thủ.
Kiến trúc này áp dụng cho cả workload truyền thống và workload AI. Một AI agent chạy trên Amazon Bedrock cũng phải tuân thủ các chính sách lọc DNS, danh sách tên miền cho phép và vành đai dữ liệu tương tự như một máy ảo Amazon EC2 hay container.
Các biện pháp phòng ngừa chủ động (Preventive Controls)
Đây là những biện pháp chặn đứng hành vi trích xuất dữ liệu trước khi nó xảy ra, được áp dụng cho các hoạt động có nguy cơ gây hại cao.
AWS Network Firewall
AWS Network Firewall hoạt động như một chốt chặn trung tâm, kiểm tra sâu các gói tin từ Lớp 3 đến Lớp 7. Trong kịch bản một máy chủ EC2 bị xâm nhập hoặc một AI agent bị chiếm quyền, Network Firewall sẽ chặn kết nối đến máy chủ độc hại bên ngoài vì địa chỉ đó không nằm trong danh sách tên miền được phê duyệt. Các khả năng chính bao gồm:
- Lọc theo tên miền: Chặn traffic đến các địa chỉ không được phép.
- Lọc theo IP và port: Chỉ cho phép kết nối đến các IP bên ngoài thực sự cần thiết.
- Phát hiện và ngăn chặn xâm nhập (IDS/IPS): Sử dụng các quy tắc tương thích Suricata để chặn các mẫu tấn công đã biết.
- Giải mã TLS: Kiểm tra traffic đã mã hóa để phát hiện các nỗ lực lấy cắp dữ liệu ẩn trong kết nối HTTPS.
Đối với môi trường đa tài khoản, AWS Firewall Manager giúp triển khai và quản lý Network Firewall một cách nhất quán. Ngoài ra, AWS Network Firewall Proxy (đang trong giai đoạn preview) cung cấp khả năng lọc HTTP/HTTPS chi tiết hơn.
Route 53 Resolver DNS Firewall
Kẻ tấn công có thể mã hóa dữ liệu nhạy cảm vào các truy vấn DNS để gửi ra ngoài, một kỹ thuật gọi là DNS tunneling (đường hầm DNS), vốn có thể vượt qua các tường lửa thông thường. Route 53 Resolver DNS Firewall giải quyết lỗ hổng này bằng cách lọc và chặn các truy vấn DNS đáng ngờ ngay tại tầng resolver, trước khi bất kỳ kết nối mạng nào được thiết lập. Các tính năng chính:
- Chặn tên miền độc hại: Sử dụng danh sách tên miền được quản lý bởi AWS, bao gồm các mối đe dọa về malware, ransomware, botnet.
- Thực thi danh sách cho phép (allow-lists): Chỉ cho phép truy vấn đến các tên miền đã được phê duyệt.
- Tính năng nâng cao: Sử dụng AI/ML để phát hiện DNS tunneling và các thuật toán tạo tên miền ngẫu nhiên (DGA).
Vành đai dữ liệu (Data Perimeters)
Vành đai dữ liệu là một tập hợp các quy tắc phòng ngừa để đảm bảo chỉ những danh tính đáng tin cậy mới có thể truy cập tài nguyên đáng tin cậy từ các mạng dự kiến. Ngay cả khi kẻ tấn công có được thông tin đăng nhập hợp lệ, chúng cũng không thể sử dụng API của dịch vụ AWS để chuyển dữ liệu ra ngoài tổ chức. Các công cụ chính để xây dựng vành đai dữ liệu bao gồm:
- Service Control Policies (SCPs): Ngăn chặn người dùng tạo ra các tài nguyên có thể bypass các kiểm soát egress.
- Resource Control Policies (RCPs): Hạn chế quyền truy cập API vào tài nguyên của bạn.
- VPC Endpoint Policies: Đây là lớp kiểm soát egress trực tiếp nhất, đảm bảo traffic đến các dịch vụ AWS không đi ra internet và chỉ có thể truy cập các tài nguyên trong phạm vi tổ chức. Ví dụ, một chính sách có thể được áp dụng để chỉ cho phép truy cập các bucket S3 thuộc về tổ chức của bạn, ngăn chặn việc sao chép dữ liệu sang một bucket S3 bên ngoài.
Các biện pháp phát hiện (Detective Controls)
Các biện pháp này giúp phát hiện các nỗ lực trích xuất dữ liệu sau khi chúng xảy ra, cung cấp thông tin để điều tra và cải thiện các biện pháp phòng ngừa.
Amazon GuardDuty
GuardDuty là lớp phát hiện quan trọng, liên tục giám sát các hành vi bất thường và các mẫu tấn công cho thấy nỗ lực trích xuất dữ liệu đang diễn ra. Các khả năng phát hiện tập trung vào egress bao gồm:
- Phát hiện trích xuất dữ liệu qua DNS: Cảnh báo khi các máy chủ EC2 đang truyền dữ liệu qua kênh DNS.
- Phát hiện tác nhân độc hại đã biết: Kích hoạt cảnh báo khi API dữ liệu S3 được gọi từ các địa chỉ IP nằm trong danh sách đen của AWS.
- Tương quan chuỗi tấn công nhiều bước: Phát hiện các chiến dịch trích xuất dữ liệu phức tạp, ví dụ như khi kẻ tấn công thay đổi chính sách bucket S3 rồi bắt đầu lấy dữ liệu một cách có hệ thống.
IAM Access Analyzer và AWS Security Hub
IAM Access Analyzer giúp xác định các đường dẫn rò rỉ dữ liệu tiềm ẩn bằng cách phát hiện các tài nguyên có thể truy cập từ bên ngoài tài khoản hoặc tổ chức AWS của bạn. Nó liên tục giám sát các chính sách và xác định tài nguyên nào đang được chia sẻ với các thực thể bên ngoài vùng tin cậy.
AWS Security Hub tổng hợp các phát hiện từ nhiều dịch vụ bảo mật của AWS (GuardDuty, Amazon Inspector, Amazon Macie) để cung cấp một cái nhìn toàn diện về các rủi ro bảo mật. Ví dụ, Security Hub có thể xác định một bucket S3 chứa dữ liệu nhạy cảm đang bị phơi bày công khai và chưa được mã hóa, đánh dấu đây là một rủi ro thất thoát dữ liệu cần được xử lý ngay lập tức.
Chiến lược triển khai bảo mật Egress
Doanh nghiệp không cần phải triển khai tất cả các biện pháp kiểm soát cùng một lúc. AWS đề xuất một cách tiếp cận theo từng giai đoạn để xây dựng hệ thống bảo mật egress một cách từ từ, phù hợp với mức độ trưởng thành và khả năng chấp nhận rủi ro của tổ chức.
- Giai đoạn 1 – Quick wins: Kích hoạt Route 53 DNS Firewall trên các VPC để đóng lỗ hổng DNS exfiltration. Kích hoạt GuardDuty trên các tài khoản để có khả năng phát hiện mối đe dọa cơ bản.
- Giai đoạn 2 – Nền tảng: Triển khai Data Perimeters trên toàn tổ chức (SCPs, RCPs, và VPC Endpoint Policies). Triển khai Network Firewall đính kèm với Transit Gateway.
- Giai đoạn 3 – Tối ưu hóa: Kích hoạt IAM Access Analyzer để phát hiện truy cập từ bên ngoài một cách liên tục. Triển khai các cơ chế khắc phục tự động qua EventBridge và Lambda để cập nhật quy tắc tường lửa theo thời gian thực. Tập trung hóa các phát hiện trong Security Hub với cảnh báo tự động.
Bảo mật egress không phải là một công cụ duy nhất mà là một chiến lược nhiều lớp. Bằng cách đánh giá hiện trạng, xác định các lỗ hổng và triển khai dần các biện pháp kiểm soát, doanh nghiệp có thể biến các điểm mù trong luồng dữ liệu đi ra thành các trạm kiểm soát được giám sát chặt chẽ.


