👋 Hi! Bạn cần tư vấn gì về dịch vụ AWS?

Gã khổng lồ thanh toán Stripe, với khối lượng xử lý 1,4 nghìn tỷ USD mỗi năm, đã giảm 26% thời gian xử lý các quy trình tuân thủ tài chính nhờ triển khai hệ thống agent AI trên nền tảng Amazon Bedrock. Quan trọng hơn, hệ thống này vẫn đảm bảo con người là người ra quyết định cuối cùng và đạt tỷ lệ hữu ích trên 96%. Bài viết này, dựa trên chia sẻ từ chính đội ngũ Stripe (đồng tác giả bởi Christopher Phillippi và Chrissie Cui), sẽ phân tích kiến trúc kỹ thuật, các quyết định về hạ tầng và những bài học thực tiễn cho doanh nghiệp muốn ứng dụng agent AI vào các lĩnh vực đòi hỏi tính chính xác và kiểm soát cao.

Thách thức tuân thủ tại quy mô toàn cầu

Stripe là nền tảng hạ tầng tài chính cho hàng triệu công ty tại 50 quốc gia, bao gồm 62% trong danh sách Fortune 500, và xử lý khối lượng thanh toán hàng năm lên tới 1,4 nghìn tỷ USD. Khi quy mô mở rộng, thách thức lớn nhất là làm sao để các hoạt động tuân thủ theo kịp mà không cần tăng nhân sự tương ứng. Các chuyên viên phân tích rủi ro đã phải dành tới 80% thời gian để thu thập tài liệu từ nhiều hệ thống khác nhau, thay vì tập trung vào công việc đánh giá chuyên môn có giá trị cao.

Để giải quyết bài toán này, Stripe đã tìm đến agentic AI (AI tác tử – có khả năng tự lập kế hoạch và hành động) để tự động hóa các cuộc điều tra, giúp các chuyên gia tập trung vào việc ra quyết định. Hệ thống được xây dựng dựa trên ba trụ cột chính:

  • Giám sát và Trách nhiệm giải trình: Con người luôn ở vị trí kiểm soát, được hỗ trợ bởi các agent.
  • Minh bạch: Toàn bộ quá trình được ghi lại thành dấu vết kiểm toán (audit trail) không thể thay đổi.
  • Hiệu quả: Tự động hóa các bước điều tra sơ bộ, cho phép các chuyên viên thực hiện các đánh giá sâu hơn với tốc độ nhanh hơn.

Kiến trúc kỹ thuật và những bài học quan trọng

Để triển khai thành công, Stripe đã xây dựng một hệ thống gồm ba thành phần chính: phân rã và điều phối tác vụ, framework agent ReAct, và hạ tầng hỗ trợ.

Phân rã tác vụ thành các bước nhỏ

Thay vì giao một nhiệm vụ phức tạp cho một agent duy nhất, Stripe đã chia nhỏ quy trình đánh giá thành các tác vụ con, dễ quản lý hơn. Các tác vụ này được sắp xếp theo một DAG (Directed Acyclic Graph – Đồ thị có hướng không chu trình), nơi kết quả của tác vụ trước là đầu vào cho tác vụ sau. Cách tiếp cận này giúp đảm bảo chất lượng ở từng bước và giữ cho agent tập trung vào đúng vấn đề cần giải quyết.

Tuy nhiên, câu trả lời của agent chỉ mang tính tham khảo. Chuyên viên con người mới là người đưa ra câu trả lời cuối cùng cho mỗi tác vụ con, đảm bảo sự giám sát và trách nhiệm giải trình.

Sơ đồ luồng đánh giá với sự tham gia của con người và các tác vụ con được điều phối theo dạng DAG.

Framework agent ReAct: Lý luận và Hành động

Để thu thập thông tin cho mỗi câu hỏi phụ, Stripe đã xây dựng một agent tuân thủ dựa trên framework ReAct (Reasoning and Acting). Thay vì chỉ dựa vào kiến thức có sẵn của LLM, agent này có thể chủ động gọi các công cụ (tools) để truy xuất dữ liệu cần thiết. Vòng lặp ReAct bao gồm các bước: Thought (Suy nghĩ) → Action (Hành động) → Observation (Quan sát), cho phép agent liên tục thu thập và xử lý thông tin cho đến khi có đủ cơ sở để đưa ra câu trả lời cuối cùng.

Luồng logic của một agent theo framework ReAct.

Hạ tầng chuyên dụng cho Agent

Một bài học quan trọng từ Stripe là agent AI đòi hỏi một kiến trúc hạ tầng khác biệt so với các mô hình Machine Learning truyền thống. ML truyền thống thường bị giới hạn bởi năng lực tính toán (compute-bound) và cần GPU, trong khi agent AI lại bị giới hạn bởi tốc độ mạng (network-bound) vì phải chờ phản hồi từ các lệnh gọi API tới LLM hoặc các công cụ. Do đó, Stripe đã xây dựng một Agent Service chuyên dụng, được thiết kế để xử lý các tác vụ không đồng bộ, chạy trong thời gian dài.

Kiến trúc tổng thể của hệ thống agent tuân thủ tại Stripe.

Ngoài ra, Stripe sử dụng một microservice trung gian gọi là LLM Proxy để quản lý tất cả các lệnh gọi đến LLM. Kiến trúc này giúp kiểm soát băng thông, dễ dàng chuyển đổi giữa các model, thiết lập cơ chế dự phòng (fallback) và theo dõi chi phí sử dụng. Trong vòng chưa đầy một năm, dịch vụ này đã phát triển từ vài agent lúc ra mắt lên hơn 100 agent.

Kiến trúc của dịch vụ LLM Proxy tại Stripe.

Tận dụng sức mạnh của Amazon Bedrock

Stripe đã tích hợp Amazon Bedrock vào trong LLM Proxy của mình để hưởng các lợi ích sau:

  • Bảo mật và quyền riêng tư được chuẩn hóa: Bedrock đảm bảo các model từ Amazon và các công ty AI hàng đầu tuân thủ các tiêu chuẩn bảo mật nghiêm ngặt của Stripe mà không cần quy trình đánh giá riêng cho từng model.
  • Tính năng phong phú: Stripe đã sử dụng tính năng prompt caching trên Bedrock để giảm 60% chi phí token đầu vào. Trong tương lai, họ dự định khám phá thêm fine-tuning và pre-training.
  • Một API, nhiều model: Dễ dàng tích hợp và chuyển đổi giữa các foundation model khác nhau chỉ bằng cách thay đổi tên model trong lệnh gọi API.

Kết quả ấn tượng và Lộ trình tiếp theo

Kết quả, Stripe đã giảm 26% thời gian xử lý trung bình cho mỗi yêu cầu đánh giá, trong khi tỷ lệ hữu ích (helpfulness rating) từ các chuyên viên đạt trên 96%. Toàn bộ quá trình được ghi lại thành một dấu vết kiểm toán (audit trail) đầy đủ, đáp ứng các yêu cầu kiểm tra của cơ quan quản lý.

Bài học từ Stripe cho thấy việc ứng dụng agent AI trong các môi trường được quản lý chặt chẽ là hoàn toàn khả thi và mang lại hiệu quả kinh doanh rõ rệt. Thành công không chỉ đến từ sức mạnh của LLM, mà còn từ việc thiết kế kiến trúc hệ thống thông minh: phân rã tác vụ, đảm bảo con người giám sát, và xây dựng hạ tầng chuyên dụng. Trong tương lai, Stripe sẽ tiếp tục mở rộng hệ thống để xử lý các cuộc điều tra phức tạp hơn và khám phá các kỹ thuật tùy biến model trên Amazon Bedrock như fine-tuning để nâng cao hơn nữa chất lượng và hiệu quả.