6 Bài học Kinh nghiệm: 50 Tác nhân AI Nhận Đánh giá Đầu tiên về Hiệu suất thường niên
Nếu bạn đã hoặc đang cho nhân viên nghỉ việc để thay thế bằng AI, hãy nghĩ lại!
Trong một năm, một nhóm của McKinsey đã quan sát những nhân viên kỹ thuật số (AI tác nhân hay AI Agents) này trong công việc. Dưới đây là báo cáo tiến độ của họ.
Bài viết của tác giả Joe McKendrick, biên tập viên, cộng tác viên, đăng vào ngày 27 tháng 9 năm 2025 trên ZDNet.
Những điểm chính trong bài viết
- McKinsey đã triển khai và quan sát hơn 50 hệ thống AI tác nhân trong một năm.
- Nhân viên kỹ thuật số cần rất nhiều công sức để làm quen với công việc.
- Tác nhân AI không phải là giải pháp tốt nhất cho mọi nhu cầu kinh doanh.
Mở đầu
Theo nhiều đánh giá, tác nhân AI được coi là đồng nghiệp kỹ thuật số trong lực lượng lao động ngày nay. Vì vậy, giống như với nhân viên là con người, chúng cũng nên được đánh giá hiệu suất hàng năm, phải không? Các chuyên gia tại McKinsey đã làm chính xác điều đó, công bố kết quả đánh giá hiệu suất một năm của các tác nhân AI mà công ty tư vấn này đã triển khai và quan sát.
Những nhân viên kỹ thuật số này đã làm việc như thế nào trong năm đầu tiên? Kết luận của nhóm McKinsey: Chúng cần rất nhiều công sức để làm quen; chúng không phải lúc nào cũng là câu trả lời tốt nhất cho mọi nhu cầu kinh doanh; và các đồng nghiệp là con người không phải lúc nào cũng ấn tượng với công việc của các tác nhân.
Báo cáo tiến độ, được viết bởi Lareina Yee, Michael Chui và Roger Roberts, từ McKinsey, đã xem xét ít nhất 50 hệ thống AI tác nhân mà các tác giả đã chủ trì tại McKinsey cùng những nơi khác. Sau một năm làm việc với các tác nhân AI, họ đã rút ra 6 bài học kinh nghiệm quý giá.
1. Tác nhân hoạt động tốt hơn trong quy trình làm việc
Yee và các đồng nghiệp khuyên rằng: Triển khai tác nhân AI chỉ vì theo xu hướng công nghệ có tác nhân AI sẽ không hiệu quả. Vấn đề là việc tích hợp tác nhân để thúc đẩy quy trình làm việc. Các nỗ lực AI tác nhân tập trung vào việc tái tưởng tượng lại toàn bộ quy trình làm việc một cách cơ bản, tức là các bước liên quan đến con người, quy trình và công nghệ, có nhiều khả năng mang lại kết quả tích cực hơn.
Hãy bắt đầu bằng việc giải quyết các điểm khó khăn chính của người dùng, các đồng tác giả gợi ý. Các tổ chức có quy trình làm việc nhiều tài liệu, chẳng hạn như công ty bảo hiểm hoặc công ty luật, được hưởng lợi nhiều hơn từ việc để tác nhân AI xử lý các bước tẻ nhạt trong luồng làm việc.
2. Tác nhân không phải lúc nào cũng là câu trả lời
Để giúp tránh các khoản đầu tư lãng phí hoặc độ phức tạp không mong muốn, hãy tiếp cận vai trò của tác nhân giống như cách họ làm khi đánh giá con người cho một đội ngũ hiệu suất cao. Câu hỏi chính cần đặt ra là: 'Công việc cần làm là gì và năng lực tương đối của mỗi thành viên tiềm năng trong nhóm, hoặc tác nhân, là gì để làm việc cùng nhau đạt được những mục tiêu đó?'
Nếu năng lực của AI tác nhân quá mức cần thiết cho một vấn đề hoặc nếu vấn đề đó yêu cầu các phương pháp tiêu chuẩn hóa, lặp đi lặp lại với mức độ biến đổi thấp, hãy sử dụng các tùy chọn đơn giản hơn như tự động hóa dựa trên quy tắc, phân tích dự đoán hoặc gợi ý mô hình ngôn ngữ lớn (LLM).
3. "AI slop" (đầu ra kém chất lượng) đã là vấn đề lặp đi lặp lại
Một trong những vấn đề phổ biến nhất mà nhóm McKinsey quan sát thấy là các hệ thống tác nhân có vẻ ấn tượng trong các buổi demo nhưng làm người dùng thực sự chịu trách nhiệm về công việc thất vọng - hiện tượng gọi là "AI slop" tạm dịch là "đầu ra chất lượng thấp". Kết quả là, người dùng mất niềm tin vào các tác nhân và ngừng sử dụng chúng.
Các công ty nên đầu tư mạnh vào phát triển tác nhân, giống như cách họ làm với phát triển nhân viên. Giống như với nhân viên là con người, các tác nhân nên được cung cấp mô tả công việc rõ ràng, được đào tạo hội nhập và được phản hồi liên tục để chúng trở nên hiệu quả hơn và cải thiện thường xuyên.
4. Khó theo dõi số lượng lớn tác nhân
Khi chỉ làm việc với một vài tác nhân AI, việc xem xét công việc của chúng và phát hiện lỗi chủ yếu có thể đơn giản. Nhưng khi các công ty triển khai hàng trăm, hoặc thậm chí hàng nghìn tác nhân, nhiệm vụ trở nên khó khăn. Khi có sai sót - và sẽ luôn có sai sót khi các công ty mở rộng quy mô tác nhân - rất khó để tìm ra chính xác điều gì đã sai.
Nhóm đã học được bài học này bằng cách xác minh hiệu suất của tác nhân ở mỗi bước của quy trình làm việc, sử dụng các công cụ quan sát. "Xây dựng giám sát và đánh giá vào quy trình làm việc có thể giúp các nhóm phát hiện sai sót sớm, tinh chỉnh logic và liên tục cải thiện hiệu suất, ngay cả sau khi các tác nhân được triển khai."
5. Tác nhân cho thấy giá trị tốt nhất khi được chia sẻ giữa các chức năng
Tác nhân có thể trở nên đắt đỏ và dư thừa nếu các nhà thiết kế tái tạo lại bánh xe cho mọi nhiệm vụ phát sinh. Các công ty thường tạo một tác nhân duy nhất cho mỗi nhiệm vụ được xác định. Điều này có thể dẫn đến sự dư thừa và lãng phí đáng kể vì cùng một tác nhân thường có thể hoàn thành các nhiệm vụ khác nhau có nhiều hành động giống nhau - chẳng hạn như thu thập, trích xuất, tìm kiếm và phân tích.
Đầu tư vào các tác nhân có thể tái sử dụng đòi hỏi trước tiên phải xác định các nhiệm vụ lặp lại. Phát triển các tác nhân và thành phần tác nhân có thể dễ dàng được tái sử dụng trong các quy trình làm việc khác nhau và làm cho nó đơn giản để các nhà phát triển truy cập chúng.
6. Tác nhân sẽ không bao giờ hoạt động hoàn toàn độc lập
Sẽ luôn có nhu cầu về nhân viên là con người để giám sát độ chính xác của mô hình, đảm bảo tuân thủ, sử dụng phán đoán và xử lý các trường hợp biên. Thiết kế lại công việc để con người và tác nhân có thể cộng tác tốt cùng nhau. Nếu không tập trung vào điều đó, ngay cả các chương trình tác nhân tiên tiến nhất cũng có nguy cơ thất bại âm thầm, các lỗi chồng chất và người dùng từ chối.
Kết quả là, đánh giá hiệu suất tác nhân năm sau cũng có thể kết thúc kém xuất sắc.
* Bài viết được hỗ trợ chuyển ngữ bởi Claude.AI
Nguồn tham khảo
- 50 AI agents get their first annual performance review - 6 lessons learned: https://www.zdnet.com/article/nearly-everything-youve-heard-about-ai-and-job-cuts-is-wrong-heres-why/
Nhận xét