10 công cụ AI tạo sinh (Gen AI) được sử dụng nhiều nhất trong doanh nghiệp
![]() |
10 công cụ AI tạo sinh (GenAI) phổ biến nhất trong doanh nghiệp - Chuyển đổi.số. Tạo bởi Recraft AI. |
Từ chatbot AI và trợ lý ảo, đến các công cụ tạo âm thanh và video, đây là những công cụ AI tạo sinh hàng đầu đang được sử dụng hiện nay.
AI tạo sinh (Generative AI hay Gen AI) đã xâm nhập vào doanh nghiệp một cách mạnh mẽ kể từ khi OpenAI ra mắt ChatGPT vào năm 2022. Theo Precedence Research, thị trường AI tạo sinh toàn cầu đã vượt 25 tỷ đô la vào năm 2024 và dự kiến sẽ đạt mức 803 tỷ đô la đến năm 2033. Và AI tại Wharton, một phần của Sáng kiến AI và Phân tích Wharton tại Trường Wharton của UPenn, cùng với công ty tư vấn GBK Collective, cũng phát hiện trong một nghiên cứu về các nhà ra quyết định cấp cao rằng các doanh nghiệp có 1.000 nhân viên trở lên đã đầu tư trung bình cao hơn gấp đôi vào AI tạo sinh trong năm 2024 so với năm 2023.
Nhưng một khảo sát gần đây của Deloitte cho thấy, mặc dù đa số những người tham gia từ cấp giám đốc đến cấp C-suite có kinh nghiệm thử nghiệm hoặc triển khai AI tạo sinh dự định tăng chi tiêu tổng thể cho AI trong năm tài chính tới, họ vẫn thận trọng trong cách tiếp cận, dự kiến chỉ có 30% hoặc ít hơn trong số các thử nghiệm AI tạo sinh của họ sẽ được mở rộng quy mô đầy đủ trong vài tháng tới - phản ánh tình trạng của các công cụ họ đang sử dụng.
Vậy với bối cảnh tiếp cận và áp dụng hiện tại, dưới đây là 10 công cụ AI tạo sinh được sử dụng nhiều nhất trong doanh nghiệp hiện nay.
Bài viết được tác giả Thor Olavsrud tổng hợp và xuất bản trên CIO.com vào ngày 17/04/2025.
![]() |
Xếp hạng 10 công cụ AI tạo sinh phổ biến nhất trong doanh nghiệp - Chuyển đổi.số |
ChatGPT
ChatGPT, được phát triển bởi OpenAI, là một ứng dụng chatbot được xây dựng trên mô hình trí tuệ nhân tạo tiền huấn luyện tạo sinh (generative pre-trained transformer, hay GPT). Ra mắt vào năm 2022, đây là công cụ AI tạo sinh được sử dụng nhiều nhất trong doanh nghiệp, với 62% người tham gia khảo sát gần đây của Wharton cho biết họ hiện đang sử dụng nó và 28% cho biết họ chưa sử dụng nhưng đang đánh giá hoặc thử nghiệm.
Điểm mạnh của ChatGPT là khả năng hiểu và tạo ra ngôn ngữ tự nhiên, khiến nó trở thành công cụ tuyệt vời để giải quyết các thách thức ngôn ngữ phức tạp bao gồm tự động hóa và nâng cao dịch vụ khách hàng, tối ưu hóa hoạt động bằng cách xử lý các truy vấn lặp lại, tạo báo cáo, soạn thảo email và viết mô tả sản phẩm.
Giống như tất cả các AI tạo sinh, độ chính xác của ChatGPT có thể khác nhau và khả năng không hiểu cảm xúc có thể dẫn đến vấn đề trong một số tình huống. Sự giám sát và can thiệp của con người có thể cần thiết.
Microsoft Copilot
Microsoft Copilot là giao diện trò chuyện tích hợp trong Microsoft 365 nhằm nâng cao năng suất trong các ứng dụng như Word, Excel, PowerPoint, Outlook và Teams. Ra mắt vào năm 2023, nó sử dụng mô hình nền tảng GPT-4 của OpenAI và là công cụ AI tạo sinh được sử dụng nhiều thứ hai. Theo khảo sát của Wharton, 52% người tham gia cho biết doanh nghiệp của họ hiện đang sử dụng Copilot và 35% cho biết họ đang đánh giá hoặc thử nghiệm nó.
Điểm mạnh của Copilot nằm ở khả năng tích hợp với các ứng dụng năng suất mà nhân viên trong môi trường Microsoft 365 sử dụng cả ngày. Nó tuân thủ các chính sách bảo mật, tuân thủ và quyền riêng tư mà doanh nghiệp đã thiết lập, và có sẵn như một tiện ích bổ sung cho giấy phép Microsoft hiện có. Các ứng dụng bao gồm:
- Soạn thảo tài liệu và tóm tắt văn bản trong Word
- Tạo biểu đồ từ dữ liệu hiện có trong Excel
- Tạo dàn ý và thiết kế slide trong PowerPoint
- Quản lý hộp thư Outlook, tóm tắt chuỗi email và soạn thảo trả lời
- Tóm tắt các điểm chính từ các cuộc họp Teams và tạo danh sách việc cần làm
- Tận dụng Power BI để tạo báo cáo và hình ảnh trực quan bằng truy vấn ngôn ngữ tự nhiên
Giống như ChatGPT, độ chính xác của Copilot không hoàn hảo. Ví dụ, khi tóm tắt nội dung, nó có thể bỏ lỡ điểm chính hoặc bỏ qua các chi tiết quan trọng. Tương tự, ngay cả khi dựa vào tài liệu mang thương hiệu, bản sao và hình ảnh, đầu ra của nó không nhất thiết phù hợp với tiêu chuẩn thương hiệu. Người dùng cần phải giám sát đầu ra.
Google Gemini
Google Gemini (trước đây là Bard) là một chatbot đàm thoại được xây dựng trên nền tảng các mô hình AI đa phương thức Gemini của Google. Wharton phát hiện 40% người tham gia khảo sát hiện đang sử dụng Gemini, và 39% đang đánh giá hoặc thử nghiệm nó.
So với ChatGPT và Microsoft Copilot, Gemini, ra mắt vào năm 2023, đã dẫn đầu về các tính năng đa phương thức - khả năng xử lý và tạo ra hình ảnh, âm thanh và video ngoài văn bản. Gemini được tích hợp với các công cụ Google Workspace như Gmail, Docs và Slides.
Các ứng dụng tiềm năng của Gemini bao gồm:
- Soạn thảo email dựa trên gợi ý từ Smart Email Composer
- Tạo bài thuyết trình trong Google Slides dựa trên hướng dẫn
- Xác định xu hướng, điểm bất thường và mối tương quan trong Google Sheets thông qua Spreadsheet Analyzer
- Tạo hình nền và mô phỏng ánh sáng chuyên nghiệp cho hội nghị video Google Meet, và thậm chí cải thiện trải nghiệm âm thanh
Việc tích hợp Gemini với Google Workspace khiến nó trở thành công cụ tuyệt vời trong môi trường sử dụng Workspace nhưng có tính hữu dụng hạn chế bên ngoài môi trường đó vì nó hoạt động trong môi trường bảo mật của Google. Và giống như ChatGPT và Copilot, độ chính xác có thể là vấn đề và khuyến nghị cần có sự giám sát của con người đối với kết quả đầu ra.
Meta AI
Meta AI là trợ lý ảo AI đa phương thức của Meta dành cho các ứng dụng nhắn tin và mạng xã hội của công ty, bao gồm Facebook, Instagram, WhatsApp và Messenger. Giống như Gemini, 40% người tham gia khảo sát của Wharton cho biết họ hiện đang sử dụng Meta AI, trong khi 36% cho biết họ đang đánh giá hoặc thử nghiệm nó.
Được cung cấp bởi mô hình Llama LLM của Meta, người dùng có thể tận dụng Meta AI để đưa ra gợi ý, trả lời câu hỏi, chỉnh sửa hình ảnh và cung cấp bản dịch trong các ứng dụng của công ty. Doanh nghiệp có thể sử dụng Meta AI để thiết lập trợ lý ảo có thể:
- Tự động hóa tương tác với khách hàng, bao gồm trả lời câu hỏi và đưa ra khuyến nghị cá nhân hóa
- Tạo điều kiện thuận lợi cho thương mại trong các ứng dụng của Meta
- Phân tích dữ liệu để giúp doanh nghiệp tạo chiến dịch tiếp thị nhắm mục tiêu
Meta AI đã được tích hợp sẵn với các ứng dụng mà nhiều khách hàng dành phần lớn thời gian trực tuyến, nhưng có những tác động tiềm ẩn về quyền riêng tư và đạo đức liên quan đến việc truy cập dữ liệu khách hàng.
Dall-E 3
AI tạo sinh không chỉ là về chatbot và trợ lý ảo. DALL-E 3, cũng từ OpenAI, tập trung vào việc tạo ra hình ảnh từ mô tả văn bản, và 30% người tham gia khảo sát của Wharton cho biết họ hiện đang sử dụng DALL-E 3, và 35% cho biết họ đang đánh giá hoặc thử nghiệm nó. OpenAI đã ra mắt mô hình DALL-E gốc vào năm 2021, và mô hình học sâu DALL-E 3 tận dụng thị giác máy tính và xử lý ngôn ngữ tự nhiên để tạo ra hình ảnh. Các ứng dụng kinh doanh tiềm năng bao gồm phát triển ý tưởng sản phẩm, bản phác thảo ứng dụng, thiết kế logo, tạo hình ảnh và video cho bài đăng trên mạng xã hội, và tài liệu giáo dục.
Trong số các công cụ tạo hình ảnh AI, điểm mạnh của DALL-E 3 nằm ở việc tích hợp với ChatGPT, tuy nhiên nhiều người dùng cho rằng nó gặp khó khăn với tính chân thực của hình ảnh, với phong cách đặc trưng khiến dễ dàng nhận ra hình ảnh được tạo bởi mô hình.
RunwayML Gen-1 và Gen-2
Runway sử dụng đầu vào là văn bản, hình ảnh và video (bao gồm cả nội dung được tạo ra bởi các công cụ AI tạo sinh khác) để tạo ra video, và 25% người tham gia khảo sát của Wharton cho biết họ hiện đang sử dụng Gen-1 và Gen-2, trong khi 31% cho biết họ đang đánh giá hoặc thử nghiệm các mô hình này.
Mô hình Gen-2, ra mắt vào năm 2023 (Gen-4 đã được phát hành vào tháng 4), mở rộng khả năng của mô hình Gen-1, cho phép tạo ra video dài đến 18 giây. Người dùng có thể điều khiển chuyển động của camera để tùy chỉnh nội dung và nối các đoạn video để tạo ra video dài hơn. Trong số nhiều ứng dụng khác, doanh nghiệp có thể sử dụng công cụ này để tạo hoạt hình từ tài sản tĩnh, hiệu ứng hình ảnh và bảng phân cảnh.
Runway có đường cong học tập dốc - những cải tiến rõ rệt trong giai đoạn đầu và chậm hơn về sau đối với một số tính năng và có thể tiêu tốn nhiều tài nguyên.
Stable Diffusion
Ra mắt vào năm 2022, Stable Diffusion là một mô hình học sâu từ Stability AI tạo ra hình ảnh độ phân giải cao, chân thực từ gợi ý văn bản và hình ảnh. Nó cũng có thể tạo video và hoạt hình, và 24% người tham gia khảo sát của Wharton cho biết họ hiện đang sử dụng Stable Diffusion và 33% cho biết họ đang đánh giá hoặc thử nghiệm nó.
Dựa trên mô hình khuếch tán tiềm ẩn đòi hỏi ít sức mạnh xử lý hơn nhiều so với một số đối thủ cạnh tranh, Stable Diffusion có khả năng chạy trên máy tính để bàn và máy tính xách tay với GPU cấp người tiêu dùng thay vì bị giới hạn ở các dịch vụ đám mây.
Các ứng dụng kinh doanh tiềm năng của Stable Diffusion bao gồm hình ảnh y tế, tạo hình ảnh cho danh mục sản phẩm, thiết kế nguyên mẫu kỹ thuật số, tạo nghệ thuật khái niệm và bảng phân cảnh, và chỉnh sửa hình ảnh bao gồm hiệu chỉnh màu sắc và giảm nhiễu.
Midjourney
Midjourney là một công cụ tạo hình ảnh từ gợi ý ngôn ngữ tự nhiên. Ra mắt ở phiên bản beta mở vào năm 2022, 23% người tham gia khảo sát của Wharton cho biết họ hiện đang sử dụng Midjourney và 32% cho biết họ đang đánh giá hoặc thử nghiệm nó.
Midjourney có thể được truy cập thông qua nền tảng giao tiếp Discord hoặc trang web chính thức của công cụ.
Hình ảnh được tạo thông qua giấy phép thương mại của Midjourney có thể được sử dụng cho mục đích thương mại nhưng không thể được bảo vệ bản quyền trừ khi được biến đổi đáng kể bởi con người. Do đó, hình ảnh được tạo bởi Midjourney và không được biến đổi bởi nghệ sĩ con người được coi là thuộc phạm vi công cộng.
Perplexity
Perplexity, ra mắt bởi Perplexity AI vào năm 2022, là một công cụ tìm kiếm được hỗ trợ bởi AI sử dụng các mô hình ngôn ngữ lớn (LLM) để xử lý truy vấn và tổng hợp câu trả lời, và 21% người tham gia khảo sát của Wharton cho biết họ hiện đang sử dụng Perplexity và 33% cho biết họ đang đánh giá hoặc thử nghiệm nó.
Perplexity được xây dựng trên Microsoft Azure. Phiên bản miễn phí sử dụng mô hình GPT-3.5 của OpenAI, nhưng người dùng trả phí có thể chọn mô hình của họ. Các ứng dụng bao gồm:
- Tìm kiếm nội bộ để tìm kiếm nội dung đồng thời trên web và trong tài liệu nội bộ
- Tài chính, bao gồm báo giá cổ phiếu theo thời gian thực, theo dõi giá, so sánh doanh nghiệp cùng ngành và các công cụ phân tích tài chính cơ bản
- Perplexity Assistant, trợ lý tìm kiếm được hỗ trợ bởi AI cho thiết bị Android
Claude
Claude là một chatbot AI đàm thoại được phát hành bởi Anthropic vào năm 2023 và 19% người tham gia khảo sát của Wharton báo cáo hiện đang sử dụng Claude, trong khi 34% cho biết họ đang đánh giá hoặc thử nghiệm nó.
Claude dựa trên các nguyên tắc AI Hiến pháp (CAI) (Constitutional AI (CAI) principles), được phát triển bởi Anthropic, là một phương pháp để đào tạo các hệ thống AI nhằm giải quyết các mối quan tâm về tính minh bạch, an toàn và ra quyết định mà không phụ thuộc vào phản hồi của con người. CAI nhằm mục đích cung cấp cho Claude các ranh giới đạo đức, cho phép nó từ chối trả lời các truy vấn nếu xác định rằng câu trả lời sẽ gây hại.
Là một lựa chọn thay thế cho các dịch vụ tổng hợp khác như ChatGPT, doanh nghiệp có thể sử dụng Claude để tự động hóa và nâng cao dịch vụ khách hàng, tối ưu hóa hoạt động bằng cách xử lý các truy vấn lặp lại, tạo báo cáo, soạn thảo email và tạo mô tả sản phẩm.
Claude được biết đến với sự rõ ràng trong câu trả lời của mình, nhưng cũng có xu hướng dài dòng.
Trên đây là báo cáo tổng hợp với các công cụ hỗ trợ tiếng Anh và chủ yếu ở thị trường Bắc Mỹ. Quý anh chị có sử dụng công cụ nào trong công việc không? Và đánh giá của các bạn cho công cụ nào hỗ trợ tiếng Việt tốt nhất?
Nguồn tham khảo:
- 10 most used gen AI tools in the enterprise: https://www.cio.com/article/3961674/10-most-used-gen-ai-tools-in-the-enterprise.html
- Gen AI ROI falls short of expectations, but belief persists: https://www.cio.com/article/3806973/gen-ai-roi-falls-short-of-expectations-but-belief-persists.html
Có thể bạn quan tâm?
Các ví dụ chuyển đổi số trong ngành tài chính, ngân hàng và bảo hiểm
- Hành trình chuyển đổi số mạnh mẽ từ thị trường bảo hiểm Trung Quốc
- Ping An Insurance (Bảo hiểm Bình An) và Hành trình số hóa tiên phong ở Trung Quốc
- Zhong An (bảo hiểm Trung An): nền tảng sinh ra cho chuyển đổi số ngành bảo hiểm Trung Quốc
- Insurtech (Công nghệ bảo hiểm): Định nghĩa, phân loại, xu hướng, và tác động tới các đơn vị bảo hiểm trong ngành
- Một số ví dụ về các công ty bảo hiểm chuyển đổi số và insurtech khác trên toàn cầu
Chuỗi bài AI Tạo sinh đột phá ngành tài chính (ngân hàng, bảo hiểm): Cơ hội, Thách thức, Bước khởi đầu
A - Ngành ngân hàng (banking)
1 - Giá trị, các cơ hội chính và ứng dụng chủ đạo
3 - Mở rộng quy mô ứng dụng AI Tạo sinh (GenAI)
B - Ngành bảo hiểm
1 - Các cơ hội chính/ Các ứng dụng chủ đạo
2.1. Về GenAI
2.2. Về dữ liệu
Chuỗi bài viết Sẵn sàng cho Trí tuệ Nhân tạo (AI): Điều Lãnh đạo CNTT CIO Cần Biết và Làm.
- Phần 1: Xác định tham vọng AI | Sẵn sàng cho Trí tuệ Nhân tạo: Điều Lãnh đạo CNTT CIO Cần Biết và Làm
- Phần 2: Các phương án triển khai AI | Sẵn sàng cho Trí tuệ Nhân tạo: Điều Lãnh đạo CNTT CIO Cần Biết và Làm
- Phần 3: Xác định các rủi ro của AI | Sẵn sàng cho Trí tuệ Nhân tạo: Điều Lãnh đạo CNTT CIO Cần Biết và Làm
- Có cần bổ nhiệm CAIO (Giám đốc Cấp cao về AI)?
- Giải thích về Các Mô hình Ngôn ngữ Lớn (LLMs) & AI Tạo sinh (GenAI)
- Gartner Dự báo 10 Công nghệ chiến lược hàng đầu năm 2024 và xa hơn
- Xu hướng 6: AI (Artificial Intelligence): Trí tuệ nhân tạo
Chuỗi bài viết về AI tác nhân (AI Agents)
- Tác nhân AI (AI Agent) là gì? AI tự chủ sẽ thay đổi cách chúng ta làm việc ra sao? Lợi ích và thách thức?
- 5 Quan niệm sai lầm về AI Tác nhân (AI Agents)
- Khác Biệt Chính Giữa AI Tự chủ (AI Agent) và AI Tạo Sinh (Generative AI)
- Kiến trúc Doanh nghiệp (EA) với 5 mức độ trưởng thành của AI Tác nhân
- 5 cách Tác nhân AI (AI Agents) Giúp Các "Doanh nhân Đơn thân" (Solopreneurs) Mở rộng Quy mô mà Không cần Thuê nhân viên
Nhận xét