Từ điển Trí tuệ Nhân tạo: 52 thuật ngữ AI nên biết
![]() |
Từ điển: 52 thuật ngữ AI nên biết. Tạo bởi Recraft.AI cho blog Chuyển đổi. số |
AI (trí tuệ nhân tạo) hiện đã trở thành một phần trong cuộc sống hàng ngày của chúng ta. Từ sự phổ biến to lớn của ChatGPT đến việc Google đưa các bản tóm tắt AI lên đầu kết quả tìm kiếm, AI đang hoàn toàn chiếm lĩnh internet. Với AI, bạn có thể nhận được câu trả lời tức thì cho hầu hết mọi câu hỏi. Cảm giác như đang nói chuyện với ai đó có bằng tiến sĩ về mọi thứ.
Nhưng khía cạnh đó của chatbot AI chỉ là một phần của bối cảnh AI. Chắc chắn, việc có ChatGPT giúp làm bài tập về nhà hoặc có Midjourney tạo ra những hình ảnh hấp dẫn về robot mech dựa trên quốc gia xuất xứ thật tuyệt vời, nhưng tiềm năng của AI tạo sinh có thể hoàn toàn định hình lại nền kinh tế. Điều đó có thể trị giá 4,4 nghìn tỷ đô la cho nền kinh tế toàn cầu hàng năm, theo McKinsey Global Institute, đó là lý do tại sao bạn nên mong đợi nghe ngày càng nhiều về trí tuệ nhân tạo.
AI đang xuất hiện trong một loạt các sản phẩm khiến người ta choáng ngợp - một danh sách ngắn, tóm lược bao gồm Gemini của Google, Copilot của Microsoft, Claude của Anthropic, và Perplexity, những cái tên trong 10 công cụ AI phổ biến trong doanh nghiệp.
Khi mọi người trở nên quen thuộc hơn với một thế giới gắn bó với AI, các thuật ngữ mới đang xuất hiện khắp nơi. Vì vậy, dù bạn đang cố gắng tỏ ra thông minh trong khi uống rượu hay gây ấn tượng trong một cuộc phỏng vấn xin việc, dưới đây là một số thuật ngữ AI quan trọng bạn nên biết.
Từ điển này nên được cập nhật thường xuyên, và được sắp xếp theo thứ tự abc từ gốc tiếng Anh.
Thuật ngữ AI
- artificial general intelligence, AGI - Trí tuệ nhân tạo tổng quát: Một khái niệm gợi ý về một phiên bản AI tiên tiến hơn so với những gì chúng ta biết ngày nay, có thể thực hiện các nhiệm vụ tốt hơn nhiều so với con người đồng thời cũng tự dạy và phát triển khả năng của chính mình.
- Agentive - Tính tác nhân: Các hệ thống hoặc mô hình thể hiện tính tác nhân với khả năng tự chủ theo đuổi các hành động để đạt được mục tiêu. Trong bối cảnh AI, một mô hình agentive có thể hoạt động mà không cần giám sát liên tục, chẳng hạn như một chiếc xe tự lái cấp cao. Không giống như khung lý thuyết "agentic" ở hậu trường, các khung lý thuyết "agentive" ở phía trước, tập trung vào trải nghiệm người dùng.
- AI ethics - Đạo đức AI: Các nguyên tắc nhằm ngăn chặn AI gây hại cho con người, đạt được thông qua các phương tiện như xác định cách các hệ thống AI nên thu thập dữ liệu hoặc xử lý thiên kiến.
- AI safety - An toàn AI: Một lĩnh vực liên ngành quan tâm đến các tác động dài hạn của AI và cách nó có thể tiến triển đột ngột thành một siêu trí tuệ có thể thù địch với con người.
- Algorithm - Thuật toán: Một chuỗi hướng dẫn cho phép một chương trình máy tính học hỏi và phân tích dữ liệu theo một cách cụ thể, chẳng hạn như nhận biết các mẫu, sau đó học từ nó và hoàn thành nhiệm vụ một cách tự động.
- Alignment - điều chỉnh hài hoà: Việc điều chỉnh AI để tạo ra kết quả mong muốn tốt hơn. Điều này có thể đề cập đến bất cứ điều gì từ kiểm duyệt nội dung đến duy trì các tương tác tích cực với con người.
- Anthropomorphism - Nhân cách hóa: Khi con người có xu hướng gán các đặc điểm giống con người cho các đối tượng không phải con người. Trong AI, điều này có thể bao gồm việc tin rằng một chatbot giống con người và có nhận thức hơn thực tế, như tin rằng nó vui, buồn hoặc thậm chí có tri giác.
- Artificial intelligence, AI - Trí tuệ nhân tạo: Việc sử dụng công nghệ để mô phỏng trí thông minh của con người, dù trong các chương trình máy tính hay robot. Một lĩnh vực trong khoa học máy tính nhằm xây dựng các hệ thống có thể thực hiện các nhiệm vụ của con người.
- Autonomous agents - Tác nhân tự động: Một mô hình AI có khả năng, lập trình và các công cụ khác để hoàn thành một nhiệm vụ cụ thể. Ví dụ, một chiếc xe tự lái là một tác nhân tự động vì nó có đầu vào cảm biến, GPS và thuật toán lái xe để tự điều hướng trên đường. Các nhà nghiên cứu Stanford đã chỉ ra rằng các tác nhân tự động có thể phát triển văn hóa, truyền thống và ngôn ngữ chung riêng của chúng.
- Bias - Thiên kiến, thiên vị: Liên quan đến các mô hình ngôn ngữ lớn LLM, các lỗi phát sinh từ dữ liệu huấn luyện. Điều này có thể dẫn đến việc sai lầm khi gán các đặc điểm nhất định cho các chủng tộc hoặc nhóm nhất định dựa trên định kiến, thiên vị.
- Chatbot: Một chương trình giao tiếp với con người thông qua văn bản mô phỏng ngôn ngữ con người.
- ChatGPT: Một chatbot AI được phát triển bởi OpenAI sử dụng công nghệ mô hình ngôn ngữ lớn.
- Cognitive computing - Điện toán nhận thức: Một thuật ngữ khác cho trí tuệ nhân tạo.
- Data augmentation - Tăng cường dữ liệu: Điều chỉnh lại các dữ liệu hiện có hoặc thêm một tập dữ liệu đa dạng hơn để huấn luyện AI.
- Dataset - Tập dữ liệu: Một tập hợp thông tin kỹ thuật số được sử dụng để huấn luyện, kiểm tra và xác thực một mô hình AI.
- Deep learning - Học sâu: Một phương pháp AI, và một tiểu lĩnh vực của học máy (machine learning), sử dụng nhiều tham số để nhận biết các mẫu phức tạp trong hình ảnh, âm thanh và văn bản. Quá trình này được lấy cảm hứng từ não bộ con người và sử dụng mạng nơ-rôn nhân tạo để tạo ra các mẫu.
- Diffusion - Khuếch tán: Một phương pháp học máy (machine learning) lấy một phần dữ liệu hiện có, như một bức ảnh, và thêm nhiễu ngẫu nhiên. Các mô hình khuếch tán huấn luyện mạng của chúng để tái tạo hoặc khôi phục bức ảnh đó.
- Emergent behavior - Hành vi nổi lên: Khi một mô hình AI thể hiện các khả năng không mong muốn.
- End-to-end learning, E2E - Học từ đầu đến cuối: Một quá trình học sâu trong đó một mô hình được hướng dẫn thực hiện một nhiệm vụ từ đầu đến cuối. Nó không được huấn luyện để hoàn thành một nhiệm vụ tuần tự mà thay vào đó học từ các đầu vào và giải quyết tất cả cùng một lúc.
- Ethical considerations - Cân nhắc đạo đức: Nhận thức về các hàm ý đạo đức của AI và các vấn đề liên quan đến quyền riêng tư, sử dụng dữ liệu, công bằng, lạm dụng và các vấn đề an toàn khác.
- Foom (Chưa có từ tương đương tiếng Việt): Còn được gọi là fast takeoff hoặc hard takeoff. Khái niệm rằng nếu ai đó xây dựng một AGI thì có thể đã quá muộn để cứu nhân loại.
- Generative adversarial networks, GANs - Mạng đối kháng tạo sinh: Một mô hình AI tạo sinh bao gồm hai mạng nơ-rôn để tạo dữ liệu mới: một bộ tạo và một bộ phân biệt. Bộ tạo tạo nội dung mới, và bộ phân biệt kiểm tra xem nó có xác thực không.
- Generative AI - AI tạo sinh: Một công nghệ tạo nội dung sử dụng AI để tạo văn bản, video, dòng code hoặc hình ảnh. AI được cung cấp lượng lớn dữ liệu huấn luyện, tìm các mẫu để tạo ra các phản hồi mới của riêng mình, đôi khi có thể tương tự như tài liệu nguồn.
- Google Gemini: Một chatbot AI của Google hoạt động tương tự như ChatGPT nhưng lấy thông tin từ web hiện tại, trong khi ChatGPT bị giới hạn dữ liệu đến năm 2021 và không kết nối internet.
- Guardrails - Hàng rào: Các chính sách và hạn chế được áp dụng cho các mô hình AI để đảm bảo dữ liệu được xử lý có trách nhiệm và mô hình không tạo ra nội dung đáng lo ngại.
- Hallucination - Ảo giác: Một phản hồi không chính xác từ AI. Có thể bao gồm AI tạo sinh tạo ra các câu trả lời không chính xác nhưng được phát biểu với sự tự tin như thể chúng đúng. Lý do cho điều này không hoàn toàn được biết. Ví dụ, khi hỏi một chatbot AI, "Leonardo da Vinci vẽ Mona Lisa khi nào?" nó có thể trả lời với một tuyên bố không chính xác rằng, "Leonardo da Vinci vẽ Mona Lisa năm 1815," tức là 300 năm sau khi nó thực sự được vẽ.
- Inference - Suy luận: Quá trình các mô hình AI sử dụng để tạo văn bản, hình ảnh và nội dung khác về dữ liệu mới, bằng cách suy luận từ dữ liệu huấn luyện của chúng.
- Large language model, LLM - Mô hình ngôn ngữ lớn: Một mô hình AI được huấn luyện trên lượng lớn dữ liệu văn bản để hiểu ngôn ngữ và tạo nội dung mới bằng ngôn ngữ giống con người.
- Latency - Độ trễ: Thời gian chậm trễ từ khi hệ thống AI nhận được đầu vào hoặc lời nhắc và tạo ra đầu ra.
- Machine learning, ML - Học máy: Một thành phần trong AI cho phép máy tính học hỏi và đưa ra kết quả dự đoán tốt hơn mà không cần lập trình rõ ràng. Có thể được kết hợp với các tập huấn luyện để tạo nội dung mới.
Từ điển: 52 thuật ngữ AI nên biết. Tạo bởi Recraft.AI cho blog Chuyển đổi. số - Microsoft Bing: Một công cụ tìm kiếm của Microsoft hiện có thể sử dụng công nghệ cung cấp sức mạnh cho ChatGPT để đưa ra kết quả tìm kiếm được hỗ trợ bởi AI. Nó tương tự như Google Gemini khi được kết nối với internet.
- Multimodal AI - AI đa phương thức: Một loại AI có thể xử lý nhiều loại đầu vào, bao gồm văn bản, hình ảnh, video và lời nói.
- Natural language processing hay NLP - Xử lý ngôn ngữ tự nhiên: Một nhánh của AI sử dụng học máy và học sâu để cho máy tính khả năng hiểu ngôn ngữ con người, thường sử dụng các thuật toán học, mô hình thống kê và quy tắc ngôn ngữ học.
- Neural network - Mạng nơ-rôn: Một mô hình tính toán giống cấu trúc não bộ con người và được thiết kế để nhận biết các mẫu trong dữ liệu. Bao gồm các nút kết nối, hoặc nơ-rôn, có thể nhận biết các mẫu và học theo thời gian.
- Overfitting - Quá khớp: Lỗi trong học máy (ML) khi nó hoạt động quá gần với dữ liệu huấn luyện và có thể chỉ có thể xác định các ví dụ cụ thể trong dữ liệu đó nhưng không phải dữ liệu mới.
- Paperclips - Hiệu ứng Kẹp giấy: Lý thuyết Paperclip Maximiser, được đặt ra bởi triết gia Nick Boström của Đại học Oxford, là một kịch bản giả định trong đó một hệ thống AI sẽ tạo ra càng nhiều kẹp giấy thật càng tốt. Trong mục tiêu tạo ra số lượng kẹp giấy tối đa, một hệ thống AI giả thuyết sẽ tiêu thụ hoặc chuyển đổi tất cả vật liệu để đạt được mục tiêu của mình. Điều này có thể bao gồm tháo dỡ máy móc khác để sản xuất thêm kẹp giấy, máy móc có thể có lợi cho con người. Hậu quả không mong muốn của hệ thống AI này là nó có thể tiêu diệt nhân loại trong mục tiêu làm kẹp giấy. Việc này nói về tác động tiêu cực của AI do cơ chế thưởng.
- Parameters - Tham số: Các giá trị số cho mô hình ngôn ngữ lớn (LLM) cấu trúc và hành vi, cho phép nó đưa ra dự đoán.
- Perplexity: Tên của một chatbot và công cụ tìm kiếm được hỗ trợ bởi AI thuộc sở hữu của Perplexity AI. Nó sử dụng một mô hình ngôn ngữ lớn, như những mô hình được tìm thấy trong các chatbot AI khác, để trả lời câu hỏi với các câu trả lời mới. Kết nối với internet mở cũng cho phép nó cung cấp thông tin cập nhật và lấy kết quả từ khắp web. Perplexity Pro, một tầng trả phí của dịch vụ, cũng có sẵn và sử dụng các mô hình khác, bao gồm GPT-4o, Claude 3 Opus, Mistral Large, LlaMa 3 mã nguồn mở và Sonar 32k riêng của nó. Người dùng Pro có thể tải lên tài liệu để phân tích, tạo hình ảnh và diễn giải mã.
- Prompt - Lời nhắc: Gợi ý hoặc câu hỏi bạn nhập vào chatbot AI để nhận phản hồi.
- Prompt chaining - Chuỗi lời nhắc: Khả năng của AI sử dụng thông tin từ các tương tác trước để tô màu các phản hồi trong tương lai.
- Quantization - Lượng tử hóa: Quá trình mà một mô hình học lớn AI được làm nhỏ hơn và hiệu quả hơn (mặc dù, ít chính xác hơn một chút) bằng cách giảm độ chính xác từ định dạng cao hơn xuống định dạng thấp hơn. Một cách tốt để nghĩ về điều này là so sánh hình ảnh 16-megapixel với hình ảnh 8-megapixel. Cả hai vẫn rõ ràng và có thể nhìn thấy, nhưng hình ảnh độ phân giải cao hơn sẽ có nhiều chi tiết hơn khi bạn phóng to.
- Stochastic parrot - Con vẹt ngẫu nhiên: Một phép tương tự của LLM minh họa rằng phần mềm không có sự hiểu biết lớn hơn về ý nghĩa đằng sau ngôn ngữ hoặc thế giới xung quanh nó, bất kể đầu ra có thuyết phục đến mức nào. Cụm từ này đề cập đến cách một con vẹt có thể bắt chước từ ngữ của con người mà không hiểu ý nghĩa đằng sau chúng.
- Style transfer - Chuyển đổi phong cách: Khả năng điều chỉnh phong cách của một hình ảnh với nội dung của hình ảnh khác, cho phép AI diễn giải các thuộc tính thị giác của một hình ảnh và sử dụng nó trên hình ảnh khác. Ví dụ, lấy chân dung tự họa của Rembrandt và tái tạo nó theo phong cách của Picasso.
- Temperature - Nhiệt độ: Tham số được đặt để kiểm soát mức độ ngẫu nhiên của đầu ra của mô hình ngôn ngữ. Nhiệt độ cao hơn có nghĩa là mô hình chấp nhận rủi ro nhiều hơn.
- Text-to-image generation - Tạo văn bản thành hình ảnh: Tạo hình ảnh dựa trên mô tả bằng văn bản.
- Token - đơn vị cơ bản tính việc sử dụng: Các đoạn văn bản nhỏ mà các mô hình ngôn ngữ AI xử lý để xây dựng phản hồi cho lời nhắc của bạn. Một token tương đương với bốn ký tự trong tiếng Anh, hoặc khoảng ba phần tư của một từ.
- Training data - Dữ liệu huấn luyện: Các tập dữ liệu được sử dụng để giúp các mô hình AI học, bao gồm văn bản, hình ảnh, mã hoặc dữ liệu.
- Transformer Model - Mô hình chuyển đổi: Một kiến trúc mạng nơ-rôn và mô hình học sâu học ngữ cảnh bằng cách theo dõi các mối quan hệ trong dữ liệu, như trong câu hoặc các phần của hình ảnh. Vì vậy, thay vì phân tích một câu từng từ một, nó có thể nhìn toàn bộ câu và hiểu ngữ cảnh.
- Turing test - Kiểm tra Turing: Được đặt theo tên của nhà toán học và khoa học máy tính nổi tiếng Alan Turing, nó kiểm tra khả năng của máy móc hoạt động như con người. Máy móc vượt qua nếu con người không thể phân biệt phản hồi của máy với con người khác.
- Unsupervised learning - Học không giám sát: Một hình thức học máy trong đó dữ liệu huấn luyện được gán nhãn không được cung cấp cho mô hình và thay vào đó mô hình phải tự xác định các mẫu trong dữ liệu.
- Weak AI, narrow AI - AI yếu, hay AI hẹp: AI tập trung vào một nhiệm vụ cụ thể và không thể học ngoài bộ kỹ năng của nó. Hầu hết AI ngày nay là AI yếu.
- Zero-shot learning - Học zero-shot: Một bài kiểm tra trong đó mô hình phải hoàn thành một nhiệm vụ mà không được cung cấp dữ liệu huấn luyện cần thiết. Một ví dụ sẽ là nhận biết sư tử trong khi chỉ được huấn luyện trên hổ.
Nguồn tham khảo:
- ChatGPT Glossary: 52 AI Terms Everyone Should Know: https://www.cnet.com/tech/services-and-software/chatgpt-glossary-52-ai-terms-everyone-should-know/
Nhận xét