AI tạo sinh là gì?

AI tạo sinh là gì? AI tạo sinh chính là một nhánh của trí tuệ nhân tạo (AI) và sự trỗi dậy mạnh mẽ của nó hứa hẹn sẽ là yếu tố “xoay chuyển” doanh nghiệp hiện nay. Cơn sốt đầu tư vào trí tuệ nhân tạo tạo sinh mở ra những cơ hội kinh doanh béo bở lên đến hàng ngàn tỷ đô la Mỹ. Nội dung bài viết này, chúng ta hãy cùng nhau đi tìm hiểu chi tiết về công nghệ này! 

AI tạo sinh là gì?
AI tạo sinh là gì?

AI tạo sinh là gì?

Theo Wikipedia, AI tạo sinh hay trí tuệ nhân tạo tạo sinh (Generative Artificial Intelligence) là một loại hệ thống AI (trí thông minh máy móc) có khả năng tạo ra văn bản, hình ảnh hoặc những phương tiện truyền thông khác dựa trên các gợi ý. Các mô hình AI tạo sinh và cấu trúc của dữ liệu đầu vào của chúng được áp dụng bằng cách áp dụng các kỹ thuật học máy mạng nơ-ron (gọi là mô hình nền tảng). Dữ liệu mới tạo ra sau đó có đặc điểm tương tự. 

Chat GPT là sản phẩm công nghệ của AI tạo sinh được sử dụng phổ biến
Chat GPT là sản phẩm công nghệ của AI tạo sinh được sử dụng phổ biến

Những hệ thống AI tạo sinh đáng chú ý hiện nay bao gồm Chat GPT (biến thể là Bing Chat). Đây là một chatbot được xây dựng bởi Open AI (phòng nghiên cứu trí tuệ nhân tạo của Mỹ); sử dụng các mô hình ngôn ngữ lớn nền tảng GPT-3, GPT-4 và Bard (chatbot của Google xây dựng dựa trên mô hình nền tảng LaMDA. Một số mô hình AI tạo sinh khác gồm các hệ thống nghệ thuật AI như Stable Diffusion, Midjourney và DALL-E.

Ngày nay, AI tạo sinh có tiềm năng ứng dụng trong các ngành công nghiệp bao gồm nghệ thuật, viết lách, phát triển phần mềm, thiết kế, tài chính, chăm sóc sức khỏe, tiếp thị, thời trang, trò chơi,… 

Đầu tư vào AI tạo sinh thực sự tăng vọt từ những năm đầu thập kỷ 2020 ở các công ty lớn như Microsoft, Google, Baidu và nhiều công ty nhỏ hơn đang phát triển mô hình trí tuệ nhân tạo tạo sinh. Tuy nhiên cũng xuất hiện những lo ngại về việc sử dụng sai mục đích của AI tạo sinh như tạo tin giả, deepfake,… nhằm lừa dối hoặc thao túng con người. 

Lịch sử hình thành AI tạo sinh 

Kể từ khi thành lập, lĩnh vực học máy (machine learning) đã ứng dụng các mô hình thống kê gồm cả mô hình tạo sinh, để mô hình hóa và dự đoán dữ liệu. Cho đến cuối những năm 2000, sự xuất hiện của học sâu (deep learning) đã thúc đẩy tiến bộ và nghiên cứu trong xử lý hình ảnh, video, phân tích văn bản, nhận dạng giọng nói và một số tác vụ khác. Tuy nhiên, hầu hết mạng thần kinh sâu được đào tạo như mô hình phân biệt đều thực hiện các tác vụ phân loại như phân loại hình ảnh dựa trên mạng thần kinh tích chập. 

Sự ra đời của học máy (machine learning) và học sâu (deep learning)
Sự ra đời của học máy (machine learning) và học sâu (deep learning)

Năm 2014, các tiến bộ như Autoencoder biến đổi (VAE) và mạng đối nghịch tạo sinh đã tạo ra mạng thần kinh sâu thực tế đầu tiên có khả năng học các mô hình tạo sinh. Theo đó, thay vì phân biệt dữ liệu phức tạp như hình ảnh thì các mô hình tạo sinh sâu này có thể xuất ra không chỉ tạo nhãn (label) cho hình ảnh, mà còn có thể xuất ra toàn bộ hình ảnh.

Năm 2017, mạng Transformer cho phép phát triển các mô hình tạo sinh dẫn đến Generative pre-trained transformer (GPT) đầu tiên ra đời vào năm 2018 và tiếp đến là GPT-2 vào năm 2019. Từ đó đã chứng minh khả năng tạo sinh không giám sát cho nhiều tác vụ khác nhau như một mô hình nền tảng (Foundation model).

Năm 2021, sự ra mắt của DALL-E – Là một mô hình tạo sinh pixel dựa trên Transformer; và sau đó là Midjourney và Stable Diffusion đã đánh dấu cho sự xuất hiện của nghệ thuật trí tuệ nhân tạo chất lượng cao thực tế từ những lời nhắc hoặc gợi ý (prompt).

DALL-E 3 tích hợp với ChatGPT được ra mắt
DALL-E 3 tích hợp với ChatGPT được ra mắt

Tháng 1 năm 2023, Futurism.com đã đưa tin rằng CNET đã sử dụng một công cụ AI nội bộ không được tiết lộ để viết ít nhất ra 77 câu chuyện của mình. Tin tức này sau khi tin tức được công bố, CNET đã đăng các bản sửa lỗi cho 41 câu chuyện.

Cho đến tháng 3 năm 2023, GPT-4 đã được phát hành. Một nhóm từ Microsoft Research đã lập luận rằng “nó có thể được xem một cách hợp lý như một phiên bản ban đầu (nhưng vẫn chưa thực sự hoàn chỉnh) của hệ thống trí tuệ tổng quát nhân tạo (AGI)”. 

Cách thức hoạt động của AI tạo sinh như thế nào?

AI tạo sinh được xây dựng bằng cách áp dụng học máy không giám sát hoặc tự giám sát cho một tập dữ liệu cụ thể. Khả năng của hệ thống AI tạo sinh sẽ phụ thuộc vào mô-đun hoặc loại của tập dữ liệu được sử dụng.

Hệ thống AI tạo sinh có thể là đơn mô-đun hoặc đa mô-đun. Trong đó, hệ thống đơn mô-đun chỉ nhận một loại đầu vào; còn hệ thống đa mô-đun có thể nhận nhiều hơn một loại đầu vào. Ví dụ như GPT-4 của OpenAI chấp nhận cả đầu vào văn bản và hình ảnh. Cụ thể:

  • Văn bản: AI tạo sinh được đào tạo trên các từ hoặc ký tự đại diện cho từ gồm GPT-3, LaMDA, LLaMA, BLOOM, GPT-4,…  Vậy nên chúng có khả năng xử lý ngôn ngữ tự nhiên, dịch tự động, tạo ngôn ngữ tự nhiên và có thể sử dụng làm mô hình nền tảng cho các tác vụ khác. Các tập dữ liệu như BookCorpus, Wikipedia,…
  • : Ngoài các văn bản ngôn ngữ tự nhiên thì những mô hình ngôn ngữ lớn có thể được đào tạo trên văn bản ngôn ngữ lập trình, cho phép chúng tạo ra mã nguồn cho các chương trình máy tính mới. Ví dụ như OpenAI Codex.
OpenAI Codex
OpenAI Codex
  • Hình ảnh: Hệ thống AI tạo sinh được đào tạo trên những tập hình ảnh có chú thích văn bản gồm Imagen, DALL-E, Midjourney, Adobe Firefly, Stable Diffusion và một số hệ thống khác. Do đó, chúng thường được sử dụng để tạo hình ảnh từ văn bản cũng như chuyển đổi phong cách hình ảnh. Ví dụ các tập dữ liệu hình ảnh như LAION-5B,… 
  • Phân tử: AI tạo sinh được đào tạo trên các chuỗi axit amin hoặc những biểu diễn phân tử như SMILES (đại diện cho DNA hoặc protein). Các hệ thống này được dùng để dự đoán cấu trúc protein và tìm kiếm thuốc. Tập dữ liệu bao gồm những dữ liệu sinh học khác nhau.
  • Âm nhạc: AI tạo sinh được đào tạo dựa trên các dạng sóng âm thanh của âm nhạc được ghi lại, cùng với chú thích văn bản để tạo ra mẫu âm nhạc mới dựa trên mô tả văn bản. 
Ecrett - Trình tạo nhạc AI
Ecrett – Trình tạo nhạc AI
  • Video: AI tạo sinh được đào tạo trên video có chú thích để tạo ra các video có tính nhất quán về mặt thời gian. Ví dụ như Gen1 và Gen2 của RunwayML hay Make-A-Video của Meta Platforms.
  • Hành động của robot: AI tạo sinh được đào tạo dựa trên chuyển động của một hệ thống robot có khả năng tạo ra các quỹ đạo mới cho hoạch định chuyển động. Ví dụ UniPi của Google Research dùng các lời nhắc như “nhặt bát màu xanh lam” hay “lau đĩa bằng miếng bọt biển màu vàng” để điều khiển chuyển động cánh tay robot.
UniPi của Google Research
UniPi của Google Research

Lợi ích của AI tạo sinh đối với các ngành công nghiệp 

Hiện nay, AI tạo sinh xuất hiện ở khắp mọi lĩnh vực; nhưng đối với một số ngành công nghiệp đặc biệt sẽ khai thác được lợi ích một cách nhanh chóng từ AI tạo sinh. Cụ thể:

1. Dịch vụ tài chính

Những công ty về dịch vụ tài chính có thể tận dụng sức mạnh và hiệu quả chi phí của AI tạo sinh để phục vụ khách hàng, cũng đồng thời giảm tối đa mức chi phí.

Theo đó, tổ chức tài chính có thể sử dụng chatbot thoại dựa trên mô hình nền tảng AI tạo sinh để cải thiện dịch vụ khách hàng qua cách tạo ra những đề xuất sản phẩm và phản hồi các yêu cầu từ phía khách hàng. Bên cạnh đó cũng có thể nhanh chóng theo dõi phê duyệt khoản vay bằng cách sử dụng mô hình nền tảng cho các thị trường chưa có nhiều cách tiếp cận các tổ chức tài chính, đặc biệt là ở quốc gia đang phát triển. 

Công nghệ Blockchain - Tự động hóa quy trình bằng robot (RPA) trong hoạt động ngân hàng
Công nghệ Blockchain – Tự động hóa quy trình bằng robot (RPA) trong hoạt động ngân hàng

Đối với các ngân hàng thì có thể nhanh chóng phát hiện gian lận trong khiếu nại hoặc gian lận thẻ tín dụng/khoản vay. Công ty đầu tư hoàn toàn có thể sử dụng sức mạnh của mô hình nền tảng để đưa ra lời khuyên tài chính cá nhân cho khách hàng của họ với một chi phí thấp.

2. Chăm sóc sức khỏe và khoa học đời sống

AI tạo sinh giúp đẩy nhanh việc khám phá và nghiên cứu thuốc bằng cách dùng các mô hình để tạo ra những trình tự protein mới với đặc tính cụ thể cho việc thiết kế của các kháng thể, enzyme, vắc-xin và liệu pháp gen. 

AI tạo sinh là hệ thống phân tích chăm sóc sức khỏe thông minh
AI tạo sinh là hệ thống phân tích chăm sóc sức khỏe thông minh

Các công ty có thể sử dụng mô hình nền tảng để thiết kế trình tự gen tổng hợp cho ứng dụng trong sinh tổng hợp và kỹ thuật trao đổi chất như tạo ra đường dẫn truyền sinh tổng hợp mới hoặc tối ưu hóa biểu hiện gen để phục vụ cho mục đích sản xuất sinh học. 

Cuối cùng, mô hình nền tảng AI tạo sinh có thể tạo ra dữ liệu tổng hợp về bệnh nhân và chăm sóc sức khỏe. Việc này cũng mang đến lợi ích cho việc đào tạo các mô hình AI, mô phỏng thử nghiệm lâm sàng hoặc nghiên cứu các bệnh hiếm gặp mà không cần phải truy cập vào tập dữ liệu lớn trong thế giới thực.

3. Ngành ô tô và sản xuất

Công ty ô tô và sản xuất có thể ứng dụng AI tạo sinh cho rất nhiều trường hợp sử dụng, từ kỹ thuật đến trải nghiệm trong xe và dịch vụ khách hàng. Cụ thể:

  • AI tạo sinh sẽ giúp cho doanh nghiệp tối ưu hóa thiết kế các bộ phận cơ khí để giảm bớt trở ngại trong thiết kế xe, cũng như tối ưu hóa quy trình sản xuất và giảm chi phí. 
Trí tuệ nhân tạo tạo sinh – Kỹ sư trí tuệ nhân tạo trong ngành sản xuất ô tô 
Trí tuệ nhân tạo tạo sinh – Kỹ sư trí tuệ nhân tạo trong ngành sản xuất ô tô
  • Tạo ra các trải nghiệm mới trong xe bao gồm cả việc thiết kế các trợ lý cá nhân. 
  • Giúp nâng cao chất lượng dịch vụ khách hàng thông qua cách đưa ra phản hồi nhanh chóng cho các câu hỏi phổ biến nhất của khách hàng. 
  • Tạo dữ liệu tổng hợp phục vụ kiểm thử các ứng dụng, đặc biệt là với dữ liệu ít khi được đưa vào tập dữ liệu kiểm thử. Ví dụ như dữ liệu về lỗi hoặc các trường hợp hiếm gặp.

4. Truyền thông và giải trí

Đối với ngành truyền thông và giải trí, AI tạo sinh hỗ trợ sản xuất nội dung phim chất lượng cao, mới lạ với mức chi phí và thời gian chỉ bằng một phần của phương pháp truyền thống. 

AI tạo sinh sẽ tác động lên các phân cảnh trong phim
AI tạo sinh sẽ tác động lên các phân cảnh trong phim

Các nghệ sĩ có thể bổ sung và nâng cao album của mình bằng âm nhạc do AI tạo ra. Với tổ chức truyền thông thì có thể sử dụng AI tạo sinh để cải thiện trải nghiệm khách hàng bằng cách cung cấp nội dung và quảng cáo được cá nhân hóa giúp tăng doanh thu. Còn với công ty game thì có thể dùng AI tạo sinh để tạo ra các trò chơi mới, cho phép người chơi xây dựng hình đại diện.

5. Viễn thông

AI tạo sinh thời kỳ đầu được ứng dụng trong viễn thông đều tập trung vào việc đổi mới trải nghiệm khách hàng. Khi đó, trải nghiệm khách hàng sẽ được xác định bởi hàng loạt tương tác tích lũy của bên đăng ký nhận ở trên tất cả điểm tiếp xúc trên hành trình của khách hàng. 

Ứng dụng AI tạo sinh để đổi mới trải nghiệm khách hàng
Ứng dụng AI tạo sinh để đổi mới trải nghiệm khách hàng

Ví dụ, tổ chức viễn thông có thể ứng dụng AI tạo sinh để cải thiện dịch vụ khách hàng bằng những tác tử đối thoại trực tiếp giống hệt với con người. Đồng thời tối ưu hóa hiệu suất mạng bằng cách phân tích dữ liệu mạng để đề xuất những bản sửa lỗi, và làm mới mối quan hệ khách hàng bằng các trợ lý bán hàng trực tiếp đã được cá nhân hóa tối đa.

6. Năng lượng

AI tạo sinh phù hợp với những tác vụ liên quan đến phân tích dữ liệu phức tạp, nhận dạng quy luật, dự báo và tối ưu hóa ở trong ngành năng lượng.

Ứng dụng AI tạo sinh trong tìm kiếm và khai thác dầu khí
Ứng dụng AI tạo sinh trong tìm kiếm và khai thác dầu khí

Những tổ chức năng lượng có thể cải thiện dịch vụ khách hàng bằng cách phân tích dữ liệu khách hàng. Từ đó xác định các quy luật sử dụng và phát triển các sản phẩm có mục tiêu, các chương trình sử dụng năng lượng hiệu quả và các sáng kiến đáp ứng theo nhu cầu. 

Hệ thống AI tạo sinh sẽ giúp quản lý lưới điện, nâng cao độ an toàn tại nơi vận hành và tối ưu hóa quá trình sản xuất năng lượng thông qua các mô phỏng hồ chứa.

Những thiếu sót của AI tạo sinh

Theo Reuters, AI tạo sinh có thể tạo ra thay đổi mang tính bước ngoặt với nhiều ngành nghề nhưng chúng lại còn quá mới nên người dùng vẫn chưa thấy các tác động lâu dài. Tuy nhiên, điều đầu tiên khiến chuyên gia lo lắng chính là AI tạo sinh có thể tạo ra thông tin hoàn toàn sai. Và tồi tệ hơn, đôi khi nó mang thành kiến bởi thông tin đầu vào được lấy từ khắp Internet.

Cảnh báo đáng sợ về thông tin sai lệch trên AI ChatGPT
Cảnh báo đáng sợ về thông tin sai lệch trên AI ChatGPT

Có một số cách để giảm thiểu tác động tiêu cực của AI tạo sinh đó là:

  • Nhà phát triển phải chọn lọc dữ liệu đầu vào cẩn trọng ngay từ đầu. 
  • Thay vì dùng mô hình Generative AI có sẵn thì các tổ chức có thể cân nhắc để dùng mô hình chuyên biệt với quy mô nhỏ hơn, có thể tùy chỉnh dựa trên dữ liệu của riêng mình để phù hợp với nhu cầu và giảm thiểu sai lệch.

Hiện nay, giới chuyên gia khuyến cáo người dùng tránh dùng AI tạo sinh cho những quyết định quan trọng. Lý do là vì bối cảnh rủi ro và cơ hội có thể thay đổi nhanh chóng mỗi ngày mà có thể AI chưa được cập nhật.

Cuối cùng, khi AI tạo sinh ngày càng trở nên phổ biến và xuất hiện một cách tự nhiên trong đời sống thì môi trường pháp lý liên quan đòi hỏi sẽ phải theo kịp sự phát triển của công nghệ. 

Một số mô hình phát triển hệ thống AI tạo sinh nổi bật

Hiện nay có rất nhiều mô hình AI tạo sinh khác nhau, và khi kết hợp ưu điểm của mỗi loại sẽ giúp tạo ra mô hình AI tạo sinh mạnh mẽ nhất. 

1. Diffusion (Denoising Diffusion Probabilistic Models – DDPMs)

Là mô hình tạo sinh xác định vectơ trong không gian ẩn thông qua 1 quá trình 2 bước khi huấn luyện; 2 bước gồm Forward Diffusion và Reverse Diffusion. Trong đó, Forward diffusion dần dần thêm nhiễu ngẫu nhiên vào dữ liệu huấn luyện; còn Reverse Diffusion đảo nghịch lại để tái tạo lại các mẫu dữ liệu. Dữ liệu mới sau đó được tạo ra bằng cách chạy quá trình Reverse Denoising bắt đầu từ nhiễu hoàn toàn ngẫu nhiên.

Mô hình DDPMs 
Mô hình DDPMs

Một mô hình DDPMs có thể mất nhiều thời gian so với các mô hình khác, nhưng quy trình 2 bước này có thể huấn luyện hàng trăm nếu như không phải là một lượng vô hạn, lớp. Do đó có thể nói, DDPMs thường cung cấp đầu ra chất lượng cao nhất khi xây dựng mô hình AI tạo sinh.

Bên cạnh đó, DDPMs cũng được phân loại là một mô hình nền tảng bởi chúng có quy mô lớn và cung cấp đầu ra chất lượng cao, linh hoạt. 

2. Variational Autoencoders (VAEs)

Bao gồm 2 mạng nơ-ron, thường được gọi là bộ mã hóa (encoder) và bộ giải mã (decoder). Khi được cung cấp đầu vào thì bộ mã hóa chuyển đổi nó thành 1 biểu diễn nhỏ hơn cùng mật độ cao hơn của dữ liệu. Biểu diễn này sẽ bảo tồn thông tin cần thiết cho bộ giải mã để tái tạo lại dữ liệu đầu vào ban đầu, đồng thời cũng sẽ loại bỏ bất kỳ thông tin không liên quan nào. 

Variational Autoencoders (VAEs)
Variational Autoencoders (VAEs)

Bộ mã hóa và bộ giải mã hoạt động cùng nhau để học biểu diễn dữ liệu tiềm ẩn hiệu quả và đơn giản, cho phép người dùng dễ dàng lấy mẫu các biểu diễn tiềm ẩn mới có thể được ánh xạ thông qua bộ giải mã nhằm tạo dữ liệu mới. Dù VAEs có tốc độ tạo hình ảnh đầu ra nhanh hơn, nhưng hình ảnh được tạo bởi chúng không chi tiết bằng mô hình Diffusion.

3. Generative Adversarial Networks (GANs)

GANs là mô hình được phát triển vào năm 2014, đối đầu 2 mạng nơ-ron với nhau. Cụ thể, Generator tạo ra các ví dụ mới; còn Discriminator học cách phân biệt nội dung là thực (từ miền) hoặc giả (được tạo ra).

Cơ chế hoạt động của mô hình GANs
Cơ chế hoạt động của mô hình GANs

Generator và Discriminator được đào tạo cùng nhau, ngày càng trở nên thông minh khi Generator tạo ra nội dung tốt hơn và Discriminator cũng phân biệt chính xác hơn. Quy trình này được lặp lại và không ngừng thúc đẩy cả 2 có thể cải thiện sau mỗi vòng lặp cho đến khi nội dung được tạo ra không thể phân biệt  so với nội dung hiện có.

Thực tế, dù GANs có thể cung cấp các mẫu chất lượng cao và tạo đầu ra nhanh chóng, nhưng các mẫu thường ít đa dạng. Vì vậy, GANs sẽ phù hợp hơn với việc tạo dữ liệu cụ thể cho miền dữ liệu.

4. Transformer (Transformer Neural Network)

Mô hình Transformer là một dạng cụ thể của kiến trúc mạng nơ-ron đã được phổ biến bởi khả năng xử lý dữ liệu tuần tự như văn bản một cách hiệu quả. Transformer sử dụng cơ chế tự chú ý để nắm bắt sự phụ thuộc giữa các từ khác nhau trong một câu, cho phép chúng hiểu hơn về các mối quan hệ ngữ nghĩa. Kiến trúc này chứng minh hiệu quả trong các nhiệm vụ xử lý ngôn ngữ tự nhiên khác nhau, giúp cải thiện dịch máy, tạo văn bản và nhiều ứng dụng khác dựa trên văn bản.

Kiến trúc mô hình Transformer
Kiến trúc mô hình Transformer

Hai cơ chế làm mô hình Transformer “tinh thông” cho các ứng dụng AI tạo sinh văn bản gồm self-attention và positional encodings. Đây là 2 công nghệ giúp biểu diễn thời gian và cho phép thuật toán tập trung vào cách các từ ở vị trí xa nhau có mối quan hệ với nhau. Trong đó, lớp self-attention gán trọng số cho mỗi phần của đầu vào – là trọng số biểu thị sự quan trọng của đầu vào đó trong ngữ cảnh của toàn bộ đầu vào; còn positional encoding là một biểu diễn về thứ tự các từ đầu vào xuất hiện.

Nội dung trên đây là các thông tin tổng hợp để trả lời cho câu hỏi AI tạo sinh là gì. Có thể nói, AI tạo sinh đã và đang nhận được sự thu hút đáng kể của các công ty công nghệ lớn và các công ty khởi nghiệp hiện nay. Nó chính là cột mốc bứt phá đối với nhiều nhà công nghệ, vậy nên thành tựu nó mang lại rất đáng để chúng ta theo dõi!

About Phạm Xuân Thanh

Tôi là Phạm Xuân Thanh – Tôi đã có kinh nghiệm hơn 3 năm review đánh giá về các loại máy móc công nghiệp, thiết bị vệ sinh công nghiệp, cách chăm sóc xe hơi. Tôi hy vọng những kiến thức mà tôi chia sẻ có thể giúp mọi người hiểu rõ hơn về các công dụng, chức năng của các loại thiết bị công nghiệp và các cách chăm sóc xe hơi này.

View all posts by Phạm Xuân Thanh →