meeyland app
Meey Land
Cổng thông tin bất động sản xác thực 4.0
Tải ứng dụng

DALL-E là gì? Cách hệ thống tạo ra nghệ thuật AI

Thứ năm, 02/02/2023-11:02
DALL-E đang vô cùng phổ biến trong giới nghệ sĩ kỹ thuật số. Trình tạo văn bản thành hình ảnh AI mạnh mẽ này cho phép người dùng thỏa sức sáng tạo. Nhiều người tin rằng các trình tạo AI như DALL-E chính là tương lai của nghệ thuật kỹ thuật số. Cùng tìm hiểu chi tiết DALL-E là gì trong bài viết dưới đây.

DALL-E là gì?

DALL-E là một mô hình học máy (machine learning) do OpenAI phát triển. DALL-E được mệnh danh là ứng dụng đầu tiên có thể tạo hình ảnh từ văn bản. 

Hệ thống sử dụng mạng nơ-ron dựa trên transformer, một loại học máy hiểu ngữ cảnh và xử lý trình tự, để tạo ra hình ảnh mới thể hiện chính xác từng gợi ý văn bản (prompt). DALL-E liên tục được đào tạo và cập nhật bộ dữ liệu để có thể dự đoán chính xác hơn nữa.

Giải mã tên gọi “DALL-E”

“DALL-E” là sự kết hợp giữa tên của nghệ sĩ Salvador Dali, họa sĩ có ảnh hưởng lớn nhất thế kỷ 20 với phong cách siêu thực, và người máy WALL-E trong bộ phim cùng tên của Pixar. Tên gọi cho thấy sự kết hợp giữa nghệ thuật và hoạt hình kỹ thuật số thông qua trí tuệ nhân tạo. DALL-E đã và đang để lại dấu ấn có một không hai trong thế giới AI.


DALL-E là ứng dụng đầu tiên có thể tạo hình ảnh từ văn bản. 
DALL-E là ứng dụng đầu tiên có thể tạo hình ảnh từ văn bản. 

Hướng dẫn đăng ký sử dụng DALL-E

Tạo tài khoản OpenAI

Truy cập labs.openai.com, đăng ký bằng tài khoản Google hoặc Microsoft hoặc tạo thông tin đăng nhập bằng địa chỉ email.

Tuy nhiên, hiện DALL-E chưa hỗ trợ IP Việt Nam, do đó, nếu muốn sử dụng DALL-E, bạn cần thuê SIM USA để nhận tin nhắn xác thực và tải phần mềm VPN để FAKE IP qua USA.

Xem hướng dẫn chi tiết tại bài viết Chat GPT là gì? Hướng dẫn đăng ký Chat GPT đơn giản

DALL-E có miễn phí không?

DALL-E không hoàn toàn miễn phí. Dịch vụ chạy trên “credit”. Khi đăng ký, người dùng sẽ nhận được 50 credit miễn phí và 15 credit miễn phí mỗi tháng sau đó, không áp dụng cộng dồn. Các credit mua được cộng dồn từ tháng này sang tháng khác trong tối đa 12 tháng. 115 credit có giá 15 đô la.

Một credit cho phép người dùng sáng tạo ra một thế hệ nghệ thuật AI với cụm từ gợi ý (mỗi thế hệ gồm bốn hình ảnh mới). Đồng thời sử dụng credit để tạo biến thể cho tác phẩm đã tạo ra trước đó. Người dùng cũng có thể dùng thêm credit để hình ảnh do AI tạo ra được chi tiết và chính xác hơn.

DALL-E hoạt động như thế nào?

DALL-E có thể tạo ra hình ảnh vốn chỉ có trong tưởng tượng dựa trên các từ do người sáng tạo cung cấp, ngay cả khi đó là mô tả độc đáo và dị thường nhất.

Vậy DALL-E tạo ra tác phẩm nghệ thuật như thế nào? DALL-E áp dụng thuật toán vào các từ và đặt các từ trong một loạt các vectơ, hay chính là nhúng văn bản thành hình ảnh. Sau đó, AI tạo ra một hình ảnh gốc từ biểu diễn chung dựa trên văn bản do người dùng sáng tạo. Ilya Sutskever, đồng sáng lập và nhà khoa học chính tại OpenAI cho biết, DALL-E có thể "lấy bất kỳ văn bản nào và tạo ra hình ảnh từ đó".

Với các bộ dữ liệu nâng cao (dataset), kết hợp với học sâu (deep learning), học máy, DALL-E có thể sáng tạo ra tác phẩm nghệ thuật mới. Nó lấy hình ảnh nhúng và tạo ra một hình ảnh thực tế. AI cũng có thể thêm thắt các chi tiết nhỏ phù hợp, chẳng hạn như bóng đổ, hình ảnh phản chiếu để hình ảnh trông chân thực hơn.

Sự khác biệt giữa DALL-E và DALL-E 2

DALL-E (ra mắt vào tháng 1/2021) và DALL-E 2 (ra mắt vào tháng 4/2022) đều là các công cụ do OpenAI phát triển. Tuy nhiên chúng có sự khác biệt về số lượng tham số, cho phép DALL-E 2 tạo ra hình ảnh thậm chí còn tốt hơn DALL-E. Do nó tạo ra hình ảnh có chất lượng phân giải cao hơn. Trong khi DALL-E sử dụng 12 tỷ tham số, DALL-E 2 hoạt động trên 3,5 tỷ tham số, với 1,5 tỷ tham số bổ sung để nâng cao độ phân giải.

DALLE-2 tạo ra hình ảnh có độ phân giải cao hơn, mặc dù sử dụng ít tham số hơn so với phiên bản tiền nhiệm. Thêm vào đó. DALL-E 2 có thể mở rộng hình ảnh ngoài những gì có trong ảnh gốc, hay còn được gọi là Outpainting - tạo bố cục mới từ hình ảnh cũ. Nó có độ phân giải lớn hơn gấp bốn lần so với DALL-E. Nhìn chung, DALL-E 2 linh hoạt hơn và tạo ra hình ảnh chân thực và chính xác hơn so với  DALL-E.

Tính năng mới lạ của DALL-E: Outpainting

Vào tháng 8 năm 2022, OpenAI đã giới thiệu một tính năng mới độc đáo có tên là Outpainting cho DALL-E 2. Sản phẩm đầu tiên là phiên bản mở rộng của tác phẩm nghệ thuật cổ điển "Thiếu nữ đeo hoa tai ngọc trai" của Johannes Vermeer. Hình ảnh do DALL-E tạo ra chứa bức chân dung nổi tiếng nhưng được phóng to gần gấp 20 lần, bối cảnh mở rộng là một căn phòng bừa bộn với đồ trang trí, đồ nội thất, v.v.

Tính năng Outpainting cho phép người dùng tiếp tục tạo hình ảnh vượt qua ranh giới ban đầu, đưa các yếu tố hình ảnh đi theo một hướng mới, chỉ thông qua mô tả. Tính năng bổ sung này là sự cân bằng tuyệt vời cho tính năng chỉnh sửa trước đây của DALL-E, được gọi là inpainting, cho phép người dùng thay đổi hình ảnh đã tạo.

Một số kiệt tác được DALL-E làm mới


"Thiếu nữ đeo hoa tai ngọc trai" sau khi được mở rộng 
"Thiếu nữ đeo hoa tai ngọc trai" sau khi được mở rộng 

“Mona Lisa” được biến hóa bởi DALL-E
“Mona Lisa” được biến hóa bởi DALL-E

Bức tranh sơn dầu “The Milkmaid” của Johannes Vermeer 
Bức tranh sơn dầu “The Milkmaid” của Johannes Vermeer 

“American Gothic” được tô điểm bởi tính năng Outpainting
“American Gothic” được tô điểm bởi tính năng Outpainting

Hướng dẫn sử dụng Outpainting trong DALL-E

  • Mở DALL-E 2 và chuyển đến màn hình chính
  • Nhấp vào nút “Or upload an image to edit”
DALL-E là gì? Cách hệ thống tạo ra nghệ thuật AI - ảnh 6
  • Tải lên hình ảnh bạn muốn chỉnh sửa; lưu ý: DALL-E sẽ cắt hình ảnh thành hình vuông
DALL-E là gì? Cách hệ thống tạo ra nghệ thuật AI - ảnh 7
  • Sử dụng công cụ xóa để tinh chỉnh xung quanh các cạnh của ảnh gốc
DALL-E là gì? Cách hệ thống tạo ra nghệ thuật AI - ảnh 8
  • Chuyển đến khung nhập prompt phía trên phần chỉnh sửa và nhập nội dung bạn muốn tạo.
DALL-E là gì? Cách hệ thống tạo ra nghệ thuật AI - ảnh 9
  • DALL-E sẽ chọn một hình ảnh mới và trộn nó với bản gốc một cách mượt mà.
DALL-E là gì? Cách hệ thống tạo ra nghệ thuật AI - ảnh 10

Các tính năng khác của DALL-E là gì? 

  • Chỉnh sửa: Có thể những hình ảnh do Dall-E tạo ra không đáp ứng yêu cầu của bạn. Do đó, DALL-E cung cấp thêm công cụ chỉnh sửa tốt nhất, cho phép bạn chỉnh sửa và thay đổi hình ảnh theo mong muốn.
  • Biến thể: Người dùng có thể tạo thêm các biến thể khác trên hình ảnh do Dall-E tạo ra hoặc thậm chí được người dùng tải lên với cảm hứng được lấy từ hình ảnh gốc.
  • Giảm lạm dụng: Do chức năng độc đáo của Dall-E là tạo ra hình ảnh từ văn bản, nên có thể nó đang bị sử dụng sai mục đích ở một mức độ nào đó. Đó là lý do tại sao Dall-E từ chối người dùng tải hình ảnh thực tế lên nền tảng của nó và cũng hạn chế người dùng tạo hình ảnh mô tả khuôn mặt của những người nổi tiếng hoặc chính trị gia để tránh gây tranh cãi.
  • Ngăn chặn sáng tạo hình ảnh gây hại: Các bộ lọc của DALL-E hoạt động hiệu quả trong việc ngăn người dùng vi phạm chính sách nội dung. DALL-E không cho phép người dùng tạo ra hình ảnh có nội dung bôi nhọ, làm xấu cho các ổ chức, nhân vật công chúng, không cho phép tạo ra nội dung người lớn.
  • Giám sát: Các máy chủ của DALL-E liên tục được tự động hóa và được con người giám sát để ngăn mọi người lạm dụng nền tảng.

DALL-E có quan trọng hay không?

DALL-E được coi là cuộc cách mạng của thế giới công nghệ vì trí tuệ nhân tạo trước đó chỉ có thể tạo hình ảnh khi nhìn thấy hình ảnh. Việc OpenAI phát triển ra DALL-E đang thay đổi cách AI vận hành vì một đầu vào văn bản giờ đây có thể tạo ra một hình ảnh có tương quan chặt chẽ, giống như những gì chúng ta tưởng tượng về nó.

Sau khi hiểu về Dall-E là gì, nhiều người có thể đang thắc mắc: Liệu kỹ thuật học máy này có phải là dấu chấm hết của sự sáng tạo nghệ thuật hay không? Nếu giờ đây máy tính có thể tạo ra hình ảnh gốc thông qua văn bản, thì nghệ sĩ, nhân viên thiết kế đồ họa hay họa sĩ và những nghề tương tự sẽ làm gì?

Chúng ta cần hiểu rõ là một phát minh như Dall-E không thể chấm dứt tài năng của con người hay trở thành sự thay thế mà đó chỉ là sự nâng cao năng lực của con người.

Không có công nghệ nào, tính đến thời điểm hiện tại, có thể thay thế con người trong lĩnh vực hội họa. Ngoài ra, Dall-E cần ngôn ngữ đầu vào cụ thể để hiển thị hình ảnh phức tạp. Đôi khi những hình ảnh đó có thể không đủ làm cho bạn cảm thấy hài lòng và đôi khi không có tác dụng thực sự.

Lợi ích của DALL-E trong lĩnh vực thương mại

Mặc dù Dall-E có thể không phù hợp cho một số mục đích, nhưng nó chắc chắn có lợi trong các lĩnh vực:

  • Website thương mại điện tử: Khi cần tạo các hình ảnh sản phẩm các website thương mại điện tử, Dall-E phát huy tác dụng khá tốt. Dall-E là một lựa chọn rẻ hơn và hợp lý hơn, nơi các nhà thiết kế có thể đưa vào hình ảnh động mở rộng và đơn giản hơn một chút so với  thiết kế kỹ thuật thông thường.
  • Website bất động sản: Một lĩnh vực khác mà Dall-E khá hữu ích là trên·các website bất động sản. Với DALL-E, khách hàng hoặc nhà phát triển có thể xây dựng hình ảnh cấu trúc bất động dựa trên mong muốn và thông số kỹ thuật.

Những tác phẩm kỳ lạ nhất được tạo ra bởi DALL-E


Khi Godzilla kết hợp với SpongeBob SquarePants, sẽ ra một biến thể Godzilla vừa kỳ lạ vừa mắc cười như thế này đây.
Khi Godzilla kết hợp với SpongeBob SquarePants, sẽ ra một biến thể Godzilla vừa kỳ lạ vừa mắc cười như thế này đây.

Nhập “Apple Car” và DALL-2 trả về một chiếc ô tô thể thao tối giản, lấy cảm hứng từ MacBook và Magic Mouse, chế tác từ nhôm và kính.
Nhập “Apple Car” và DALL-2 trả về một chiếc ô tô thể thao tối giản, lấy cảm hứng từ MacBook và Magic Mouse, chế tác từ nhôm và kính.

Bạn đã bao giờ tưởng tượng chú cún Pug trong hình hài Pikachu sẽ như thế nào chưa?
Bạn đã bao giờ tưởng tượng chú cún Pug trong hình hài Pikachu sẽ như thế nào chưa?

Khi nhóm rối Muppets tấn công Tuần lễ thời trang London, sẽ cho ra đời những photoshoot độc lạ như vậy.
Khi nhóm rối Muppets tấn công Tuần lễ thời trang London, sẽ cho ra đời những photoshoot độc lạ như vậy.

Borat Sagdiyev trong vai Dr Strange
Borat Sagdiyev trong vai Dr Strange

Nếu gấu mèo kết hợp với tennis Wimbledon những năm 1990, thì kết quả sẽ là…
Nếu gấu mèo kết hợp với tennis Wimbledon những năm 1990, thì kết quả sẽ là…

Kết luận

DALL-E 2 mang lại tiềm năng to lớn với Outpainting cho phép người nghệ sĩ vượt qua giới hạn của tác phẩm nghệ thuật kỹ thuật số. Tất cả những gì bạn cần là vận dụng trí tưởng tượng và ý tưởng cho khung cảnh siêu thực mà bạn muốn thêm vào ảnh gốc. Trình tạo AI sẽ giúp bạn vượt xa các kỹ năng thủ công và tận dụng tối đa ý tưởng của mình.

CÓ thể nói, DALL-E là một trong những công cụ tốt nhất để tạo nghệ thuật AI hiện nay và mang lại kết quả thực sự ấn tượng.

Hy vọng rằng sau khi đọc hết nội dung trên, bạn đã hiểu DALL-E là gì. Bạn đã sáng tạo hình ảnh nào thông qua trình tạo văn bản thành hình ảnh AI chưa? Chia sẻ kinh nghiệm trong phần bình luận bên dưới nhé!
 

Chia sẻ:

Cùng chủ đề

Chiến lược mới của các Big Tech nhằm thâu tóm thị trường AI

Các “ông lớn” công nghệ gia tăng nỗ lực chinh phục thị trường Ấn Độ

Châu Âu ấp ủ xây dựng các trung tâm dữ liệu mới trên quỹ đạo

Lo ngại lộ dữ liệu, Mỹ tiếp tục mở cuộc điều tra ba nhà mạng của Trung Quốc

Hãng sản xuất pin đến từ Trung Quốc “trình làng” dòng pin mới với hiệu suất khủng

Trung tâm dữ liệu AI Cloud quy mô lớn đầu tiên của Đông Nam Á đi vào vận hành

Sau ChatGPT, những AI nào đang rục rịch được tích hợp vào iPhone?

Cuộc chạy đua trí tuệ nhân tạo ngày càng “nóng”, đối thủ lớn nhất của OpenAI công bố chatbot mạnh nhất

Tin mới cập nhật

Một số dự án treo bất ngờ được thoát "khai tử" nhờ Hà Nội tung "phao cứu sinh"

2 ngày trước

Quy định cấm bán bảo hiểm "gắn" dịch vụ ngân hàng: Doanh nghiệp bảo hiểm muốn có hướng dẫn cụ thể

2 ngày trước

Gặp khó với "danh phận", Condotel cắt lỗ cả tỉ đồng nhưng thanh khoản vẫn mất hút

2 ngày trước

Tập đoàn Foxconn tiếp tục rót thêm 551 triệu USD đầu tư phát triển công nghệ tại Việt Nam

2 ngày trước

Thương mại điện tử bùng nổ, nhà phố cho thuê đìu hiu, ế ẩm

3 ngày trước