Imagen là mô hình tạo hình ảnh có độ trung thực cao của Google, có khả năng tạo hình ảnh chân thực và chất lượng cao từ câu lệnh bằng văn bản. Tất cả hình ảnh được tạo đều có hình mờ SynthID. Để tìm hiểu thêm về các biến thể mô hình Imagen hiện có, hãy xem phần Các phiên bản mô hình.
Lưu ý: Bạn cũng có thể tạo hình ảnh bằng các tính năng đa phương thức tích hợp của Gemini. Hãy xem Hướng dẫn tạo hình ảnh để biết thông tin chi tiết.Ví dụ này minh hoạ cách tạo hình ảnh bằng mô hình Imagen:
Hiện tại, Imagen chỉ hỗ trợ câu lệnh bằng tiếng Anh và các thông số sau:
Lưu ý: Quy ước đặt tên của các tham số sẽ khác nhau tuỳ theo ngôn ngữ lập trình.personGeneration: Cho phép mô hình tạo hình ảnh về con người. Sau đây là các giá trị được hỗ trợ:
Phần này trong hướng dẫn về Imagen cho bạn biết cách sửa đổi câu lệnh chuyển văn bản sang hình ảnh có thể tạo ra nhiều kết quả, cùng với ví dụ về những hình ảnh bạn có thể tạo.
Câu lệnh hiệu quả là câu lệnh có tính mô tả và rõ ràng, đồng thời sử dụng các từ khoá và bộ sửa đổi có ý nghĩa. Hãy bắt đầu bằng cách nghĩ đến chủ thể, bối cảnh và phong cách.
Chủ thể: Điều đầu tiên bạn cần nghĩ đến khi đưa ra câu lệnh là chủ thể: đối tượng, người, động vật hoặc cảnh vật mà bạn muốn tạo hình ảnh.
Bối cảnh và thông tin cơ bản: Bối cảnh hoặc thông tin cơ bản cũng quan trọng không kém khi đặt đối tượng. Hãy thử đặt chủ thể của bạn vào nhiều phông nền. Ví dụ: một phòng chụp hình có phông nền trắng, ngoài trời hoặc môi trường trong nhà.
Kiểu: Cuối cùng, hãy thêm kiểu hình ảnh mà bạn muốn. Phong cách có thể là phong cách chung (tranh vẽ, ảnh chụp, bản phác thảo) hoặc phong cách rất cụ thể (tranh vẽ bằng phấn màu, bản vẽ bằng than, hình ảnh 3D đẳng cự). Bạn cũng có thể kết hợp các kiểu.
Sau khi viết phiên bản đầu tiên của câu lệnh, hãy tinh chỉnh câu lệnh bằng cách thêm nhiều chi tiết hơn cho đến khi bạn nhận được hình ảnh mà mình muốn. Việc lặp lại là rất quan trọng. Bắt đầu bằng cách xác định ý tưởng cốt lõi, sau đó tinh chỉnh và mở rộng ý tưởng đó cho đến khi hình ảnh được tạo gần giống với hình ảnh mà bạn mong muốn.
Các mô hình Imagen có thể biến ý tưởng của bạn thành hình ảnh chi tiết, cho dù câu lệnh của bạn ngắn hay dài và chi tiết. Tinh chỉnh ý tưởng của bạn thông qua việc đưa ra câu lệnh lặp đi lặp lại, thêm thông tin chi tiết cho đến khi bạn đạt được kết quả hoàn hảo.
Lời khuyên bổ sung về cách viết câu lệnh cho Imagen:
Các mô hình Imagen có thể thêm văn bản vào hình ảnh, mở ra nhiều khả năng sáng tạo hơn trong việc tạo hình ảnh. Hãy tham khảo hướng dẫn sau để khai thác tối đa tính năng này:
Nhiều cụm từ: Thử nghiệm với hai hoặc ba cụm từ riêng biệt để cung cấp thêm thông tin. Tránh dùng quá 3 cụm từ để có bố cục rõ ràng hơn.
Vị trí của hướng dẫn: Mặc dù Imagen có thể cố gắng đặt văn bản theo chỉ dẫn, nhưng đôi khi sẽ có sự khác biệt. Tính năng này liên tục được cải thiện.
Kiểu phông chữ truyền cảm hứng: Chỉ định một kiểu phông chữ chung để ảnh hưởng một cách tinh tế đến các lựa chọn của Imagen. Đừng dựa vào việc sao chép phông chữ một cách chính xác, mà hãy kỳ vọng vào những cách diễn giải sáng tạo.
Cỡ chữ: Chỉ định cỡ chữ hoặc thông tin chung về cỡ chữ (ví dụ: nhỏ, vừa, lớn) để ảnh hưởng đến quá trình tạo cỡ chữ.
Để kiểm soát kết quả đầu ra tốt hơn, bạn có thể thấy việc tham số hoá đầu vào thành Imagen là hữu ích. Ví dụ: giả sử bạn muốn khách hàng có thể tạo biểu trưng cho doanh nghiệp của họ và bạn muốn đảm bảo biểu trưng luôn được tạo trên nền có màu đơn sắc. Bạn cũng muốn giới hạn các lựa chọn mà khách hàng có thể chọn trong trình đơn.
Trong ví dụ này, bạn có thể tạo một câu lệnh có tham số tương tự như sau:
A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.Trong giao diện người dùng tuỳ chỉnh, khách hàng có thể nhập các tham số bằng một trình đơn và giá trị mà họ chọn sẽ điền sẵn vào câu lệnh mà Imagen nhận được.
Ví dụ:
Câu lệnh: A minimalist logo for a health care company on a solid color background. Include the text Journey.

Câu lệnh: A modern logo for a software company on a solid color background. Include the text Silo.

Câu lệnh: A traditional logo for a baking company on a solid color background. Include the text Seed.

Hãy sử dụng các ví dụ sau để tạo câu lệnh cụ thể hơn dựa trên các thuộc tính như nội dung mô tả về nhiếp ảnh, hình dạng và chất liệu, các phong trào nghệ thuật trong lịch sử và các đối tượng sửa đổi chất lượng hình ảnh.
Để sử dụng kiểu này, hãy bắt đầu bằng cách dùng các từ khoá cho Imagen biết rõ rằng bạn đang tìm kiếm một bức ảnh. Bắt đầu câu lệnh bằng "Một bức ảnh về. . .". Ví dụ:
Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh văn bản tương ứng với mô hình Imagen 3.
Trong các ví dụ sau, bạn có thể thấy một số tham số và đối tượng sửa đổi dành riêng cho nhiếp ảnh. Bạn có thể kết hợp nhiều hệ số sửa đổi để kiểm soát chính xác hơn.
Khoảng cách chụp của camera - Cận cảnh, chụp từ xa
Vị trí camera - trên không, từ dưới lên
Ánh sáng - tự nhiên, kịch tính, ấm áp, lạnh
Chế độ cài đặt camera - làm mờ chuyển động, lấy nét mềm, bokeh, chân dung
Loại ống kính - 35 mm, 50 mm, mắt cá, góc rộng, macro
Loại phim - đen trắng, polaroid
Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh văn bản tương ứng với mô hình Imagen 3.
Phong cách nghệ thuật đa dạng từ phong cách đơn sắc như bản phác thảo bằng bút chì, đến nghệ thuật số siêu thực. Ví dụ: các hình ảnh sau đây sử dụng cùng một câu lệnh nhưng có nhiều kiểu khác nhau:
"Một [art style or creation technique] về chiếc sedan điện thể thao góc cạnh với các toà nhà chọc trời ở phía sau"
Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh văn bản tương ứng với mô hình Imagen 2.
Một trong những điểm mạnh của công nghệ này là bạn có thể tạo ra những hình ảnh khó hoặc không thể tạo được bằng cách khác. Ví dụ: bạn có thể tạo lại biểu trưng công ty bằng nhiều chất liệu và kết cấu.
Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh văn bản tương ứng với mô hình Imagen 3.
Một số phong cách đã trở thành biểu tượng qua nhiều năm. Sau đây là một số ý tưởng về phong cách hội hoạ hoặc nghệ thuật trong lịch sử mà bạn có thể thử.
"tạo một hình ảnh theo phong cách của [art period or movement] : một trang trại gió"
Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh văn bản tương ứng với mô hình Imagen 3.
Một số từ khoá có thể cho mô hình biết rằng bạn đang tìm kiếm một thành phần chất lượng cao. Sau đây là một số ví dụ về bộ sửa đổi chất lượng:
Sau đây là một vài ví dụ về câu lệnh không có công cụ sửa đổi chất lượng và câu lệnh tương tự có công cụ sửa đổi chất lượng.
Nguồn hình ảnh: Mỗi hình ảnh được tạo bằng câu lệnh văn bản tương ứng với mô hình Imagen 3.
Tính năng tạo hình ảnh của Imagen cho phép bạn đặt 5 tỷ lệ khung hình riêng biệt.
Toàn màn hình (4:3) - Tỷ lệ khung hình này thường được dùng trong nội dung nghe nhìn hoặc phim. Đây cũng là kích thước của hầu hết các TV cũ (không phải màn hình rộng) và máy ảnh định dạng trung bình. Tỷ lệ này chụp được nhiều cảnh hơn theo chiều ngang (so với tỷ lệ 1:1), khiến đây trở thành tỷ lệ khung hình được ưu tiên cho nhiếp ảnh.
Toàn màn hình dọc (3:4) - Đây là tỷ lệ khung hình toàn màn hình được xoay 90 độ. Nhờ đó, bạn có thể chụp được nhiều cảnh hơn theo chiều dọc so với tỷ lệ khung hình 1:1.
Màn hình rộng (16:9) - Tỷ lệ này đã thay thế tỷ lệ 4:3 và hiện là tỷ lệ khung hình phổ biến nhất cho TV, màn hình và màn hình điện thoại di động (chế độ ngang). Hãy dùng tỷ lệ khung hình này khi bạn muốn chụp nhiều cảnh nền hơn (ví dụ: cảnh quan thiên nhiên).
Dọc (9:16) - Tỷ lệ này là tỷ lệ màn hình rộng nhưng được xoay. Đây là một tỷ lệ khung hình tương đối mới và được các ứng dụng video ngắn (ví dụ: YouTube Shorts) ưa chuộng. Sử dụng chế độ này cho các vật thể cao có hướng dọc rõ rệt như toà nhà, cây cối, thác nước hoặc các vật thể tương tự khác.
Các phiên bản khác nhau của mô hình tạo hình ảnh có thể cung cấp cả đầu ra mang tính nghệ thuật và chân thực như ảnh chụp. Hãy sử dụng những từ ngữ sau trong câu lệnh để tạo ra kết quả chân thực hơn, dựa trên chủ đề mà bạn muốn tạo.
Lưu ý: Hãy xem những từ khoá này là hướng dẫn chung khi bạn cố gắng tạo hình ảnh siêu thực. Bạn không bắt buộc phải thực hiện những việc này để đạt được mục tiêu. Trường hợp sử dụng Loại ống kính Tiêu cự Thông tin chi tiết bổ sung Người (ảnh chân dung) Ống kính cố định, ống kính thu phóng 24-35mm phim đen trắng, phim noir, độ sâu trường ảnh, song tông (nêu 2 màu) Thực phẩm, côn trùng, thực vật (vật thể, tĩnh vật) Macro 60-105mm Độ chi tiết cao, lấy nét chính xác, ánh sáng được kiểm soát Thể thao, động vật hoang dã (chuyển động) Thu phóng bằng ống kính chụp xa 100-400mm Tốc độ màn trập nhanh, theo dõi hành động hoặc chuyển động Thiên văn học, phong cảnh (góc rộng) Ống kính góc rộng 10-24mm Thời gian phơi sáng lâu, tiêu cự sắc nét, phơi sáng lâu, nước hoặc mây mịnBằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo ra các bức chân dung sau:
Câu lệnh: Một phụ nữ, ảnh chân dung 35 mm, tông màu kép xanh dương và xám Mô hình: imagen-3.0-generate-002
Câu lệnh: Một phụ nữ, ảnh chân dung 35 mm, phim noir Người mẫu: imagen-3.0-generate-002
Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo ra những hình ảnh đối tượng sau:
Câu lệnh: lá của cây cầu nguyện, ống kính macro, 60mm Mô hình: imagen-3.0-generate-002
Câu lệnh: một đĩa mì ống, ống kính macro 100 mm Mô hình: imagen-3.0-generate-002
Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo ra những hình ảnh động sau:
Câu lệnh: một pha tiếp bóng thành công, tốc độ màn trập nhanh, tính năng theo dõi chuyển động Mô hình: imagen-3.0-generate-002
Câu lệnh: Một chú hươu đang chạy trong rừng, tốc độ màn trập nhanh, theo dõi chuyển động Mô hình: imagen-3.0-generate-002
Bằng cách sử dụng một số từ khoá trong bảng, Imagen có thể tạo ra những hình ảnh góc rộng sau đây:
Câu lệnh: một dãy núi rộng lớn, phong cảnh góc rộng 10 mm Mô hình: imagen-3.0-generate-002
Câu lệnh: một bức ảnh về mặt trăng, ảnh thiên văn, góc rộng 10 mm Mô hình: imagen-3.0-generate-002
Link nội dung: https://mcbs.edu.vn/chup-anh-nghe-thuat-trong-phong-a19688.html