Ngày 15 tháng 3 năm 2025, giới công nghệ chứng kiến một bước tiến vượt bậc trong lĩnh vực tạo video từ AI với sự ra mắt của LTX Video 0.9.5. Đây là phiên bản cải tiến đáng kể của mô hình LTX local video, hứa hẹn mang đến trải nghiệm tạo video nhanh chóng và chất lượng cao ngay trên máy tính cá nhân. Bài viết này sẽ là chìa khóa giúp bạn làm chủ công cụ mạnh mẽ này thông qua nền tảng ComfyUI, mở ra cánh cửa sáng tạo nội dung video không giới hạn.
Sức Mạnh Vượt Trội Của LTX Video 0.9.5: Tạo Video AI Nhanh Chóng Và Dễ Dàng
LTX Video 0.9.5 không chỉ là một bản nâng cấp thông thường, mà là một cuộc cách mạng về tốc độ và khả năng sáng tạo. Với card đồ họa RTX 4090, mô hình này có thể tạo ra một video dài 4 giây chỉ trong vòng 17 giây. Tốc độ này gần như đạt đến thời gian thực, giúp bạn tiết kiệm đáng kể thời gian và công sức so với các phương pháp tạo video truyền thống.
Trong bài viết này, chúng ta sẽ cùng nhau khám phá:
Những cải tiến vượt trội so với phiên bản trước.
Quy trình tạo video từ chữ (text-to-video) chi tiết.
Quy trình tạo video từ ảnh (image-to-video) từng bước.
Để sử dụng LTX Video 0.9.5, bạn cần đến sự trợ giúp của ComfyUI, một giao diện người dùng đồ họa mạnh mẽ, cho phép bạn tạo ra các quy trình làm việc phức tạp cho Stable Diffusion và các tác vụ liên quan đến AI khác. ComfyUI có thể được cài đặt trên Windows, Mac hoặc sử dụng trực tiếp trên Google Colab.
Nếu bạn là người mới bắt đầu, hãy tham khảo hướng dẫn sử dụng ComfyUI cho người mới bắt đầu để nắm vững các kiến thức cơ bản.
Chạy LTX Video 0.9.5 Trên Google Colab: Tiện Lợi Và Hiệu Quả
Nếu bạn sử dụng ComfyUI Colab notebook, bạn không cần phải cài đặt các tệp mô hình theo cách thủ công. Chúng sẽ được tải xuống tự động khi bạn khởi động notebook.
Đảm bảo chọn các mô hình LTX trước khi bắt đầu notebook để quá trình tải diễn ra suôn sẻ.
Sau khi notebook đã sẵn sàng, bạn có thể tải xuống tệp JSON workflow từ hướng dẫn này và kéo thả vào ComfyUI để bắt đầu.
Những Cải Tiến Đáng Chú Ý Của LTX Video 0.9.5: Khả Năng Thương Mại Hóa Và Chất Lượng Vượt Trội
Giấy Phép Sử Dụng: Mở Ra Cơ Hội Thương Mại
Tin vui cho cộng đồng sáng tạo nội dung, LTX Video 0.9.5 đi kèm với giấy phép Open RAIL-M mới, cho phép sử dụng cho mục đích thương mại. Bạn có thể thoải mái lưu trữ mô hình và sử dụng các video được tạo ra để kiếm tiền.
Text-to-video: Biến Chữ Thành Phim
Giống như phiên bản trước, LTX Video 0.9.5 tiếp tục hỗ trợ tạo video từ mô tả bằng chữ. Tuy nhiên, điểm khác biệt nằm ở chất lượng video đã được cải thiện đáng kể, mang đến những thước phim sắc nét và sống động hơn.
Image-to-video: Thổi Hồn Vào Bức Ảnh
LTX Video 0.9.5 có khả năng sử dụng một hình ảnh làm khung hình đầu tiên và biến nó thành một video hoàn chỉnh. Tính năng này mở ra những khả năng sáng tạo vô tận, cho phép bạn tạo ra những câu chuyện độc đáo từ những bức ảnh tĩnh.
Tuy nhiên, cần lưu ý rằng một số video được tạo ra từ quy trình image-to-video có thể không đạt được chất lượng mong muốn. Đừng lo lắng, tôi sẽ chia sẻ những mẹo để tạo ra những video chất lượng cao nhất.
Khắc Phục Khung Hình Đầu Và Cuối Video: Kiểm Soát Từng Khoảnh Khắc
Bạn có thể tùy chỉnh cả khung hình đầu và cuối của video để tạo ra những đoạn phim hoàn hảo đến từng chi tiết. Tính năng này đặc biệt hữu ích khi bạn muốn tạo ra những video có tính liên kết và mạch lạc cao.
Text-to-image Workflow: Hướng Dẫn Từng Bước Tạo Video Từ Chữ
Workflow này sẽ hướng dẫn bạn tạo ra một video dài 4 giây từ một đoạn mô tả bằng chữ.
Bước 0: Cập Nhật ComfyUI
Trước khi bắt đầu, hãy đảm bảo rằng ComfyUI của bạn đã được cập nhật lên phiên bản mới nhất. Cách dễ nhất để thực hiện việc này là sử dụng ComfyUI Manager.
Nhấp vào nút Manager trên thanh công cụ phía trên cùng.
Chọn Update ComfyUI.
Khởi động lại ComfyUI.
Bước 1: Tải Xuống Mô Hình
Tải xuống ltx-video-2b-v0.9.5.safetensors và đặt nó vào thư mục ComfyUI > models > checkpoints.
Tải xuống t5xxlfp16.safetensors và đặt nó vào thư mục ComfyUI > models > textencoders.
Bước 2: Tải Workflow
Tải xuống workflow text-to-video.
Kéo thả nó vào ComfyUI.
Bước 3: Cài Đặt Các Node Còn Thiếu
Workflow này sử dụng node Video Combine để lưu video dưới dạng MP4. Nếu bạn thấy các khối màu đỏ, điều đó có nghĩa là bạn chưa cài đặt các node tùy chỉnh mà workflow này yêu cầu.
Nhấp vào Manager > Install missing custom nodes và cài đặt các node còn thiếu.
Khởi động lại ComfyUI.
Bước 4: Chỉnh Sửa Prompt
Thay đổi prompt thành nội dung bạn muốn tạo. LTXV hoạt động tốt hơn với các prompt dài và mô tả chi tiết. Bạn có thể sử dụng ChatGPT để mở rộng prompt của mình.
Bước 5: Tạo Video
Nhấp vào nút Queue để tạo video.
Image-to-video Workflow: Biến Ảnh Tĩnh Thành Video Động
Workflow này sẽ hướng dẫn bạn sử dụng một hình ảnh làm khung hình đầu tiên để tạo ra một video. Bạn cũng cần mô tả video trong prompt.
Bước 0: Cập Nhật ComfyUI
Tương tự như workflow text-to-video, hãy đảm bảo rằng ComfyUI của bạn đã được cập nhật lên phiên bản mới nhất.
Bước 1: Tải Xuống Mô Hình
Đảm bảo bạn đã tải xuống các mô hình cần thiết như đã hướng dẫn ở trên.
Bước 2: Tải Workflow
Tải xuống workflow image-to-video.
Kéo thả nó vào ComfyUI.
Bước 3: Cài Đặt Các Node Còn Thiếu
Cài đặt các node tùy chỉnh còn thiếu nếu cần thiết.
Bước 4: Tải Ảnh Lên
Tải một hình ảnh lên node Load Image. Hình ảnh này sẽ được sử dụng làm khung hình đầu tiên của video.
Bước 5: Chỉnh Sửa Prompt
Thay đổi prompt để phù hợp với hình ảnh đã tải lên và mô tả những gì sẽ xảy ra trong 4 giây tiếp theo.
Bước 6: Tạo Video
Nhấp vào nút Queue để tạo video.
Khắc Phục Khung Hình Đầu Và Cuối Video: Tạo Video Hoàn Hảo
Workflow này cho phép bạn cố định cả khung hình đầu và cuối của video. Để sử dụng nó, bạn cần hai hình ảnh đầu vào và một prompt.
Bước 0: Cập Nhật ComfyUI
Đảm bảo ComfyUI của bạn đã được cập nhật.
Bước 1: Tải Xuống Mô Hình
Tải xuống các mô hình cần thiết.
Bước 2: Tải Workflow
Tải xuống workflow image-to-video với khung hình đầu và cuối được cố định.
Kéo thả nó vào ComfyUI.
Bước 3: Cài Đặt Các Node Còn Thiếu
Cài đặt các node tùy chỉnh còn thiếu.
Bước 4: Tải Ảnh Lên
Tải ảnh cho khung hình đầu tiên lên node Load Image phía trên và ảnh cho khung hình cuối cùng lên node Load Image phía dưới.
Bước 5: Chỉnh Sửa Prompt
Chỉnh sửa prompt để mô tả những gì xảy ra giữa khung hình đầu và khung hình cuối.
Bước 6: Tạo Video
Nhấp vào nút Queue để tạo video.
Mẹo Sử Dụng LTX Video 0.9.5: Nâng Cao Hiệu Quả Và Chất Lượng Video
Tạo Video Mới: Thay Đổi Seed
Thay đổi giá trị noise_seed trong node SamplerCustom để tạo ra một video hoàn toàn khác.
Thay Đổi Kích Thước Video
Độ phân giải mặc định là 768 x 512. Bạn có thể hoán đổi chiều rộng và chiều cao để tạo video dọc. Tuy nhiên, không nên thay đổi độ phân giải, vì điều này có thể làm giảm chất lượng video.
Độ Dài Video
Thay đổi cài đặt length (được đo bằng khung hình) để điều chỉnh độ dài của video.
Tạo Nhiều Video Cùng Lúc
Cài đặt batch_size trong node EmptyLTXVLatentVideo kiểm soát số lượng video được tạo cùng một lúc. Thay đổi nó để tạo nhiều video.
Tránh Các Chuyển Động Khó
Mô hình LTXV 0.9.5 có thể gặp khó khăn khi tạo ra các chuyển động phức tạp như một người mặc áo khoác hoặc các video có chuyển động lớn của bộ phận cơ thể.
Prompt Dài Mang Lại Kết Quả Tốt Hơn
Viết càng nhiều trong prompt, video càng tốt. Sử dụng ChatGPT để mở rộng prompt.
Tạo Vài Video Và Chọn Video Tốt Nhất
Đôi khi, video có thể không đạt yêu cầu. Thay đổi seed và tạo một video mới. Quá trình này diễn ra nhanh chóng, vì vậy đừng ngại thử nghiệm.
Sử Dụng FP8 Text Encoders Để Tiết Kiệm Không Gian
Nếu bạn sử dụng card đồ họa Nvidia với dòng RTX 4000 trở lên, bạn có thể sử dụng text encoder ở định dạng FP8 để tiết kiệm không gian lưu trữ. Dung lượng sẽ là 5 GB thay vì 10 GB.
Tài Liệu Tham KhảoLTX Video 0.9.5 và ComfyUI mở ra kỷ nguyên sáng tạo video AI, biến mọi ý tưởng thành hiện thực một cách nhanh chóng và dễ dàng.