Bước tiến mới về trí tuệ nhân tạo: hệ thống AI có thể tạo ra video từ một đoạn văn bản

bình thường để tạo ra các đoạn video, dù ngắn thi bằng lái xe máy hay dài, luôn cần một chiếc camera và một người sử dụng nó. Thế nhưng điều đó có thể không còn đúng nữa khi giờ đây, chỉ với một đoạn text ngắn gọn biểu lộ lại quang cảnh cần quay phim là đủ để phần mềm dưới đây có thể tạo nên một đoạn phim. Dù bạn cũng không hy vọng đoạn phim này sẽ có chất lượng đoạt giải Oscar, nhưng nó sẽ rất hữu dụng trong nhiều lĩnh vực khác, như giúp một nhân chứng dựng lại một vụ tai nạn hoặc tội ác.

ngày nay các hệ thống AI đã quen thuộc với việc xác định nội dung của hình ảnh và dán nhãn chúng. Một số khác còn có thể tạo ra các hình ảnh từ những nhãn này. Nhưng tạo ra một hình ảnh từ một đoạn text và làm nó chuyển động như một đoạn phim lại là một bước tiến hết sức lớn lao.

Hệ thống AI với thiết kế mô phỏng cách con người tạo ra nghệ thuật

Thuật toán mới là một dạng của máy học, tức thị nó phải được đào tạo. Đặc biệt đây lại là một màng lưới thần kinh nhân tạo, hay một loạt các lớp với những phần tử điện toán nhỏ để xử lý dữ liệu theo cách na ná như những nơ ron tâm thần trong bộ não.

Về cơ bản, hệ thống AI được đào tạo bằng các đoạn video với những hành động được gắn nhãn với các tả về hành động đó, tỉ dụ “ chơi golf trên sân cỏ ”. Trong quá trình đào tạo, phần mềm đánh giá hiệu suất của nó sau mỗi lần thử, và phản hồi của nó được luân chuyển qua hàng triệu các kết nối màng lưới để tinh chỉnh cho các tính hạnh trong ngày mai.

Theo nhóm nghiên cứu, hệ thống AI này có hai mạng lưới tâm thần nhân tạo. Một mạng lưới để tạo ra đoạn video, hoạt động theo hai tuổi với “ thiết kế để mô phỏng cách con người tạo ra nghệ thuật .” thời đoạn thứ nhất, hệ thống sử dụng đoạn text để tạo ra một “gist” (ý chính) của đoạn video, về căn bản là một hình ảnh mờ của phần nền với một đốm màu mờ, nơi hoạt động chính diễn ra. thời đoạn hai sử dụng cả gist này và đoạn văn bản để tạo ra một đoạn video ngắn.

Trong quá trình huấn luyện, một mạng lưới thứ hai đóng vai trò như một “bộ sàng lọc”. Nó xem đoạn video được tạo ra cùng với đoạn video thực tế để cải thiện sản phẩm tạo ra. tỉ dụ với hoạt cảnh “đi thuyền trên biển”, màng lưới sẽ xem nó cùng với một video thực tế về việc đi thuyền buồm trên biển, và nó được đào tạo để chọn ra một đoạn video thực tại. Phản hồi đó được đưa ngược lại cho màng lưới đầu tiên để tạo ra đoạn video với độ chính xác có giới hạn cao hơn.

Các hình ảnh được tạo ra vẫn còn sạn như các đoạn băng VHS. Tuy nhiên, một thuật toán phân loại đơn giản sẽ phỏng đoán một cách chuẩn xác hành động sắp xảy ra từ 6 lựa chọn có sẵn chỉ với khoảng nửa thời kì. Theo các nhà nghiên cứu, mạng lưới này cũng có thể tạo ra các đoạn video với những hành động bất nghĩa, thí dụ “ đi thuyền trên tuyết ” và “ chơi golf tại bể bơi ”.

ngày nay, độ dài các đoạn video chỉ mới ở mức 32 khung hình – nghĩa là chỉ khoảng 1 giây – và kích thước chỉ bằng một con tem thư ở Mỹ, 64 x 64 pixel. Theo Yitong Li, nhà khoa học máy tính tại Đại học Duke ở Durham, Bắc Carolina, tác giả của nghiên cứu này, các đoạn video lớn hơn sẽ làm giảm độ chính xác. bởi con người thường xuất hiện với các hình ảnh bị sai lệch, thành ra, anh cho rằng, bước tiếp theo sẽ sử dụng các mô hình khung xương người để cải thiện chuyển động.

Một AI có thể hiểu sâu sắc hơn thế giới hình ảnh

Theo Tinne Tuytelaars, nhà khoa học máy tính tại đại học Katholieke Universiteit Leuven của Bỉ, người đã thực hiện một nghiên cứu về dự đoán video của riêng mình cho rằng, các áp dụng của AI này sẽ vượt xa ra khỏi Hollywood. thí dụ nó cho phép nén video tốt hơn nếu một đoạn phim có thể được lưu trữ bằng một đoạn văn bản biểu thị ngắn.

Nó cũng có thể tạo ra dữ liệu huấn luyện cho các thuật toán máy học khác. tỉ dụ, các đoạn clip thực tại sẽ giúp các ô tô tự lái chuẩn bị trước cho những tình huống nguy hiểm mà chúng không thường gặp. Và việc hiểu sâu sắc thế giới hình ảnh có thể tạo nên các vận dụng bổ ích, từ việc trọng tài đến giám sát. Theo nhà nghiên cứu Hamed Pirsiavash, nhà khoa học máy tính tại Đại học Maryland, chúng có thể giúp một ô tô tự lái dự đoán đường đi một chiếc xe máy, hoặc huấn luyện một robot gia đình mở tủ lạnh.

Tham khảo Technologyreview

trí óc nhân tạo có một lỗ hổng bảo mật "chết người", các ông lớn như Google hay Amazon vẫn đang nuốm tìm cách khắc phục

Học lái xe ô tô uy tín và chất lượng

Bước tiến mới về trí tuệ nhân tạo: hệ thống AI có thể tạo ra video từ một đoạn văn bản

Related Articles :

Đăng nhận xét

Popular Posts