Sora AI giữa hai luồng dư luận
Một số ý kiến cho rằng Sora sẽ góp phần thúc đẩy mạnh mẽ sự sáng tạo trong tiếp thị và thương mại. Tuy nhiên, nhiều người khác lại còn khá “dè chừng” với công cụ này.
Như một phần trong chiến dịch quảng bá sản phẩm trước kỳ nghỉ lễ, công ty mẹ của ChatGPT – OpenAI đã phát hành Sora, nền tảng tạo video rất được mong đợi của công ty. Trước đây, nền tảng này chỉ dành cho một nhóm người dùng thử nghiệm được chọn lọc. Một số chuyên gia tin rằng công cụ này có thể làm thay đổi đáng kể tính sáng tạo trong hoạt động thương mại.
Sau nhiều tháng thử nghiệm, OpenAI đã phát triển một phiên bản nâng cao của công cụ này, gọi là Sora Turbo, hiện có sẵn trên Sora.com dành cho người dùng ChatGPT Plus và Pro tại Hoa Kỳ và một số thị trường khác. Sora Turbo hứa hẹn khả năng tạo video nhanh hơn, cho phép người dùng tạo video thực tế, độ phân giải 1080p, thời lượng dài tới 20 giây từ văn bản. Mô hình này hỗ trợ nhiều tỷ lệ khung hình khác nhau và cho phép người dùng tùy chỉnh nội dung bằng tài sản của riêng họ hoặc tạo hình ảnh hoàn toàn mới.
Sản phẩm cũng bao gồm một “công cụ phân cảnh” cho phép người dùng tùy chỉnh chính xác hơn từng khung hình trong video. Thêm vào đó, các nguồn cấp dữ liệu do cộng đồng quản lý đang được triển khai trong nền tảng để giới thiệu nội dung do người dùng tạo ra.
Công ty cho biết trong bài đăng trên blog thông báo về việc phát hành: “Chúng tôi hy vọng phiên bản đầu tiên của Sora sẽ cho phép mọi người ở khắp mọi nơi khám phá những hình thức sáng tạo mới, kể câu chuyện của họ và mở rộng ranh giới của những gì có thể làm được với việc kể chuyện bằng video”.
Công ty cho biết Sora Turbo “nhanh hơn nhiều” so với bản thử nghiệm của Sora được phát hành cho số lượng người dùng hạn chế vào tháng 2 và lưu ý rằng đội ngũ này đang nỗ lực để công cụ này có giá cả phải chăng hơn trong tương lai.
Công ty cũng giải quyết những lo ngại ngày càng tăng về tính minh bạch và việc tiết lộ xung quanh nội dung do AI tạo ra. Công ty giải thích rằng các video do Sora tạo ra bao gồm siêu dữ liệu cho tiêu chuẩn kỹ thuật của Liên minh về nguồn gốc và tính xác thực của nội dung (C2PA), cũng như các hình mờ mặc định có thể nhìn thấy. Thêm vào đó, công ty đã xây dựng một chức năng tìm kiếm nội bộ sử dụng các thông số kỹ thuật để xác định nguồn gốc của video. Về mặt lý thuyết, tất cả các tính năng này có thể được sử dụng để xác định xem video có được phát triển thông qua Sora hay không, giúp hạn chế sự lan truyền thông tin sai lệch trực tuyến và có khả năng giảm thiểu các tranh chấp về sở hữu trí tuệ.
OpenAI cũng đã triển khai các biện pháp bảo vệ nội dung trên Sora – nội dung bị chặn bao gồm các tài liệu liên quan đến lạm dụng tình dục trẻ em và video deepfake về tình dục.
Sora hiện chưa có mặt ở Anh hoặc hầu hết các nước châu Âu.
Những luồng dư luận ủng hộ
Một số chuyên gia về tiếp thị, sản xuất và truyền thông cho rằng khả năng của công cụ này có vẻ đã phát triển vượt xa những gì được thể hiện trong quảng cáo bị chế giễu của Toys R Us vào tháng 6.
“Sora đang thay đổi cách chúng ta tiếp cận sáng tạo thương mại và tiếp thị”, ông Nikola Baldikov, Nhà sáng lập kiêm Giám đốc Điều hành tại Inbound Blogging, một công ty nội dung tập trung vào SEO, cho biết, “Sora giúp việc sáng tạo nội dung chất lượng cao dễ tiếp cận hơn bao giờ hết. Nó cắt giảm nhu cầu về các quy trình tiền sản xuất tốn kém và thiết bị chuyên nghiệp, mở ra cánh cửa cho các thương hiệu và nhà sáng tạo nhỏ hơn, những người trước đây không có đủ nguồn lực”.
Ông Dev Nag, CEO của công ty hỗ trợ tự động hóa QueryPal, cũng đồng tình với quan điểm này khi cho biết: “Cũng giống như ảnh stock đã chuyển đổi quảng cáo in ấn cách đây nhiều thập kỷ, Sora và các công cụ video AI tương tự sẽ giúp việc tạo nội dung video chất lượng cao dễ tiếp cận hơn và nhanh hơn đáng kể – và vì người sáng tạo có thể tạo ra chính xác những gì họ hình dung thay vì phải tìm kiếm trong các tài sản hiện có, nên khả năng sáng tạo sẽ mở rộng theo cấp số nhân”.
Nag kỳ vọng rằng những cải tiến liên tục đối với khả năng của Sora sẽ có tác động lâu dài đến nền kinh tế và hoạt động của quảng cáo và tiếp thị. Hiện tại, ông cho biết, “chúng ta đang bước vào ‘làn sóng đầu tiên’, nơi chúng ta sẽ thấy quá trình sản xuất hàng ngày được hợp lý hóa các tài sản như quảng cáo trên mạng xã hội và bản demo sản phẩm”.
Nhưng theo quan điểm của ông, tốc độ phát triển nhanh chóng của các khả năng AI “cho thấy rằng bất kỳ hạn chế kỹ thuật hiện tại nào cũng sẽ phần lớn biến mất trong vòng 18 đến 24 tháng” – nghĩa là, chẳng bao lâu nữa, chúng ta sẽ chạm trán với “làn sóng thứ hai”. Ông dự đoán rằng kỷ nguyên này sẽ chứng kiến các trường hợp sử dụng mở rộng cho các công nghệ tạo video như Sora. Ông cho biết “Các nhà sáng tạo và các công ty sẽ bắt đầu tận dụng công nghệ này như một đối tác sáng tạo, nhanh chóng tạo nguyên mẫu ý tưởng và khám phá các hướng sáng tạo với tốc độ và quy mô chưa từng có”.
Khả năng của Sora không chỉ định hình lại cách làm việc của những người làm sáng tạo – mà còn có thể định hình lại chính đội ngũ sáng tạo. Baldikov hy vọng rằng việc lên ý tưởng và soạn thảo hợp lý có thể giải phóng nhân sự, để họ tập trung nhiều hơn vào chiến lược cấp cao – nhưng nó cũng có thể thay thế một số công việc. Ông cho biết: “Nếu các nhiệm vụ như tìm khái niệm và soạn thảo nội dung nhanh hiện có thể được thực hiện trong vài phút, bạn không cần phải có một đội ngũ lớn để thực hiện chúng”.
Quan điểm của những người hoài nghi
Mặc dù Sora được kỳ vọng cao, nhưng thị trường có nhiều đối thủ mạnh và việc thành công sẽ gặp nhiều thách thức. Một số ít các mô hình chuyển văn bản thành video khác đã khẳng định được vị thế. Đứng đầu trong số đó là Runway, được biết đến với sự tích hợp liền mạch trong quy trình làm việc sáng tạo, đầu ra chất lượng cao và nhấn mạnh vào sự tự do nghệ thuật. Runway cũng đã định vị mình là một công cụ cho các chuyên gia sáng tạo như nhà làm phim và nhà thiết kế.
Một số chuyên gia tin rằng OpenAI có thể đã bỏ lỡ cơ hội quan trọng để thúc đẩy việc áp dụng Sora trong các công ty giải trí, sản xuất và quảng cáo.
“Các phân khúc người dùng chuyên nghiêp bao gồm các hãng phim, công ty quảng cáo, VFX và studio hoạt hình – đều đang được các công ty như Runway phục vụ tốt, công ty này có lượng khách hàng lớn trên tất cả các phân khúc này”, bà Sanja Partalo, đồng sáng lập kiêm đối tác tại S4S Ventures, công ty đầu tư vào các công ty chuyên cung cấp các sản phẩm/dịch vụ liên quan đến tiếp thị, quảng cáo và truyền thông, cho biết. Bà cũng cho rằng Wonder Dynamics thuộc sở hữu của Autodesk là công ty dẫn đầu trong lĩnh vực hoạt hình tạo sinh.
Bên cạnh sự cạnh tranh, Sora vẫn có thể gặp phải những hạn chế về mặt kỹ thuật. Nhiều người dùng phiên bản thử nghiệm đã lưu ý rằng, mặc dù có hình ảnh tinh vi, mô hình này vẫn gặp phải những sai lầm về mặt hình ảnh thường gặp trong hình ảnh và video do AI tạo ra – chẳng hạn như đôi khi không mô tả được bàn tay với số ngón tay chính xác.
Mặc dù OpenAI đã làm việc trong nhiều tháng để giải quyết các vấn đề kỹ thuật, công ty thừa nhận trong bài đăng trên blog của mình rằng sản phẩm vẫn chưa hoàn hảo. “Phiên bản Sora mà chúng tôi đang triển khai có nhiều hạn chế”, OpenAI viết, “Nó thường tạo ra các hiện tượng vật lý không thực tế và gặp khó khăn với các hành động phức tạp trong thời gian dài”.
Một số nhà tiếp thị vẫn chưa tin vào bất kỳ tiến bộ kỹ thuật nào mà Sora đã đạt được trong những tháng kể từ khi phát hành bản beta.
Ông Bernard Meyer, Giám đốc Cấp cao về Sáng tạo và Truyền thông tại Omnisend, một công ty thương mại điện tử và tiếp thị qua email, cho biết: “Sora rất phù hợp với các chuỗi sự kiện giả tạo, phi lý, vô nghĩa và mơ mộng”.
Nói chung, Meyer cho rằng video do AI tạo ra có xu hướng không đạt yêu cầu khi nói đến việc “tạo ra sự nhất quán về mặt hình ảnh” và nói rằng con người thường có thể xác định được những điểm không nhất quán về mặt hình ảnh này. “Ngay cả khi chi tiết nhỏ nhất ‘không ổn’, chúng ta cũng có thể phát hiện ra và điều đó sẽ khiến chúng ta mất tập trung hoặc mất mục đích của video”, ông nói.
Bỏ qua những hạn chế về mặt kỹ thuật, các video do Sora tạo ra có thể sẽ không hấp dẫn vì thiếu bối cảnh văn hóa và cảm xúc của con người, theo bà Daria Shevchenko, Giám đốc Tiếp thị tại Snov.io, đơn vị giúp các công ty tự động hóa các nỗ lực tiếp thị của họ. Theo quan điểm của bà, không có sự cải tiến kỹ thuật nào có thể chuyển đổi liền mạch thành “nội dung có thể gây được tiếng vang với người thật”. Bà nói, “Chỉ có con người mới biết cách làm điều đó”.
Cân nhắc về vấn đề pháp lý và đạo đức
Sự ra mắt công khai của Sora đã làm dấy lên lo ngại về các vấn đề pháp lý và đạo đức có thể làm phức tạp thêm quá trình áp dụng rộng rãi nền tảng này.
Đầu tiên, Sora có thể đại diện cho bước đột phá về nội dung do AI tạo ra, nhưng cũng làm dấy lên mối quan tâm ngày càng tăng của người tiêu dùng và các nhà lập pháp về tính xác thực, nguồn gốc và quyền sở hữu trí tuệ. Ngày nay, nhu cầu tiết lộ rõ ràng hơn về việc liệu một nội dung có được tạo ra hay tăng cường bằng AI hay không đang ngày càng tăng.
OpenAI cho biết Sora tuân thủ các thông số kỹ thuật của Liên minh về Nguồn gốc và Tính xác thực của Nội dung (C2PA). Được thành lập vào năm 2021 bởi một đội ngũ bao gồm Adobe, BBC, Intel và Microsoft, C2PA đã thiết lập một tiêu chuẩn kỹ thuật truy cập mở có thể được sử dụng để xác minh nguồn gốc và tính xác thực của một phần nội dung.
Tuy nhiên, một số chuyên gia vẫn lo ngại do OpenAI thiếu minh bạch về các hoạt động đào tạo và quản lý của mình. Công ty không tiết lộ các tập dữ liệu cụ thể được sử dụng để đào tạo Sora. Giống như nhiều mô hình AI tạo ra hướng đến người tiêu dùng khác, có khả năng chương trình đã được đào tạo trên một phạm vi rộng lớn thông tin có sẵn công khai, có thể bao gồm công việc trong phạm vi công cộng, tài liệu có bản quyền và các nguồn khác. Tất nhiên, khả năng mô hình được đào tạo trên công việc có bản quyền tạo ra những cạm bẫy pháp lý tiềm ẩn cho người dùng và cho OpenAI.
Ông Brian Sanford, Biên tập viên Sáng tạo và Giám đốc Hậu kỳ tại Versus, một studio sản xuất, đã tham gia bản beta của nghệ sĩ và đã có quyền truy cập mở rộng vào Sora trong sáu tháng qua. Mặc dù ông ấn tượng với khả năng tạo video dài hơn và độ trung thực về mặt hình ảnh của sản phẩm cuối cùng, những vẫn còn hoài nghi về quá trình đào tạo của hệ thống. Và cuối cùng, Sanford coi đây là một rào cản cấm đoán. Ông cho biết “Nếu không hiểu rõ” về cách Sora được đào tạo, “sẽ rất khó để triển khai hệ thống trong sản xuất thương mại”.
Bà Terri Walter, Giám đốc Điều hành của công ty tiếp thị B2B SalientMG, cũng đồng tình với quan điểm này. Bà cho biết Sora “vẫn còn lâu mới trở thành công cụ mà chúng tôi khuyến nghị sử dụng cho mục đích thương mại”.
Bà lập luận rằng Sora không bảo vệ được tài sản và quản lý phù hợp, khiến nó trở thành một gánh nặng tiềm ẩn đối với các nhà tiếp thị và quảng cáo. Bà thúc giục ngành công nghiệp này chú ý đến các hoạt động quản lý của OpenAI và luôn cảnh giác trong việc tuân thủ các quy định về quyền riêng tư dữ liệu như Quy định bảo vệ dữ liệu chung của EU và Đạo luật an toàn trực tuyến của Vương quốc Anh.
Các chuyên gia vẫn còn nhiều ý kiến trái chiều về mức độ mà Sora sẽ cách mạng hóa tiếp thị và sáng tạo thương mại, nhưng có một điều rõ ràng: sự gia tăng của video do AI tạo ra vẫn còn đi kèm với nhiều vấn đề pháp lý và đạo đức vẫn chưa được giải quyết thoả đáng.
Ngay sau khi ra mắt công chúng vào thứ Hai, OpenAI đã tạm dừng đăng ký tài khoản Sora mới do nhu cầu quá cao.
* Nguồn: The Drum