Sora

Sora ხელოვნურ ინტელექტზე დაფუძნებული ახალი ვიდეოგენერატორია, რომელიც OpenAI-მ სულ ცოტა ხნის წინ, თებერვალში წარადგინა.

ხელოვნური ინტელექტის ეს დიფუზური მოდელი ქმნის რეალისტურ, შემოქმედებით სცენებს ტექსტური ინსტრუქციების, იგივე პრომპტების საშუალებით.

მარტივად რომ ვთქვათ, Sora-ს შეუძლია თქვენი ნებისმიერი ფანტაზია, რომელსაც მას ტექსტუალური სახით მიაწოდებთ, წამებში, 1 წუთის ხანგრძლივობის ვიდეოდ გარდაქმნას.

ფაქტია, რომ საქმე უდაოდ რევოლუციურ პროდუქტთან გაქვს…

თუმცა Sora-ს მიერ დაგენერირებული ვიდეოები, რომლებიც OpenAI-ს ოფიციალურ პრეზენტაციაში იყო წარმოდგენილი, კრიტიკის ხარცეცხლს მაინც ვერ აცდა.

ამ ბლოგში განვიხილავთ, რა შეუძლია Sora-ს და რა არის მასში სამომავლოდ დასახვეწი.

Sora-ს შეუძლია შექმნას სცენები მრავალი პერსონაჟით, მოძრაობის კონკრეტული ტიპებით, საგნებისა და ფონის ზუსტი დეტალებით.

მას ესმის არა მხოლოდ ის, რაც მომხმარებელმა ითხოვა, არამედ აღიქვამს იმასაც, თუ როგორ არსებობენ საგნები ფიზიკურ სამყაროში.

ამ ახალ ვიდეოგენერატორს  თქვენს მიერ ატვირთული ფოტოებიდანაც შეუძლია ვიდეოს დაგენერირება, თანაც ისე, რომ ფოტოზე ასახული ყველა დეტალი ზედმიწევნით გაითვალისწინოს.

მოდელს ენის ღრმა გაგება აქვს. ეს მას საშუალებას აძლევს მოთხოვნებს ზუსტი ინტერპრეტაცია გაუწიოს და შექმნას დამაჯერებელი პერსონაჟები, რომლებიც ძლიერ ემოციებს გამოხატავენ.

Sora-ს ასევე შეუძლია, ერთ გენერირებულ ვიდეოში მრავალი კადრი შექმნას, რომლებიც პერსონაჟების და ვიზუალური სტილის მიხედვით იქნება შენარჩუნებული.

თუმცა, აქვე ისიც უნდა აღვნიშნოთ, რომ ამ უკანასკნელში, Sora-ს პატარა ხარვეზიც აქვს. ხანდახან ის მიზეზისა და შედეგის ზოგიერთ კავშირს ვერ ხვდება.

მაგალითად, შეიძლება ერთ კადრში ადამიანმა შოკოლადი ჩაკბიჩოს, მაგრამ შემდეგ კადრში შოკოლადი ხელშეუხებელი, ნაკბეჩის გარეშე გვიჩვენოს.

Sora-მ შეიძლება ერთმანეთში მარჯვენა და მარცხენა, ან ზოგიერთი სივრცული დეტალიც აურიოს.

OpenAI-მ Sora-ზე წვდომა მხატვრებს, დიზაინერებს და კინორეჟისორებს უკვე მისცა, რადგან მათგან წამოსული უკუკავშირი, სამომავლოდ, ამ ახალი ხელსაწყოს გაუმჯობესებისთვის გამოიყენოს.

სანამ ეს ახალი ხელსაწყო მომხმარებლისთვის ფართოდ ხელმისაწვდომი გახდება, კომპანია უსაფრთხოების განხრით მნიშვნელოვან ნაბიჯებს დგამს.

პრაქტიკულად, Sora ჯერ კიდევ გამოცდის რეჟიმშია.

OpenAI დომენის ექსპერტებთან აქტიურად თანამშრომლობს, რათა ისეთ რისკებს აარიდოს თავი, როგორიც დეზინფორმაცია, სიძულვილის ენის გავრცელება, ან მიკერძოებაა.

იქმნება ინსტრუმენტები, რომლებიც მიუღებელი კონტენტის აღმოჩენას უზრუნველყოფს და იმასაც გვიჩვენებს, თუ როდის შეიქმნა კონკრეტული ვიდეო Sora-ს მიერ.

Sora DALLE და  GPT მოდელებზე ჩატარებულ კვლევებს ეყრდნობა.

ის სწორედ DALLE 3-ის ტექნიკას იყენებს, რომელიც ვიზუალური  მონაცემებისთვის ძალიან კონკრეტული წარწერების გენერირებას გულისხმობს.

შედეგაც, მოდელს შეეძლება მომხმარებლის ტექსტური ინსტრუქციები უფრო ზედმიწევნით დაიცვას.

ყველა ბლოგი