شرکت Kling AI از نسل تازه مدل هوش مصنوعی ویدیوساز خود با نام Kling 3.0 پرده برداشت؛ مدلی که بهعنوان یک زیرساخت یکپارچه برای تولید محتوای چندرسانهای مبتنی بر هوش مصنوعی معرفی شده است.
طبق گزارشها، این محصول در فضایی رقابتی عرضه میشود که بازیگران شناختهشدهای مانند Runway ،Sora و Veo برای تثبیت جایگاه خود در آن رقابت میکنند. Kling 3.0 با تمرکز ویژه بر ارتقای کیفیت تصویر، حفظ پیوستگی بصری کاراکترها و هماهنگی دقیق صدا و تصویر توسعه یافته و تلاش دارد همزمان با گسترش سریع بازار هوش مصنوعی مولد، نیازهای حرفهایتری را پوشش دهد.
براساس اعلام KlingAI، مدل Kling 3.0 قرار است در چند محور اصلی از رقبا متمایز شود. نخستین محور، پایداری بسیار بالا در کاراکترها و عناصر صحنه عنوان شده که هدف آن حفظ چهره، لباس و جزئیات بصری در طول نماهای مختلف است. این ویژگی برای تولیدکنندگان محتوا اهمیت زیادی دارد زیرا تغییر ناخواسته چهره یا اشیای کلیدی در نسخههای قبلی، یکی از انتقادهای اصلی کاربران بود.
محور دوم، تولید ویدیوی انعطافپذیر معرفی شده است. Kling 3.0 امکان ساخت کلیپهای ۱۵ ثانیهای با کنترل دقیق بر نماها، حرکت دوربین و ترکیب چند شات را فراهم میکند. این مدل روی واقعگرایی بالای تصویر و امکان طراحی توالی تأکید دارد تا کاربر بتواند بهجای یک نما، دنبالهای کوتاه شبیه سکانس فیلم تولید کند. این رویکرد به تولیدکنندگان محتوا اجازه میدهد ساختار روایی منسجمتری در خروجی خود داشته باشند.
سومین محور، صوت ارتقایافته عنوان شده است. Kling 3.0 از صدا با چند کاراکتر مرجع پشتیبانی میکند و زبانها و لهجههای بیشتری را پوشش میدهد. این ویژگی به تولید ویدیوهایی کمک میکند که صدا و تصویر همزمان و هماهنگ دارند و کاربر مجبور نیست صدا را جداگانه در نرمافزارهای دیگر تولید یا هماهنگ کند. پشتیبانی از چند کاراکتر صوتی هم برای سناریوهای دیالوگمحور اهمیت دارد.

چهارمین محور، بهبود تولید تصویر است. Kling 3.0 خروجی تصویر 4K ارائه میدهد و حالت تازهای برای تولید مجموعه تصاویر پیدرپی معرفی کرده که برای طراحی استوریبورد یا کمیک و همچنین تولید نماهای ثابت سینمایی کاربرد دارد. تمرکز روی جلوههای سینمایی و جزئیات بیشتر در نورپردازی و بافتها، Kling 3.0 را به ابزاری نزدیکتر به نیازهای تولید حرفهای تبدیل میکند.
دموهای Kling 3.0 عملکردی همسطح رقبا از نظر پویایی، فرمانپذیری متنی و واقعگرایی بصری نشان میدهند و کاهش خطاهای حرکتی و تصویری در آنها مشهود است. بااینحال، برای کاربران عادی تفاوت محسوسی میان خروجی این مدل و سایر رقبا دیده نمیشود و رقابت بیشتر به عوامل فنی، سرعت، هزینه و ابزارهای کنترلی محدود شده است.
Kling 3.0 درحالحاضر با وضوح 1080p و 720p در دسترس قرار دارد. تولید ویدیو با این مدل بر پایه اعتبار انجام میشود و میزان اعتبار مصرفی به طول ویدیو و نوع ورودی بستگی دارد. کاربران علاقهمند میتوانند جزئیات بیشتر درباره نحوه استفاده، هزینهها و محدودیتها را روی وبسایت KlingAI مشاهده کنند. این مدل هم مانند دیگر مدلهای هوش مصنوعی ویدیوساز، در مرحلهای قرار دارد که هنوز نمیتوان آن را جایگزین کامل تولید سنتی ویدیو دانست، اما برای آزمایش ایدهها، ساخت نمونه اولیه و تولید محتوای کوتاه، گزینهای قابلتوجه بهحساب میآید.