تکنولوژی

از نقص تا بی‌نقصی: مدل جدید انتشار به مشکلات تولید تصویر هوش مصنوعی پایان می‌دهد

دانشمندان کامپیوتر در دانشگاه رایس روش جدیدی به نام ElasticDiffusion برای تولید تصاویر با استفاده از مدل‌های انتشار پیش‌تمرین شده توسعه داده‌اند که مشکلاتی مانند تولید تصاویر نامتقارن و با جزئیات نادرست را حل می‌کند. این روش سیگنال‌های محلی و جهانی را جدا می‌کند و تصاویر واضح‌تری ایجاد می‌کند که نیازی به آموزش اضافی ندارند، هرچند که زمان تولید تصاویر نسبت به مدل‌های دیگر بیشتر است.

هوش مصنوعی مولد (AI) در تاریخچه خود در تولید تصاویر متوازن با جزئیات درست همیشه مشکل داشته است، به ویژه در مواردی مانند انگشتان و تقارن صورت.

علاوه بر این، وقتی دستور تولید تصاویر با اندازه‌ها و وضوح‌های مختلف داده می‌شود، این مدل‌ها ممکن است شکست بخورند.

دانشمندان کامپیوتر در دانشگاه رایس روش جدیدی برای تولید تصاویر با استفاده از مدل‌های انتشار پیش‌تمرین شده توسعه داده‌اند تا چنین مشکلاتی را رفع کنند.

این مدل‌ها نوعی از AI مولد هستند که با افزودن لایه به لایه نویز تصادفی به تصاویری که روی آنها تمرین می‌کنند یاد می‌گیرند و سپس با برداشتن نویز افزوده‌شده، تصاویر جدید ایجاد می‌کنند.

ElasticDiffusion

معید حاجی علی، دانشجوی دکترای علوم کامپیوتر در دانشگاه رایس، روش جدید به نام ElasticDiffusion را در یک مقاله بازبینی شده توسط همتایان در کنفرانس بین‌المللی IEEE در سال 2024 در مورد بینایی کامپیوتر و تشخیص الگو (CVPR) در سیاتل ارائه داد.

حاجی علی گفت:

توسط
Interesting Engineering
منبع
Interesting Engineering
نمایش بیشتر

اخبار مرتبط

بازگشت به بالا