از نقص تا بینقصی: مدل جدید انتشار به مشکلات تولید تصویر هوش مصنوعی پایان میدهد
هوش مصنوعی مولد (AI) در تاریخچه خود در تولید تصاویر متوازن با جزئیات درست همیشه مشکل داشته است، به ویژه در مواردی مانند انگشتان و تقارن صورت.
علاوه بر این، وقتی دستور تولید تصاویر با اندازهها و وضوحهای مختلف داده میشود، این مدلها ممکن است شکست بخورند.
دانشمندان کامپیوتر در دانشگاه رایس روش جدیدی برای تولید تصاویر با استفاده از مدلهای انتشار پیشتمرین شده توسعه دادهاند تا چنین مشکلاتی را رفع کنند.
این مدلها نوعی از AI مولد هستند که با افزودن لایه به لایه نویز تصادفی به تصاویری که روی آنها تمرین میکنند یاد میگیرند و سپس با برداشتن نویز افزودهشده، تصاویر جدید ایجاد میکنند.
ElasticDiffusion
معید حاجی علی، دانشجوی دکترای علوم کامپیوتر در دانشگاه رایس، روش جدید به نام ElasticDiffusion را در یک مقاله بازبینی شده توسط همتایان در کنفرانس بینالمللی IEEE در سال 2024 در مورد بینایی کامپیوتر و تشخیص الگو (CVPR) در سیاتل ارائه داد.
حاجی علی گفت: