گوگل یک هوش مصنوعی متن به تصویر جدید دارد که به گفته این شرکت رقبا را شکست میدهد. این برنامه که Imagen نام دارد، متنی را دریافت میکند و توصیف آن را به صورت عکس خروجی میدهد. به گزارش cnet، قابلیت Imagen از دیگر مولدهای تبدیل متن به تصویر مانند مدلهای DALL-E، VQ-GAN+CLIP و Latent […]
گوگل یک هوش مصنوعی متن به تصویر جدید دارد که به گفته این شرکت رقبا را شکست میدهد. این برنامه که Imagen نام دارد، متنی را دریافت میکند و توصیف آن را به صورت عکس خروجی میدهد.
به گزارش cnet، قابلیت Imagen از دیگر مولدهای تبدیل متن به تصویر مانند مدلهای DALL-E، VQ-GAN+CLIP و Latent Diffusion پیروی میکند. هنگامی که از گوگل خواسته شد تصاویر ایجاد شده توسط Imagen و سایر تولیدکنندگان متن به تصویر را مقایسه کند، مردم دریافتند که مدل گوگل از رقبای خود در دقت و وفاداری به متن، تصویر بهتری ایجاد میکند.
گوگل چندین نمونه از پیامهای متنی و تصاویر حاصل از هوش مصنوعی را در وب سایت Imagen خود به اشتراک گذاشت. مدلهای یادگیری متن به تصویر، قدرت سیستمهای یادگیری ماشینی را نشان میدهند. در این حالت، Imagen نیاز به دانستن نحوه استفاده از نرم افزارهای تخصصی مانند فتوشاپ برای ایجاد تصاویر انتزاعی را از بین میبرد.
همانطور که در کنفرانس I/O گوگل در اوایل این ماه اشاره شد، سیستمهای هوش مصنوعی به شرکت کمک میکنند تا به چشمانداز آینده محاسباتی محیطی نزدیکتر شود. محاسبات محیطی ایده ای است که مردم میتوانند روزی به طور مستقیم و بدون نیاز به دانش خاصی از سیستمها یا کدهای خاص در رایانهها استفاده کنند.
با این حال، گوگل تصمیم گرفته است که Imagen را برای عموم منتشر نکند. Imagen اینترنت را برای کسب اطلاعات مورد نیاز حوزه آموزش و ایجاد تصاویر مفهومی و انتزاعی کارآمدتر میکند. از آنجایی که اینترنت میتواند مملو از کلیشهها و سوگیریها باشد، این موارد میتواند در نهایت وارد Imagen نیز شود. گوگل گفت این سوگیریها شامل ترجیح دادن رنگ پوست روشنتر و کلیشههای جنسیتی غربی است. این شرکت همچنین نگران است که Imagen ممکن است توسط برخی بازیگران استفاده منفی شود.
گوگل به سایر سازندگان هوش مصنوعی هشدار میدهد که مراقب انتشار مدلهای متن به تصویر برای عموم باشند و توجه دقیقی به اطلاعاتی که یک هوش مصنوعی روی آنها آموزش میدهد، داشته باشند.
بیشتر بخوانید