Редица компании усилено работиха последните месеци по свои завършени софтуерни решения използващи изкуствен интелект за увеличаване на резолюцията на растерни изображения. Дойде ред и на Google да покажат впечатляващи резултати.
Google публикуваха в блога си проучване на специалисти от техния екип Brain Team, озаглавено „създаване на прецизни изображения с използване на дифузионни модели“. В статията, изследователите говорят за новите постижения, които са направили в областта на мащабирането на цифрови изображения без загуба на качество.

Специалистите от Brain Team тренираха модел за машинно обучение, който превръща снимките с ниска разделителна способност в изображения с висока разделителна способност с почти никаква загуба на качество. Експертите смятат, че тяхното достижение може да се използва за различни цели, от подобряване на стари семейни снимки до подобряване на качеството на медицинските изображения.

Google проучва концепцията за дифузионните модели от 2015 г.насам, но доскоро гигантът предпочиташе друга техника за обучение на AI наречена дълбоки генеративни модели. Компанията установи, че резултатите от новия подход са значително по-добри от съществуващите технологии.
Новият подход е получи обозначението SR3. От Google казват, че SR3 представлява модел за дифузия с ултра висока разделителна способност, който създава изображение с висока разделителна способност от чист шум, разчитайки на оригиналната снимка с ниска разделителна способност. Моделът се обучава в процеса на изкривяване на изображението, при който шумът постепенно се добавя към изображението, докато остане само чист шум. След това алгоритъмът обръща процеса, като постепенно премахва шума от изображението, като се ръководи от оригиналната снимка с ниска разделителна способност.

Установено е, че най-добри резултати SR3 показва при мащабиране на портрети и снимки на природата. Алгоритъмът позволява да постигнете фотореалистично изображение, увеличавайки резолюцията на портретите до шестнадесет пъти.

След като от Google са се уверили колко ефективна е SR3, компанията е отишла още по-далеч, като са предложили друг подход, наречен CDM, който е модел на проста дифузия. CDM е обучен на основата на данни от ресурса ImageNet, съдържащ повече от 14 милиона изображения с висока разделителна способност. CDM предлага каскаден подход, при който първо се генерира изображение с ниска разделителна способност, при което каскадно се прилага SR3 за създаване на изображения с висока разделителна способност, като постепенно се увеличава до възможно най-високо. Според Google изображението с разделителна способност 32 × 32 пиксела може да бъде увеличено до 256 × 256 пиксела без осезаеми загуби, осем пъти. Картината с резолюция 64 × 64 пиксела и изобщо успя да се мащабира до резолюция 1024 × 1024 пиксела, 16 пъти.

Резултатите от работата на изкуствения интелект са наистина впечатляващи. Изображенията в крайния си вариант, въпреки фините недостатъци, изглеждат наистина много добре и повечето потребители ги възприемат като оригинални снимки.
Източник: PetaPixel

Printguide
Интернет портал за печатни технологии.