employment.az employment.az

Dərc olunma tarixi

21.11.2025 Texnologiya

Baxış sayı

eye 39

Oxunma müddəti

clock 6 dəq

Tədqiqatçılar süni intellektin yaradıcılığının arxasında gizlənən maddələri aşkara çıxarırlar

Bir zamanlar bizə sürücüsüz avtomobillər və robot xidmətçilər vəd olunurdu. Bunun əvəzinə, şahmatda bizi məğlub edə bilən, nəhəng mətn yığınlarını analiz edə bilən və sonetlər yazan süni intellekt sistemləri ortaya çıxdı. Bu, müasir dövrün ən böyük sürprizlərindən biri oldu: İnsanlar üçün asan olan fiziki tapşırıqlar robotlar üçün çox çətin görünərkən, alqoritmlər getdikcə bizim zəkanımızı təqlid etməkdə daha bacarıqlı olur.

Araşdırmaçılar uzun müddətdir başqa bir məqamla da çaşqınlıq içindədirlər — bu alqoritmlərin qəribə bir yaradıcılıq nümayiş etdirmələri.

DALL·E, Imagen və Stable Diffusion kimi görüntü yaratma vasitələrinin əsəsini təşkil edən diffuziya modelləri əslində təlim aldıqları şəkillərin tam surətlərini yaratmaq üçün dizayn olunmuşdu. Lakin praktikada, sanki improvizasiya edirmiş kimi davranırlar; şəkillərdəki elementləri birləşdirərək yeni bir şey yaradırlar — yalnız mənasız rəng yığınları deyil, semantik mənası olan tutarlı vizuallar. Paris École Normale Supérieure-dən süni intellekt tədqiqatçısı və fizik Giulio Biroli-nin dediyi kimi bu, diffuziya modellərinin arxasındakı “paradoks”dur: “Əgər mükəmməl işləsəydilər, sadəcə yadda saxlamaları gərəkərdi,” deyir. “Ancaq etmirlər — əslində yeni nümunələr yarada bilirlər.”

Şəkilləri yaratmaq üçün diffuziya modelləri “səs-küyün aradan qaldırılması” adlanan bir prosesdən istifadə edir. Onlar şəkli rəqəmsal səs-küyə (başqa sözlə, nizamsız piksellər yığınına) çevirir, sonra onu yenidən yığırlar. Bu, bir rəsm əsərini dəfələrlə kağız doğrama maşınından keçirib yalnız toz halına salmağa, sonra isə həmin tozu yenidən tabloya çevirməyə bənzəyir. Tədqiqatçılar illərlə bunu düşünürdü: əgər modellər sadəcə yenidən yığırsa, bəs yenilik haradan gəlir? Bu, doğranmış tablonun tamamilə yeni bir sənət əsərinə çevrilməsinə bənzəyir.

İndi isə iki fizik cəsarətli bir iddia irəli sürüb: Yaradıcı görünüş, səs-küyün aradan qaldırılması prosesindəki texniki qüsurların birbaşa nəticəsidir. 2025 Beynəlxalq Maşın Öyrənməsi Konfransında təqdim olunacaq məqalələrində onlar təlim keçmiş diffuziya modellərinin riyazi modelini hazırlayıb və göstəriblər ki, iddia olunan yaradıcılıq əslində deterministik bir prosesdir — onların arxitekturasının birbaşa və qaçınılmaz nəticəsi.

Diffuziya modellərinin qara qutusunu işıqlandıran bu yeni araşdırma gələcək süni intellekt araşdırmaları üçün — və bəlkə də insan yaradıcılığını anlamağımız üçün — böyük nəticələr vəd edir. Hollandiya Radboud Universitetindən kompüter alim Luca Ambrogioni belə deyir: “Bu məqalənin əsl gücü, çox qeyri-adi bir şey haqqında son dərəcə dəqiq proqnozlar verə bilməsidir.”

Stanford Universitetində tətbiqi fizika üzrə magistr tələbəsi və məqalənin aparıcı müəllifi Mason Kamb uzun müddətdir morfogenezdən — canlı sistemlərin öz-özünə necə formalaşmasından təsirlənirdi.

İnsan və digər heyvan embrionlarının inkişafını anlamağın yollarından biri 20-ci əsr riyaziyyatçısı Alan Turing-in adıyla bağlı olan “Turing naxışı” anlayışıdır. Turing naxışları hüceyrə qruplarının necə müxtəlif orqanlara və ətraflara bölünə biləcəyini izah edir. Əsas olan odur ki, bu koordinasiya tamamilə lokal səviyyədə baş verir. Trilyonlarla hüceyrənin son plana uyğunlaşmasını idarə edən bir CEO yoxdur. Hüceyrələr, yəni, əvvəlcədən müəyyən edilmiş bədən planına sahib deyillər; sadəcə qonşu hüceyrələrdən gələn siqnallara cavab verirlər. Bu aşağıdan-yuxarıya sistem adətən problemsiz işləyir, amma bəzən səhvlər verir — məsələn, artıq barmaq yaranması kimi.

İlk süni intellekt şəkilləri internetdə görünməyə başlayanda çoxu sürrealist rəsmlərə bənzəyirdi; insanlar əlavə barmaqlarla təsvir olunurdu. Bu, Kamb-a dərhal morfogenez səhvlərini xatırlatdı: “Bu, [aşağıdan yuxarıya] işləyən bir sistemin verə biləcəyi növ bir səhvin iyini verirdi,” dedi.

Araşdırmaçılar həmin vaxta qədər diffuziya modellərinin vizual istehsalda bir sıra texniki qısayollardan istifadə etdiyini bilirdilər. Birincisi “yerlilik” adlanır: modellər yalnız bir piksel qrupuna — yəni “yamaya” — fokuslanır. İkincisi isə sərt bir qaydaya əməl edirlər: Şəkili bir neçə piksel hərəkət etdirirsinizsə, model də nəticəsində eyni hərəkəti avtomatik tətbiq edir. Bu xüsusiyyət “ötürmə ekvivalansı” (translational equivariance) kimi tanınır və strukturu qorumağın bir yoludur; bu olmadan realistik vizuallar yaratmaq çox daha çətin olar.

Məhz bu xüsusiyyətlər səbəbindən diffuziya modelləri müəyyən bir yamanın son görüntüdə harada yerləşəcəyinə əhəmiyyət vermir. Onlar sadəcə həmin yamaları yaratmağa fokuslanır və sonra bu yamaların yerini müəyyən etmək üçün “skor funksiyası” adlanan riyazi modeldən istifadə edirlər. Bu, rəqəmsal Turing naxışı kimi təsəvvür oluna bilər.

Araşdırmaçılar uzun müddət yerli və ekvivalentlik kimi xüsusiyyətləri sadəcə səs-küyü azaltma prosesinin məhdudiyyətləri kimi düşünürdülər — modellərin mükəmməl surətlər yaratmasının qarşısını alan texniki qəribəliklər. Onlar bunu yaradıcılıqla əlaqələndirmirdilər. Yaradıcı davranışın daha yüksək səviyyəli bir fenomen olduğu güman edilirdi.

Amma yanıldıqları ortaya çıxdı.

Yerlik əsasında yaradılmış

Kamb 2022-ci ildə Stanford-da Surya Ganguli-nin laboratoriyasında magistratura təhsilinə başladı. OpenAI həmin il ChatGPT-ni yaydı və bugün “generativ süni intellekt” adlandırılan sahə böyük diqqət topladı. Texnologiya inkişaf etdiriciləri daha güclü modellər qurmağa çalışarkən, akademiklər bu sistemlərin daxili iş prinsiplərini anlamağa yönəldi.

Kamb nəhayət belə bir hipotez irəli sürdü: yerlik və ekvivalentliyin özləri yaradıcılığa səbəb olur. Bu, cazibədar bir eksperimental imkan yaradırdı: əgər yalnız yerlik və ekvivalentlik üçün optimallaşdırılmış bir sistem qurmaq mümkün olarsa, o sistem diffuziya modeli kimi davranmalı idi. Bu eksperiment, Ganguli ilə birlikdə yazdığı yeni məqalənin əsasını təşkil edir.

Kamb və Ganguli sistemlərinə “ekvivalent yerli skor” (equivariant local score, ELS) maşını adını verdilər. Bu, təlim keçmiş diffuziya modeli deyil; yalnız yerlik və ekvivalentlik mexanizmlərinə əsaslanaraq səs-küydən təmizlənmiş görüntülərin necə görünəcəyini analitik şəkildə proqnozlaşdıra bilən tənliklər toplusudur. Daha sonra səs-küyə çevrilmiş görüntüləri həm ELS maşını ilə, həm də ResNet və UNet kimi güclü diffuziya modelləri ilə emal etdilər.

Nəticələr “şokedici idi,” dedi Ganguli: hər bir halda ELS maşını təlim keçmiş diffuziya modellərinin nəticələrinin 90%-i ilə eyni nəticəni verdi — bu, “maşın öyrənməsində görünməmiş bir şeydir.”

Bu nəticələr Kambın hipotezini dəstəkləyirdi: “Yerli məhdudiyyəti tətbiq etdiyiniz andan etibarən [yaradıcılıq] avtomatik olaraq yaranırdı; dinamiklərin içindən tamamilə təbii şəkildə çıxırdı,” dedi. Səs-küyü azaltma prosesində modellərin diqqət pəncərəsini məhdudlaşdıran — onları kontekstdən asılı olmayaraq yalnız yerli yamaqlara fokuslamağa məcbur edən — eyni mexanizmlər eyni zamanda yaradıcılığı mümkün edirdi. Modellerdə müşahidə olunan artıq barmaq fenomeni də modellərin kontekstdən qopuq şəkildə yalnız lokal piksel yamaları yaratmağa aludə olmalarının birbaşa yan məhsulu idi.

Mütəxəssislər etiraf edirlər ki, Kamb və Ganguli-nin məqaləsi diffuziya modellərindəki yaradıcılığın mexanizmlərini aydınlaşdırsa da, hələ də gizli məqamlar var. Məsələn, böyük dil modelləri və digər süni intellekt sistemləri də yaradıcılıq nümayiş etdirir, amma yerlik və ekvivalentlikdən istifadə etmirlər.

“Düşünürəm ki, bu hekayənin çox vacib bir hissəsidir,” deyir Biroli, “[amma] hamısı deyil.”

Yaradıcı davranışın yaradılması

Tədqiqatçılar ilk dəfə olaraq göstərdilər ki, diffuziya modellərinin yaradıcılığı sırf səs-küyü aradan qaldırma prosesinin yan məhsulu kimi düşünüla bilər və bu, riyazi olaraq formullaşdırılıb misilsiz dəqiqliklə proqnozlaşdırıla bilər. Bu, insan rəssamlarını beyin skanerinə yerləşdirib yaradıcılıqlarının ortaq sinir mexanizmini tənlik şəklində yaza bilmək kimidir.

Bu bənzətmə bəlkə də yalnız bir metafor deyil: Kamb və Ganguli-nin işi insan beyninin qara qutusunu da işıqlandıra bilər. Georgia Texnologiya İnstitutu və IBM Research-də diffuziya modelləri üzərində çalışan maşın öyrənimi tədqiqatçısı Benjamin Hoover belə deyir: “İnsan və süni intellekt yaradıcılığı bəlkə də o qədər də fərqli deyil. Biz təcrübələrimizə, xəyallarımıza, gördüklərimizə, eşitdiklərimizə və arzularımıza əsaslanaraq bir şeylər birləşdiririk. Süni intellekt də gördüklərindən və tələb ediləndən aldığı hissələri bir araya gətirir.” Bu baxışa görə həm insan, həm də süni yaradıcılıq dünyanın natamam anlaşılmasına əsaslana bilər: Biz hamımız imkan daxilində boşluqları doldurmağa çalışırıq və bəzən yeni və dəyərli bir şey yaradırıq. Bəlkə də buna “yaradıcılıq” deyirik.

heart save
Yazar
  • İstifadəçi adı:

    kaizen
  • Ad Soyad:

    Kaizen.az
  • Məqalə sayı:

    192

Əlaqəli məqalələr

paper-1-img
Aqronomiya Robotları

04.05.2023

Texnologiya

Texnologiyanın durmadan inkişaf etdiyi müasir dövr yenilikləri aqronomiyadan da yan keçməyib. Bu gün sizlərlə aqronomiyada istifadə olunan bir-birindən fərqli və yararlı robotlarla tanış olacağıq.

paper-1-img
Texnoloji İnkişafların İnsan Davranışlarına və Sosial Mediaya Təsiri

28.10.2021

Texnologiya

Texnologiyanın inkişafı ilə insanların texnologiya ilə qarşılıqlı əlaqəsində fərqliliklər yaratdı. Keçmişdə çox evdə kompüter, telefon və planşet, hətta televizor belə yox idi.

paper-1-img
Metaverse: Yeni Virtual Dünya

19.11.2021

Texnologiya

Bildiyiniz kimi, bu yaxınlarda Facebook-un qurucusu və baş direktoru Mark Zukerberq ,Facebook adının şirkətin gələcəyini adekvat şəkildə təsvir etmədiyini və ad dəyişikliyini təsdiqlədi və “Metaverse”haqqında bəzi məlumatlar verdi.İnsanlarda “Metaverse” nədir? ,Hansı xüsusiyyətlələrə malikdir? və s kimi suallar yarandı.Gəlin bu suallara cavab tapmağa çalışaq.