main-post-cover

    Yeni süni zəka modelinin öyrədilməsinə 50$-dan az vəsait sərf edilib

    Süni İntellekt
    07.02.2025
    Emil Nəcəfov
         Stenford Vaşinqton Universitetinin tədqiqatçıları OpenAI-dən daha yaxşı riyazi problemləri həll edən süni zəka modeli yaradıblar. S1 adlanan bu model, cəmi 1000 sualdan ibarət məhdud məlumat bazası üzərində distillə üsulu ilə öyrədilib. Bu yanaşma minimum resurslarla yüksək effektivliyə nail olmağa imkan verib və göstərib ki, OpenAI, Microsoft, MetaGoogle kimi böyük şirkətlərin süni zəka modelləri üçün mütləq nəhəng məlumat mərkəzləri yaratmalarına və onları minlərlə NVIDIA qrafik prosessoru ilə təmin etmələrinə ehtiyac olmaya bilər. Təcrübənin əsas uğur amili distillə metodu olub. Bu üsul kiçik süni zəka modellərinin daha böyük modellərin verdiyi cavablar əsasında öyrənməsinə imkan yaradır.
         Məqalədə The Verge yazır ki, s1 modeli öz bacarıqlarını Google şirkətinin Gemini 2.0 Flash Thinking Experimental adlı süni zəka modelinin cavablarını istifadə edərək sürətlə təkmilləşdirib. S1 modeli Alibaba-nın (Cloud bölməsi) açıq mənbəli Qwen 2.5 layihəsi əsasında yaradılıb. Əvvəlcə tədqiqatçılar 59 000 sualdan ibarət məlumat bazası istifadə ediblər, lakin təcrübələr göstərib ki, məlumat həcminin artırılması nəzərəçarpacaq yaxşılaşma yaratmır. Buna görə son təlim prosesi cəmi 1000 sualdan ibarət məhdud bir məlumat bazası üzərində aparılıb. Bu prosesdə cəmi 16 ədəd NVIDIA H100 GPU-dan istifadə olunub və bütün bu resurslar üçün 50$-dan az vəsait xərclənib.
         S1 modelinə həmçinin "test zamanı miqyaslandırma" (test-time scaling) üsulu tətbiq edilib. Bu üsul modelə cavabı generasiya etməzdən əvvəl "düşünməyə" imkan verir. Bundan əlavə, tədqiqatçılar modelin öz nəticələrini yenidən yoxlamasını təmin etmək üçün ona "Wait" ("Gözlə") əmrini əlavə ediblər. Bu üsul süni zəkanı əlavə düşünməyə və öz cavablarını yenidən nəzərdən keçirərək səhvlərini düzəltməyə təşviq edib. S1 modeli riyazi məsələlərin həllində OpenAI-nin o1-preview modelini 27% üstələyərək təsirli nəticələr göstərib.
         Son zamanlarda diqqət çəkən DeepSeek-in R1 modeli də oxşar yanaşmadan istifadə edib və nisbətən az maliyyə vəsaiti ilə yüksək performans nümayiş etdirib. Lakin OpenAI hazırda DeepSeek-i öz modellərindən məlumat çıxarmaqda və istifadə şərtlərini pozmaqda ittiham edir. Bununla yanaşı, Google Gemini-nin istifadə şərtlərində də onun API-dan rəqib çat-botlarının yaradılması üçün istifadə edilməsinin qadağan olunduğu qeyd edilib. Ekspertlər bildirirlər ki, kiçik və daha ucuz süni zəka modellərinin sayının artması bütün sənayeni dəyişə bilər. Bu, süni zəkanın öyrədilməsi üçün milyardlarla dollar investisiya qoymağa, nəhəng məlumat mərkəzləri qurmağa və böyük həcmdə GPU almağa ehtiyac olmadığını sübut edə bilər.
    Mənbə: The Verge
    Linki kopyala

    Bənzər xəbərlər

    Oxşar xəbərlər
    Samsung 6G-yə süni zəkanı inteqrasiya etməyi planlaşdırır
    samsung-6g-ye-suni-zekani-inteqrasiya-etmeyi-planlasdirir
    Süni zəka özü-özünü bərpa edə bilən asfaltın hazırlanmasında yardımçı olub
    suni-zeka-ozu-ozunu-berpa-ede-bilen-asfaltin-hazirlanmasinda-yardimci-olub
    Google Gemini 2.0 Flash Thinking süni zəka modeli hamı üçün istifadəyə verilib
    google-gemini-20-flash-thinking-suni-zeka-modeli-hami-ucun-istifadeye-verilib
    ByteDance inanılmaz real görünən videoları yarada bilən süni zəka sistemini təqdim edib (VİDEO)
    bytedance-inanilmaz-real-gorunen-videolari-yarada-bilen-suni-zeka-sistemini-teqdim-edib-video
    Google süni zəkanı hərbi məqsədlərdə istifadə etməyəcəyi vədindən imtina edib
    google-suni-zekani-herbi-meqsedlerde-istifade-etmeyeceyi-vedinden-imtina-edib