Lajme

Universitetet zvicerane do të publikojnë një program shumëgjuhësh për inteligjencën artificiale

K

Këtë verë, studiuesit në universitetet zvicerane do të vënë në dispozicion një model të madh gjuhësor (LLM), një program të AI-së të trajnuar mbi sasi të mëdha të dhënash, të zhvilluar në infrastrukturën publike. Një tipar përcaktues i modelit është rrjedhshmëria e tij shumëgjuhëshe në mbi 1,500 gjuhë.

I trajnuar në superkompjuterin “Alps” në Qendrën Kombëtare Zvicerane të Superkompjuterëve (CSCS) në Lugano, LLM i ri shënon një moment historik në IA-në me burim të hapur dhe përsosmërinë shumëgjuhëshe, thanë zhvilluesit e tij të mërkurën.

Këtë javë në Gjenevë, rreth pesëdhjetë organizata ndërkombëtare që punojnë për LLM me burim të hapur dhe IA të besueshme u mblodhën në Samitin e parë Ndërkombëtar të Ndërtuesve të LLM me burim të hapur.

I organizuar nga qendrat e IA-së në institutet federale të teknologjisë të Zvicrës në Lozanë (EPFL) dhe Cyrih (ETH Zurich), të dy institucionet e shohin ngjarjen si një moment të rëndësishëm në ndërtimin e një ekosistemi bashkëpunues ndërkombëtar rreth modeleve të hapura dhe transparente. Këto shihen gjithnjë e më shumë si alternativa të besueshme ndaj sistemeve komerciale, të cilat zakonisht zhvillohen pas dyerve të mbyllura në Shtetet e Bashkuara dhe Kinë.

Pjesëmarrësve iu dha një pamje paraprake e publikimit të afërt të një LLM plotësisht të hapur dhe të zhvilluar publikisht, të bashkëkrijuar nga shkencëtarë të EPFL, ETH Zurich dhe universiteteve të tjera zvicerane, në bashkëpunim me inxhinierë nga CSCS, transmeton albinfo.ch.

Aktualisht në fazën përfundimtare të testimit, modeli do të jetë i disponueshëm për shkarkim nën një licencë të hapur më vonë gjatë verës. Ai përqendrohet në transparencë, performancë shumëgjuhëshe dhe akses të gjerë.

Kodi burimor dhe të dhënat e trajnimit do të jenë të hapura dhe të riprodhueshme, për të inkurajuar miratimin në sektorët shkencorë, qeveritarë, arsimorë dhe privatë. Kjo qasje synon të promovojë si inovacionin, ashtu edhe llogaridhënien.

“Modelet plotësisht të hapura mundësojnë aplikacione me besim të lartë dhe janë thelbësore për avancimin e kërkimeve mbi rreziqet dhe mundësitë e IA-së. Proceset transparente gjithashtu lehtësojnë pajtueshmërinë rregullatore,” shpjegon Imanol Schlag, një studiues në qendrën e IA-së të ETH Zurich, i cili po piloton projektin së bashku me Antoine Bosselut dhe Martin Jaggi në EPFL.

Një tipar dallues i modelit është zotërimi i më shumë se 1,500 gjuhëve. “Ne theksuam shumëgjuhësinë masive që në fillim,” shpjegon Bosselut në një njoftim.

Ndryshe nga modelet amerikane që përqendrohen në anglisht, modeli bazë u trajnua mbi një korpus të gjerë tekstesh në më shumë se 1,500 gjuhë, rreth 60 për qind në anglisht dhe 40 për qind në gjuhë të tjera, si dhe në të dhëna kodi dhe matematikore. Falë këtij përfaqësimi gjuhësor dhe kulturor, modeli mund të përdoret kudo në botë.

Dokumentacioni i plotë do ta shoqërojë botimin, duke detajuar arkitekturën e modelit, metodat e trajnimit dhe rekomandimet e përdorimit, për të mundësuar ripërdorim transparent dhe zhvillim të vazhdueshëm.

E lançuar në dhjetor të vitit 2023 nga dy institutet federale të teknologjisë, iniciativa zvicerane e inteligjencës artificiale mbështetet nga më shumë se dhjetë institucione akademike në të gjithë vendin.