Arsim & Kulturë

AICo, një korpus i gjuhës shqipe me 100 milionë fjalë

Në ditën e pestë të Seminarit të Gjuhës, Letërsisë dhe Kulturës Shqiptare, është diskutuar për ndërtimin e korpuseve të gjuhëve, me ç’rast profesori Besim Kabashi ka prezantuar “AICo” korpusin i cili përmban tekste të ndryshme.

Me këtë rast, Kabashi ka thënë se ka ndërtuar korpusin e gjuhës shqipe me qëllim të lehtësimit të punës së gjuhëtarëve dhe   studiuesve të gjuhës shqipe.

Më tej, ai ka treguar se rezultatet e kësaj pune janë një hulumtim prej 10 vitesh, me ç’rast është bërë edhe selektimi i teksteve njëkohësisht, ndërsa ka shpjeguar se rreth 32 mijë fjalë i ka shënjuar me dorë.

“Unë tekstet i kam shënjuar në aspektin morfologjik dhe sintaksor me dorë. Tani një pjesë, një shumë prej 32 mijë fjalëve janë bërë me dorë. Meqë kjo kërkon shumë kohë dhe shumë punë, unë ato i kam filluar që t’i bëjë automatikisht. Duke u trajnuar në atë pjesë, kam filluar që ta trajnoj një program që bënë anotimin në vend të njeriut. Anotimi i pjesës më të madhe të korpusit është automatik”, tha ai.

Kabashi ka sqaruar se korpusi mund të ketë rreth 5 përqind gabime.

Ndryshe, korpusi është tërësia e veprave themelore që botohen në një fushë dhe që lidhen njëra me tjetrën./kp