Txatbot irekia

LATXA

LABS

Latxa euskarazko hizkuntza eredu ireki ahaltsua da. Epe luzeko proiektua da, euskara beste hizkuntzen pare jarri nahi duena.

Tarteko probako beta bertsio honek ez dauzka eredu komertzialen gaitasun guztiak, baina kalitate oneko euskara sortzen du. Gure ikerketa eta zuen erabileraren bidez gaitasun gehiago eta kalitate hobeagoa edukiko du.

Jarraitu irakurtzen

Zer egin dezakezu Latxarekin?

Latxa hainbat zereginetarako erabil dezakezu euskaraz. Hona hemen adibide batzuk:

โœ๏ธ

Idazketa laguntza

Testuak sortu, zuzendu edo hobetu. Emailak, txostenak edo edozein dokumentu idazten lagundu.

"Idatz iezadazu email formal bat bilera bat eskatzeko"
๐Ÿ“š

Laburpenak

Testu luzeak laburtu eta funtsezko ideiak atera. Artikuluak, albisteak edo dokumentuak laburbildu.

"Laburtu testu hau paragrafo batean"
๐ŸŒ

Itzulpena

Testuak beste hizkuntzetatik euskarara edo euskaratik beste hizkuntzetara itzuli.

"Itzuli testu hau ingelesera"
๐Ÿ’ก

Ideiak sortu

Brainstorming egin proiektuetarako, izenburuak asmatu edo sormena sustatu.

"Eman 5 ideia euskal kulturari buruzko podcast baterako"
โ“

Galderak erantzun

Informazioa lortu gai ezberdinei buruz, azalpenak jaso eta zalantzak argitu.

"Zer da fotosintesia?"
๐Ÿ’ป

Kodea

Programazioan lagundu, kodea azaldu edo erroreak konpondu.

"Azaldu Python-en for begizta bat"

Labs bertsioaren mugak

Latxa Labs beta bertsioa bat da, eta mugak ditu. Garrantzitsua da jakitea:

โš ๏ธ

Akatsak egin ditzake: Informazio okerra edo zehaztasun gabea eman dezake. Egiaztatu beti informazio garrantzitsua.

๐Ÿ”„

Etengabe hobetzen: Gure ikerketa eta zuen erabileraren bidez gaitasun gehiago eta kalitate hobeagoa edukiko du.

๐Ÿ“Š

Gaitasun mugatuak: Eredu komertzialek gaitasun gehiago dituzte oraindik (fitxategiak igo, internet atzitu, etab), baina Latxa etengabe hobetzen ari da.

Ereduak eta datuak

HiTZ zentroan euskararako ereduak, kodea eta datuak sortu ditugu, guztiontzat eskuragarri. Lizentzia irekiak dituzte (erabilera komertziala barne).

Eredua

Latxa familia

Tamaina ezberdinetako ereduak. 70B onena da; 8B azkarragoa.

Datuak

Latxarako datuak

Latxa entrenatzeko erabilitako datu-multzoak

Baliabide gehiago: ๐Ÿค— HuggingFace ยท ๐Ÿ“ฆ GitHub

IKER-GAITU proiektuaren parte

Latxa IKER-GAITU proiektuaren barruan garatutako txatbot-a da. Proiektu honen helburu nagusia hizkuntza teknologian ikertzea da, euskararen presentzia esparru digitalean handitzeko.

Gaur egungo eta etorkizuneko teknologiek datu testual eta ahozko kopuru izugarriak behar dituzte hizkuntza bakoitzeko, baina euskarak eta beste hizkuntza txikiagoek orain eskain ditzaketen datuak ez dira nahikoak teknologia hauek behar duten kalitatea izateko. Beraz, funtsezkoa da hizkuntza teknologian ikertzea, euskarak gero eta ohikoagoa izango den teknologia horretan presentzia izan dezan eta beste hizkuntzen maila lor dezan.

๐ŸŽฏ Gure helburua

Lortu testu bidezko elkarrizketa sistema ahaltsuenetik (ChatGPT edo Gemini bezalakoak) euskaraz beste hizkuntzetan bezain ondo funtzionatzea. Latxa horretarako pausoa da.

Proiektuari buruzko informazio gehiago: IKER-GAITU webgunea