A Mosaic Factor, ens centrem en la creació de LLM específics de sector (o models lingüístics lleugers) per a les nostres organitzacions clientes.
Els LLM lleugers són de gran importància tenint en compte factors com:
-
- Rendibilitat
- Sostenibilitat
- Privadesa
- Ètica
Els LLM lleugers són models d’IA que permeten un control més gran a nivell de l’empresa, sense dependre de serveis externs amb cost associat. Necessiten menys capacitat de computació, sent models més ràpids i rendibles, i s’adapten millor a les necessitats de l’empresa.
Podem dir que són més responsables, ja que s’adapten a les necessitats d’una indústria o domini específic, cosa que els fa més segurs, efectius i lleugers en tots els aspectes (considerant el consum d’energia, la mida i l’adaptació al seu ús previst).
Ens enfoquem a construir LLMs que treballin amb els requisits intrínsecs de seguretat i privadesa de les indústries que necessiten rastrejar i tenir proves legals del que passa dins dels seus sistemes, fins i tot quan entrenen models d’IA, com Salut, Serveis Corporatius, Indústria, etc.
Clarament, també interessen a empreses que pretenen ser socialment responsables a l’hora de gestionar grans quantitats de dades o documentació i desitgen abordar les possibilitats dels models d’IA de manera responsable.
Per què utilitzar aquesta solució?
- Anàlisi de dades i personalització: els LLM poden processar grans volums de dades textuals per identificar patrons i tendències, cosa que facilita la presa de decisions informades i la planificació estratègica, així com la personalització dels serveis per a usuaris específics en funció de les seves dades de comportament.
- Automatització de tasques repetitives: els LLM poden encarregar-se de tasques repetitives i de baix valor, com la classificació de correus electrònics, la generació d’informes i l’entrada de dades. Això allibera temps perquè els empleats se centrin en tasques més estratègiques.
- Millora del servei al client: els LLM poden integrar-se en xatbots i assistents virtuals per proporcionar respostes ràpides i precises a les consultes dels clients, millorant la satisfacció i reduint els temps d’espera.
Integrar els LLMs a l’organització
La integració d’LLM lleugers en els sistemes existents pot ser un element estratègic que s’ha de gestionar adequadament. Així és com ho fem a Mosaic Factor:
1. Avaluació i planificació:
a. Identificar casos d’ús: determinem on un LLM pot aportar valor. Els casos d’ús més comuns inclouen xatbots, anàlisi de sentiments, generació de contingut i traducció.
b. Avaluar dades: avaluem la qualitat i la quantitat de les dades disponibles. Els LLM requereixen dades d’entrenament substancials per obtenir un rendiment òptim.
2. Selecció del model:
a. Selecció del light LLM: optem per models més petits (per exemple, DistilBERT, TinyGPT) que ofereixen eficiència sense sacrificar la qualitat.
b. Fine-tuning: quan s’utilitza un model prèviament entrenat, l’ajustem amb dades específiques del sector per millorar la rellevància i la precisió.
3. Infraestructura i desplegament:
a. Recursos computacionals: assignem prou recursos informàtics (CPU/GPU) per a l’entrenament i la inferència.
b. Integració d’API: configurem APIs per interactuar amb l’LLM. Els frameworks més populars són Hugging Face Transformers i l’API d’OpenAI.
c. Escalabilitat: ens assegurem que el sistema pugui gestionar una càrrega més gran a mesura que creix l’ús del model.
4. Pretractament de dades:
a. Tokenització: convertim el text en tokens adequats per a l’entrada de l’LLM.
b. Format d’entrada: preparem dades d’entrada (per exemple, indicacions, preguntes) per a l’LLM.
5. Inferència i output:
a. Processament per lots: optimitzem la inferència mitjançant el processament per lots de sol·licituds.
b. Postprocessament: netegem i donem format a la sortida generada per l’LLM per a la interacció amb l’usuari (ex. xat o formulari d’entrada).
6. Seguiment i manteniment:
a. Mètriques de rendiment: monitorem el rendiment de l’LLM (per exemple, la seva precisió o el temps de resposta).
b. Actualitzacions periòdiques: mantenim els LLM actualitzats amb noves dades i els tornem a entrenar periòdicament.
c. Gestió d’errors: implementem una gestió robusta d’errors per a escenaris inesperats.
La integració d’LLMs és un procés iteratiu. En general, recomanem començar amb un pilot a petita escala, recopilar feedback i refinar el sistema en funció de les dades d’ús reals.
Creem models d’IA robustos i escalables
Ens centrem en la creació de models d’IA optimitzats d’alt rendiment que minimitzin l’ús de recursos computacionals, cosa que es tradueix en menors costos i menor impacte mediambiental.
Sempre avaluem els casos d’ús d’IA dins de la indústria específica de l’empresa per assegurar-nos que els LLM permetin a les empreses prendre decisions basades en dades, optimitzar processos i mantenir-se a






























