RECURSOS TIC - SALESIANS SARRIÀ

Butlleti Intel·ligència artificial - 22 Novembre 2023

LCM - LoRA

Realització d'inferències utilitzant LCM-LoRA, una tècnica per a generar imatges d'alta qualitat en pocs passos. Els Models de Coherència Latent (LCM) s'extreuen de models de difusió estables i permeten la creació ràpida d'imatges, ideal per a entorns en temps real. LCM-LoRA s'enfoca a entrenar només algunes capes d'adaptador, evitant l'entrenament complet del model i mantenint un nombre manejable de paràmetres. S'aplica a diferents tasques com a text a imatge, imatge a imatge, combinat amb LoRA amb estil, entre altres. La tècnica ofereix un flux de treball eficient i ràpid, superant la lentitud iterativa dels models de difusió tradicionals.

VEURE DEMO

Meta treu l'editor Emu AI

Meta acaba d'anunciar dues noves eines creatives impulsades per IA, Emu Edit permet als usuaris realitzar edicions d'imatges amb instruccions de text, i el model les comprèn intuïtivament sense seleccions específiques i Emu Vídeo pot generar videoclips curts i animacions utilitzant missatges de text, imatges o tots dos com a entrades. Totes dues funcions s'integraran a Facebook i Instagram.

VEURE MÉS

Runway Brush

La nova funció Motion Brush de Runway et permet animar i elegir direccions i velocitats de moviment per a seccions de la teva imatge. Pots estendre-ho durant 4 segons, fins a 3 vegades i canviar el moviment de la càmera cada vegada. La versió beta de Motion Brush estarà disponible per a tots aviat. Veure fil a Twitter / X.

VEURE MÉS

LM Studio

Amb LM Studio, pots executar LLMs en el teu ordinador personal (PC o Mac), completament offline. Utilitzar models a través de la interfície de xat in-app o d'un servidor local compatible amb OpenAI. Descàrrega qualsevol arxiu de model compatible des dels repositoris de HuggingFace. Eina creada a partir del projecte crida.cpp. Tutorial i App

DESCARREGA

palm trees

Speak Subtitles for YouTube

Converteix subtítols de text per a YouTube en un discurs que sona natural gràcies a les tecnologies de IA de Google i Microsoft. Text-to-Speech permet sintetitzar amb més de 100 veus, disponibles en múltiples idiomes i variants. L'extensió pot entrar en conflicte amb altres extensions per a YouTube. Si l'extensió no funciona o tens algun problema, prova de desactivar altres extensions.

VEURE MÉS

Stable Vídeo Diffusion

StabilityAI (creadors de Stable Diffusion) acaba d'anunciar un nou model de generació de vídeo, Stable Vídeo Diffusion. El model s'ha alliberat i el podeu descarregar, encara que la seva llicència no recull ús comercial. Característiques: durada de vídeo de 2-5 segons, fins a 30 frames/sec temps de processament: < 2 min.

VEURE MÉS

Noticies Breus...

- Sam Altman deixa OpenAI i ha estat contractat per microsoft
- El nou ceo de OpenAI és cofundador de Twitch
- Meta dissol l'equip de IA responsable
- Anthropic: Claude 2.1: Finestra de context de 200.000 tokens (500 pàgines), disminució del doble en les taxes d'al·lucinacions i preus actualitzats.
- OpenAI anuncia funcions de veu ChatGPT gratuïtes en la seva aplicació mòbil.

Per provar i jugar...

- AI Shadows: Genera ombres realistes per a fotografies d'aspecte professional i elimina el fons
- Listening: Millora l'aprenentatge d'idiomes amb exercicis d'escolta impulsats per IA
- GPT Zero: Detectar si un assaig és ChatGPT o escrit per humans (comentari: es pot enganyar)
- Convert text subtitles for YouTube: Converteix subtítols de text per a YouTube en veu amb so natural utilitzant les tecnologies d'intel·ligència artificial de Google i Microsoft.
- Roboflow: Startup amb seu a Des Moines, Iowa, que desenvolupa eines de modelatge de visió per ordinador
- Meshy: Crea impressionants models 3D amb IA