Butlleti Intel·ligència artificial - 22 Novembre 2023
LCM - LoRA
Realització d'inferències utilitzant LCM-LoRA, una tècnica per a generar imatges d'alta qualitat en pocs passos. Els Models de Coherència Latent (LCM) s'extreuen de models de difusió estables i permeten la creació ràpida d'imatges, ideal per a entorns en temps real. LCM-LoRA s'enfoca a entrenar només algunes capes d'adaptador, evitant l'entrenament complet del model i mantenint un nombre manejable de paràmetres. S'aplica a diferents tasques com a text a imatge, imatge a imatge, combinat amb LoRA amb estil, entre altres. La tècnica ofereix un flux de treball eficient i ràpid, superant la lentitud iterativa dels models de difusió tradicionals.

VEURE DEMO

 
Meta treu l'editor Emu AI
Meta acaba d'anunciar dues noves eines creatives impulsades per IA, Emu Edit permet als usuaris realitzar edicions d'imatges amb instruccions de text, i el model les comprèn intuïtivament sense seleccions específiques i Emu Vídeo pot generar videoclips curts i animacions utilitzant missatges de text, imatges o tots dos com a entrades. Totes dues funcions s'integraran a Facebook i Instagram.

VEURE MÉS

 
Runway Brush

La nova funció Motion Brush de Runway et permet animar i elegir direccions i velocitats de moviment per a seccions de la teva imatge. Pots estendre-ho durant 4 segons, fins a 3 vegades i canviar el moviment de la càmera cada vegada. La versió beta de Motion Brush estarà disponible per a tots aviat. Veure fil a Twitter / X.

VEURE MÉS

 
LM Studio
Amb LM Studio, pots executar LLMs en el teu ordinador personal (PC o Mac), completament offline. Utilitzar models a través de la interfície de xat in-app o d'un servidor local compatible amb OpenAI. Descàrrega qualsevol arxiu de model compatible des dels repositoris de HuggingFace. Eina creada a partir del projecte crida.cpp. Tutorial i App

DESCARREGA

 
palm trees
Speak Subtitles for YouTube
Converteix subtítols de text per a YouTube en un discurs que sona natural gràcies a les tecnologies de IA de Google i Microsoft. Text-to-Speech permet sintetitzar amb més de 100 veus, disponibles en múltiples idiomes i variants. L'extensió pot entrar en conflicte amb altres extensions per a YouTube. Si l'extensió no funciona o tens algun problema, prova de desactivar altres extensions.

VEURE MÉS

 
Stable Vídeo Diffusion
StabilityAI (creadors de Stable Diffusion) acaba d'anunciar un nou model de generació de vídeo, Stable Vídeo Diffusion. El model s'ha alliberat i el podeu descarregar, encara que la seva llicència no recull ús comercial. Característiques: durada de vídeo de 2-5 segons, fins a 30 frames/sec temps de processament: < 2 min.

VEURE MÉS

 
Noticies Breus...
 
Per provar i jugar...
  • - AI Shadows: Genera ombres realistes per a fotografies d'aspecte professional i elimina el fons
  • - Listening: Millora l'aprenentatge d'idiomes amb exercicis d'escolta impulsats per IA
  • - GPT Zero:  Detectar si un assaig és ChatGPT o escrit per humans (comentari: es pot enganyar)
  • - Convert text subtitles for YouTube: Converteix subtítols de text per a YouTube en veu amb so natural utilitzant les tecnologies d'intel·ligència artificial de Google i Microsoft.
  • - Roboflow: Startup amb seu a Des Moines, Iowa, que desenvolupa eines de modelatge de visió per ordinador
  • - Meshy: Crea impressionants models 3D amb IA
 
2024 © Salesians Sarrià - Espai Escola.