RECURSOS TIC - SALESIANS SARRIÀ

Butlleti Intel·ligència artificial - 29 Febrer 2024

Stable Diffusion 3

Stability AI ha anunciat Stable Diffusion 3, el seu model de text a imatge més avançat fins ara, destacant un rendiment millorat en prompts de múltiples subjectes, qualitat d'imatge i capacitats ortogràfiques. Encara que encara no està disponible per al públic en general, s'ha obert una llista d'espera per a una vista prèvia primerenca. Aquest model, que varia de 800M a 8B paràmetres, enfatitza en la seguretat i l'accessibilitat, prometent democratitzar la creació creativa mantenint pràctiques d'IA segures i responsables.

VEURE MÉS

Adobe Acrobat amb IA

Adobe Acrobat introdueix assistència d'IA generativa per interactuar amb documents PDF, permetent obtenir respostes i resums ràpids. Disponible inicialment en anglès per a subscripcions de pagament d'Acrobat Pro, amb plans d'expansió a Acrobat Reader. Aquest avanç destaca el compromís d'Adobe amb l'ètica en IA.

VEURE MÉS

EMO: Vídeo a partir d'una sola imatge i un audio

EMO és un marc de generació de vídeos de retrats expressius impulsat per àudio, creat per l'Institut de Computació Intel·ligent del Grup Alibaba. Utilitzant una imatge de referència i àudio vocal, com parlar o cantar, EMO pot generar vídeos d'avatars vocals amb expressions facials expressives i diverses postures del cap, mantenint la identitat del personatge en vídeos de qualsevol durada. Aquest mètode admet cançons en diversos idiomes i estils de retrat, demostrant una sincronització precisa amb ritmes ràpids i la capacitat d'animar retrats de diverses eres i estils.

VEURE DEMOS AMB QUALITAT I AUDIO

Models Gemma - Google

Google ha llançat Gemma 2B i 7B, dos models de IA de codi obert dissenyats per a permetre que els desenvolupadors aprofitin més lliurement la recerca darrere del seu model insígnia Gemini. A diferència de Gemini, que és un model de IA tancat, els models Gemma estan pensats per a tasques més lleugeres, com a bots simples o tasques de resum.

VEURE MÉS

Image to Video - SORA

OpenAI ha revelat una innovació que promet revolucionar la forma en què interactuem amb la tecnologia visual: la conversió d'imatge estàtica a vídeo. A través del nou vídeo de Sora, es mostra com una imatge generada per DALL-E 3 (primer fotograma de l'inici del video) cobra vida, transformant-se en un vídeo d'1 minut. Aquest avanç no sols destaca la capacitat de OpenAI per a generar contingut dinàmic, sinó que també obre portes a noves formes d'expressió creativa i comunicació visual.

VEURE VÍDEO AMB QUALITAT REAL

Noticies Breus...

Vídeos interessants...

Per provar i jugar...

- Screenshot2HTML: GPT Eina per aconseguir el codi HTMLi CSS a partir d'una imatge, particularment pràctica per a pàgines web i interfícies d'usuari.
- Galileo: Si tens interès en desenvolupar interfícies d'usuari mitjançant text o imatges, Galileo ha estat recentment posat a disposició del públic.
- DynamiCrafter: El sistema per a generar vídeos des de imatges DynamicCrafter està disponible per a proves en Replicate. Projecte