• The AI Pimp Club
  • Posts
  • AI DAILY NEWS#76 - Révélations GPT-4, YouTube IA Doublage, Voice Library & Plus

AI DAILY NEWS#76 - Révélations GPT-4, YouTube IA Doublage, Voice Library & Plus

🤩IA POUR LE BUSINESS! #76

27/06/2023

🚀 Bienvenue dans AI DAILY NEWS! 🗞️

  • 🎭 Le SECRET de GPT-4 révélé : 8 modèles dans 1!

  • 🚀 YouTube lance l'outil de doublage IA

  • 👄 Prête ta voix à Voice Library d’ElevenLabs

  • 🦾 ORCA-Mini, l'open-source LLM local (sur ton PC)

  • 🔄 IA Révolution : les LLM autocorrectifs avec BACKSPACE

  • 🤖 Booste la productivité avec ces outils IA

🧵THE THREAD

📰NEWS

RÉSUMÉ

• Le modèle GPT-4 est l'un des modèles les plus révolutionnaires disponibles au public, gratuitement ou à travers un portail commercial (en version bêta).

• GPT-4 n’est pas un modèle dense monolithique simple comme GPT-3 et GPT-3.5 mais un mélange de 8 modèles de 220 milliards de paramètres. 🧐

• La méthodologie s'appelle "mixture of experts" et se compose de 4 étapes :

- Division du travail en tâches sous-jacentes.

- Mise en place d'un expert pour chaque tâche.

- Utilisation d'un modèle de commutation pour décider quel expert utiliser.

- Agrégation des prédictions et des sorties du modèle de commutation pour faire une prédiction. 🤓

• Microsoft a probablement choisi cette méthodologie pour contrer la concurrence et garder ses avancées en matière d’innovation. 😤

• Les modèles « Switch » sont plus rapides et performants que les modèles MoE (Mixture of Experts) et peuvent être utilisés à des facteurs de capacité plus faibles (1-1,25). 💪

RÉSUMÉ

- YouTube teste une nouvelle fonctionnalité qui permet aux créateurs automatiquement de doubler leurs vidéos en d'autres langues avec l'aide de l'IA 👩‍💻

- Cette fonctionnalité est mise en œuvre par le moyen de Aloud, un service de dubbing alimenté par l'IA qui est partie de Google Area 120 🤖 

- En Juin 2021, les créateurs ont doublé plus de 10.000 vidéos dans plus de 70 langues 🗣

- Les créateurs n'ont plus à passer par des fournisseurs tiers pour doubler leurs vidéos, ce qui peut prendre beaucoup de temps et coûter cher 🔹 

- Aloud est disponible en Anglais, Espagnol et Portugais, et des langues supplémentaires telles que le Hindi et le Bahasa Indonesien seront ajoutées à l'avenir 🔹 

- YouTube travaille à rendre les pistes audio traduites similaires à la voix du créateur, avec plus d'expression et de synchronisation labiale 🗣

- L'IA générative permettra à Aloud de lancer des fonctionnalités telles que la préservation de la voix, un meilleur transfert d'émotion et une réanimation des lèvres 🤖

RÉSUMÉ

• Voice Library est une communauté virtuelle pour générer, partager et explorer différents voices.

• Voice Design est au centre de Voice Library et vous permet de générer de nouvelles voix synthétiques en fonction de paramètres tels que l'âge, le genre et l'accent.

• Chaque voix générée est entièrement unique et réaliste et offre une grande toile pour produire une narration de qualité.

• Voice Library permet également aux utilisateurs de partager leurs propres voix avec la communauté, ce qui leur donne un accès encore plus large aux différentes applications.

• Le partage dans Voice Library est facile et des récompenses sont offertes aux utilisateurs qui partagent leurs voix.

• Voice Library se développe constamment avec des labels spécifiques aux différents usages, des voix multilingues, des outils de recherche améliorés et des voix exclusives.

🦾TECH

RÉSUMÉ

• Présentation du modèle Orca-Mini, un modèle LLM open source qui peut être exécuté localement 🤓

• Création des ensembles de données et entraînement du modèle 🗃

• Utilisation du modèle dans un notebook Jupyter et l’interface web Uber Google 💻

• Démonstration des capacités du modèle pour générer du texte, répondre à des questions et même écrire du code fonctionnel 💪 

• Impressionnante capacité du modèle à résoudre des activités, générer des idées créatives et à résumer le texte 🤩

RÉSUMÉ

- 🔄 Une nouvelle architecture permet aux grands modèles de langage de s'auto-corriger pendant la génération de texte en utilisant une action appelée backspace.

🎯 Les modèles combinent l'apprentissage par imitation et l'apprentissage par renforcement pour minimiser les divergences entre leur génération et le contenu généré par les humains.

📝 Cette approche promet la création de grands modèles de langage auto-correctifs, ouvrant de nouvelles possibilités en traitement automatique du langage naturel.

✅ L'architecture utilise des actions et des états pour apprendre des distributions conditionnelles ressemblant aux données, tout en évitant les actions incorrectes.

⚡ L'utilisation d'une action backspace permet au modèle de revenir en arrière et de corriger ses propres erreurs.

🔢 La métrique Mao Way est utilisée pour mesurer l'écart entre le texte généré par le modèle de langage et le texte généré par l'humain.

🤖OUTILS IA

ElevenLabs - Libère la puissance de notre technologie de pointe pour générer des discours réalistes et captivants dans un grand nombre de langues.

FinanceGPT - Transforme tes analyses et recherches financières

BeforeSunset - Transforme ta journée de travail du chaos à la clarté

L'option "Aide-moi à m'organiser" alimentée par l'IA commence à être déployée dans Google Sheets

Leet Resumes - Utilise l'IA générative pour réécrire tes CV

Current - Partage le travail en cours avec ton équipe et reçois des résumés hebdomadaires alimentés par l'IA.

Gamma - L'outil de présentation de l'IA permet désormais l'exportation vers PowerPoint (Tweet)

Olvy 2.0 - Analyse les commentaires des utilisateurs 10 fois plus vite grâce à l'IA

Embedchain - Cadre de travail pour créer facilement des robots alimentés par LLM sur n'importe quel ensemble de données

Fin Intercom's breakthrough AI bot for your support team (en anglais)

Cohesive - Transforme ta narration avec des voix d'IA semblables à celles des humains

Retrouve chaque jour une sélection exclusive d’info d’insider sur les intelligences artificielles pour le business et la production de contenu.