- The AI Pimp Club
- Posts
- AI DAILY NEWS#76 - Révélations GPT-4, YouTube IA Doublage, Voice Library & Plus
AI DAILY NEWS#76 - Révélations GPT-4, YouTube IA Doublage, Voice Library & Plus
🤩IA POUR LE BUSINESS! #76
27/06/2023
🚀 Bienvenue dans AI DAILY NEWS! 🗞️
🎭 Le SECRET de GPT-4 révélé : 8 modèles dans 1!
🚀 YouTube lance l'outil de doublage IA
👄 Prête ta voix à Voice Library d’ElevenLabs
🦾 ORCA-Mini, l'open-source LLM local (sur ton PC)
🔄 IA Révolution : les LLM autocorrectifs avec BACKSPACE
🤖 Booste la productivité avec ces outils IA
🧵THE THREAD
🔥 Transforme ton navigateur web en une machine de guerre pour ta productivité !
Les 18 extensions ChatGPT pour Chrome qui tuent!🚀
🧵THREAD— The AI Pimp (@the_ai_pimp)
5:55 AM • May 17, 2023
📰NEWS
RÉSUMÉ
• Le modèle GPT-4 est l'un des modèles les plus révolutionnaires disponibles au public, gratuitement ou à travers un portail commercial (en version bêta).
• GPT-4 n’est pas un modèle dense monolithique simple comme GPT-3 et GPT-3.5 mais un mélange de 8 modèles de 220 milliards de paramètres. 🧐
• La méthodologie s'appelle "mixture of experts" et se compose de 4 étapes :
- Division du travail en tâches sous-jacentes.
- Mise en place d'un expert pour chaque tâche.
- Utilisation d'un modèle de commutation pour décider quel expert utiliser.
- Agrégation des prédictions et des sorties du modèle de commutation pour faire une prédiction. 🤓
• Microsoft a probablement choisi cette méthodologie pour contrer la concurrence et garder ses avancées en matière d’innovation. 😤
• Les modèles « Switch » sont plus rapides et performants que les modèles MoE (Mixture of Experts) et peuvent être utilisés à des facteurs de capacité plus faibles (1-1,25). 💪
RÉSUMÉ
- YouTube teste une nouvelle fonctionnalité qui permet aux créateurs automatiquement de doubler leurs vidéos en d'autres langues avec l'aide de l'IA 👩💻
- Cette fonctionnalité est mise en œuvre par le moyen de Aloud, un service de dubbing alimenté par l'IA qui est partie de Google Area 120 🤖
- En Juin 2021, les créateurs ont doublé plus de 10.000 vidéos dans plus de 70 langues 🗣
- Les créateurs n'ont plus à passer par des fournisseurs tiers pour doubler leurs vidéos, ce qui peut prendre beaucoup de temps et coûter cher 🔹
- Aloud est disponible en Anglais, Espagnol et Portugais, et des langues supplémentaires telles que le Hindi et le Bahasa Indonesien seront ajoutées à l'avenir 🔹
- YouTube travaille à rendre les pistes audio traduites similaires à la voix du créateur, avec plus d'expression et de synchronisation labiale 🗣
- L'IA générative permettra à Aloud de lancer des fonctionnalités telles que la préservation de la voix, un meilleur transfert d'émotion et une réanimation des lèvres 🤖
RÉSUMÉ
• Voice Library est une communauté virtuelle pour générer, partager et explorer différents voices.
• Voice Design est au centre de Voice Library et vous permet de générer de nouvelles voix synthétiques en fonction de paramètres tels que l'âge, le genre et l'accent.
• Chaque voix générée est entièrement unique et réaliste et offre une grande toile pour produire une narration de qualité.
• Voice Library permet également aux utilisateurs de partager leurs propres voix avec la communauté, ce qui leur donne un accès encore plus large aux différentes applications.
• Le partage dans Voice Library est facile et des récompenses sont offertes aux utilisateurs qui partagent leurs voix.
• Voice Library se développe constamment avec des labels spécifiques aux différents usages, des voix multilingues, des outils de recherche améliorés et des voix exclusives.
🦾TECH
RÉSUMÉ
• Présentation du modèle Orca-Mini, un modèle LLM open source qui peut être exécuté localement 🤓
• Création des ensembles de données et entraînement du modèle 🗃
• Utilisation du modèle dans un notebook Jupyter et l’interface web Uber Google 💻
• Démonstration des capacités du modèle pour générer du texte, répondre à des questions et même écrire du code fonctionnel 💪
• Impressionnante capacité du modèle à résoudre des activités, générer des idées créatives et à résumer le texte 🤩
RÉSUMÉ
- 🔄 Une nouvelle architecture permet aux grands modèles de langage de s'auto-corriger pendant la génération de texte en utilisant une action appelée backspace.
🎯 Les modèles combinent l'apprentissage par imitation et l'apprentissage par renforcement pour minimiser les divergences entre leur génération et le contenu généré par les humains.
📝 Cette approche promet la création de grands modèles de langage auto-correctifs, ouvrant de nouvelles possibilités en traitement automatique du langage naturel.
✅ L'architecture utilise des actions et des états pour apprendre des distributions conditionnelles ressemblant aux données, tout en évitant les actions incorrectes.
⚡ L'utilisation d'une action backspace permet au modèle de revenir en arrière et de corriger ses propres erreurs.
🔢 La métrique Mao Way est utilisée pour mesurer l'écart entre le texte généré par le modèle de langage et le texte généré par l'humain.
🤖OUTILS IA
ElevenLabs - Libère la puissance de notre technologie de pointe pour générer des discours réalistes et captivants dans un grand nombre de langues.
FinanceGPT - Transforme tes analyses et recherches financières
BeforeSunset - Transforme ta journée de travail du chaos à la clarté
L'option "Aide-moi à m'organiser" alimentée par l'IA commence à être déployée dans Google Sheets
Leet Resumes - Utilise l'IA générative pour réécrire tes CV
Current - Partage le travail en cours avec ton équipe et reçois des résumés hebdomadaires alimentés par l'IA.
Olvy 2.0 - Analyse les commentaires des utilisateurs 10 fois plus vite grâce à l'IA
Embedchain - Cadre de travail pour créer facilement des robots alimentés par LLM sur n'importe quel ensemble de données
Fin Intercom's breakthrough AI bot for your support team (en anglais)
Cohesive - Transforme ta narration avec des voix d'IA semblables à celles des humains