Maak kennis met BLOOMChat: een open source meertalig chatmodel (LLM) met 176 miljard parameters, gebouwd bovenop het BLOOM-model

De afbeelding is gemaakt met Midjourney

Met een aantal grote vorderingen die worden gemaakt op het gebied van kunstmatige intelligentie, gaan natuurlijke taalsystemen snel vooruit. Grote taalmodellen (LLM) worden met elke upgrade en innovatie aanzienlijk beter en populairder. Bijna dagelijks wordt er een nieuwe functie of wijziging toegevoegd, waardoor LLM’s in bijna elk vakgebied in verschillende toepassingen kunnen worden bekeken. LLM’s zijn overal, van machinevertaling en tekstsamenvatting tot sentimentanalyse en het beantwoorden van vragen.

De open source-gemeenschap heeft opmerkelijke vooruitgang geboekt bij het ontwikkelen van op conversatie gebaseerde LLM’s, maar meestal in de Engelse taal. Iets minder aandacht is besteed aan het ontwikkelen van een vergelijkbare meertalige gespreksvaardigheid in een LLM. Om dit aan te pakken, introduceerde SambaNova, een softwarebedrijf dat zich richt op productieve AI-oplossingen, een open source, meertalige chat LLM genaamd BLOOMChat. Ontwikkeld in samenwerking met Together, een open, schaalbare en gedecentraliseerde cloud voor kunstmatige intelligentie, BLOOMChat is een meertalige conversatie-LLM met 176 miljard parameters op basis van het BLOOM-model.

Het BLOOM-model is in staat om tekst te genereren in 46 natuurlijke talen en 13 programmeertalen. Voor talen zoals Spaans, Frans en Arabisch vertegenwoordigt BLOOM het eerste taalmodel ooit gemaakt met meer dan 100 miljard parameters. BLOOM is ontwikkeld door de organisatie BigScience, een internationaal samenwerkingsverband van meer dan 1000 onderzoekers. Door BLOOM op open chat te verbeteren en datasets uit te lijnen van projecten zoals OpenChatKit, Dolly 2.0 en OASST1, zijn de kernmogelijkheden van BLOOM uitgebreid naar het chatdomein.

???? Bekijk honderden AI-tools in onze AI Tools Club

Om de meertalige chat te ontwikkelen, gebruikten LLM, BLOOMChat, SambaNova en Together SambaNova DataScale-systemen die SambaNova’s unieke Reconfigurable Dataflow Architecture gebruiken voor het trainingsproces. Synthetische chatgegevens en menselijke schrijfvoorbeelden zijn gecombineerd om BLOOMChat te creëren. Een grote synthetische dataset genaamd OpenChatKit heeft gediend als basis voor de chatfunctionaliteit, en door mensen gegenereerde datasets van hogere kwaliteit, zoals Dolly 2.0 en OASST1, zijn gebruikt om de prestaties aanzienlijk te verbeteren. De code en scripts die worden gebruikt om opdrachten in de OpenChatKit- en Dolly-v2-datasets in te stellen, zijn beschikbaar gemaakt op SambaNova’s GitHub.

In menselijke evaluaties die in zes talen werden uitgevoerd, hadden BLOOMChat-antwoorden 45,25% van de tijd de voorkeur boven GPT-4-antwoorden. Vergeleken met vier andere open-source chatmodellen in dezelfde zes talen, werden de antwoorden van BLOOMChat in 65,92% van de gevallen als beste gerangschikt. Deze prestatie dicht met succes het gat in de meertalige chatmogelijkheden van de open source-markt. In de WMT-vertaaltest presteerde BLOOMCchat beter dan aanvullende iteraties van BLOOM-modellen en populaire open source-chatmodellen.

BLOOMChat heeft, net als andere chat-LLM’s, beperkingen. Het kan feitelijk onjuiste of irrelevante informatie opleveren, of het kan per ongeluk van taal wisselen. Het kan zelfs zinnen herhalen, beperkte coderings- of wiskundige mogelijkheden hebben en soms giftige inhoud creëren. Er wordt verder onderzoek gedaan om deze uitdagingen aan te pakken en een beter gebruik te garanderen.

Kortom, BLOOMChat is gebaseerd op het uitgebreide werk van de open source-gemeenschap en is een geweldige aanvulling op de lijst van enkele uiterst nuttige en meertalige LLM’s. Door het vrij te geven onder een open source-licentie, streven SambaNova en Together ernaar de toegang tot geavanceerde meertalige chatmogelijkheden uit te breiden en verdere innovatie in de AI-onderzoeksgemeenschap aan te moedigen.


controleer het Werk En Referentie artikel. Vergeet niet te abonneren Onze 21k+ ML SubReddit, Discord-kanaalEn Email nieuwsbrief, waar we het laatste AI-onderzoeksnieuws, indrukwekkende AI-projecten en meer delen. Als u vragen heeft over bovenstaand artikel of als we iets hebben gemist, kunt u ons mailen op Asif@marktechpost.com

???? Bekijk honderden AI-tools bij AI Tools Club

Tanya Malhotra is een senior van de University of Petroleum & Energy Studies, Dehradun, en volgt BTech in Computer Science Engineering met specialisatie in kunstmatige intelligentie en machine learning.
Hij is een Data Science-enthousiasteling met een goed analytisch en kritisch denkvermogen en een grote interesse in het verwerven van nieuwe vaardigheden, het leiden van teams en het organiseren van werk.

➡️ Maak kennis met Bright Data: ‘s werelds nummer 1 webdataplatform

Leave a Reply

Your email address will not be published. Required fields are marked *