Vilka är begränsningarna för Vicuna AI?

Vicuna AI har, liksom andra stora språkmodeller, vissa begränsningar. Dessa inkluderar: <ul><li> Svårigheter med resonemang och matematik</li><li> Potentiellt felaktig faktaprecision</li><li> Begränsade säkerhetsgarantier och möjlig toxicitet eller partiskhet</li></ul> <br > Utvecklarna arbetar för att ta itu med dessa begränsningar genom pågående framtida forskning.

Vicuna AI

Vicuna: En chatbot med öppen källkod som imponerar på GPT-4 med 90 %* ChatGPT Quality

Tillgång

Vicuna AI Detaljer

Produktinformation

Sociala Medier

Produktbeskrivning

<p>Vi introducerar Vicuna-13B, en chatbot med öppen källkod som tränas genom att finjustera LLaMA på användardelade konversationer som samlas in från ShareGPT. Preliminär utvärdering...

Vicuna AI Introduktion

Vicuna: En chatbot med öppen källkod som imponerar på GPT-4 med 90 %* ChatGPT-kvalitet

Översikt

Den snabba utvecklingen av stora språkmodeller (LLM) har revolutionerat chatbot-systemen, vilket resulterat i oöverträffade nivåer av intelligens som ses i OpenAI:s ChatGPT. Trots dess imponerande prestanda förblir tränings- och arkitekturdetaljerna för ChatGPT fortfarande oklara, vilket hindrar forskning och innovation med öppen källkod inom detta område. Inspirerade av Meta LLaMA och Stanford Alpaca-projektet introducerar vi Vicuna-13B, en chatbot med öppen källkod som backas upp av en förbättrad datauppsättning och en lättanvänd, skalbar infrastruktur. Genom att finjustera en LLaMA-basmodell på användardelade konversationer som samlats in från ShareGPT.com, har Vicuna-13B visat konkurrenskraftiga prestanda jämfört med andra modeller med öppen källkod som Stanford Alpaca. Det här blogginlägget ger en preliminär utvärdering av Vicuna-13B:s prestanda och beskriver dess tränings- och serviceinfrastruktur. Vi inbjuder också communityn att interagera med vår onlinedemo för att testa funktionerna hos denna chatbot.

Hur bra är Vicuna?

Efter att ha finjusterat Vicuna med 70 000 användardelade ChatGPT-konversationer upptäcker vi att Vicuna blir kapabel att generera mer detaljerade och välstrukturerade svar jämfört med Alpaca (se exempel nedan), med kvaliteten i nivå med ChatGPT.

Onlinedemo

Prova Vicuna-13B-demon här!

Utbildning

Vicuna skapas genom att finjustera en LLaMA-basmodell med hjälp av cirka 70 000 användardelade konversationer samlade från ShareGPT.com med offentliga API:er. För att säkerställa datakvalitet konverterar vi tillbaka HTML-koden till markdown och filtrerar bort några olämpliga eller lågkvalitativa prover. Dessutom delar vi upp långa konversationer i mindre segment som passar modellens maximala kontextlängd.

Konversationer i flera svängar: Vi justerar träningsförlusten för att ta hänsyn till konversationer med flera svängar och beräknar finjusteringsförlusten enbart på chatbots utdata.
Minnesoptimeringar: För att möjliggöra Vicunas förståelse av långa sammanhang utökar vi den maximala kontextlängden från 512 i alpacka till 2048, vilket avsevärt ökar GPU-minneskraven. Vi tar itu med minnestrycket genom att använda gradientcheckpointing och blixtuppmärksamhet.
Kostnadsminskning via Spot Instance: Den 40x större datamängden och 4x sekvenslängden för träning utgör en avsevärd utmaning i utbildningskostnader. Vi använder SkyPilot managed spot för att minska kostnaderna genom att utnyttja de billigare spot-instanserna med automatisk återställning för preemptions och automatisk zonväxling. Denna lösning minskar kostnaderna för utbildning av 7B-modellen från cirka 140 och 13B-modellen från cirka 300.

Servering

Vi bygger ett serveringssystem som kan servera flera modeller med distribuerad arbetare. Den stöder flexibel plug-in för GPU-arbetare från både lokala kluster och molnet. Genom att använda en feltolerant styrenhet och hanterad punktfunktion i SkyPilot kan detta serversystem fungera bra med billigare spotinstanser från flera moln för att minska serveringskostnaderna. Det är för närvarande en lätt implementering och vi arbetar på att integrera mer av vår senaste forskning i den.

Hur man utvärderar en chatbot?

Att utvärdera AI-chatbotar är en utmanande uppgift, eftersom det kräver att man undersöker språkförståelse, resonemang, och sammanhangsmedvetenhet. Med AI-chatbotar som blir mer avancerade kanske nuvarande öppna benchmarks inte längre räcker. Till exempel kan utvärderingsdataset som används i Stanfords Alpaca, självinstruera, effektivt besvaras av SOTA chatbots, vilket gör det svårt för människor att urskilja skillnader i prestanda. Fler begränsningar inkluderar kontaminering av utbildnings-/testdata och den potentiellt höga kostnaden för att skapa nya riktmärken. För att ta itu med dessa problem föreslår vi ett utvärderingsramverk baserat på GPT-4 för att automatisera chatbots prestandabedömning.

Begränsningar

Vi har märkt att Vicuna, i likhet med andra stora språkmodeller, har vissa begränsningar. Till exempel är den inte bra på uppgifter som involverar resonemang eller matematik, och den kan ha begränsningar när det gäller att exakt identifiera sig själv eller säkerställa den faktiska riktigheten av dess utdata. Dessutom har den inte optimerats tillräckligt för att garantera säkerhet eller mildra potentiell toxicitet eller partiskhet. För att ta itu med säkerhetsproblemen använder vi OpenAI modererings-API för att filtrera bort olämpliga användarinmatningar i vår onlinedemo. Icke desto mindre förväntar vi oss att Vicuna kan fungera som en öppen startpunkt för framtida forskning för att ta itu med dessa begränsningar.

Release

I vår första release kommer vi att dela utbildnings-, serverings- och utvärderingskoden på en GitHub-repo: https://github.com/lm-sys/FastChat. Vi släppte även Vicuna-13B modellvikter. Det finns ingen plan att släppa datamängden. Gå med i vår Discord-server och följ vår Twitter för att få de senaste uppdateringarna.

Hur bra är Vicuna?

Onlinedemo

Prova Vicuna-13B-demon här< /a>!

Översikt

Den snabba utvecklingen av stora språkmodeller (LLMs) har revolutionerat chatbotsystem, vilket resulterat i oöverträffade nivåer av intelligens som kan ses i OpenAI:s ChatGPT. Trots dess imponerande prestanda förblir tränings- och arkitekturdetaljerna för ChatGPT fortfarande oklara, vilket hindrar forskning och innovation med öppen källkod inom detta område. Inspirerade av Meta LLaMA och Stanford Alpaca-projektet introducerar vi Vicuna-13B, en chatbot med öppen källkod som backas upp av en förbättrad datauppsättning och en lättanvänd, skalbar infrastruktur. Genom att finjustera en LLaMA-basmodell på användardelade konversationer som samlats in från ShareGPT.com, har Vicuna-13B visat konkurrenskraftiga prestanda jämfört med andra modeller med öppen källkod som Stanford Alpaca. Det här blogginlägget ger en preliminär utvärdering av Vicuna-13B:s prestanda och beskriver dess tränings- och serviceinfrastruktur. Vi inbjuder också communityn att interagera med vår onlinedemo för att testa funktionerna hos denna chatbot.

Träning

Vicuna skapas genom att finjustera en LLaMA-basmodell med cirka 70 000 användare- delade konversationer samlade från ShareGPT.com med offentliga API:er. För att säkerställa datakvalitet konverterar vi tillbaka HTML-koden till markdown och filtrerar bort några olämpliga eller lågkvalitativa prover. Dessutom delar vi upp långa konversationer i mindre segment som passar modellens maximala kontextlängd.

Betjäning

Vi bygger ett visningssystem som kan betjäna flera modeller med distribuerade arbetare. Den stöder flexibel plug-in för GPU-arbetare från både lokala kluster och molnet. Genom att använda en feltolerant styrenhet och hanterad punktfunktion i SkyPilot kan detta serversystem fungera bra med billigare spotinstanser från flera moln för att minska serveringskostnaderna. Det är för närvarande en lätt implementering och vi arbetar på att integrera mer av vår senaste forskning i den.

Hur Att utvärdera en chatbot?

Att utvärdera AI-chatbotar är en utmanande uppgift, eftersom det kräver att man undersöker språkförståelse, resonemang och sammanhangsmedvetenhet. Med AI-chatbotar som blir mer avancerade kanske nuvarande öppna benchmarks inte längre räcker. Till exempel kan utvärderingsdataset som används i Stanfords Alpaca, self-instruct, effektivt besvaras av SOTA chatbots, vilket gör det svårt för människor att urskilja skillnader i prestanda. Fler begränsningar inkluderar kontaminering av utbildnings-/testdata och den potentiellt höga kostnaden för att skapa nya riktmärken. För att ta itu med dessa problem föreslår vi ett utvärderingsramverk baserat på GPT-4 för att automatisera chatbots prestandabedömning.

Begränsningar

Vi har märkt att Vicuna, i likhet med andra stora språkmodeller, har vissa begränsningar. Till exempel är den inte bra på uppgifter som involverar resonemang eller matematik, och den kan ha begränsningar när det gäller att exakt identifiera sig själv eller säkerställa den faktiska riktigheten av dess utdata. Dessutom har den inte optimerats tillräckligt för att garantera säkerhet eller mildra potentiell toxicitet eller partiskhet. För att ta itu med säkerhetsproblemen använder vi OpenAI moderation API för att filtrera bort olämpliga användarinmatningar i vår onlinedemo . Icke desto mindre räknar vi med att Vicuna kan fungera som en öppen utgångspunkt för framtida forskning för att ta itu med dessa begränsningar.

Visa mer

Vicuna AI FAQ

Preliminära utvärderingar med GPT-4 som domare indikerar att Vicuna AI uppnår mer än 90 % av kvaliteten på ChatGPT och Google Bard. Detta innebär att Vicuna AI kan ge svar som är lika användbara, relevanta, korrekta och detaljerade som ChatGPT och Bard i de flesta fall.

Vicuna AI tränades genom att finjustera en LLaMA-basmodell på en datauppsättning med 70 000 användardelade konversationer som samlats in från ShareGPT. Dessa konversationer konverterades till markdown och filtrerades efter kvalitet innan träning.

Vicuna AI har, liksom andra stora språkmodeller, vissa begränsningar. Dessa inkluderar:

Svårigheter med resonemang och matematik
Potentiellt felaktig faktaprecision
Begränsade säkerhetsgarantier och möjlig toxicitet eller partiskhet

Utvecklarna arbetar för att ta itu med dessa begränsningar genom pågående framtida forskning.

Vicuna AI Webbplatstrafik

Besök

Datum	Besök
2024-06-01	2207473
2024-07-01	2143625
2024-08-01	2099531

Mått

Mått	Värde
Studsprocent	59.33%
Sidor per besök	1.99
Genomsnittlig besökstid	177.02 s

Geografi

Land	Dela
🇨🇳 Kina	14.42%
🇺🇸 USA	14.22%
🇷🇺 Ryssland	12.08%
🇻🇳 Vietnam	5.55%
🇩🇪 Tyskland	5.30%

Källa

Källa	Värde
Direktåtkomst	55.07%
Sök	33.37%
Hänvisningar	8.26%
Sociala Medier	3.06%
Betalda remisser	0.16%
E-post	0.07%

Vicuna AI Alternativa produkter

AI Art(opens in a new tab)

Bilddgenerering

Maker Post intelligent design online samarbetsplattform är ett grafiskt designverktyg och online grafisk designprogramvara som tillhandahåller ett stort antal affischmallar, ny mediegrafik, e- handelsmallar, huvudbildmallar, inbjudningar, meddelanden, goda nyheter, logotyper och annat gratis designmaterial och mallar, Maker Poster AI Toolbox tillhandahåller intelligent generering av affischer online, utklipp med ett klick, eliminering med ett klick, borttagning av vattenstämpel med ett klick , högupplöst bildåterställning, förlustfri förstoring, smart pussel och många andra smarta AI-verktyg.

90.9KBesök

7%Sök

Hocoos AI(opens in a new tab)

Bygga webbplats

Skapa professionella webbplatser på några sekunder med Hocoos AI webbplatsbyggare. Få alla försäljnings- och marknadsföringsverktyg för att starta och växa din onlineverksamhet nu.

134.2KBesök

52%Sök

AIDesign(opens in a new tab)

Text till Bild Konvertering

Generera AI-bilder från textbeskrivningar och mer text till bild

MolyPix AI(opens in a new tab)

Illustrationsskapande

Skapa personliga födelsedagskort utan ansträngning med Molypix.AI! Låt vår Generative AI skapa ett unikt födelsedagskort till dina nära och kära.

17.2KBesök

9%Sök

https://www.insmind.com/ai-design-generator

insMind(opens in a new tab)

Bilddgenerering

Vår AI-designgenerator är designad för att skapa AI-grafik, bilder, logotyper, flygblad, omslag, banners och mer. Börja skapa design nu, det är gratis!

Stockimg AI(opens in a new tab)

Bilddgenerering

Stockimg är ett allt-i-ett-verktyg för design och innehållsskapande som drivs av AI. Du kan enkelt skapa logotyp, illustration, tapeter, affisch och mer.

265.5KBesök

48%Sök

Vicuna AI

Vicuna AI Detaljer

Produktinformation

Webbplats

Kategori

E-post

Sociala Medier

Produktbeskrivning

Vicuna AI Introduktion

Vicuna: En chatbot med öppen källkod som imponerar på GPT-4 med 90 %* ChatGPT-kvalitet

Översikt

Hur bra är Vicuna?

Onlinedemo

Utbildning

Servering

Hur man utvärderar en chatbot?

Begränsningar

Release

Hur bra är Vicuna?

Onlinedemo

Översikt

Träning

Betjäning

Hur Att utvärdera en chatbot?

Begränsningar

Vicuna AI FAQ

Hur jämför Vicuna AI med ChatGPT och Bard?

Hur tränades Vicuna AI?

Vilka är begränsningarna för Vicuna AI?

Vicuna AI Webbplatstrafik

Besök

Mått

Geografi

Källa

Vicuna AI Alternativa produkter

AI Art(opens in a new tab)

Hocoos AI(opens in a new tab)

AIDesign(opens in a new tab)

MolyPix AI(opens in a new tab)

insMind(opens in a new tab)

Stockimg AI(opens in a new tab)