Quali sono i limiti di Vicuna AI?

Vicuna AI, come altri modelli linguistici di grandi dimensioni, presenta alcune limitazioni. Questi includono: <ul><li> Difficoltà nel ragionamento e nella matematica</li><li> Accuratezza fattuale potenzialmente imprecisa</li><li> Garanzie di sicurezza limitate e possibile tossicità o distorsione</li></ul> <br > Gli sviluppatori stanno lavorando per affrontare queste limitazioni attraverso la ricerca futura in corso.

Vicuna AI

Vicuna: un chatbot open source che impressiona GPT-4 con il 90%* di qualità ChatGPT

Accesso

Dettagli di Vicuna AI

Informazioni sul Prodotto

Social Media

Descrizione del Prodotto

<p>Presentiamo Vicuna-13B, un chatbot open source addestrato ottimizzando LLaMA sulle conversazioni condivise dagli utenti raccolte da ShareGPT. Valutazione preliminare...

Vicuna AI Introduzione

Vicuna: un chatbot open source che impressiona GPT-4 con una qualità ChatGPT del 90%*

Panoramica

Il rapido avanzamento dei modelli linguistici di grandi dimensioni (LLM) ha rivoluzionato i sistemi di chatbot, dando vita a soluzioni senza precedenti livelli di intelligenza visti nel ChatGPT di OpenAI. Tuttavia, nonostante le sue prestazioni impressionanti, i dettagli sulla formazione e sull’architettura di ChatGPT rimangono poco chiari, ostacolando la ricerca e l’innovazione open source in questo campo. Ispirandoci al progetto Meta LLaMA e Stanford Alpaca, presentiamo Vicuna-13B, un chatbot open source supportato da un set di dati avanzato e da un'infrastruttura scalabile e facile da usare. Perfezionando un modello base LLaMA sulle conversazioni condivise dagli utenti raccolte da ShareGPT.com, Vicuna-13B ha dimostrato prestazioni competitive rispetto ad altri modelli open source come Stanford Alpaca. Questo post del blog fornisce una valutazione preliminare delle prestazioni di Vicuna-13B e ne descrive l'addestramento e l'infrastruttura di servizio. Invitiamo inoltre la community a interagire con la nostra demo online per testare le capacità di questo chatbot.

Quanto è buono Vicuna?

Dopo aver perfezionato Vicuna con 70.000 conversazioni ChatGPT condivise dagli utenti, scopriamo che Vicuna diventa capace di generare risposte più dettagliate e ben strutturate rispetto ad Alpaca (vedi esempi sotto), con una qualità pari a ChatGPT.

Demo online

Prova qui la demo di Vicuna-13B!

Formazione

Vicuna viene creata mettendo a punto un modello base LLaMA utilizzando circa 70.000 conversazioni condivise dagli utenti raccolte da ShareGPT.com con API pubbliche. Per garantire la qualità dei dati, riconvertiamo l'HTML in markdown e filtriamo alcuni campioni inappropriati o di bassa qualità. Inoltre, dividiamo le conversazioni lunghe in segmenti più piccoli che si adattano alla lunghezza massima del contesto del modello.

Conversazioni a più turni: adattiamo la perdita di addestramento per tenere conto delle conversazioni a più turni e calcoliamo la perdita di regolazione esclusivamente sul output del chatbot.
Ottimizzazioni della memoria: per consentire la comprensione di Vicuna del contesto lungo, espandiamo la lunghezza massima del contesto da 512 in alpaca a 2048, il che aumenta sostanzialmente i requisiti di memoria della GPU. Affrontiamo la pressione della memoria utilizzando il checkpoint gradiente e l'attenzione flash.
Riduzione dei costi tramite istanza Spot: il set di dati 40 volte più grande e la lunghezza della sequenza 4 volte superiore per la formazione rappresentano una sfida considerevole in termini di spese di formazione. Utilizziamo lo spot gestito da SkyPilot per ridurre i costi sfruttando le istanze spot più economiche con ripristino automatico per prelazioni e cambio automatico di zona. Questa soluzione riduce i costi di formazione del modello 7B da circa 140 e del modello 13B da circa 300.

Serving

Costruiamo un sistema di serveggio in grado di servire più modelli con distribuzione distribuita lavoratori. Supporta il plug-in flessibile dei GPU Worker sia dai cluster on-premise che dal cloud. Utilizzando un controller con tolleranza agli errori e una funzionalità spot gestita in SkyPilot, questo sistema di servizio può funzionare bene con istanze spot più economiche da più cloud per ridurre i costi di servizio. Attualmente si tratta di un'implementazione leggera e stiamo lavorando per integrare al suo interno le nostre ultime ricerche.

Come valutare un chatbot?

Valutare i chatbot IA è un compito impegnativo, poiché richiede l'esame della comprensione del linguaggio, del ragionamento, e consapevolezza del contesto. Con i chatbot IA sempre più avanzati, gli attuali benchmark aperti potrebbero non essere più sufficienti. Ad esempio, il set di dati di valutazione utilizzato nell’Alpaca di Stanford, auto-istruito, può ricevere una risposta efficace dai chatbot SOTA, rendendo difficile per gli esseri umani discernere le differenze nelle prestazioni. Ulteriori limitazioni includono la contaminazione dei dati di formazione/test e il costo potenzialmente elevato della creazione di nuovi benchmark. Per affrontare questi problemi, proponiamo un quadro di valutazione basato su GPT-4 per automatizzare la valutazione delle prestazioni dei chatbot.

Limitazioni

Abbiamo notato che, analogamente ad altri modelli linguistici di grandi dimensioni, Vicuna presenta alcune limitazioni. Ad esempio, non è bravo in compiti che coinvolgono il ragionamento o la matematica e potrebbe avere limitazioni nell’identificarsi accuratamente o nel garantire l’accuratezza fattuale dei suoi risultati. Inoltre, non è stato sufficientemente ottimizzato per garantire la sicurezza o mitigare potenziali tossicità o bias. Per risolvere i problemi di sicurezza, utilizziamo l'API di moderazione OpenAI per filtrare gli input inappropriati degli utenti nella nostra demo online. Ciononostante, prevediamo che Vicuna possa fungere da punto di partenza aperto per la ricerca futura volta ad affrontare queste limitazioni.

Rilascio

Nel nostro primo rilascio, condivideremo il codice di formazione, pubblicazione e valutazione su un repository GitHub: https://github.com/lm-sys/FastChat. Abbiamo anche rilasciato i pesi del modello Vicuna-13B. Non è previsto il rilascio del set di dati. Unisciti al nostro server Discord e segui il nostro Twitter per ricevere gli ultimi aggiornamenti.

Quanto è buona Vicuna?

Dopo aver perfezionato Vicuna con 70.000 conversazioni ChatGPT condivise dagli utenti, scopriamo che Vicuna diventa in grado di generare risposte più dettagliate e ben strutturate rispetto ad Alpaca (vedi esempi di seguito ), con una qualità paragonabile a ChatGPT.

Demo online

Prova la demo di Vicuna-13B qui< /a>!

Panoramica

Il rapido progresso dei modelli linguistici di grandi dimensioni (LLM) ha rivoluzionato i sistemi di chatbot, determinando livelli di intelligenza senza precedenti, come osservato nel ChatGPT di OpenAI. Tuttavia, nonostante le sue prestazioni impressionanti, i dettagli sulla formazione e sull’architettura di ChatGPT rimangono poco chiari, ostacolando la ricerca e l’innovazione open source in questo campo. Ispirandoci al progetto Meta LLaMA e Stanford Alpaca, presentiamo Vicuna-13B, un chatbot open source supportato da un set di dati avanzato e da un'infrastruttura scalabile e facile da usare. Perfezionando un modello base LLaMA sulle conversazioni condivise dagli utenti raccolte da ShareGPT.com, Vicuna-13B ha dimostrato prestazioni competitive rispetto ad altri modelli open source come Stanford Alpaca. Questo post del blog fornisce una valutazione preliminare delle prestazioni di Vicuna-13B e ne descrive l'addestramento e l'infrastruttura di servizio. Invitiamo inoltre la community a interagire con la nostra demo online per testare le capacità di questo chatbot.

Formazione

Vicuna viene creato mettendo a punto un modello base LLaMA utilizzando circa 70.000 utenti. conversazioni condivise raccolte da ShareGPT.com con API pubbliche. Per garantire la qualità dei dati, riconvertiamo l'HTML in markdown e filtriamo alcuni campioni inappropriati o di bassa qualità. Inoltre, dividiamo le conversazioni lunghe in segmenti più piccoli che si adattano alla lunghezza massima del contesto del modello.

Servizio

Costruiamo un sistema di servizio in grado di servire più modelli con lavoratori distribuiti. Supporta il plug-in flessibile dei GPU Worker sia dai cluster on-premise che dal cloud. Utilizzando un controller con tolleranza agli errori e una funzionalità spot gestita in SkyPilot, questo sistema di servizio può funzionare bene con istanze spot più economiche da più cloud per ridurre i costi di servizio. Attualmente si tratta di un'implementazione leggera e stiamo lavorando per integrare al suo interno ulteriori ricerche più recenti.

Come Valutare un chatbot?

Valutare i chatbot IA è un compito impegnativo, poiché richiede l'esame della comprensione del linguaggio, del ragionamento e della consapevolezza del contesto. Con i chatbot IA sempre più avanzati, gli attuali benchmark aperti potrebbero non essere più sufficienti. Ad esempio, al set di dati di valutazione utilizzato nell'Alpaca di Stanford, auto-istruzione, si può rispondere in modo efficace tramite SOTA chatbot, rendendo difficile per gli esseri umani discernere le differenze nelle prestazioni. Ulteriori limitazioni includono la contaminazione dei dati di formazione/test e il costo potenzialmente elevato della creazione di nuovi benchmark. Per affrontare questi problemi, proponiamo un quadro di valutazione basato su GPT-4 per automatizzare la valutazione delle prestazioni dei chatbot.

Limitazioni

Abbiamo notato che, analogamente ad altri grandi modelli linguistici, Vicuna ha alcune limitazioni. Ad esempio, non è bravo in compiti che coinvolgono il ragionamento o la matematica e potrebbe avere limitazioni nell’identificarsi accuratamente o nel garantire l’accuratezza fattuale dei suoi risultati. Inoltre, non è stato sufficientemente ottimizzato per garantire la sicurezza o mitigare potenziali tossicità o bias. Per risolvere i problemi di sicurezza, utilizziamo l'API di moderazione OpenAI per filtrare gli input inappropriati degli utenti nella nostra demo online . Ciononostante, prevediamo che Vicuna possa fungere da punto di partenza aperto per la ricerca futura volta ad affrontare queste limitazioni.

Mostra più

Vicuna AI FAQ

Le valutazioni preliminari utilizzando GPT-4 come giudice indicano che Vicuna AI raggiunge oltre il 90% della qualità di ChatGPT e Google Bard. Ciò significa che Vicuna AI può fornire risposte altrettanto utili, pertinenti, accurate e dettagliate quanto ChatGPT e Bard nella maggior parte dei casi.

Vicuna AI è stata addestrata mettendo a punto un modello base LLaMA su un set di dati di 70.000 conversazioni condivise dagli utenti raccolte da ShareGPT. Queste conversazioni sono state convertite in ribasso e filtrate in termini di qualità prima dell'addestramento.

Vicuna AI, come altri modelli linguistici di grandi dimensioni, presenta alcune limitazioni. Questi includono:

Difficoltà nel ragionamento e nella matematica
Accuratezza fattuale potenzialmente imprecisa
Garanzie di sicurezza limitate e possibile tossicità o distorsione

Gli sviluppatori stanno lavorando per affrontare queste limitazioni attraverso la ricerca futura in corso.

Vicuna AI Traffico del Sito

Visite

Data	Visite
2024-06-01	2207473
2024-07-01	2143625
2024-08-01	2099531

Metrica

Metrica	Valore
Tasso di Rimbalzo	59.33%
Pagine per Visita	1.99
Durata Media della Visita	177.02 s

Geografia

Paese	Condividi
🇨🇳 Cina	14.42%
🇺🇸 Stati Uniti d'America	14.22%
🇷🇺 Russia	12.08%
🇻🇳 Vietnam	5.55%
🇩🇪 Germania	5.30%

Fonte

Fonte	Valore
Accesso Diretto	55.07%
Ricerca	33.37%
Riferimenti	8.26%
Social Media	3.06%
Riferimenti a Pagamento	0.16%
Email	0.07%

Vicuna AI Prodotti Alternativi

AI Art(opens in a new tab)

Generazione di immagini

Maker Post piattaforma di collaborazione online di progettazione intelligente è uno strumento di progettazione grafica e un software di progettazione grafica online che fornisce un gran numero di modelli di poster, grafica per nuovi media, e- modelli commerciali, modelli di immagini principali, inviti, annunci, buone notizie, loghi e altri materiali e modelli di progettazione gratuiti, Maker Poster AI Toolbox fornisce generazione intelligente online di poster, ritaglio con un clic, eliminazione con un clic, rimozione filigrana con un clic , ripristino delle immagini ad alta definizione, ingrandimento senza perdita di dati, puzzle intelligente e molti altri strumenti AI intelligenti.

90.9KVisite

7%Ricerca

Hocoos AI(opens in a new tab)

Creazione di siti web

Crea siti Web professionali in pochi secondi con il costruttore di siti Web AI Hocoos. Ottieni subito tutti gli strumenti di vendita e marketing per avviare e far crescere il tuo business online.

134.2KVisite

52%Ricerca

TianGong AI(opens in a new tab)

Chatbot conversazionale

Tiangong è il primo motore di ricerca AI in Cina. È in grado di comprendere le intenzioni degli utenti, cercare enormi quantità di informazioni sull'intera rete e utilizzare la tecnologia di intelligenza artificiale per riassumere, riassumere e integrare queste informazioni per produrre risultati di ricerca di alta qualità e senza pubblicità. Può anche I risultati della ricerca vengono organizzati automaticamente in mappe mentali e schemi per supportare ricerche di ricerca accademica e scientifica professionale. Inoltre, Tiangong ha anche la capacità di chattare, scrivere, fare domande, rispondere e disegnare. Tiangong interagisce con gli utenti attraverso il linguaggio naturale in domande e risposte, che può soddisfare diverse esigenze come domande e risposte sulla conoscenza, creazione di articoli, deduzione logica, calcolo matematico, programmazione di codici, disegno AI, chat umana virtuale e compagnia emotiva. Tiangong ha anche un gran numero di agenti intelligenti che possono assisterti in vari scenari come lo studio, il posto di lavoro e la vita.

812Visite

46%Ricerca

AIDesign(opens in a new tab)

Conversione da testo a immagine

Genera immagini AI da descrizioni di testo e altro testo in immagine

MagicShot.ai(opens in a new tab)

Generazione di immagini

Trasforma le tue idee in straordinarie opere d'arte basate sull'intelligenza artificiale con MagicShot.ai. Crea immagini istantaneamente utilizzando il nostro generatore di foto AI. Scatena la tua creatività!

33.9KVisite

38%Ricerca

Stockimg AI(opens in a new tab)

Generazione di immagini

Stockimg è uno strumento tutto in uno per la progettazione e la creazione di contenuti basato sull'intelligenza artificiale. Puoi generare facilmente logo, illustrazioni, sfondi, poster e altro ancora.

265.5KVisite

48%Ricerca

Vicuna AI

Dettagli di Vicuna AI

Informazioni sul Prodotto

Sito Web

Categoria

Email

Social Media

Descrizione del Prodotto

Vicuna AI Introduzione

Vicuna: un chatbot open source che impressiona GPT-4 con una qualità ChatGPT del 90%*

Panoramica

Quanto è buono Vicuna?

Demo online

Formazione

Serving

Come valutare un chatbot?

Limitazioni

Rilascio

Quanto è buona Vicuna?

Demo online

Panoramica

Formazione

Servizio

Come Valutare un chatbot?

Limitazioni

Vicuna AI FAQ

Come si confronta Vicuna AI con ChatGPT e Bard?

Come è stata addestrata Vicuna AI?

Quali sono i limiti di Vicuna AI?

Vicuna AI Traffico del Sito

Visite

Metrica

Geografia

Fonte

Vicuna AI Prodotti Alternativi

AI Art(opens in a new tab)

Hocoos AI(opens in a new tab)

TianGong AI(opens in a new tab)

AIDesign(opens in a new tab)

MagicShot.ai(opens in a new tab)

Stockimg AI(opens in a new tab)