Vicuna AI의 한계는 무엇입니까?

Vicuna AI는 다른 대규모 언어 모델과 마찬가지로 특정 한계가 있습니다. 여기에는 다음이 포함됩니다. <ul><li> 추론 및 수학의 어려움</li><li> 잠재적으로 부정확한 사실적 정확성</li><li> 제한된 안전 보장 및 독성 또는 편견 가능성</li></ul> <br > 개발자들은 지속적인 향후 연구를 통해 이러한 한계를 해결하기 위해 노력하고 있습니다.

Vicuna AI

Vicuna: 90%* ChatGPT 품질로 GPT-4를 감동시킨 오픈 소스 챗봇

접속

Vicuna AI 상세 정보

제품 정보

소셜 미디어

제품 설명

<p>ShareGPT에서 수집한 사용자 공유 대화에 대해 LLaMA를 미세 조정하여 훈련한 오픈 소스 챗봇인 Vicuna-13B를 소개합니다. 예비평가 ...

Vicuna AI 소개

Vicuna: 90%* ChatGPT 품질로 GPT-4를 감동시키는 오픈 소스 챗봇

개요

대규모 언어 모델(LLM)의 급속한 발전은 챗봇 시스템에 혁명을 가져왔고 전례 없는 결과를 가져왔습니다. OpenAI의 ChatGPT에서 볼 수 있는 지능 수준. 그러나 인상적인 성능에도 불구하고 ChatGPT의 교육 및 아키텍처 세부 사항은 불분명하여 이 분야의 연구 및 오픈 소스 혁신을 방해합니다. Meta LLaMA 및 Stanford Alpaca 프로젝트에서 영감을 받아 향상된 데이터 세트와 사용하기 쉽고 확장 가능한 인프라가 지원되는 오픈 소스 챗봇인 Vicuna-13B를 소개합니다. ShareGPT.com에서 수집한 사용자 공유 대화에서 LLaMA 기본 모델을 미세 조정함으로써 Vicuna-13B는 Stanford Alpaca와 같은 다른 오픈 소스 모델에 비해 경쟁력 있는 성능을 보여주었습니다. 이 블로그 게시물은 Vicuna-13B의 성능에 대한 예비 평가를 제공하고 교육 및 서비스 인프라에 대해 설명합니다. 또한 커뮤니티에 온라인 데모를 통해 상호 작용하여 이 챗봇의 기능을 테스트하도록 초대합니다.

Vicuna는 얼마나 좋은가요?

70,000개의 사용자 공유 ChatGPT 대화로 Vicuna를 미세 조정한 후 Vicuna가 능력을 갖추게 되었음을 발견했습니다. ChatGPT와 동등한 품질로 Alpaca에 비해 더 자세하고 잘 구성된 답변을 생성합니다(아래 예 참조).

온라인 데모

여기에서 Vicuna-13B 데모를 사용해 보세요!

교육

Vicuna는 공개 API를 통해 ShareGPT.com에서 수집한 약 70,000개의 사용자 공유 대화를 사용하여 LLaMA 기본 모델을 미세 조정하여 만들어졌습니다. 데이터 품질을 보장하기 위해 HTML을 다시 마크다운으로 변환하고 부적절하거나 품질이 낮은 샘플을 필터링합니다. 또한 긴 대화를 모델의 최대 컨텍스트 길이에 맞는 더 작은 세그먼트로 나눕니다.

다단계 대화: 다중 회전 대화를 고려하여 훈련 손실을 조정하고 미세 조정 손실은 챗봇의 출력.
메모리 최적화: Vicuna가 긴 컨텍스트를 이해할 수 있도록 최대 컨텍스트 길이를 알파카의 512에서 2048로 확장하여 GPU 메모리 요구 사항을 크게 늘립니다. 우리는 그래디언트 체크포인트와 플래시 어텐션을 활용하여 메모리 압박을 해결합니다.
스팟 인스턴스를 통한 비용 절감: 훈련을 위한 40배 더 큰 데이터세트와 4배의 시퀀스 길이는 훈련 비용에 있어 상당한 어려움을 안겨줍니다. 우리는 SkyPilot 관리형 스팟을 사용하여 선점 및 자동 구역 전환을 위한 자동 복구 기능이 있는 저렴한 스팟 인스턴스를 활용하여 비용을 절감합니다. 이 솔루션은 7B 모델의 훈련 비용을 약 140개에서, 13B 모델의 훈련 비용을 약 300개에서 줄였습니다.

서빙

우리는 분산된 모델을 통해 여러 모델을 서빙할 수 있는 서빙 시스템을 구축합니다. 노동자. 온프레미스 클러스터와 클라우드 모두에서 GPU 작업자의 유연한 플러그인을 지원합니다. SkyPilot의 내결함성 컨트롤러 및 관리형 스팟 기능을 활용함으로써 이 서비스 시스템은 여러 클라우드의 저렴한 스팟 인스턴스와 잘 작동하여 서비스 비용을 줄일 수 있습니다. 이는 현재 경량 구현이며 최신 연구를 더 많이 통합하기 위해 노력하고 있습니다.

챗봇을 평가하는 방법

AI 챗봇을 평가하는 것은 언어 이해, 추론, 그리고 상황 인식. AI 챗봇이 더욱 발전함에 따라 현재의 공개 벤치마크로는 더 이상 충분하지 않을 수 있습니다. 예를 들어, 스탠포드의 알파카(Self-Instruct)에 사용된 평가 데이터 세트는 SOTA 챗봇을 통해 효과적으로 답변할 수 있어 인간이 성능 차이를 식별하기 어렵게 만듭니다. 더 많은 제한 사항에는 훈련/테스트 데이터 오염과 새로운 벤치마크 생성에 따른 잠재적으로 높은 비용이 포함됩니다. 이러한 문제를 해결하기 위해 우리는 챗봇 성능 평가를 자동화하는 GPT-4 기반의 평가 프레임워크를 제안합니다.

제한 사항

우리는 다른 대규모 언어 모델과 마찬가지로 Vicuna에도 특정 제한 사항이 있음을 확인했습니다. 예를 들어 추론이나 수학적 작업을 잘 하지 못하며, 자신을 정확하게 식별하거나 출력의 사실적 정확성을 보장하는 데 한계가 있을 수 있습니다. 또한 안전성을 보장하거나 잠재적인 독성이나 편견을 완화할 만큼 충분히 최적화되지 않았습니다. 안전 문제를 해결하기 위해 OpenAI 중재 API를 사용하여 온라인 데모에서 부적절한 사용자 입력을 필터링합니다. 그럼에도 불구하고 우리는 Vicuna가 이러한 제한 사항을 해결하기 위한 향후 연구의 열린 출발점이 될 수 있을 것으로 기대합니다.

릴리스

첫 번째 릴리스에서는 GitHub 저장소에서 교육, 제공 및 평가 코드를 공유할 것입니다. https://github.com/lm-sys/FastChat. 우리는 또한 Vicuna-13B 모델 무게를 출시했습니다. 데이터세트를 공개할 계획은 없습니다. Discord 서버에 가입하고 Twitter를 팔로우하여 최신 업데이트를 받으세요.

Vicuna는 얼마나 좋은가요?

70,000개의 사용자 공유 ChatGPT 대화로 Vicuna를 미세 조정한 후 Vicuna가 Alpaca에 비해 더 자세하고 잘 구조화된 답변을 생성할 수 있다는 사실을 발견했습니다(아래 예 참조). ), ChatGPT와 동등한 품질을 제공합니다.

온라인 데모

여기 <에서 vicuna-13b="Vicuna-13B" 데모를="데모를" 사용해="사용해" 보세요.="보세요." a="a">!

개요

대규모 언어 모델(LLM)의 급속한 발전은 챗봇 시스템에 혁명을 일으켰고, OpenAI의 ChatGPT에서 볼 수 있듯이 전례 없는 수준의 지능을 가져왔습니다. 그러나 인상적인 성능에도 불구하고 ChatGPT의 교육 및 아키텍처 세부 사항은 불분명하여 이 분야의 연구 및 오픈 소스 혁신을 방해합니다. Meta LLaMA 및 Stanford Alpaca 프로젝트에서 영감을 받아 향상된 데이터 세트와 사용하기 쉽고 확장 가능한 인프라가 지원되는 오픈 소스 챗봇인 Vicuna-13B를 소개합니다. ShareGPT.com에서 수집한 사용자 공유 대화에서 LLaMA 기본 모델을 미세 조정함으로써 Vicuna-13B는 Stanford Alpaca와 같은 다른 오픈 소스 모델에 비해 경쟁력 있는 성능을 보여주었습니다. 이 블로그 게시물은 Vicuna-13B의 성능에 대한 예비 평가를 제공하고 교육 및 서비스 인프라에 대해 설명합니다. 또한 커뮤니티가 온라인 데모를 통해 상호 작용하여 이 챗봇의 기능을 테스트하도록 초대합니다.

교육

Vicuna는 약 70,000명의 사용자를 사용하여 LLaMA 기본 모델을 미세 조정하여 생성됩니다. 공개 API를 사용하여 ShareGPT.com에서 수집한 공유 대화. 데이터 품질을 보장하기 위해 HTML을 다시 마크다운으로 변환하고 부적절하거나 품질이 낮은 샘플을 필터링합니다. 또한, 긴 대화를 모델의 최대 컨텍스트 길이에 맞는 작은 세그먼트로 나눕니다.

제공

우리는 분산된 작업자를 사용하여 여러 모델을 제공할 수 있는 제공 시스템을 구축합니다. 온프레미스 클러스터와 클라우드 모두에서 GPU 작업자의 유연한 플러그인을 지원합니다. SkyPilot의 내결함성 컨트롤러 및 관리형 스팟 기능을 활용함으로써 이 서비스 시스템은 여러 클라우드의 저렴한 스팟 인스턴스와 잘 작동하여 서비스 비용을 줄일 수 있습니다. 현재는 경량 구현이며 최신 연구를 여기에 통합하기 위해 노력하고 있습니다.

방법 챗봇을 평가하려면?

AI 챗봇을 평가하는 것은 언어 이해, 추론, 상황 인식을 검토해야 하기 때문에 어려운 작업입니다. AI 챗봇이 더욱 발전함에 따라 현재의 공개 벤치마크로는 더 이상 충분하지 않을 수 있습니다. 예를 들어 Stanford의 Alpaca에서 사용되는 평가 데이터 세트인 self-instruct는 다음과 같이 효과적으로 답변할 수 있습니다. SOTA 챗봇은 인간이 성능 차이를 식별하기 어렵게 만듭니다. 더 많은 제한 사항에는 훈련/테스트 데이터 오염과 새로운 벤치마크 생성에 따른 잠재적으로 높은 비용이 포함됩니다. 이러한 문제를 해결하기 위해 우리는 챗봇 성능 평가를 자동화하는 GPT-4 기반의 평가 프레임워크를 제안합니다.

제한 사항

우리는 다른 대규모 언어 모델과 유사하게 Vicuna가 특정 제한 사항. 예를 들어 추론이나 수학적 작업을 잘 하지 못하며, 자신을 정확하게 식별하거나 출력의 사실적 정확성을 보장하는 데 한계가 있을 수 있습니다. 또한 안전성을 보장하거나 잠재적인 독성이나 편견을 완화할 만큼 충분히 최적화되지 않았습니다. 안전 문제를 해결하기 위해 OpenAI 조정 API를 사용하여 온라인 데모에서 부적절한 사용자 입력을 필터링합니다. . 그럼에도 불구하고, 우리는 Vicuna가 이러한 한계를 해결하기 위한 향후 연구의 열린 출발점이 될 수 있을 것으로 기대합니다.

Vicuna AI FAQ

GPT-4를 심사위원으로 사용한 예비 평가에서는 Vicuna AI가 ChatGPT 및 Google Bard 품질의 90% 이상을 달성한 것으로 나타났습니다. 이는 Vicuna AI가 대부분의 경우 ChatGPT 및 Bard만큼 유용하고 관련성이 높으며 정확하고 상세한 응답을 제공할 수 있음을 의미합니다.

Vicuna AI는 LLaMA 기본 모델을 미세 조정하여 훈련되었습니다. ShareGPT에서 수집한 70,000개의 사용자 공유 대화 데이터 세트를 기반으로 합니다. 이러한 대화는 훈련 전에 마크다운으로 변환되고 품질을 위해 필터링되었습니다.

Vicuna AI는 다른 대규모 언어 모델과 마찬가지로 특정 한계가 있습니다. 여기에는 다음이 포함됩니다.

추론 및 수학의 어려움
잠재적으로 부정확한 사실적 정확성
제한된 안전 보장 및 독성 또는 편견 가능성

개발자들은 지속적인 향후 연구를 통해 이러한 한계를 해결하기 위해 노력하고 있습니다.

Vicuna AI 웹사이트 트래픽

방문

날짜	방문
2024-06-01	2207473
2024-07-01	2143625
2024-08-01	2099531

지표

지표	값
이탈률	59.33%
방문 당 페이지 수	1.99
평균 방문 시간	177.02 s

지리

국가	공유
🇨🇳 중국	14.42%
🇺🇸 미국	14.22%
🇷🇺 러시아연방	12.08%
🇻🇳 베트남	5.55%
🇩🇪 독일	5.30%

출처

출처	값
직접 접속	55.07%
검색	33.37%
추천	8.26%
소셜 미디어	3.06%
유료 추천	0.16%
이메일	0.07%

Vicuna AI 대체 제품

TianGong AI(opens in a new tab)

대화형 챗봇

天Gong AI Gong은 중국 최초의 AI 검색 엔진으로, 사용자 의도를 이해하고 전체 네트워크의 방대한 정보를 검색하며 인공 지능 기술을 사용하여 이 정보를 요약, 요약 및 통합하여 광고 없는 고품질 검색 결과를 출력할 수 있습니다. 검색도 가능합니다. 결과는 전문 학술 및 과학 연구 검색을 지원하기 위해 뇌 지도와 개요로 자동 구성됩니다. 또한 Tiangong은 채팅, 글쓰기, 질문 및 답변, 그림 그리기 능력도 갖추고 있습니다. Tiangong은 지식 Q&A, 기사 작성, 논리적 추론, 수학적 계산, 코드 프로그래밍, AI 드로잉, 가상 인간 채팅, 감정적 교제 등 다양한 요구를 충족할 수 있는 자연어 질문과 답변을 통해 사용자와 상호 작용합니다. 또한 Tiangong에는 학습, 직장, 생활 등 다양한 시나리오에서 도움을 줄 수 있는 수많은 지능형 에이전트가 있습니다.

812방문

46%검색

1.5K방문

40%검색

LogoAI AI(opens in a new tab)

그래픽 디자인

LogoAI.ai의 AI 로고 메이커로 독특하고 전문적인 로고를 손쉽게 만들어보세요. 무료 온라인 접속, 고급 사용자 정의, 워터마크 없는 로고, 안전한 디자인을 즐겨보세요.

299방문

55%검색

Vicuna AI

Vicuna AI 상세 정보

제품 정보

웹사이트

카테고리

이메일

소셜 미디어

제품 설명

Vicuna AI 소개

Vicuna: 90%* ChatGPT 품질로 GPT-4를 감동시키는 오픈 소스 챗봇

개요

Vicuna는 얼마나 좋은가요?

온라인 데모

교육

서빙

챗봇을 평가하는 방법

제한 사항

릴리스

Vicuna는 얼마나 좋은가요?

온라인 데모

개요

교육

제공

방법 챗봇을 평가하려면?

제한 사항

Vicuna AI FAQ

Vicuna AI 웹사이트 트래픽

방문

지표

지리

출처

Vicuna AI 대체 제품

TianGong AI(opens in a new tab)

AI Headshot(opens in a new tab)

AI Form Fill(opens in a new tab)

Addition Tables(opens in a new tab)

AI Updates Now(opens in a new tab)

LogoAI AI(opens in a new tab)

Vicuna AI

Vicuna AI 상세 정보

제품 정보

웹사이트

카테고리

이메일

소셜 미디어

제품 설명

Vicuna AI 소개

Vicuna: 90%* ChatGPT 품질로 GPT-4를 감동시키는 오픈 소스 챗봇

개요

Vicuna는 얼마나 좋은가요?

온라인 데모

교육

서빙

챗봇을 평가하는 방법

제한 사항

릴리스

Vicuna는 얼마나 좋은가요?

온라인 데모

개요

교육

제공

방법 챗봇을 평가하려면?

제한 사항

Vicuna AI FAQ

Vicuna AI는 ChatGPT 및 Bard와 어떻게 비교됩니까?

Vicuna AI는 어떻게 훈련되었습니까?

Vicuna AI의 한계는 무엇입니까?

Vicuna AI 웹사이트 트래픽

방문

지표

지리

출처

Vicuna AI 대체 제품

TianGong AI(opens in a new tab)

AI Headshot(opens in a new tab)

AI Form Fill(opens in a new tab)

Addition Tables(opens in a new tab)

AI Updates Now(opens in a new tab)

LogoAI AI(opens in a new tab)