目次

March 26, 2024 · View on GitHub

logo

Orion-14B

🀗 HuggingFace メむンペヌゞ | 🀖 ModelScope メむンペヌゞ
🎬 HuggingFace デモ | 🎫 ModelScope デモ
😺 GitHub
📖 技術レポヌト

目次


1. モデル玹介

  • Orion-14B-Baseは、140億のパラメヌタを持぀マルチランゲヌゞの倧芏暡モデルで、さたざたな蚀語に察応するために2.5兆トヌクンの倚様なデヌタセットでトレヌニングされたした。このデヌタセットには、䞭文、英語、日本語、韓囜語などが含たれおいたす。このモデルは、倚蚀語環境でのさたざたなタスクにおいお卓越した性胜を発揮しおいたす。Orion-14Bシリヌズモデルは、䞻芁なパフォヌマンスベンチマヌクで優れた結果を瀺し、同じパラメヌタ数を持぀他のベヌスモデルを明らかに凌駕しおいたす。具䜓的な技術の詳现に぀いおは、参照先をご芧ください。技術レポヌトを参照しおください。

  • Orion-14B シリヌズのモデルは、以䞋の特城がありたす

    • 基座20Bパラメヌタモデルは、総合的な評䟡で優れた結果を瀺しおいたす。
    • 倚蚀語察応力が匷く、特に日本語ず韓囜語の察応胜力が優れおいたす
    • ファむンチュヌニングモデルは適応性が高く、人間の泚釈぀きブラむンドテストでは高性胜なパフォヌマンスを発揮しおいたす。
    • 長文察応バヌゞョンは非垞に長いテキストをサポヌトし、20䞇トヌクンの長さで優れた効果を発揮し、最倧で320,000トヌクンたでサポヌト可胜です。
    • 量子化バヌゞョンではモデルサむズが70%瞮小し、掚論速床が30%向䞊し、性胜の損倱が1%以䞋です。
opencompass modelcap

Orion-14B シリヌズ モデルには以䞋が含たれたす

  • Orion-14B-Base: 2.5兆トヌクンの倚様なデヌタセットでトレヌニングされ、140億のパラメヌタを持぀倚蚀語基本モデルです。
  • Orion-14B-Chat: 高品質なコヌパスでファむンチュヌニングされた察話型モデルで、倧芏暡モデルコミュニティにより良いナヌザヌむンタラクション䜓隓を提䟛するこずを目指しおいたす。
  • Orion-14B-LongChat: 20䞇トヌクンの長さで優れた効果を発揮し、最倧で320,000トヌクンたでサポヌト可胜で、長文曞の評䟡セットでの性胜は専甚モデルに匹敵したす。
  • Orion-14B-Chat-RAG: スタムの怜玢匷化生成デヌタセットでファむンチュヌニングされたチャットモデルで、怜玢匷化生成タスクで卓越した性胜を発揮しおいたす。
  • Orion-14B-Chat-Plugin: プラグむンず関数呌び出しタスクに特化したチャットモデルで、代理を䜿甚する関連するシナリオに適しおいたす。倧芏暡蚀語モデルがプラグむンず関数呌び出しシステムの圹割を果たしたす。
  • Orion-14B-Base-Int4: int4を䜿甚しお量子化された基本モデル。モデルサむズが70%瞮小し、掚論速床が30%向䞊し、わずか1%未満の性胜䜎䞋しか発生したせん。
  • Orion-14B-Chat-Int4: int4を䜿甚しお量子化された察話モデル。


2. モデルのダりンロヌド

以䞋はモデルのリリヌスずダりンロヌドURLが提䟛されおいたす

モデル名HuggingFace ダりンロヌドリンクModelScope ダりンロヌドリンク
⚟Orion-14B-BaseOrion-14B-BaseOrion-14B-Base
😛Orion-14B-ChatOrion-14B-ChatOrion-14B-Chat
📃Orion-14B-LongChatOrion-14B-LongChatOrion-14B-LongChat
🔎Orion-14B-Chat-RAGOrion-14B-Chat-RAGOrion-14B-Chat-RAG
🔌Orion-14B-Chat-PluginOrion-14B-Chat-PluginOrion-14B-Chat-Plugin
💌Orion-14B-Base-Int4Orion-14B-Base-Int4Orion-14B-Base-Int4
📊Orion-14B-Chat-Int4Orion-14B-Chat-Int4Orion-14B-Chat-Int4


3. モデルのベンチマヌク

3.1. 基本モデル Orion-14B-Base ベンチマヌク

3.1.1. LLM 評䟡結果怜査ず専門知識

モデルC-EvalCMMLUMMLUAGIEvalGaokaoBBH
LLaMA2-13B41.438.455.030.918.245.6
Skywork-13B59.161.462.743.656.148.3
Baichuan2-13B59.061.359.537.445.649.0
QWEN-14B71.770.267.951.962.553.7
InternLM-20B58.859.062.144.645.552.5
Orion-14B-Base72.970.669.954.762.156.5

3.1.2. LLM 評䟡結果蚀語理解ず䞀般的な知識

モデルRACE-middleRACE-highHellaSwagPIQALambadaWSC
LLaMA 2-13B63.058.977.579.876.566.3
Skywork-13B87.684.173.778.371.866.3
Baichuan 2-13B68.967.270.878.174.166.3
QWEN-14B93.090.380.279.871.466.3
InternLM-20B86.483.378.180.371.868.3
Orion-14B-Base93.291.378.579.578.870.2

3.1.3. LLM 評䟡結果OpenCompass テストセット

モデル平均怜査蚀語知識理解掚論
LLaMA 2-13B47.345.247.058.350.943.6
Skywork-13B53.661.151.352.764.545.2
Baichuan 2-13B49.451.847.548.958.144.2
QWEN-14B62.471.352.6756.168.860.1
InternLM-20B59.462.555.060.167.354.9
Orion-14B-Base64.371.455.060.071.961.6

3.1.4. 日本語のテストセットにおけるLLMパフォヌマンスの比范

モデル平均JCQAJNLIMARCJSQDJQKXLSXWNMGSM
PLaMo-13B52.356.742.895.870.671.08.7070.52.40
WebLab-10B50.766.653.782.162.956.210.072.02.40
ELYZA-jp-7B48.871.725.386.670.864.12.5062.17.20
StableLM-jp-7B51.133.443.396.770.678.110.772.82.80
LLaMA 2-13B46.375.047.638.876.167.718.163.210.4
Baichuan 2-13B57.173.731.391.680.563.318.672.225.2
QWEN-14B65.885.960.797.083.371.818.870.638.0
Yi-34B67.183.861.295.286.178.527.269.235.2
Orion-14B-Base69.188.275.894.175.785.117.378.838.0

3.1.5. 韓囜のテストセットにおけるLLMパフォヌマンスの比范。n = 0およびn = 5は評䟡に䜿甚されたn-shotのプロンプトを衚したす。

モデル平均
n=0  n=5
HellaSwag
n=0  n=5
COPA
n=0  n=5
BooIQ
n=0  n=5
SentiNeg
n=0  n=5
KoGPT53.0    70.155.9    58.373.5    72.945.1    59.837.5    89.4
Polyglot-ko-13B69.6    73.759.5    63.179.4    81.148.2    60.491.2    90.2
LLaMA 2-13B46.7    63.741.3    44.059.3    63.834.9    73.851.5    73.4
Baichuan 2-13B52.1    58.739.2    39.660.6    60.658.4    61.550.3    72.9
QWEN-14B53.8    73.745.3    46.864.9    68.933.4    83.571.5    95.7
Yi-34B54.2    72.144.6    44.758.0    60.665.9    90.248.3    92.9
Orion-14B-Chat74.5    79.647.0    49.677.7    79.481.6    90.792.4    98.7

3.1.6. 倚蚀語評䟡

モデルトレヌニング蚀語日本語韓囜語䞭囜語英語
PLaMo-13B英語, 日本語52.3***
Weblab-10B英語, 日本語50.7***
ELYZA-jp-7B英語, 日本語48.8***
StableLM-jp-7B英語, 日本語51.1***
KoGPT-6B英語, 韓囜語*70.1**
Polyglot-ko-13B英語, 韓囜語*70.7**
Baichuan2-13Bマルチ蚀語57.158.750.857.1
Qwen-14Bマルチ蚀語65.873.764.565.4
Llama2-13Bマルチ蚀語46.363.741.455.3
Yi-34Bマルチ蚀語67.172.258.768.8
Orion-14B-Chatマルチ蚀語69.179.567.967.3

3.2. チャットモデル Orion-14B-Chat ベンチマヌク

3.2.1. チャットモデルのMTBenchにおける䞻芳的評䟡

モデルファヌストタヌンセカンドタヌン平均
Baichuan2-13B-Chat7.056.476.76
Qwen-14B-Chat7.306.626.96
Llama2-13B-Chat7.106.206.65
InternLM-20B-Chat7.035.936.48
Orion-14B-Chat7.687.077.37
* 掚論にはvllmを䜿甚

3.2.2. チャットモデルのAlignBenchにおける䞻芳的評䟡

モデル数孊論理基瀎䞭囜語コンピュヌタラむティング圹割プロフェッショナリズム平均
Baichuan2-13B-Chat3.764.076.226.057.116.976.756.435.25
Qwen-14B-Chat4.914.716.906.366.746.646.596.565.72
Llama2-13B-Chat3.053.795.434.406.766.636.995.654.70
InternLM-20B-Chat3.393.925.965.507.186.196.496.224.96
Orion-14B-Chat4.004.246.186.577.167.367.166.995.51
* 掚論にはvllmを䜿甚

3.3. LongChatモデルOrion-14B-LongChatのベンチマヌク

3.3.1. LongChatによるLongBenchの評䟡

モデルNarrativeQAMultiFieldQA-enMultiFieldQA-zhDuReaderQMSumVCSUMTRECTriviaQALSHTRepoBench-P
GPT-3.5-Turbo-16k23.6052.3061.2028.7023.4016.0068.0091.4029.2053.60
LongChat-v1.5-7B-32k16.9041.4029.1019.5022.709.9063.5082.3023.2055.30
Vicuna-v1.5-7B-16k19.4038.5043.0019.3022.8015.1071.5086.2028.8043.50
Yi-6B-200K14.1136.7422.6814.0120.448.0872.0086.6138.0063.29
Orion-14B-LongChat19.4748.1155.8437.0224.8715.4477.0089.1245.5054.31

3.4. Chat RAGモデルベンチマヌク

3.4.1. 自己構築RAGテストセットのLLM評䟡結果

モデル応答の有効性(キヌワヌド)*応答の有効性(䞻芳的評䟡)匕甚の胜力フォヌルバックの胜力*AutoQA*デヌタ抜出
Baichuan2-13B-Chat8576106951
Qwen-14B-Chat797775476872
Qwen-72B-Chat(Int4)878990326776
GPT-4919496957586
Orion-14B-Chat-RAG868791977371
* 手動評䟡を意味したす

3.5. Chat PluginモデルOrion-14B-Chat-Pluginベンチマヌク

3.5.1. 自己構築プラグむンテストセットのLLM評䟡結果

モデルフルパラメヌタの意図認識パラメヌタが䞍足しおいる堎合の意図認識非プラグむン呌び出しの認識
Baichuan2-13B-Chat2500
Qwen-14B-Chat55050
GPT-49552.3870
Orion-14B-Chat-Plugin92.560.3290

3.6. 量子化モデルOrion-14B-Base-Int4ベンチマヌク

3.6.1. 量子化前埌の比范

モデルサむズ(GB)掚論速床トヌクン/秒C-EvalCMMLUMMLURACEHellaSwag
OrionStar-14B-Base28.013572.870.670.093.378.5
OrionStar-14B-Base-Int48.317871.869.869.293.178.0


4. モデル掚論

掚論に必芁なモデルの重み、゜ヌスコヌド、および蚭定は、Hugging Faceに公開されおおり、ダりンロヌドリンクはこの文曞の冒頭にある衚に瀺されおいたす。ここでは、さたざたな掚論方法のデモが行われたす。プログラムは自動的にHugging Faceから必芁なリ゜ヌスをダりンロヌドしたす。

4.1. Pythonコヌド

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation.utils import GenerationConfig

tokenizer = AutoTokenizer.from_pretrained("OrionStarAI/Orion-14B", use_fast=False, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("OrionStarAI/Orion-14B", device_map="auto",
                                             torch_dtype=torch.bfloat16, trust_remote_code=True)

model.generation_config = GenerationConfig.from_pretrained("OrionStarAI/Orion-14B")
messages = [{"role": "user", "content": "Hello, what is your name? "}]
response = model.chat(tokenizer, messages, streaming=False)
print(response)

䞊蚘のPython゜ヌスコヌドでは、モデルは device_map='auto' でロヌドされ、利甚可胜なすべおのGPUを利甚されおいたす。デバむスを指定するには、 export CUDA_VISIBLE_DEVICES=0,1 のようなものを䜿甚できたすGPU 0および1を䜿甚。

4.2. コマンドラむンツヌル

CUDA_VISIBLE_DEVICES=0 python cli_demo.py

このコマンドラむンツヌルはチャットシナリオ向けに蚭蚈されおおり、基本モデルの呌び出しをサポヌトしおいたせん。

4.3. 盎接スクリプト掚論


# ベヌスモデル
CUDA_VISIBLE_DEVICES=0 python demo/text_generation_base.py --model OrionStarAI/Orion-14B --tokenizer OrionStarAI/Orion-14B --prompt hello

# チャットモデル
CUDA_VISIBLE_DEVICES=0 python demo/text_generation.py --model OrionStarAI/Orion-14B-Chat --tokenizer OrionStarAI/Orion-14B-Chat --prompt hi


4.4. vLLMを䜿甚した掚論


4.5. llama.cppを䜿甚した掚論

  • プロゞェクトのアドレス
    https://github.com/ggerganov/llama.cpp

  • プルリク゚スト
    https://github.com/ggerganov/llama.cpp/pull/5118

  • GGUF圢匏に倉換する方法

    python convert-hf-to-gguf.py path/to/Orion-14B-Chat --outfile chat.gguf
    
  • モデル掚論方法

    ./main --frequency-penalty 0.5 --frequency-penalty 0.5 --top-k 5 --top-p 0.9 -m chat.gguf -p "Building a website can be done in 10 simple steps:\nStep 1:" -n 400 -e
    

4.6 䟋の出力

4.6.1 カゞュアルチャット

User: Hello
Orion-14B: Hello! How can I help you today? If you have any questions or need assistance, feel free to ask.
User: What functions do you have?
Orion-14B: As an AI language model, I have a wide range of functions and capabilities, including but not limited to:
  Answering general knowledge questions: I can provide information on various topics such as history, science, geography, and more.
  Providing definitions and explanations: I can explain complex concepts and provide definitions for words and phrases.
  Assisting with tasks: I can help with simple tasks like setting reminders, converting units of measurement, and even ordering food from restaurants.
  Generating text: I can write short stories, essays, articles, and other types of content based on prompts given to me.
  Translating languages: I can translate text from one language to another.
  Chatting: I can engage in conversation with users and respond to their queries in a conversational manner.
  Summarizing long texts: I can summarize longer texts like articles, books, and research papers.
  Generating random numbers and names: I can generate random numbers within a specified range and also suggest names based on certain criteria.
  Playing games: I can play simple games like Hangman, Trivia, and more.
  Providing recommendations: I can recommend movies, music, books, and other forms of entertainment based on user preferences.
  These are just some of the many functions that I am capable of performing. If you have a specific task in mind, feel free to ask me about it.
User: Tell me a joke.
Orion-14B: Sure, here's a classic one-liner: Why don't scientists trust atoms? Because they make up everything.

4.6.2. 日本語ず韓囜語のチャット

User自己を玹介しおください
Orion-14Bこんにちは、私の名前はChatMaxで、OrionStarによっお開発されたAIアシスタントです。私はナヌザヌに正確で、客芳的で、有甚な回答を提䟛し、圌らが問題を解決し、情報を取埗するのを助けるこずができたす。
User자Ʞ소개륌 핎죌섞요.
Orion-14B안녕하섞요, 제 읎늄은 ChatMax입니닀. OrionStar에서 개발한 AI 얎시슀턎튞입니닀. 저는 사용자듀에게 정확하고 객ꎀ적읎며 유용한 답변을 제공하여 묞제륌 핎결하고 정볎륌 얻는 데 도움을 쀄 수 있습니닀.


5. 声明、ラむセンス

5.1. 声明

匊瀟は党おの利甚者に察しお、Orion-14Bモデルを䜿甚しお囜家の瀟䌚安党を危険にさらすか、違法な掻動に䜿甚しないよう匷く呌びかけたす。さらに、Orion-14Bモデルを適切な安党審査ず登録なしにむンタヌネットサヌビスに䜿甚しないよう芁求したす。 すべおの利甚者がこの原則を守るこずを期埅しおおり、科技の発展が芏範ず合法の環境で進むこずを確認しおいたす。匊瀟はモデルのトレヌニングプロセスで䜿甚されるデヌタのコンプラむアンスを確保するために最善の努力をしおいたす。ただし、モデルずデヌタの耇雑性から、予枬できない問題が䟝然ずしお発生する可胜性がありたす。 したがっお、Orion-14Bオヌプン゜ヌスモデルの䜿甚によっお匕き起こされる問題、デヌタセキュリティの問題、公共の意芋のリスク、たたはモデルが誀誘導、乱甚、拡散、たたは䞍適切に䜿甚されるこずによるリスクや問題に぀いお、匊瀟は䞀切の責任を負いたせん。

5.2. ラむセンス

Orion-14B シリヌズモデルのコミュニティ利甚


6. 䌚瀟玹介

オリオンスタヌOrionStarは、2016幎9月に蚭立された、䞖界をリヌドするサヌビスロボット゜リュヌション䌁業です。オリオンスタヌは人工知胜技術を基に、次䞖代の革新的なロボットを開発し、人々が単玔な䜓力劎働から解攟され、仕事や生掻がよりスマヌトで面癜くなるようにするこずを目指しおいたす。技術を通じお瀟䌚ず䞖界をより良くするこずを目指しおいたす。

オリオンスタヌは、完党に独自に開発された党䜓的な人工知胜技術を持っおおり、音声察話や芖芚ナビゲヌションなどが含たれたす。補品開発胜力ず技術応甚胜力を統合しおいたす。オリオンメカニカルアヌムプラットフォヌムを基に、オリオンスタヌ 、AI Robot Greeting Mini、Lucki、Coffee Masterなどの補品を展開し、オリオンスタヌロボットのオヌプンプラットフォヌムであるオリオンOSも構築しおいたす。本圓に有甚なロボットのために生たれたずいう理念に基づき、オリオンスタヌはAI技術を通じお倚くの人々に力を䞎えおいたす。

7幎間のAI経隓を基に、オリオンスタヌは「聚蚀」ずいう倧芏暡な深局孊習アプリケヌションを導入し、業界の顧客向けにカスタマむズされたAI倧芏暡モデルのコンサルティングずサヌビス゜リュヌションを提䟛しおいたす。これにより、䌁業の経営効率を向䞊させる目暙を達成するのに圹立っおいたす。

オリオンスタヌの倧芏暡モデルアプリケヌション胜力の䞻芁な利点には、海量デヌタ凊理、倧芏暡モデルの事前トレヌニング、二次事前トレヌニング、ファむンチュヌニング、プロンプト゚ンゞニアリング、゚ヌゞェント開発など、党䜓のチェヌンにわたる胜力ず経隓の蓄積が含たれたす。 さらに、システム党䜓のデヌタ凊理フロヌず数癟のGPUによる䞊列モデルトレヌニング胜力を含む、゚ンドツヌ゚ンドのモデルトレヌニング胜力を持っおいたす。これらの胜力は、倧芏暡政府、クラりドサヌビス、囜際展開の電子商取匕、消費財など、さたざたな産業のシヌンで実珟されおいたす。

倧芏暡モデルアプリケヌションの展開に関するニヌズがある䌁業は、お気軜にお問い合わせください。
Tel: 400-898-7779
E-mail: ai@orionstar.com
Discord コミュニティ リンク: https://discord.gg/zumjDWgdAs

wechat
```