AIアシスタント「ClaudeAI」が注目を集めています。
このClaudeAIは、AI安全性研究に特化した非営利団体AnthropicがGPT-3ベースで開発した新しい大規模言語モデルです。
透明性が高く、倫理に基づいた制御が可能なAIとして設計されている一方で、幅広い知識と高度な言語処理能力を備えていると評価されています。
そんなClaudeAIですが、有料プランと無料プランが提供されていますが、それぞれのプランではどのような違いがあるのでしょうか。
「ClaudeAI」有料プランと無料プランとの違い
以下の観点で違いをお伝えします。
- プランの種類
- 機能面の違い
- 知識ベースの違い
- ビジョン機能
- 拒否の減少
- 応答の正確性
- 応答スピード
プランの種類(2024年3月時点)
Cluadeでは2024年3月時点で、「Claude 3 Haiku」「Claude 3 Sonnet」「Claude 3 Opus」の 3 つの最先端モデルが含まれていました。
(https://www.anthropic.com/news/claude-3-family)より引用
2024年3月時点では無料版から使える「Claude3 Sonnet」、有料プランとして利用できるのは「「Claude 3 Opus」で、claude.ai と Claude APIの両方で利用できました。
プランの種類(2024年6月時点)
ところが、Cluadeでは2024年6月に「Claude 3.5 Sonnet」を発表しました。
「Claude 3.5 Sonnet」は驚くべきことに「Claude 3 Opus」よりも速く賢いモデルだと言います。
Claude 3.5モデルファミリーの最初のリリースとなりました。
(https://www.anthropic.com/news/claude-3-5-sonnet)より引用
プラン | 特徴 | 備考 |
---|---|---|
Claude3 Haiku | 軽量で高速型のモデルです。チャートやグラフが挿入された論文を3秒以内に読むことが可能という優れたモデル | 約1万トークンは可能(1トークン4文字程度とすると4万文字程度) |
Claude3 Sonnet | OpusとHaikuの間でバランス型ともいえる。過去モデルであるClaude 2.1より2倍速い | 無料で利用できる |
Claude 3 Opus | 最も高性能。自由形式の質問への回答精度が過去モデルであるClaude 2.1の2倍に向上したとのこと。回答速度はClaude 2.1を維持 | 2024年4月時点で最上位のモデル |
Claude3.5 Sonnet | Claude 3 Opus の 2 倍の速度。Claude 3.5モデルファミリーの最初のモデル。 | 2024年6月時点で最上位のモデル 新機能「Artifact」 |
機能面での違い
まず機能面での違いがあります。
無料版では「Claude3 Sonnet」をチャット形式で利用できます。スマートフォンからも利用でき、非常にシームレスさを感じるレスポンス速度です。
一方、有料プランでは文字数制限の緩和に加え、高度なカスタマイズ機能や優先アクセス権、大量データ処理など、高機能になります。
また、チャット機能に加えてAPIが利用できるため、企業向けAPIアクセスや組み込み開発環境の提供も可能です。
2024年6月にリリースされた「Claude 3.5 Sonnet」では、Artifact機能が実装されました。
Artifact機能は、ユーザーがコード 、テキスト、ドキュメント、Web サイトデザインなどのコンテンツ生成依頼により、会話の横に専用ウィンドウに表示して、リアルタイムで表示、編集、構築できる動的なワークスペースが作成してくれます。
知識ベースの違い
以下は公式が掲載している言語モデル別の知識値です。(2023年3月時点)
https://www.anthropic.com/news/claude-3-family
無料で利用できる「Claude Sonnet」の列を比較するだけでも、「GPT3.5」と同等・それ以上の結果です。
「Claude Ops」に至っては、GPT-4すら上回っています。
次に、2024年6月に公開された「Claude 3.5 Sonnet」の知識値です。
(https://www.anthropic.com/news/claude-3-5-sonnet)より引用
Claude3.5 Sonnetは、Claude3 OpusはもちろんGPT-4o、Gemini 1.5 Pro、Llama-400bよりも、さまざまなAIテスト結果で上回っているという結果になっています。
以下はAIテスト項目とテストの特徴です。
テスト項目 | テストの特徴 |
---|---|
Undergraduate level knowledge MMLU | 学部レベルの知識とは、大学や大学院の教育課程の最初のレベルで習得する基礎的な知識です。学部レベルの教育には、学士号、準学士号、証明書、ディプロマなどが含まれます。MMLUは、言語モデルを評価するためのベンチマークです。 |
Graduate level resoning GPQA Diamond | GPA制度という大学院共通成績評価。 |
Grade school math GSM8K | GSM8Kは、小学校レベルの算数文章問題8500問で構成されるデータセットのこと。 文章問題は、論理的な思考とステップ・バイ・ステップの回答プロセスを前提に設計されており、高い正答率を達成することは、大規模言語モデルの論理的プロセスや計算能力が高いことを意味する。 |
Math problem-solving | 数学の問題解決能力。 |
Multilingual math MGSM | 多言語数学に関するテスト。 |
Code Human Eval | コードに対する人による評価。 |
Reasoning over text DROP,F1 score | テキスト上の推論テスト。 |
Mixed evaluations BIG-Bench-Hard | BIG-Bench Hard (BBH)と呼ばれる 23 の困難な BIG-Bench タスクに焦点を当てたテスト。 |
Knowledge Q&A ARC-Challenge | Abstraction and Reasoning Corpus ( ARC ) という、AI スキルの習得を測定し、人間レベルの AI の達成に向けた進捗状況を追跡するために設計された独自のベンチマーク。 |
Common Knowledge HellaSwag | HellaSwagという、自動大規模言語モデル (LLM) ベンチマーク。 |
分析と予測、微妙なコンテンツの作成、コード生成、およびスペイン語、日本語、フランス語などの英語以外の言語での会話における機能の向上を示しています。
ビジョン機能
Claude 3 モデルは、他の主要モデルと同等の高度なビジョン機能を備えています。
ビジョン機能とは「写真、チャート、グラフ、技術図など、幅広いビジュアル形式を処理できる」ことです。
ナレッジ ベースの最大 50% を PDF、フローチャート、プレゼンテーション スライドなどのさまざまな形式でエンコードしている人もいます。
無料プランではこのビジョン機能は利用できないため、有料プランで利用する必要があります。
「Claude 3.5 Sonnet」では、このビジョン機能がさらに強化され、チャートやグラフの解釈など、視覚的な推論を必要とするタスクが大幅に改善されました。
拒否の減少
前モデルのClaude2.1と比較して、質問に対する拒否の確立も非常に少なくなりました。
https://www.anthropic.com/news/claude-3-family
応答の正確性が向上
Claude3は、前モデルのClaude2.1と比べて、難しい質問に対する正確性も向上しました。
https://www.anthropic.com/news/claude-3-family
応答スピードの向上
Haiku は、最も高速かつ最もコスト効率の高いモデルです。
チャートやグラフを含む情報とデータの密度が高い研究論文 (約 10,000 トークン) を 3 秒以内に読むことができます。
大部分のワークロードにおいて、Sonnet は、より高いレベルのインテリジェンスを備えた Claude 2 および Claude 2.1 よりも 2 倍高速です。
ナレッジ検索やセールスオートメーションなど、迅速な対応が要求されるタスクに優れています。
Opus は、Claude 2 および 2.1 と同様の速度を提供しますが、はるかに高いレベルのインテリジェンスを備えています。
(新機能)Artifact機能
「Claude 3.5 Sonnet」で新しくArtifact機能が実装されました。
この機能は、チームのプロジェクトとしてリアルタイムに同じ画面を編集してイメージを共有したりするための機能のようです。
どういった機能なのかを実際に試してみました。
例えば、SNSアカウントのアクティビティを分析してみました。いくつか分析しました。(赤枠部分)
例えば真ん中の「インプレッションとエンゲージメントの関係分析」を見てみると、
分析結果のグラフが右側のワークスペース部分に表示されました。
これは便利。分析した内容をワークスペースで共有できます。
他にも遊んでみました。勇者の画像を依頼したところ、右側にワーク画面が表示され、簡単な勇者?が作成されました。(絵のクオリティはさておき)
「草原を歩かせて」と指示したところ、緑の背景を移動するようなアニメーションが生まれました。
この機能は、チームの共同作業をサポートするように拡張され、近い将来、チームや組織全体が、知識、ドキュメント、進行中の作業を 1 つの共有スペースに安全に一元管理できるよう拡張するようです。
API機能および料金の比較
企業向けにAPIを提供しており、インテリジェンスとスピードの理想的なバランスを実現します。
他の製品と比較して低コストで強力なパフォーマンスを実現し、大規模な AI 導入で高い耐久性を実現できるように設計されています。
項目 | Opus | 3.0 Sonnet | 3.5 Sonnet | Haiku |
---|---|---|---|---|
入力 (1Mトークン あたり) | $15 | $3 | $3 | $0.25 |
出力 (1Mトークン あたり) | $75 | $15 | $15 | $1.25 |
コンテキスト ウィンドウ | 200K | 200K | 200K | 200K |
用途 | タスク自動化 研究開発 ブレインストーミング 仮説生成 創薬 戦略利用 チャート利用 グラフ 市場動向 予測分析 | データ処理 マーケティング タスクの時間短縮 品質管理 画像からテキスト解析 | データ処理 マーケティング タスクの時間短縮 品質管理 画像からテキスト解析 ⭐︎Atifact機能追加 | 顧客との会話 ライブ感ある翻訳 コンテンツ監視 コスト削減タスク 物流最適化 在庫管理 非構造データから知識抽出 |
差別化 | 最もインテリジェンス | 手頃な価格かつインテリジェンス | 3.0 Sonnetと同じコストで2倍の速さ | 最も手頃な価格 高速で軽量 |
まとめ
以上が「ClaudeAI」の仮想的な有料プランと無料プランの違いについてのまとめです。
機能面、知識レベル、応答品質など、様々な側面で他の言語モデルより優れていることがデータ上から読み取れます。
実際に私も利用してみて、Claude3 Sonnetは無料版の生成AIの中でも文章能力がなめらかで、使い勝手がいいと感じました。
早速ClaudeAIを利用して、私たちのビジネスや生活を最適化していきましょう。