starthome-logo 無料ゲーム
starthome-logo

待ち時間が短い日本語LLMで、問い合わせ一次回答の平均対応時間はどこまで縮む?


株式会社リコーは、Googleのオープンモデル「Gemma 3 27B」をベースに、オンプレミス導入に最適化した日本語LLMを開発しました。独自のモデルマージ技術により、約1万5千件のインストラクションチューニングデータから抽出した複数のChat Vectorをベースモデルに統合し、大幅な性能向上を実現しています。270億パラメータというコンパクトさを保ちながら高性能を達成し、PCサーバで構築可能なため、低コストでのプライベートLLM導入に適します。非推論モデルの特性を活かし初期応答性に優れ、執筆能力も高いため、ビジネス用途での対話や文書生成に向いています。LLMの電力消費が課題となる中で、省エネルギーと環境負荷低減にも寄与する点が特徴です。リコーは今後、推論性能や業種特化モデル、マルチモーダル性能の強化も進める方針です。

同規模モデルとの比較では、OpenAIのオープンウェイト「gpt-oss-20b」を含む最先端モデルと同等の性能を確認しました。評価は、複雑な指示を含む「ELYZA-tasks-100」と日本語のマルチターン対話を評価する「Japanese MT-Bench」で実施され、平均スコアで高い水準を示しています。具体的には、gemma-3-Ricoh-27b-20251030がJapanese MT-Benchで9.26、Elyza-tasks-100で9.03、量子化モデルがそれぞれ9.01、9.05でした。非推論モデルのため、明確な指示に対して速やかに応答を開始でき、ユーザー体験の向上に直結します。業務シナリオにおいては、要約や意図把握、計算を含む複合タスク、対話生成など広範な用途に対応できることが示唆されます。オンプレミス要件が強い業界でも、データ主権とパフォーマンスを両立できる選択肢となるでしょう。

提供形態として、本LLMは個別提供に加え、2025年12月下旬からエフサステクノロジーズの「Private AI Platform on PRIMERGY(Very Small モデル)」に量子化モデルと生成AI開発プラットフォーム「Dify」をプリインストールした構成で、リコージャパンから提供開始されます。ノーコード開発により、業種や業務に合わせた生成AIアプリを迅速に構築でき、「Dify支援サービス」による伴走支援も受けられます。社内にAI専門人材が不足する組織でも、安全なオンプレミス環境で生成AI活用を短期間に立ち上げ可能です。導入の実務では、GPUリソースを前提としないモデルマージと量子化の活用、TTFTの測定とSLA設定、用途別プロンプトガイドラインの整備、機密データの境界設定とログ監査のルール化を進めるとスムーズです。まずは社内ドキュメント要約やFAQ応答、定型レポート作成から適用し、評価指標として初期応答時間、完了までの時間、ハルシネーション率、ユーザー満足度を継続測定して最適化してください。

詳しくは「株式会社リコー」の公式ページまで。

    Loading...
    アクセスランキング
    game_banner
    Starthome

    StartHomeカテゴリー

    Copyright 2025
    ©KINGSOFT JAPAN INC. ALL RIGHTS RESERVED.