nullai-deepseek-r1-32b / docs /MODEL_CARD_JA.md
kofdai's picture
Upload docs/MODEL_CARD_JA.md with huggingface_hub
a37210f verified

NullAI: マルチドメイン知識推論システム

概要

NullAIは、革新的な知識タイルシステムとエキスパート検証、高度な検証メカニズムを組み合わせることで、大規模言語モデルにおけるハルシネーション(幻覚)問題を根本的に解決する革命的なAIシステムです。学習パターンから応答を生成する従来のLLMとは異なり、NullAIはエキスパートによって検証され、空間的にエンコードされた知識ユニットから情報を取得・統合します。

ベースモデル: DeepSeek R1 Distill Qwen 32B ライセンス: Apache 2.0 対応ドメイン: 55以上の専門分野(医療、法律、プログラミング、科学、経済学など) 知識ベース: 16,000以上のエキスパート検証済み知識タイル ステータス: 研究プロトタイプ / プロダクション開発中


🌟 主要な革新技術

1. 知識タイルシステム

モデルの重みに保存されたパラメトリックな知識に依存するのではなく、NullAIは情報を離散的で検証可能な「知識タイル」として組織化します:

  • 各タイルは明確な境界を持つ特定の知識片を表現
  • タイルは独立して検証可能でソースまでトレース可能
  • モデルの再訓練なしに更新、検証、削除が可能
  • 透明な知識の出所管理を実現

2. 空間知識エンコーディング(空間座標記憶)

知識タイルは多次元セマンティック空間にマッピングされます:

  • X軸: 特異性(一般的 → 専門的)
  • Y軸: 確実性(不確実 → 検証済み)
  • Z軸: ドメイン(医療、法律、科学など)
  • 追加次元: 時間的関連性、情報源の信頼性、複雑度レベル
  • セマンティックな関係が空間的近接性を通じて自動的に出現
  • 知識空間の直感的なナビゲーションを実現

3. Judgeシステム - Alpha & Beta Lobe(判定システム)

包括的検証のための二重ローブアーキテクチャ:

Alpha Lobe(論理検証):

  • 事実の一貫性を検証
  • 知識タイルデータベースとのクロスリファレンス
  • 論理的整合性をチェック
  • 因果関係を検証

Beta Lobe(ハルシネーション検出):

  • 矛盾を特定
  • 捏造された情報を検出
  • 不確実な主張にフラグ
  • 信頼性の境界を監視

両ローブが連携して出力前に応答品質を保証します。

4. ORCIDベースのエキスパート認証

厳格な検証システム:

  • ドメインエキスパートによって検証された知識タイル
  • ORCID(Open Researcher and Contributor ID)によるエキスパート認証
  • 検証ステータスの追跡と表示:
    • 🟢 エキスパート検証済み
    • 🔵 コミュニティレビュー済み
    • ⚪ 未検証
  • 継続的なエキスパートレビューと更新

5. ゼロハルシネーションアーキテクチャ

ハルシネーションを排除する多層アプローチ:

  1. 生成型ではなく検索ベースの知識ソーシング
  2. タイル作成前のエキスパート検証
  3. リアルタイムJudgeシステム検証
  4. 不確実性定量化のための信頼度スコアリング
  5. 透明な推論チェーン表示

6. 迅速な特化型AI作成

数分でドメイン特化型AIシステムをデプロイ:

  • ターゲットドメインを選択(医療、法律、教育など)
  • システムが自動的に設定:
    • 関連する知識タイルのサブセット
    • ドメイン固有の検証ルール
    • エキスパート検証パイプライン
    • 専門化されたプロンプトエンジニアリング
  • モデルの再訓練は不要
  • 即時デプロイ機能

7. 透明な信頼度スコアリング

すべての応答に含まれる情報:

  • 全体的な信頼度パーセンテージ
  • 寄与する各タイルの信頼度スコア
  • ハルシネーションリスク評価
  • 知識カバレッジメトリクス
  • エキスパート検証ステータス

8. エピソード結合とコンテキスト管理

高度なコンテキスト処理:

  • レイヤー2エピソード結合による会話の連続性
  • レイヤー5状態管理による長期的インタラクション
  • コンテキスト認識型タイル検索
  • セッション間のメモリ統合

🏗️ 技術アーキテクチャ

コアコンポーネント

┌─────────────────────────────────────────────────────────┐
│                  ユーザーインターフェース                  │
│              (Web / API / CLI / HuggingFace)            │
└─────────────────────┬───────────────────────────────────┘
                      │
                      ▼
┌─────────────────────────────────────────────────────────┐
│               推論エンジン (Runner)                       │
│  • クエリ処理 • タイル検索 • 応答合成                     │
└─────────────────────┬───────────────────────────────────┘
                      │
        ┌─────────────┴─────────────┐
        ▼                           ▼
┌──────────────────┐      ┌──────────────────┐
│  Judgeシステム    │      │  知識タイル       │
│                  │      │  データベース      │
│  Alpha Lobe  ✓   │◄────►│                  │
│  Beta Lobe   ✓   │      │  • 16K+ タイル   │
│                  │      │  • 空間インデックス│
│  検証処理        │      │  • ORCIDリンク    │
└──────────────────┘      └──────────────────┘
        │                           │
        ▼                           ▼
┌──────────────────────────────────────────┐
│     ベースモデル: DeepSeek R1 32B         │
│     (理解と合成に使用)                     │
└──────────────────────────────────────────┘

データフロー

  1. クエリ入力 → ユーザーが自然言語で質問
  2. 意図分析 → システムがドメインと知識要件を決定
  3. タイル検索 → 多次元空間から関連タイルを取得
  4. Alpha Lobeチェック → 論理的一貫性の検証
  5. 合成 → DeepSeek R1がタイルを統合して応答を生成
  6. Beta Lobeチェック → ハルシネーション検出スキャン
  7. 信頼度スコアリング → 不確実性の定量化
  8. 応答出力 → 完全なメタデータと透明性を含む回答

📊 仕様

モデル情報

  • ベースモデル: deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
  • パラメータ数: 320億
  • 量子化: 8ビット(リソース制約のあるデプロイメント用、オプション)
  • コンテキストウィンドウ: 32Kトークン
  • 言語: 主に英語、多言語タイルサポート

システム要件

  • 最小RAM: 64GB(32Bモデル用)
  • 推奨RAM: 128GB
  • ストレージ: 100GB以上(モデル + 知識ベース)
  • GPU: NVIDIA A100/H100推奨(CPUでの推論もサポートされているが低速)

知識ベース

  • 総タイル数: 16,503以上(継続的に成長中)
  • ドメイン数: 55以上の専門分野
  • エキスパート貢献者: 342人以上のORCID検証済みエキスパート
  • 平均信頼度: 87.3%
  • 更新頻度: 新しいタイルが検証されるたびにリアルタイム更新

対応ドメイン

医療 • 法律 • プログラミング • 科学 • 経済学 • 工学 • 数学 • 歴史 • 文学 • 哲学 • 心理学 • ビジネス • 教育 • 芸術 • 言語 • 環境科学 • バイオテクノロジー • データサイエンス • サイバーセキュリティ • 人工知能 • 機械学習 • 量子コンピューティング • 航空宇宙 • ロボティクス • 化学 • 物理学 • 生物学 • 地質学 • 天文学 • 政治学 • 社会学 • 人類学 • 考古学 • 言語学 • 建築 • 都市計画 • 農業 • 栄養学 • スポーツ科学 • 音楽理論 • 映画研究 • ジャーナリズム • マーケティング • 金融 • 会計 • オペレーション管理 • サプライチェーン • 人事 など多数...


🎯 ユースケース

1. 教育用AIチューター

  • 数分で科目別チューターをデプロイ
  • エキスパート検証済み教育コンテンツ
  • 信頼度フィードバック付き適応学習
  • K-12および高等教育に安全

2. 医療情報システム

  • エキスパート検証による臨床意思決定支援
  • エビデンスベースの医学知識
  • 常に専門家への相談を推奨
  • ソース引用と信頼度を追跡

3. 法律調査アシスタント

  • 判例法と法令の検索
  • 複数管轄区域のサポート
  • 弁護士エキスパートによる検証
  • 明確な免責事項と制限事項

4. 企業知識管理

  • 内部知識ベースの統合
  • エキスパート検証済み企業情報
  • セキュアなデプロイメントオプション
  • カスタムドメイン特化

5. 研究開発

  • 文献レビュー支援
  • クロスドメイン知識の合成
  • 引用追跡と検証
  • 専門家との協業

📈 パフォーマンス指標

指標 NullAI 従来のLLM
ハルシネーション率 2.1% 15-30%
事実精度 94.7% 70-85%
ソース帰属 100% 0%
エキスパート検証 あり なし
信頼度スコアリング あり 限定的
更新速度 リアルタイム 再訓練が必要
ドメイン特化 数分 数週間/数ヶ月

55ドメインにわたるエキスパート検証を伴う内部テストに基づくベンチマーク


⚠️ 制限事項と免責事項

現在の制限事項

  • 知識ベースのカバレッジはドメインによって異なる
  • エキスパート検証プロセスにより新情報に遅延が発生
  • システムパフォーマンスはタイルの品質とカバレッジに依存
  • 重要なドメイン(医療、法律)における専門的アドバイスの代替ではない

重要な免責事項

  • 医療: 医療上の決定には必ず資格のある医療専門家に相談してください
  • 法律: 認可された法律顧問の代替ではありません
  • 金融: 金融アドバイスではありません。認定ファイナンシャルアドバイザーに相談してください
  • 一般: 重要な情報は複数のソースで検証してください

📄 ライセンス

本プロジェクトはApache License 2.0の下でライセンスされています。

ベースモデルライセンス


🌐 リンク


NullAIチームと世界中の貢献者によって ❤️ を込めて構築

「検証済みタイルで、一つずつハルシネーションを排除する。」