コンテンツへスキップ

Chiilabo Note

  • /series
    • /print
    • /scheduled
    • /recorded
    • /dev
  • /app
  • /root

キャッシュミス

プロンプトキャッシングが効く設計なら生成コストが下げられる

2026-02-192026-02-19 by chiilabo
#Anthropic(29) #トークン(25) #OpenAI(23) #RAG(7) #システムプロンプト(7)
カテゴリー 記事 タグ 128トークン単位、Allowed Tools、Anthropic、cache_control、GPU VRAM、KVキャッシュ、LLM API、OpenAI、prompt_cache_key、prompt_cache_retention、RAG、SoftMatcha、キャッシュヒット、キャッシュミス、キャッシュ保持時間、キャッシュ書き込み、キャッシュ読み出し、システムプロンプト、チャットボット、ツール定義、トークン、トークン単価、バッチ処理、プレフィックス、プロンプトキャッシング、入力トークン、動的コンテンツ、固定コンテンツ、完全一致、推論コスト
© 2026 Chiilabo Note • Built with GeneratePress