コンテンツへスキップ

Chiilabo Note

  • /series
    • /print
    • /scheduled
    • /recorded
    • /dev
  • /app
  • /root

ディスク設計

! 1兆トークンを0.1秒台で検索するSoftMatcha 2のベンチマーク汚染の見つけ方

2026-02-252026-02-14 by chiilabo
#トークン(25) #LLM(18) #HDD(10) #削除(10) #学習データ(10)
カテゴリー 記事 タグ fastText、GloVe、HDD、LLM、SoftMatcha 2、コーパス、ディスク設計、トークン、パターン照合、ベンチマーク汚染、候補生成、優先度付きキュー、削除、動的枝刈り、単語分散表現、厳密照合、学習データ、性能測定、挿入、探索アルゴリズム、接尾辞配列、枝刈り、検索システム、索引、統計的性質、置換、表記揺れ、言い換え、評価テスト、類似検索
© 2026 Chiilabo Note • Built with GeneratePress